Workshop i tillämpad matematik den 30-31 augusti, 2004

Magnus Ekdahl

Stokastisk komplexitet i klustringsanalys

Metoder för klustring (ungefär: klassificiering) av multivariata data behövs ofta såväl i biologiska och medicinska tillämpningar som i kommersiella uppdrag (t.ex. data-mining).

En klustring kan betraktas som en representation av något dataset på ett kompakt och prediktivt sätt. I denna presentation formuleras detta synsätt med hjälp av teorin för stokastisk komplexitet, som utvecklats bl.a. av J. Rissanen.

Stokastisk komplexitet bygger på inlärning av strukturer i data med hjäp av en statistisk modellfamilj. Här består modellfamiljen av Chow-Liu beroendeträd för binära data. Dessa träd utgör ett specialfall av s.k. Bayesianska nätverk.

Ett antal resultat och algoritmer för klustring med minimering av stokastiskt komplexitet kommer att beskrivas.

Sidansvarig: karin.johansson@liu.se
Senast uppdaterad: 2019-12-03

Linköpings Universitet

Contents

Magnus Ekdahl

Stokastisk komplexitet i klustringsanalys