Magnus Ekdahl
Stokastisk komplexitet i klustringsanalys
Metoder för klustring (ungefär: klassificiering) av multivariata data behövs ofta såväl i biologiska och medicinska tillämpningar som i kommersiella uppdrag (t.ex. data-mining).
En klustring kan betraktas som en representation av något dataset på ett kompakt och prediktivt sätt. I denna presentation formuleras detta synsätt med hjälp av teorin för stokastisk komplexitet, som utvecklats bl.a. av J. Rissanen.
Stokastisk komplexitet bygger på inlärning av strukturer i data med hjäp av en statistisk modellfamilj. Här består modellfamiljen av Chow-Liu beroendeträd för binära data. Dessa träd utgör ett specialfall av s.k. Bayesianska nätverk.
Ett antal resultat och algoritmer för klustring med minimering av stokastiskt
komplexitet kommer att beskrivas.
Sidansvarig: karin.johansson@liu.se
Senast uppdaterad: 2019-12-03