Roy Skodowski

X-Means: Ein Algorithmus zur Clusterbildung unter selbstständiger Abschätzung der optimalen Clusteranzahl

2. Auflage.
kartoniert , 24 Seiten
ISBN 3638903524
EAN 9783638903523
Veröffentlicht Februar 2008
Verlag/Hersteller GRIN Verlag
Leseprobe öffnen

Auch erhältlich als:

epub eBook
13,99
17,95 inkl. MwSt.
Lieferbar innerhalb von 3-5 Tagen (Versand mit Deutscher Post/DHL)
Teilen
Beschreibung

Studienarbeit aus dem Jahr 2006 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1,7, Friedrich-Schiller-Universität Jena (Wirtschaftswissenschaftliche Fakultät), Veranstaltung: Datenanalyse 2, Sprache: Deutsch, Abstract: X-Means: Extending K-means with Efficient Estimation of the Number of Cluster
Aufbauend auf k-means greift der x-means Algorithmus die drei hauptsächlichen Probleme von k-means auf und versucht diese zu umgehen bzw. zu beheben. Dabei wird vom Benutzer im Gegensatz zu k-means nicht die Angabe einer Klassenanzahl k gefordert, sondern lediglich ein Bereich in welchem die optimale Klassenanzahl wahrscheinlich liegen wird.
Nun werden ausgehend von der unteren Grenze des angegebenen Bereiches kontinuierlich neue Centroide hinzugefügt. Dies geschieht indem die alten -Vatercentroide- aufgespalten
werden. Aus jedem Vater werden auf diese Weise zwei -Söhnecentroide- erstellt. Ob Vater- oder Söhnecentroide beibehalten werden wird auf Grundlage einer Punktbewertung mittels BIC ermittelt. Je nachdem wessen Punktzahl höher ausfällt, werden entweder die Söhne oder
der Vater als Klassenmittelpunkte verworfen. Danach wird grundsätzlich jenes Gesamtmodell ausgegeben welches nach einem ewertungskriterium die höchste Punktzahl erreicht hat.
Der x-means Algorithmus besteht grundsätzlich aus zwei Schritten:
1. Improve Params
2. Improve Structure
Der erste Schritt entspricht einem herkömmlichen k-means Durchlauf. Der zweite Schritt ermittelt, welche Centroide gesplittet werden müssen um das Ergebnis zu verbessern. Auf dieser Basis und unter Einbeziehung eines kd-tree, welcher die Durchläufe der k-means
Iterationen erheblich beschleunigt, werden sowohl die optimale Anzahl der Cluster wie auch die Cluster als solche ausgegeben. Dadurch wird es möglich viel größere Datenmengen in viel kürzerer Zeit zu analysieren.

Hersteller
GRIN Verlag

-

E-Mail: info@bod.de

Das könnte Sie auch interessieren

Download
10,99
Michael Kölling
Einführung in Java mit Greenfoot
pdf eBook
Download
30,99
Björn Rohles
Mediengestaltung
epub eBook
Download
39,90
Stephan Scheuer
Inside KI
epub eBook
Download
13,99
Michael Kölling
Einführung in Java mit Greenfoot
pdf eBook
Download
30,99
Download
29,99
Johannes C. Hofmeister
Python Alles-in-einem-Band für Dummies
epub eBook
Download
29,99
Robert Gödl
Ubuntu 24.04 LTS Schnelleinstieg
epub eBook
Download
21,99
Wolfgang Jacobsen
Der Sonnensucher. Konrad Wolf
epub eBook
Download
4,99
David Perlmutter
Blöd im Kopf?
epub eBook
Download
5,99