Für eine optimale Nutzung besuche DATAtab bitte auf deinem Desktop-PC!

Berechne:
Metrische Variablen:

How-to

Hierarchische Clusteranalyse Rechner

Wenn du eine hierarchische Clusteranalyse berechnen möchtest, kopiere einfach deine Daten in die obere Tabelle und wähle eine oder mehrere metrische Variablen aus. Zusätzlich kannst du noch die Spalte mit den Labels auswählen.

Hierarchische Clusteranalyse Rechner

Eine hierarchische Clusteranalyse verwendest du dann, wenn du Daten clustern möchtest, ohne die Anzahl der Cluster im Voraus zu kennen. Mithilfe der hierarchischen Clusteranalyse kannst du dann die Abstandsbeziehungen zwischen den Daten visualisieren.

Für die Berechnung der hierarchischen Clusteranalyse können verschiedene Verknüpfungsmethoden und Distanzen verwendet werden. Bei den Verknüpfungsmethoden und Distanzen stehen zur Auswahl:

  • Verknüpfungsmethoden: Single-linkage, Complete-linkage, Average-linkage,
  • Distanzen: Euklidisch, Manhattan, Maximum

Was ist eine Hierarchische Clusteranalyse

Die hierarchische Clusteranalyse (HCA) ist eine Clustermethode, die einen hierarchischen Baum oder ein Dendrogramm der zu clusternden Objekte erstellt. Dieser Baum stellt die Beziehungen zwischen den Objekten dar und zeigt, wie die Objekte auf verschiedenen Ebenen zu Clustern zusammengefasst werden.

Im Vergleich zu der k-means Clusteranalyse muss bei der hierarchischen Clusteranalyse die Anzahl der Cluster nicht im Vorhinein vorgegeben werden.

Es gibt zwei Hauptarten des hierarchischen Clusterns: agglomerativ und divisiv. Beim agglomerativen Clustering werden die Objekte zunächst als einzelne Cluster behandelt und dann im Laufe der Analyse zu größeren Clustern zusammengeführt. Beim divisiven Clustering werden die Objekte zunächst als ein einziges Cluster behandelt und dann im Laufe der Analyse in kleinere Cluster aufgeteilt.

Wie wird eine Hierarchische Clusteranalyse berechnet?

Bei der Erstellung des Dendrogramms wird zunächst eine Abstandsmatrix zwischen allen Objektpaaren berechnet. Aus dieser Distanzmatrix wird dann eine Verknüpfungsmatrix erstellt, die Informationen über den Abstand zwischen den Clustern in jeder Phase der Analyse enthält. Die Verknüpfungsmatrix wird dann zur Erstellung des Dendrogramms verwendet, das zeigt, wie die Cluster miteinander in Beziehung stehen.

Wann wird eine Hierarchische Clusteranalyse verwendet?

Die HCA ist in vielen Bereichen nützlich, zum Beispiel in der Biologie, im Marketing und in den Sozialwissenschaften. In der Biologie kann sie verwendet werden, um Muster in genetischen Daten zu erkennen. Im Marketing kann sie verwendet werden, um Kunden in verschiedene Gruppen einzuteilen. In der Sozialwissenschaft kann man damit Muster in Umfragedaten erkennen.

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz