Für eine optimale Nutzung besuche DATAtab bitte auf deinem Desktop-PC!
Hier auf DATAtab kannst du einen CHAID (Chi-square Automatic Interaction Detectors) Entscheidungsbaum ganz einfach online erstellen. Um einen CHAID Tree zu berechnen, wähle einfach eine abhängige Variable und mindestens zwei unabhängige Variablen aus.
Der Chaid decision Tree ist ein Algorithmus, aus dem Maschinellen lernen. Bei diesem Entscheidungsbaum wird ein Chi-Quadrat-Test verwendet, um die Signifikanz eines Merkmals zu berechnen. Der CHAID algorithmus erstellt Entscheidungsbäume für Klassifizierungsprobleme. Das bedeutet, dass nur Datensätze mit einer kategorialen Variablen verwendet werden können.
Der CHAID Entscheidungsbaum Rechner berechnet für jeden Knoten mehrere Chi-Quadrat Tests aus und nimmt dann für die nächste Ebene die Variable, die den höchsten Chi-Quadrat Wert hat.
Um ein Beispiel für Daten zu geben, die sich für die Erstellung eines CHAID-Entscheidungsbaums (Chi-squared Automatic Interaction Detection) eignen, betrachten wir ein hypothetisches Szenario zur Vorhersage der Kündigung von Kunden bei einem abonnementbasierten Dienst. Hier ist ein Beispieldatensatz:
CHAID-BeispieldatenIn diesem Datensatz steht jede Zeile für einen Kunden, und die Spalten stellen verschiedene Attribute oder Merkmale der Kunden dar. Die Spalte " Kündigung " zeigt an, ob der Kunde gekündigt hat oder nicht.
Mit diesen Daten kannst du einen CHAID-Entscheidungsbaum erstellen, um die Faktoren oder Kombinationen von Faktoren zu ermitteln, die am stärksten mit der Kündigung von Kunden verbunden sind. Der Entscheidungsbaum würde helfen, Muster und Beziehungen zwischen den unabhängigen Variablen (z. B. Alter, Geschlecht, Dauer des Abonnements, Zahlungsmethode und monatliche Nutzung) und der abhängigen Variable ("Kündigung") zu erkennen.
Baumbasierte Lernalgorithmen gelten als eine der besten und am häufigsten verwendeten überwachten Lernmethoden, da sie Modelle mit hoher Genauigkeit, Stabilität und einfacher Interpretation ermöglichen.
Beim CHAID Entscheidungsbaum steht ganz oben die abhängige Variable, z.B. ob eine Person ein Produkt kauft oder nicht. Für die nächste Reihe wird dann diejenige Variable ausgesucht, die den größten Einfluss auf die abhängige Variable hat. Anschließend werden die jeweiligen Ausprägungen dieser Variable zur neuen abhängigen Variable und das Verfahren wird wiederholt.
In dem CHAID-Entscheidungsbaum-Algorithmus wird die Chi-Quadrat Statistik verwendet, um für die abhängige Variable die Variable aus den unabhängigen Variablen zu finden, die den größten Chi-Quadrat Wert hat.
Nachdem die abhängige Variable gefunden wurde, die den größten Einfluss auf die abhängige Variable hat, werden die Ausprägungen dieser Variable zur neuen abhängigen Variable.
Eine klassisches Anwendungsgebiet des Entscheidungsbaumes ist die Kundensegmentierung und Chaid kann als alternative zur Kreuztabellen verwendet werden. Der Vorteil ist, dass die erstellten Tabellen gleich strukturiert in einem Baum dargestellt werden und die Auswertung damit leicht fällt.
DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de