ROC-Kurve erstellen
Beispieldatensatz ladenUm eine ROC-Kurve online zu erstellen kopiere einfach deine Daten in die obere Tabelle und wähle eine Test und eine Zustandsvariable aus. Anschließend kannst du dann noch den Wert der State Variable angeben, für den die ROC-Kurve erstellt werden soll.
Dann wird dir die ROC-Kurve online ausgegeben und du kannst die Koordinaten ablesen.
Receiver-Operating-Characteristic-Kurve
Eine ROC-Kurve (Receiver Operating Characteristic) ist eine grafische Darstellung der Leistung eines binären Klassifizierungssystems, wenn die Unterscheidungsschwelle variiert wird. Die ROC-Kurve stellt die Rate der echten positiven Ergebnisse (Sensitivität) gegen die Rate der falschen positiven Ergebnisse (1-Spezifität) bei verschiedenen Schwellenwerten dar.
Die ROC-Kurve ist ein nützliches Instrument zur Bewertung der Leistung eines Klassifizierers, da sie unabhängig von der Klassenverteilung ist und eine visuelle Darstellung des Kompromisses zwischen der Rate der echten Positiven und der Rate der Falsch-Positiven bietet.
Die Fläche unter der ROC-Kurve (AUC) ist ein häufig verwendetes Leistungsmaß für binäre Klassifizierungsprobleme. Die AUC reicht von 0 bis 1, wobei ein perfekter Klassifikator eine AUC von 1 hat. Ein zufälliger Klassifikator hat eine AUC von 0,5. Je näher die AUC bei 1 liegt, desto besser kann der Klassifikator zwischen den beiden Klassen unterscheiden.
Wann wird eine ROC-Kurve verwendet?
In der Praxis wird die ROC-Kurve häufig verwendet, um den optimalen Schwellenwert für einen binären Klassifikator auszuwählen. Bei einem Klassifikator, der hohe Richtig-Positiv-Raten (hohe Sensitivität) anstrebt, liegt der Schwellenwert beispielsweise näher bei Null, während bei einem Klassifikator, der niedrige Falsch-Positiv-Raten (hohe Spezifität) anstrebt, der Schwellenwert näher bei 1 liegt.
Zusammenfassend lässt sich sagen, dass die ROC-Kurve ein leistungsfähiges Instrument zur Bewertung der Leistung von binären Klassifikatoren ist. Sie bietet eine visuelle Darstellung des Kompromisses zwischen wahrer Positivrate und Falschpositivrate, und der AUC ist ein nützliches Leistungsmaß. Außerdem ist sie nützlich, um den optimalen Schwellenwert für einen binären Klassifikator auszuwählen.