(Receiver-Operating-Characteristics) geben einen Überblick über
Sensitivität und Spezifität eines
diagnostischen Tests. In ihnen werden
für verschiedene Cut-Off-Werte (möglich:
auch jeden Messpunkt) Sensitivität und Spezifität
gegeneinander aufgetragen.
Abb.:
ROC-Kurve für die CEA-Werte von Patienten mit
Bronchialkarzinim bzw. benignen Lungenerkrankungen (gleiche
Datengrundlage wie bei den Abbildungen zur Seite "Cut-Off-Werte").
Angegeben sind die ROC-Kurve (Kreise), eine Trendkurve unter
Annahme der Normalverteilung der Daten (blaue Kurve), das obere
und untere Konfidenzband(95%) der ROC-Kurve (gestrichelte Linien,
punktweise Vertrauensbereich entsprechend Binomialverteilung)
sowie die Diagonale (graue Linie).
Der diagnostische
Test weist Trennschärfe auf, wenn sich die Kurve signifikant
von der Diagonalen (links unten - rechts oben) unterscheidet. Im
Idealfall (100%ige Trennschärfe) liegt die Kurve auf der
linken bzw. oberen Begrenzungs-Seite des umschließenden
Quadrates.
Ein Maß für die Güte
des Tests ist die Fläche unter der ROC-Kurve (AUC: Area Under
Curve). Die Fläche kann Werte zwischen 0,5 und 1 annehmen,
wobei ein höherer Wert die bessere Güte anzeigt. AUC
berechnet man am einfachsten mit der Trapezmethode, die im
allgemeinen die Fläche gut abschätzt.
Weitere Hinweise zur ROC-Kurve (vgl.
auch Link-Seiten):
Die Fläche unter den
ROC-Kurven folgen der selben Statistik wie nichtparametrische,
vergleichende Rang-Tests (Wilcoxon-Statistik). Die Signifikanz
einer AUC ggü. der Diagonalen ist also einfach mit den üblichen
Tests (Mann-Whitneys U-Test) auszurechnen. Auch die AUC (vgl. ROC-Tool 1) lässt
sich direkt aus dieser Statistik schätzen: AUC=U/(N1*N2),
U- Testgröße der Wilcocon-Statistik, N1 und N2 -
Gruppenumfänge).
Deshalb sind ROC-Kurven nicht
nur für quantitative Merkmale geeigent, sondern auch für
qualitative Merkmale, die sich ordnen lassen (Ordinalskala), wie
z.B. Befunde von Röntgenbildern, Scores etc.
Vergleich von ROC-Kurven
(Test auf Unterschied von AUC, vgl. ROC-Tool 2) sind komplex. Entscheidend ist
zunächst, ob die ROC-Kurven am selben Patientengut erhoben
wurden oder nicht (verbundene vs. nicht verbundene Stichproben).
Bei sich überschneidenden ROC-Kurven ist es sinnvoll, sie
z.B. nur in einem ausgewählten Spezifitätsbereich zu
vergleichen.
Ein Ausweg ist die Verwendung
von Vierfelder-Tafeln für entweder gleiche Spezifitäten
oder Sensitivitäten (Die Werte für Sens oder Spez müssen
aber prospektiv ausgewählt sein). Diese Tafeln kann man
dann mit Hilfe des McNemar-Tests (verbundene Stichprobe) oder
des Chi2-Tests (unverbundene Stichprobe)
vergleichen.
Will man den Wert der Durchführung
eines zusätzlich zu einem Test T1 durchgeführten
diagnostischen Tests (T2) einschätzen, so vergleicht man
die ROC-Kurven von T1 mit T2a (= T1+T2) mit Hilfe der
angegebenen Verfahren.
Die Betrachtung des Anstieges
einer ROC-Kurve ist zur Bestimmung des Cut-Off-Wertes
hilfreich (vgl. dort Verfahren 3).
Sie können im
WEBSHOP
von ACOMED statistik Excel-Tools für ROC-Kurven (Excel 2000 und jüngere
Versionen) zum Selbstkosten-Preis erwerben. Weitere Informationen zu den Tools.