|
Willkommen ! English Version Biometrie & Statistik Schwerpunkt Diagnostik ROC- u. DAC-Analysen u.a. Schwerpunkt BE/PK/Tox Schwerpunkt Labor Schwerpunkt Beratung Schwerpunkt Software Referenzen/Projekte Projekte Referenzen Veröffentlichungen Links Statistiksoftware ACOMED Kontakt / Anfahrt Vorstellung Stellenangebote / Praktika Ablauf / Konditionen Impressum
|
Anhand dieser Tafel lassen sich spalten- und zeilenweise je die Verhältnisse der Einzelzellen zu den Summen bilden. Die Sensitivität ermittelt den Anteil der richtig Positiv erkannten Patienten zu allen Kranken (rp/(rp+fn), die Spezifität den Anteil der Richtig negativ erkannten Patienten an den Nicht-Kranken (rn/(rn+fp)). Sensitivität und Spezifität sind die Größen, die die Entwickler und Hersteller bei der Bewertung ihrer diagnostischen Tests verwenden können. Die Vorhersagewerte (zeilenweise Betrachtung) betrachten dagegen die Wahrscheinlichkeit, dass der Patient tatsächlich den Zustand aufweist, den der Test anzeigt (positiver Vorhersagewert: rp/(rp+fp), negativer Vorhersagewert: rn/(rn+fn). Die Vorhersagewerte beschreiben damit die Sicht des Arztes, dem das Testergebnis vorliegt. Er kann mit diesen Werten das Testergebnis hinsichtlich seiner Relevanz einschätzen. Excel-Tool: Sensitivität, Spezifität, PPV, NPV für Vierfeldertafel, mit Konfidenzintervall Special report: Measure of diagnostic accuracies in screening trials Wie sollten Sie vorgehen, wenn Sie einen diagnostischen Test untersuchen und bewerten wollen? Es werden 4 Phasen unterschieden: Phase I: In einer Technischen Voruntersuchung wird die Methode untersucht. Diese Validierung der Messeigenschaften, z.B. Richtigkeit und Präzision, gibt Aussagen zur Güte der Methode. Weitere Hinweise zur Methodenvalidierung. Phase II: Untersuchung der Messwerte auf Verteilungsunterschiede zwischen verschiedenen Patientengruppen. Damit wird eine Aussage über das Potential des Tests möglich. In Phase-II-Studien gehen Patienten ein, für die die Diagnose bereits feststeht. Die Fallzahl je Gruppe orientiert sich nicht an der Prävalenz der Erkrankung, sondern an statistischen Erwägungen. Beispiel: Für eine Phase-II-Studie zum diagnostischen Potential eines Tumormarkers werden 150 Patienten mit einem histologisch nachgewiesenen Tumor und 100 Patienten mit einer entzündlichen Erkrankung am betreffenden Organ (Tumorausschluss bereits erfolgt) einbezogen. In diesem Fall ist es wichtig, die Blutentnahme vor Therapiebeginn vorzunehmen, da eine Therapie den Tumormarkergehalt beeinflusst. Bei der Patientenauswahl sollten ferner verschiedene Erkrankungs-Stadien, verschiedene Begleiterkrankungen sowie verschiedene deomografische Faktoren berücksichtigt werden. Eine Phase-II-Studie erlaubt Aussagen zum Zusammenhang zwischen Sensitivität und Spezifität des Tests anhand einer ROC-Kurve (ROC: receiver operating characteristics). Zur Ermittlung wird der Cut-Off-Punkt über den Wertebereich des diagnostischen Tests variiert. Entsprechend ändern sich die Verhältnisse bzgl. der Zahlen rp, fp, fn und rn. Es ergibt sich eine Kurve der folgenden Art: Es gilt: Je größer der Abstand des Bogens von der Diagonale des Quadrates, desto besser der Test. Dagegen erlaubt die Phase-II-Studie nicht die Festlegung von Cut-Off-Werten oder von Vorhersagewerten. Phase-II-Studien haben damit den Charakter von explorativen Vorstudien, die dazu dienen, weitergehende Studien zu begründen. Weitere Hinweise zum Unterschied explorative / konfirmatorische Studien. Beispiel: Bei manchen neu entwickelten Tests für Tumorerkrankungen werden auf Kongressen oder in Veröffentlichungen die Ergebnisse an der malignen Gruppe Ergebnissen einer Gesundgruppe gegenübergestellt. In der Praxis muss der Arzt aber zwischen einer benignen Erkrankung, Entzündung o.a. und einer Tumorerkrankung zu unterscheiden. In dieser Konstellation verschwindet dann meist die diagnostische Trennschärfe der angepriesenen Tests. Dieses Beispiel leitet über zur Phase-III-Studie: In einer kontrollierten diagnostischen Studie wird der Test in der spezifischen klinischen Anwendungssituation beurteilt. Eine Phase-III-Diagnosestudie stößt an die Grenzen einer Promotionsarbeit - ist doch der Aufwand beträchtlich und der Ausgang ungewiss. Entscheidend ist der prospektive Ansatz: Alle Patienten mit einem Erkrankungsverdacht werden in die Studie einbezogen, der Krankheitsstatus ist noch nicht bekannt. Dies entspricht genau der Situation, in der der Test in der diagnostischen Routine eingesetzt werden würde. Das diagnostische Prozedere zum Nachweis der Erkrankung bzw. zu ihrem Ausschluss muss genau definiert und anerkannt sein (golden standard). Beispiel: Um einen Herzinfarktmarker bei niedergelassenen Allgemeinmedizinern zu evaluieren, sind alle Patienten, die mit einem gewissen Beschwerdenbild auffallen (Bsp.: Atembeklemmungen, unklare Beschwerden im Brustbereich, charakteristische Störungen des EKG) in die Studie einzubeziehen. Es ist zu erwarten, dass ein Test, der beispielsweise in Herzzentren erfolgreich eingesetzt wird, bei Anwendung in der niedergelassenen Praxis eine ganz andere Performance aufweist, da das Patientengut sich völlig anders zusammensetzt und sich die Prävalenz der Zielkrankheit unterscheidet. In Phase-III-Studien können Cut-Off-Werte festgelegt werden, was schwieriger ist als gemeinhin angenommen. Da es immer eine Überlappungszone ("Grauzone") gibt, in der der Test gleiche Ergebnisse für Kranke und nicht Kranke ergibt, gilt es Abwägungen vorzunehmen: Sind eher falsch positive oder falsch negative Einordnungen als günstig zu bewerten? Weitere Hinweise zur Festlegung von Cut-Off-Werten. Phase IV-Studien untersuchen den therapeutischen Nutzen eines Tests und beantworten Fragen wie diese:
Phase-IV-Studien sind in ihrer Durchführung komplex, und auf eine weitere Darstellung soll hier verzichtet werden. Zum Schluss noch Hinweise zu zwei systematischen Fehlern, die neben anderen Fehlern bei der Evaluierung diagnostischer Tests auftreten können und zu Verzerrungen (Bias) führen. Selection bias: Eine wesentliche Verzerrung ist zu erwarten, wenn der golden standard ein invasives Verfahren ist. Dies wird dann nämlich nur bei den Testpositiven eingesetzt, während bei Testnegativen darauf verständlicherweise verzichtet wird. Es ist eine Überschätzung der Sensitivität zu erwarten. Information bias: Die Kenntnis des Testresultates des zu untersuchenden Tests beeinflusst das Ergebnis des Außenkriteriums. Dies ist insbesondere bei Verfahren zu erwarten, bei denen Befunde interpretiert werden müssen (bildgebende Verfahren). Literatur:
|
|
||||||||||||||||||||||
| Copyright: ACOMED | |
|||||||||||||||||||||||