Diagnosestudien, Diagnostikstudien, ROC-Analyse Diagnostikstudien, Diagnosestudien, ROC-Analyse

 

Willkommen ! English Version Biometrie & Statistik Schwerpunkt Diagnostik Diagnostikstudien ROC-Analysen Schwerpunkt Labor Statistische Beratung Schwerpunkt Software Referenzen/Projekte Projekte Links Statistiksoftware ACOMED Kontakt / Anfahrt Vorstellung Stellenangebote / Praktika Ablauf / Konditionen Impressum

 

E. Meisel: Der Kuss der Amphibie (www.sum--art.de)
diagnostic likelihood ratios, DLR

Sie befinden sich: Diagnostik . Diagnostische Güte/Diagnostik-Studien

Beurteilung der diagnostischen Güte eines diagnostischen Tests in Diagnostikstudien

Die Maße der diagnostischen Güte

Es sei auf folgendes pdf-Dokument verwiesen, das zudem die Screening-Situation beschreibt: Keller T (2010): Diagnostic accuracy in diagnostic screening trials.

Die Besonderheit einer Diagnostik-Studie

Eine Diagnostikstudie dienen der Untersuchung, Evaluierung, Bewertung diagnostischer Verfahren in der Medizin, wobei die diagnostische Güte Gegenstand des Interesses ist. Bei einer Diagnostikstudie handelt es sich aus zweierlei Gründen um eine besonders interessante und anspruchsvolle Art einer klinischen Studie. Das verwundert zunächst, geht es doch letztendlich nur um die Auswertung einer Vierfeldertafel, in der zwei Zustände des Patienten (krank D+, nicht krank D-) zwei Ergebnissen des diagnostischen Tests gegenübergestellt sind (test positiv T+, test negativ T-).

Interessant an einer Diagnostik-Studie ist zunächst die Planungsseite. Es kommt darauf an, (i) den beabsichtigten Gebrauch (intended use), (b) die klinische Anwendungssituation und (c) die Stelle im diagnostischen Pfad richtig abzubilden. Dies ist schwieriger als gedacht; insbesondere bei der Entwicklung neuer Diagnostika zeigt sich, dass diese Gesichtspunkte bei der Entwicklung vernachlässigt wurden.

Ziele einer Diagnostischen Studie

In der Regel besteht das Ziel einer Diagnostikstudie in der Bestimmung der diagnostischen Güte (zusammen mit dem Konfidenzintervall), wobei die gebräuchlichen Maße die Wertepaare Sensitivität/Spezifität und/oder positiver/negativer Vorhersagewert (Abk.: PPV/NPV) und/oder positives/negatives diagnostic likelihood ratio (Abk: DLR+/DLR-) sind. Besonderes letztere Maße werden zunehmend von den Behörden oder Reviewern angefordert.

Man muss sich im klaren sein, dass der Studienansatz der Bestimmung der diagnostischen Güte explorativ ist. Ein konfirmatorischer Ansatz bestünde in dem prospektiv geplanten Nachweis, dass die diagnostische Güte bestimmte Werte überschreitet (z. B. Nachweis dass Sens>60%, Spez>80%). In der Realität ist auch häufig der Fall anzutreffen, dass der Nachweis zu erbringen ist, dass die Sensitivitä einen bestimmten Wert überschreitet, die Spezifität dagegen einen bestimmten Wert nicht unterschreitet (non inferiority).

Als weiteres Ziel ist der Vergleich diagnostischer Güten verschiedener Diagnostika zu nennen. Hier sind streng genommen 2 Vergleich zu formulieren, je für Sensitivität und Spezifität. Auch hier trifft man häufig auf die Situation, dass nur eines der Maße besser sein soll als für den Vergleichstest, während für das andere Maß lediglich Nichtunterlegenheit gezeigt werden muss. Als Maße für Vergleichstudien bieten sich rTPF (Verhältnis der Sensitivitäten) und rFPF (Verhältnis der falsch-positiv-Raten [=1-Spezifität]) bzw. rPPV (Verhältnis der PPV) und rNPV (Verhältnis der NPV) an.

Weitere Hinweise: Excel-Tool zur Berechnung der Diagnostischen Güte, inkl. diagnostic likelihood ratios DLR, explorativer vs. konfirmatorischer Ansatz, Äquivalenztest.

Verzerrungen in einer Diagnostik-Studie

Ein zweiter wichtiger Punkt sind die Verzerrungen, die bei der Durchführung und Analyse einer Diagnostik-Studie drohen. Im Vordergrund steht hierbei der Selektions-Bias. Beispielsweise wird durch den Ausschluss "unklarer" Fälle, d.h. die Einbeziehung nur "klarer" Fälle, die Realität nicht richtig abgebildet; als Ergebnis wird die diagnostische Güte des Verfahrens überschätzt. Dies betrifft zum einen die Krankheitsgruppe, in der z.B. hohe Stadien überrepräsentiert sind. Aber auch die "Gesundgruppe" ist häufig so gewählt, dass sie "zu gesund" ist, d.h. in der Realität wird ein Diagnostikum zur Unterscheidung zwischen zwei Krankheitszuständen (z.B. Tumor und Entzündung) eingesetzt, und nicht zur Unterscheidung von "krank" und "gesund".

Verzerrungen sind weiterhin häufig mit dem Goldstandard, d.h. der Festlegung der Gruppenzugehörigkeit (D+, D-) eines Patienten, verbunden. Der Goldstandard kann z.B. selbst nur eine eingeschränkte diagnostische Güte aufweisen. Oder er wird für die Gruppen D+ und D- auf unterschiedliche Weise und dadurch ggf. mit unterschiedlicher Qualität bestimmt (Verifikations-Bias).

Planung und Auswertung einer Diagnostik-Studie durch ACOMED statistik

ACOMED statistik hat sich auf die Planung, Durchführung, Analyse und Auswertung von Diagnostikstudien spezialisiert. Neben Standard-Designs hat ACOMED statistik das Know-how für spezielle Methoden zur Evaluierung der diagnostischer Tests aufgebaut.

  • Vergleich der diagnistischen Güte bei Kenntnis des Golddstandards nur für Test-Positive (VOPT-design)
  • Ermittlung der diagnostischen Güte im Multi-Reader-Multicase-design (wichtig für subjektiv beeinflusste Diagnostik, z.B. Bildgebung, Pathologie)
  • Ermittlung von Einflussfaktoren, bzw. Adjustierung der diagnostischen Güte in verallgemeinerten linearen Modellen (GLM).

Literatur zur Diagnostik-Studie

  • Pepe MS (2003): The Statistical Evaluation of Medical Tests for Classification and Prediction. Oxford University Press 2003
    Dieses Buch ist auch Grundlage für diese Präsentation (FDA-Training).

  • Zhou X-H, Obuchowski NA, McClish DK (2002). Statistical Methods in Diagnostic Medicine. Wiley Interscience New York.

  • STARD-Statement (Standards for the Reporting of diagnostic accuracy studies): Obwohl als Richtlinie für die Publikation gedacht, ist das STARD-statement auch ein gutes Planungs-Tool für Studien zur Evaluierung der diagnostischen Güte.

  • Köbberling J, Richter K, Trampisch HJ, Windeler J: Methodologie der medizinischen Diagnostik. Entwicklung, Beurteilung und Anwendung von Diagnoseverfahren in der Medizin. Springer-Verlag Berlin Heidelberg New-York (1991)

  • Köbberling J, Trampisch HJ, Windeler J: Memorandum zur Evaluierung diagnostischer Maßnahmen. Schriftenreihe der GMDS (1989) 10

  • Begg CB: Biases in the Assessment of Diagnostic Tests. Stat. Med. (1987) 6, 411-423

  • Linnet K: A Review on the Methodology for Assessing Diagnostic Tests. Clin. Chem. (1988) 34, 1379-1386

  • In diesem Report weise ich auf Besonderheiten bei der Ermittlung der diagnostischen Güte in Screening-Studien hin: Keller T (2010): Diagnostic accuracy in screening trials. (Interner technischer Report)

 
Diagnostik-Studie
Copyright: ACOMED   
Diagnose-Studie}
Diagnostik-Studie, Diagnose-Studie {short description of image} {short description of image}