Äquivalenztest, Aequivalenz-Tests, Equivalence tests Equivalence tests in diagnostic studies

 

Willkommen ! English Version Biometrie & Statistik Schwerpunkt Diagnostik Schwerpunkt Labor Statistische Beratung Statistik-Seminare Median / robuste MW Arten von Studien Multiples Testen Schwerpunkt Software Download Web-Shop Referenzen/Projekte ACOMED Kontakt / Anfahrt Vorstellung Stellenangebote / Praktika Ablauf / Konditionen Datenschutz Impressum

 

Äquivalenztest, Aequivalenz-Tests, Equivalence tests

Sie befinden sich: Statistikberatung - Statistiktipps - Äquivalenztests

Statistikberatung - Statistiktipps: Äquivalenz-Tests

Link zu Excel-tools TOST

Link zur Downloadseite mit 2 TOST-Excel-tools (Vergleich von 2 Stichproben, Vergleich einer Stichprobe mit 0, jeweils Äquivalenzansatz) inkl. Fallzahltabellen.

Das Äquivalenzproblem

Der Nachweis der Gleichheit von Eigenschaften zweier Gruppen oder der Nachweis, dass eine Differenz = 0 ist, sind gar nicht so selten Gegenstand von klinischen Studien oder Experimenten: So soll z.B. gezeigt werden, dass eine kostengünstigere Therapie genauso wirksam ist wie eine kostenintensive, dass sich ein bestimmtes physiologisches Merkmal in zwei Gruppen nicht unterscheidet, oder dass in einer Robustheitsuntersuchung sich die Messwerte nicht wesentlich ändern. Der klassische Untersuchungsgegenstand ist die Bioäquivalenzprüfung bei Arzneimitteln. Hier wird untersucht, ob sich die durch eine Fläche charakterisierten Zeitkurven des Blutgehaltes von zwei verschiedenen Verabreichungsformen eines Arzneimittels nicht unterscheiden.

Bei Methodenvalidierungsexperimenten geht es häufig darum, nachzuweisen, dass eine Zielgröße =0 ist. Z. B. kann es bei einem Methodenvergleich das Ziel sein, zu zeigen, dass der Bias (=systematische Fehler) der Test-Methode gegenüber einer Vergleichsmethode vernachlässigbar (=0) ist. Oder bei einer Robustheits- bzw. Stabilitätsuntersuchung ist zu zeigen, dass keine relevanten Änderungen auftreten.

Das häufig anzutreffendee Vorgehen:"Der t-Test (oder auch c2-Test, Mann-Whitney-U-Test usw.) liefert keinen signifikanten Unterschied, also sind die Gruppen bzgl. des untersuchten Merkmals gleich" greift zu kurz. Ein solches Ergebnis ist zwar ein Anhaltspunkt, aber kein Nachweis. Denn es handelt sich um Signifikanztests, mit denen die Ablehnung der - die Gleichheit besagende - Nullhypothese nachgewiesen wird, nicht deren Annahme.

Insbesondere dann, wenn das Hauptziel eines Projektes im Nachweis einer Äquivalenz besteht, sind die entsprechenden Tests angebracht: die Äquivalenztests. Wie auch bei den Tests zum Nachweis von Unterschieden gibt es bei den Äquivalenztests je nach der untersuchten Größe (z.B. Mittelwerte, Verhältnisse, Varianzen) entsprechende Vorgehensweisen.

Nichtunterlegenheitsproblem (non inferiority)

Es sei kurz auf ein verwandtes Problem hingewiesen, der Nachweis der Nichtunterlegenheit. Dies wird betrachtet, wenn Äquivalenz nur in eine Richtung von Interesse ist (keine Verschlechterung), aber eine Überlegenheit (und damit Abweichung von der Äquivalenz in eine Richtung) kein Problem oder sogar gewünscht ist. Ein Beispiel ist der Nachweis des fehlenden Carry-Overs bei Analysern in der Laboratoriumsmedizin: hier interessiert nur, dass Proben mit einer hoher Konzentration nicht zu fälschlich erhöhten Werten von später gemessenen Proben führen (z. B. in Folge von Verschleppung). Ein anderes Beispiel ist der Vergleich von Nebenwirkungen, diese sollten im Vergleich nicht häufiger anzutreffen sein, ein geringeres Auftreten ist dagegen kein Problem.

Vorgehen beim Äquivalenztest

Ausgangspunkt eines Äquivalenztests ist das Auffassen der Äquivalenz als Differenz mit der Größe 0 im Idealfall, real wird aber ein gewisser Bereich zugelassen, innerhalb dessen eine Differenz nicht relevant ist. Es wird also ein um 0 liegender Äquivalenzbereich festgelegt (Äquivalenzlimits), innerhalb dessen sich zwei Merkmale höchstens unterscheiden dürfen. (Bemerkung: Ähnlich des Differenzbereiches kann man auch ein Verhältnisbereich verwenden, der um 1 liegen soll.)

Entsprechend kann man auch den Quotienten zweier Größen verwenden: dann ist ein Verhältnis=1 Ausdruck der Äquivalenz. Eine Anwendung ist der Nachweis der Äquivalenz der diagnostischen Güte zweier diagnostischer Tests: Die Äquivalenz von Sensitivität und/oder Spezifität wird über die Ratios rTPF (Verhältnis der "true positive fractions" TPF, TPF=Sensitivität) und rFPF (Verhältnis der "false postive fractions" FPF, FPF=1-Spezifität).

Festlegung der Äquivalenzlimits

Das Hauptproblem bei der Durchführung der Äquivalenztests ist die prospektive(!) Festlegung der Äquivalenzlimits. Zunächst: dies ist eine inhaltliche und keine statistische Fragestellung. Trotzdem nimmt die Festlegung der Äquivalenzlimits breiten Raum in der statistischen Beratung ein. Breite Bereiche haben einen geringeren Stichprobenumfang zu Folge, und der Nachweis gelingt leichter. Andererseits kann die Validität des Nachweises eingeschränkt sein, und er wird z. B. von den Behörden nicht akzeptiert.

Man kann sich dieser Frage nähern durch folgende Betrachtungen:
Welcher Unterschied ist nicht relevant?
"A difference that makes no difference."
Was ist die minimal interessierende Differenz (MID)?
Wie groß ist die Messunsicherheit oder die biologische Variabilität?
Geht es z. B. ganz banal um Schuhgrößen zweier Gruppen, die äquivalent sein sollen, so sollten sich die Fußgrößen weniger unterscheiden als die Differenz zwischen zwei benachbarten Schuhgrößen.

Durchführung des Äquivalenztests

Nach der Festlegung der Äquivalenzlimits gibt es zwei Herangehensweisen. Zum einen werden - wie von den o. g. Tests her bekannt - Null- und Alternativhypothesen aufgestellt, nur dass sie umgekehrt formuliert werden, und dass es zwei Nullhypothesen gibt: Die Nullhypothesen besagen, dass die Differenz der Merkmale unterhalb bzw. oberhalb des Äquivalenzbereiches liegt. Die Alternativhypothese nimmt dagegen die Lage der Differenz innerhalb des Bereiches an. Werden beide Nullhypothesen mit einer vorgegebenen Irrtumswahrscheinlichkeit a abgelehnt, gilt die Äquivalenz als nachgewiesen.
Erfolgen die Nachweise anhand von Mittelwerten von Verteilungen, die nicht wesentlich von der Normalverteilung abweichen, so kommt mit dem TOST eine spezifische Form des t-Testes zur Anwendung (two-one-sided t-tests, Schuirmann 1987).

Die andere Herangehensweise benutzt (1-2*a)-Vertrauensbereiche (Konfidenzintervalle). Für die Daten wird der Vertrauensbereich der Differenz der Gruppen bzgl. des Merkmals ermittelt. Liegt der Vertrauensbereich/das Konfidenzintervall vollständig im vorgegebenen Bereich zwischen den Äquivalenzlimits, so ist die Äquivalenz nachgewiesen. Folgende Abbildung zeigt das Vorgehen:

Aequivalenz-Test unter Verwendung der Konfidenzintervalle

TOST Two-One-Sided-t-Tests

Mittlerweile wird der Begriff TOST oft als Synonym für Äquivalenztests generell verwendet, obwohl er sich streng genommen auf t-Tests und Mittelwertvergleiche bezieht ("Two-One-Sided-t-Tests"). In vielen Softwareprogrammen ist nun der TOST zu finden. Unter dem Begriff TOST wird der Äquivalenz-Test-Ansatz mitverstanden.

Auf der Downloadseite können Sie 2 TOST-Excel-tools (Vergleich von 2 Stichproben, Vergleich einer Stichprobe mit 0, jeweils Äquivalenzansatz) inkl. Fallzahltabellen laden.

Zum Schluss sei das Vorgehen beim Nachweis der Äquivalenz der Mittelwerte X und Y zweier Gruppen mit der gleichen Standardabweichung s und den Stichprobenumfängen N1 und N2 angegeben. Zunächst wird der Differenzbereich festgelegt, der von -D bis +D reichen soll. Dann wird das (1-2a)-Konfidenzintervall nach der Formel
KIunten, oben = X-Y ± t1-a, N1+N2-2·s·Wurzel(1/N1+1/N2)
berechnet. Die Größe t (Quantile der zentralen t-Verteilung) entnimmt man der Tabelle eines Statistikbuches oder verwendet die MS-EXCEL-Funktion TINV. Wenn gilt
-D < KIunten < KIoben < +D
ist die Äquivalenz nachgewiesen.

Literatur

Schuirmann DJ. A Comparison of the Two One-Sided Tests Procedure and the Power Approach for Assessing the Equivalence of Average Bioavailability. J of Pharmacokinetics and Biopharmaceutics 1987; 15(6): 657-680

Rasch et al. (1998): Verfahrensbibliothek, Band II, S. 686 ff., R. Oldenbourg Verlag München Wien

Pepe MS (2003): The Statistical Evaluation of Medical Tests for Classification and Prediction. Oxford University Press 2003

Hier können Sie Tools zum Nachweis der Äquivalenz zweier Mittelwerte, bzw. eines Mittelwertes mit dem Wert 0 (jeweils TOST, inkl. Tabellen zum Stichprobenumfang), sowie zur Berechnung der Konfidenzintervalle von rTPF und rFPF, laden.

ROC curve, ROC curves, DAC method
Copyright: ACOMED   
Äquivalenztest, Aequivalenz-Tests, Equivalence tests
Äquivalenztest  Equivalence tests Aequivalenz-Tests}