Doppelblindversuch

„Goldstandard“ der Medizin ist die doppelblinde, randomisierte (und damit kontrollierte) klinische Prüfung, die sich durch drei Punkte auszeichnet (Friedmann LM, Furberg CD, DeMets DL: Fundamentals of clinical trials. 3. ed. New York: Springer 1998): 1) Sie ist doppelblind, womit ein Untersucher-Bias verhindert werden soll. 2) Sie ist randomisiert, das heißt, die Einteilung in Gruppen erfolgt zufällig. Auf dieser zufälligen Einteilung basiert die gesamte Inferenzstatistik, die als Nullhypothese annimmt, dass sich die Gruppen nicht – oder nur durch Zufall – unterscheiden. 3) Sie ist kontrolliert, das heißt, neben der Gruppe, die eine zu prüfende Therapie erhält, gibt es mindestens eine zweite, die alternativ behandelt wird, sodass nur der „Nettoeffekt“ gemessen wird. Vor allem die letzten beiden Punkte sind die Gründe dafür, warum in einer randomisierten klinischen Studie unspezifische Faktoren nicht bestimmt und berücksichtigt werden müssen: Auf alle Behandlungsgruppen wirken die gleichen unspezifischen Faktoren; der einzige Unterschied liegt in der Therapie.

In randomisierten, doppelblinden Wirksamkeitsstudien wird die mit der zu prüfenden Intervention behandelte Gruppe mit einer Kontrollgruppe verglichen, die typischerweise Plazebo erhält. Die Zuordnung zu den Gruppen erfolgt nach einem Zufallsprinzip, das vor Beginn der Studie festgelegt wird. Sofern es sich um eine Indikation handelt, für die bereits Therapieoptionen verfügbar sind, so wird abhängig von der medizin-ethischen Vertretbarkeit die Prüfmedikation (Verum bzw. Plazebo) als „add-on“ adjuvant zur etablierten Therapie appliziert oder im drei- oder mehrarmigen Vergleich mit Plazebo einerseits und der etablierten Therapie andererseits verglichen.

Evidenz-basierte Medizin, wie vom Gesetzgeber gefordert, ist unverzichtbar auf randomisierte, doppelblinde Wirksamkeitsstudien mit Parallelgruppenvergleich angewiesen. Sie ist eine notwendige, wenn auch noch nicht unbedingt hinreichende Bedingung. Nur so kann beurteilt werden, ob eine zu prüfende Intervention anderen oder bisherigen Verfahren überlegen ist. Statistisch signifikant bedeutet aber noch lange nicht immer klinisch relevant.

Die randomisierte klinische Studie ist in der Medizin der Goldstandard, so wie allgemein das Experiment in der Naturwissenschaft. Er ist nicht ohne weiteres in allen Bereichen der Medizin anwendbar, stellt aber trotzdem ein Ideal dar, an dem sich andere Modelle messen sollten. Rosenthal- und Hawthorne-Effekt werden kontrolliert, weder Arzt noch Proband weiß, ob er in der Experimental- oder Kontrollgruppe ist.

Der Arzt weiß ob die Kontrollgruppe ein Placebo erhält, Kontrollgruppe weiß es nicht-> Blindversuch

Weder Arzt noch Patient wissen, wer Placebo und wer Wirkstoff bekommt-> Doppelblindstudie.

Versuchspersonenfehler (Hawthorne-Effekt): Die Versuchspersonen verhalten sich anders, weil sie wissen, dass sie beobachtet werden.

Versuchsleitereffekt (Rosenthaleffekt): Die Erwartung des Versuchsleiters bestimmt dessen Wahrnehmung und Verhalten. Damit verfälscht das Ergebnis in Richtung der Erwartung des Versuchsleiters durch Suggestionseinflüsse od. durch Beurteilungsfehler.

Gründe warum auch gut durchgeführte Doppelblindstudien nicht immer auf den Alltag übertragbar sind: Wenn der Durchschnittspatient einer Studie von einem Medikament profitiert, muss das nicht bedeuten, dass der durchschnittliche Patient in einer Allgemeinpraxis von der selben Behandlung profitiert. Nicht immer sind die Ergebnisse auf alle Altersgruppen übertragbar. Sehr junge und alte Patienten sind in den Studien oft unterrepräsentiert. Das selbe gilt manchmal für die Übertragung der Ergebnisse auf das andere Geschlecht, in manchen großen Studien sind Frauen oder Männer unterrepräsentiert. In Studien sind möglicherweise schwerer oder leichter Kranke als in der klinischen Praxis untersucht worden. Oft sind die Probanden in Studien sonst gesund. Die Ergebnisse lassen sich nicht unbedingt auf die meist multimorbiden Patienten in der klinischen Praxis übertragen. Die Studiendauer ist meist kurz in Relation zu den meist chronischen Gesundheitsproblemen, die in der Praxis behandelt werden müssen. Die Langzeiteffektivität bleibt oft ebenso offen, wie die Langzeitnebenwirkungen. Seltene Nebenwirkungen können in Studien nicht eindeutig der Behandlung zugeordnet werden. Wechselwirkungen zu anderen Medikamenten werden oft erst im Verlauf durch die Erfahrung mit einem Medikament beurteilbar. Komplexe Einnahmebedingungen wie beispielsweise Resorption (Aufnahme) des Medikamentes nur auf nüchternen Magen oder im Zusammenhang mit einer Mahlzeit sind in der Praxis oft schwerer durchzuhalten als in einer Studie. Studienärzte unterscheiden sich von Praktikern ebenso wie Studienpatienten von Patienten in der Praxis. Doppelblindstudien sind teuer, meist betragen die Kosten mehrere Millionen Euro, diese hohen (nicht selten auch bürokratisch bedingten) Kosten bedingen oft zu kurze Behandlungszeiten, und führen dazu, dass es oft lange dauert, bis unabhängige andere Untersucher eine Studie replizieren. Michael Rawlins (NICE): Harveian Oration, De testimonio: on the evidence for decisions about the use of therapeutic interventions Lancet 2008; 372: 2152–61

 

Quellen / Literatur:

siehe auch unter Bias Kohorte Randomisieren Validität Tests (psychologische) Testgütekriterien

Dr. Johannes Werle

Dr. med Johannes Werle

Redakteur