Berichte

Klinische Prüfung von Arzneimitteln: Beurteilung von Studien

Mit "wissenschaftlichen Untersuchungen" kann nicht nur Forschung betrieben werden, sondern auch Augenwischerei. Nicht jede randomisierte, doppelblinde, plazebokontrollierte Studie hält, was der ehrfurchtheischende Titel verspricht, erst recht nicht jede Firmen-Publikation. Doch die Spreu lässt sich vom Weizen trennen - wenn man Grundbegriffe kennt und die richtigen Fragen zu einer Veröffentlichung stellt.

Werbe-, Fach-, Qualitätstitel?

Der erste Hinweis auf die Qualität einer wissenschaftlichen Arbeit ist die Art und das Umfeld ihrer Veröffentlichung. Die Bandbreite der Medien, die sich an ein medizinisch-pharmazeutisches Fachpublikum wenden, reicht von Hochglanzbroschüren, in denen Firmen werben, bis zu internationalen Journals, die Originalarbeiten spezialisierter Forscher publizieren.

Bei der generellen Einschätzung von Fachzeitschriften ist die Fragestellung hilfreich, inwiefern Verlag und Fachblatt sich durch Anzeigen und/oder durch bezahlte (!) Abonnements finanzieren. Als Ergänzung zu Standardtiteln empfahl Dr. M. Zieglmeier, Münchner Krankenhaus-Apotheker, auf einem Fortbildungsseminar der Bayerischen Landesapothekerkammer anzeigenfreie, als kritisch bekannte Medien wie z. B. arznei-telegramm und Arzneimittelbrief.

Einen Anhalt liefert auch der Umfang an industriefinanzierten Sonderheften, die ein Blatt seinen Lesern andient. Sie unterliegen nur einer eingeschränkten redaktionellen Begutachtung. Kritisch zu hinterfragen sind tendenziöse Wertungen und Werbeaussagen in wissenschaftlichen Aufsätzen ebenso wie Werbeartikel, die sich als redaktionelle Seiten tarnen. Zu achten ist auch auf einschlägige Anzeigen in der Nähe der Aufsätze.

Unabhängig vom Medium sollten bei einer ernst zu nehmenden Publikation der Verfasser und seine Anschrift genannt sein und eine Quellen- bzw. Literaturangabe erfolgen. Interessant auch die Frage, ob der Auftraggeber und die Finanzierung der Studie erkennbar sind, z. B. anhand Markennamen und passenden Anzeigen.

Vorausgesetzt, dass man sich als Leser die Intentionen der verschiedenen Publikationen klar macht, tragen alle ihr Scherflein zur Meinungsbildung über ein Arzneimittel oder eine Therapie bei.

Studien: Struktur als Qualitätsmerkmal

Hochwertige Journals (vgl. Kasten) arbeiten mit dem Peer-Review-Verfahren: Eine Arbeit wird erst veröffentlicht, wenn sie durch (weitgehend) unabhängige Experten des Fachgebiets durchgesehen und positiv bewertet wurde. Schlägt man eins dieser weltweit anerkannten Magazine auf, fällt auf, dass wissenschaftliche Originalarbeiten einer klaren Gliederung unterliegen: Am Anfang steht die Zusammenfassung (abstract) der wesentlichen Inhalte. Sie ist nach denselben Hauptpunkten gegliedert wie der Volltext:

  • Einleitung (introduction): Hintergrund der Arbeit (background/context), Zweck der Studie (purpose/objective), exakte Definition der Fragestellung bzw. der zu prüfenden Hypothese.
  • Patienten und Methoden (methods/methodology): Beschreibung von Studienpopulation, Patientenzahl, Ein- und Ausschlusskriterien, Randomisierung, Verblindung (design), Studienorte (setting). Geplante Intervention und deren zeitlicher Ablauf, Endpunkte, statistische Methoden.
  • Ergebnisse (results): Erfolg/Misserfolg der Prüftherapie, Abweichungen vom Studienplan (Begründung!), Zahl der auswertbaren Patienten, Zahl der "drop-outs" (wie viele schieden vorzeitig aus? Begründung!), Ergebnisse oft in Tabellen/Grafiken.
  • Diskussion/Folgerungen (conclusions): Betrachtung der Ergebnisse vor dem Hintergrund der bisherigen Datenlage, klinische Relevanz der Ergebnisse, Schlussfolgerungen.

Qualitäts-Leitlinie für Therapiestudien

Eine ausführliche Beschreibung des Standards der Struktur einer hochwertigen Studie findet sich im CONSORT-Statement (Consolidated Standard of Reporting Trials = Überarbeitete Empfehlung zur einheitlichen Berichterstattung über klinische Studien. Vgl. www.cochrane.de/deutsch/ cccons1.htm).

Die standardisierte Checkliste und das CONSORT-Flussdiagramm (flowchart) dienen als Leitfaden für die Publikation klinischer Therapiestudien. Das CONSORT-Statement wird seit 1996 von namhaften englischsprachigen Zeitschriften zur Begutachtung von Studien und für das peer-reviewing verwendet.

Die wichtigsten Kriterien - und ihre Fallstricke

Ganz oben in der Studien-Hierarchie der evidenzbasierten Medizin (EBM) steht die randomisierte, doppelblinde, kontrollierte Studie (RCT = randomized controlled trial).

  • Randomisierung: Bei der Randomisierung werden die Studienteilnehmer nach dem Zufallsprinzip einer Gruppe (z. B. Verum oder Plazebo) zugewiesen. Das Ziel ist die Beobachtungsgleichheit der Patientengruppen hinsichtlich Alter, Geschlecht, Schwere der Erkrankung, Komorbidität.

    Grundsätzlich hat die Randomisierung bei der Studien-Bewertung einen noch höheren Stellenwert als die Verblindung, betont Professor Joerg Hasford vom Institut für medizinische Informationsverarbeitung, Biometrie und Epidemiologie der Universität München. Der Vorteil der Randomisierung ist, dass auch die noch unbekannten prognostischen Faktoren in ihrer Verteilung nur zufällig zwischen den Behandlungsgruppen variieren. Die Methode reduziert den Selektions-Bias, die Verfälschung von Studienergebnissen durch nicht-zufällige Stichprobenauswahl.

    Die Art der Randomisierung wird leider nicht in allen Studienberichten genau beschrieben: Optimal ist eine zentrale, computergenerierte Zuweisung der Patienten (z. B. "centrally randomised by an interactive voice response system"). Bei Doppelblindstudien sollten die Arzneimittelbehälter fortlaufend durchnummeriert sein ("sequentially numbered"), statt in Gruppe A und B unterteilt zu werden (Entblindung, sobald nur eine Einheit als Plazebo oder Verum identifiziert wurde).

  • Verblindung: Bei einer einfach verblindeten Studie bleibt dem Probanden bzw. Patienten idealerweise verborgen, ob er Verum oder Plazebo bekommt, bei einer Doppelverblindung auch dem Prüfarzt. Die Verblindung soll die Objektivität der Beobachtung erhöhen bzw. erst ermöglichen.

    Eine Verblindung stößt häufiger an ihre Grenzen, als es den meisten Lesern von Studienberichten bewusst ist. In vielen Fällen lässt sie sich gar nicht einwandfrei bzw. durchgängig herstellen. Manche Medikamente wie z. B. Fischöl (Geschmack) und manche Darreichungsformen (intravenös - subkutan - transdermal) lassen sich schwer bzw. gar nicht verblinden. Bei bestimmten Medikationen bleiben dem Patient und/oder Arzt typische Wirkungen oder Nebenwirkungen nicht verborgen. Beispiele: Betablocker verlangsamen den Herzschlag; Acetylsalicylsäure verlängert die Blutungszeit; Zytokine verursachen grippeähnliche Symptome. Dosierungsschemata können bei den verglichenen Medikationen voneinander abweichen (einmal/mehrmals tägliche/wöchentliche Gabe).

    Als Folge dieser systematischen Schwierigkeiten werden manche Studien nicht oder nur teilweise verblindet oder offen durchgeführt. Dies muss also kein Manko sein. Andere Studien werden forsch als doppelblind beworben, moniert Professor Hasford, obwohl bei näherem Hinsehen nur ein Teil der Parameter verblindet wurde - z. B. nur die Untersuchung der Patienten, nicht aber die Verabreichung des Medikaments.

    In manchen Fällen hilft die aufwändige double-dummy-Technik weiter: Dabei wird zu jeder aktiven Substanz ein eigenes, organoleptisch identisches Plazebo entwickelt. Das kann zu einer Vielzahl einzunehmender Tabletten führen, was wiederum die Compliance erschwert.

  • Signifikanz: Ein Ergebnis gilt in der wissenschaftlichen Literatur dann als signifikant, wenn die Wahrscheinlichkeit, dass es sich um einen Zufallsbefund handelt, nicht mehr als 5% beträgt (p < 0,05). Bei Studien mit einem Signifikanzniveau von 5% liefert statistisch eine von 20 Studien reine Zufallsergebnisse!

    Die statistische Signifikanz hat sich zu einem Hauptkriterium für die Akzeptanz einer Studie entwickelt. Dies verstellt nach Meinung nicht weniger Fachleute den Blick auf die Frage, ob mit einem statistisch signifikanten Ergebnis überhaupt irgendeine Frage von Relevanz beantwortet wird.

    Z. B. können in der Primärprävention der koronaren Herzkrankheit bestimmte Lipidsenker hochsignifikant das Cholesterin senken; dennoch steigt bei den so behandelten Patienten die Mortalität. Dies zeigt: Der Cholesterinspiegel ist eine der so genannten Surrogat-Zielgrößen.

  • Surrogat-Zielgrößen: HDL, LDL, Blutdruck, Harnsäure, Knochendichte - das sind Beispiele für Laborwerte oder Befunde, die für einen "harten" klinischen Endpunkt stehen: Lipidwerte und Blutdruck für die Infarkt- und Apoplex-Gefahr, Knochendichte für das Frakturrisiko usw. Dahinter steht die Annahme, dass das Drehen am Surrogatparameter mit einer entsprechenden Veränderung einer für den Patienten wirklich relevanten Zielgröße einhergeht. Dies hat sich nicht selten als Trugschluss erwiesen. Surrogatparameter dienen dennoch oft als Zielgrößen, weil sie schnell und einfach bei jedem Patienten zu messen sind und man eine Veränderung nach kurzer Studienzeit feststellen kann.
  • Patientenrelevante Zielgrößen: Dazu gehören z. B. die Überlebenszeit, die Mortalität, die Morbidität und die Lebensqualität. Sie lassen sich z. T. erst nach Jahren messen, was entsprechende Studien extrem in die Länge zieht.
  • Fallzahl: Die Patientenzahl, die notwendig ist, um zu einem statistisch signifikanten Ergebnis zu kommen, hängt von der Fragestellung ab. An einer Phase-III-Studie, die Wirksamkeit und Unbedenklichkeit eines Arzneistoffs für die Zulassung belegen soll, nehmen meist nicht mehr als 1000 Patienten teil. Bei einer Phase-IV-Studie, die das Gleiche unter Praxisbedingungen untersucht, sind die Patientenzahlen deutlich größer.

    Keine große Studie kann alle ursprünglich eingeschlossenen Patienten (Intention-to-treat) in die Endauswertung hinüberretten. Patienten steigen z. B. wegen Nebenwirkungen oder fehlender Wirksamkeit der Medikation aus oder ziehen ihre Einwilligung in die Studie zurück. Zahl, Gruppenzugehörigkeit und Gründe dieser Studienaussteiger ("drop-out") müssen im Bericht genannt sein.

  • Validität: Eine Studie weist interne Validität auf, wenn die Ergebnisse für die Patienten der Studie zutreffen, und externe Validität, wenn die Ergebnisse so verallgemeinert werden können, dass sie auch für die Routineversorgung gelten. Z. B. haben Therapiestudien mit Statinen mit dem Ausschlusskriterium "Alter über 60 Jahren" streng genommen keine Relevanz für die Patienten, bei denen diese Mittel häufig angewendet werden, bei über 65-Jährigen.

    Quellen

    "Dichtung und Wahrheit - Beurteilung von Studien", Dr. Markus Zieglmeier, Fortbildungs-Seminarreihe der Bayerischen Landesapothekerkammer im Frühjahr 2002. "Doppelblind, randomisiert und signifikant - was klinische Studien aussagen", Vortrag von Prof. Joerg Hasford, München, 23. 4. 2002.

    Kastentext Datenbankrecherche

    Medline www.ncbi.nlm.nih.gov/entrez/query.fcgi Deutsches Institut für Medizinische Dokumentation und Information (DIMDI) www.dimdi.de Universitätsbibliothek Regensburg www.bibliothek.uni-regensburg.de Deutsches Cochrane Zentrum (Verfassen, Aktualisieren und Verbreiten systematischer Übersichtsarbeiten in der Medizin) www.cochrane.de

    Kastentext Beispiele qualitativ hochwertiger Journals

    The New England Journal of Medicine http://content.nejm.org The Lancet www.thelancet.com The British Medical Journal http://bmj.com

    Kastentext Qualitätsmerkmale einer Studie

    Wer eine aussagekräftige Studie erkennen will, sollte sich nicht damit begnügen, dass es sich um eine Erstveröffentlichung in einer anerkannten Zeitschrift handelt. Folgende Fragen zu den einzelnen Bausteinen der Studie schärfen das Verständnis: Abstract: Gegliedert oder ungegliedert? Hintergrund - Studienhypothese - Patienten - Methoden - Ergebnisse - Folgerungen. Methodischer Teil:

    • Kontrollgruppe vorhanden?
    • Randomisierung klar beschrieben?
    • Verblindung sinnvoll und durchführbar?
    • Hinreichend große Patientengruppe?
    • Statistik klar beschrieben?
    • Realistische Ein- und Ausschlusskriterien?
    • Harte Endpunkte oder Ersatz-Zielgrößen?
    • Phase III oder IV der klinischen Prüfung?
    • Realistische Behandlungs-/Beobachtungsdauer?
    • Durchführung in Europa oder Nordamerika (Asiaten weisen partiell andere Stoffwechselvorgänge auf)

    Ergebnisse und Schlüsse:

    • Gruppen vergleichbar (Größe)?
    • Statistisch signifikante Ergebnisse (p m 0,05)?
    • Verzerrende Grafiken?
    • Konsistente Ergebnisse (vereinbar mit Grundlagenwissen)?
    • Differenzierung: efficacy - efficiency - benefit?
    • Aussagen von Relevanz?

    Kastentext Studienarten

    Bei einer kontrollierten Studie wird die zu untersuchende Therapie zeitgleich mit einer oder mehreren Standardtherapien und/oder Plazebo verglichen.

    Prospektive Studien erheben Daten nach der Planung kontinuierlich von Studienbeginn an.

    Retrospektiv bedeutet rückblickende Datenerhebung durch Auswertung von Krankenakten. Cave: Kausale Zusammenhänge können so nicht bewiesen werden (bias).

    Die Anwendungsbeobachtung (AWB) soll Erkenntnisse über zugelassene Arzneimittel im praktischen Einsatz liefern. Mögliche Erkenntnisziele von AWB sind bekannte/unbekannte/seltene Nebenwirkungen, Verordnungsverhalten, Compliance. AWB sind ein Ansatz der Phase-IV-Forschung, aber auch oft Marketinginstrument.

    Multizentrische Studien werden in mehreren Prüfzentren gleichzeitig durchgeführt, heute Standard. Vorteil: Verkürzung der Studiendauer durch höhere Zahl von Patienten/Probanden. Nachteil: Gefahr der Erhöhung von Variablen (bias).

    Crossover-Design für Bioäquivalenz-Studien. Abwechselnde Einnahme von Verum und Plazebo, wodurch jeder Patient seine eigene Kontrolle darstellt. Zwischen dem Medikationswechsel muss eine washout-Phase liegen, um carry-over-Effekte zu vermeiden.

    Die Fall-Kontroll-Studie (case-control-study) dient zur retrospektiven Aufklärung seltener Nebenwirkungen (z. B. Rhabdomyolyse durch CSE-Hemmer). Die Metaanalyse fasst mehrere Originalarbeiten zum selben Thema zusammen und wertet sie statistisch aus, v. a. wenn zur Erzielung einer Evidenz extrem hohe Fallzahlen benötigt werden. Problematisch ist, wenn zusammengefasste Studien methodisch und hinsichtlich der Fragestellung nicht vergleichbar sind.

    Kastentext Tipp für die Recherche

    Fragen Sie die Konkurrenz: Aspekte, die die einen zu einem Arzneimittel oder einer Studie verschweigen, werden die anderen gerne hervorheben.

  • 0 Kommentare

    Das Kommentieren ist aktuell nicht möglich.