Springe auf Hauptinhalt Springe auf Hauptmenü Springe auf SiteSearch

Evidenzbasierte Arbeits­epidemiologie – warum und wie?

Hintergrund

Epidemiologische Primärstudien sind für das Erfassen arbeitsbedingter Risiken und die Untersuchung wirksamer Präventionsmaßnahmen unerlässlich. Aufgrund der unterschiedlichen Forschungsmethoden, der geringen Aussagekraft kleinerer Einzelstudien und der unterschiedlichen Rahmenbedingungen (z. B. betriebliche Settings, Berufe, Länder) sind die Zuverlässigkeit und die Übertragbarkeit (d. h. externe Validität) von Primärstudienergebnissen jedoch oft eingeschränkt. Die Zusammenfassung oder Synthese aller verfügbaren Studienergebnisse ermöglicht eine umfassende Übersicht über die Studienlage sowie Aussagen zu der Zuverlässigkeit der Ergebnisse. Mit systematischen Reviews steht ein Instrument aus der evidenzbasierten Medizin zur Verfügung, mit dem die Wiederholbarkeit und Objektivität der Datensynthese erhöht werden kann (Khan et al. 2013; Higgins et al. 2019).

Systematische Reviews werden unter anderem zur Ableitung von Empfehlungen für medizinische Leitlinien verwendet. Leitlinien mit der höchsten Qualität (S3-Leitlinien) der Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften e. V. (AWMF) beruhen vorwiegend auf den Ergebnissen von systematischen Übersichten (AWMF – Ständige Kommission Leitlinien 2020, s. „Weitere Infos“). Ein arbeitsmedizinisches Beispiel ist die S3-Leitlinie „Gesundheitsüberwachung bei Beryllium-Exposition und diagnostisches Vorgehen bei berylliumassoziierter Erkrankung“ (Euler et al. 2013). Obwohl inzwischen abgelaufen, ist sie bisher die einzige S3-Leitlinie der Deutschen Gesellschaft für Arbeitsmedizin und Umweltmedizin (DGAUM).

Die Erstellung von systematischen Reviews wird auch in § 9 Abs. 1a SGB VII für die Überprüfung von medizinischen Erkenntnissen zu Berufskrankheiten erwähnt. Sie bieten eine fundierte Grundlage für die Ableitung einer Dosis-Wirkungs-Beziehung und die Bestimmung der Verdopplungsdosis, wie sie zuletzt bei Koxarthrose durch Lastenhandhabung (Berufskrankheit [BK] 2116) erfolgte (Ärztlicher Sachverständigenbeirat 2020, s. „Weitere Infos“).

Die zur Festlegung von Expositionsgrenzwerten erforderlichen Dosis-Wirkungs-Beziehungen werden gegebenenfalls auch auf der Grundlage systematischer Überprüfungen epidemiologischer Studien erstellt. Im „Leitfaden zur Quantifizierung stoffspezifischer Expositions-Risiko-Beziehungen und von Risikokonzentrationen bei Exposition gegenüber krebserzeugenden Gefahrstoffen am Arbeitsplatz“ (Arbeitskreis Risikoableitung im UA III des AGS 2013) ist festgehalten, dass epidemiologische Evidenz „… mittels einer strukturierten, systematischen Literatursuche identifiziert und auf ihre Qualität und Eignung für die Risikobewertung geprüft werden“ sollen.

Außerdem erstellt und veröffentlicht die Arbeitsgruppe „Cochrane Work“ hochwertige systematische Reviews zur Prävention von Berufskrankheiten und arbeitsbedingten Erkrankungen sowie Reviews zur Verbesserung der Partizipation oder Gesundheitsförderung am Arbeitsplatz und zur Förderung von Return to Work. Derzeit wird beispielsweise ein Cochrane Review über Maßnahmen am Arbeitsplatz zur Verringerung des SARS-CoV-2-Infektionsrisikos außerhalb von Gesundheitseinrichtungen vorbereitet (Pizarro et al. 2021).

Um systematische Übersichten kritisch zu betrachten, ist es notwendig zu verstehen, wie diese erstellt werden. Selbst ohne die Absicht, eine systematische Überprüfung durchzuführen, kann das Wissen darüber helfen, die methodische Angemessenheit und Vertrauenswürdigkeit von Reviews zu beurteilen.

Durchführung eines systematischen Reviews zu arbeitsmedizinischen Themen

Die meisten evidenzbasierten Forschungsmethoden sind auf den Bereich der Arbeitsmedizin übertragbar. Viele etablierte Methoden zur Durchführung systematischer Reviews, wie beispielsweise im Cochrane-Handbuch (Higgins et al. 2019) beschrieben, wurden ursprünglich für die Untersuchung von klinischen Therapien konzipiert. Auch wurde das etablierte GRADE-Verfahren (Grading of Recommendations Assessment, Development and Evaluation) zur Bewertung der Zuverlässigkeit von wissenschaftlichen Erkenntnissen (Guyatt et al. 2011) und das verbreitete AMSTAR-Tool (A MeaSurement Tool to Assess systematic Reviews) für die Beurteilung der methodologischen Qualität von Reviews (Shea et al. 2017) hauptsächlich für Untersuchungen der Wirksamkeit klinischer Therapien geschaffen. Daher sind diese Instrumente optimal für Reviews von randomisierten kontrollierten Studien (RCT) geeignet. Da RCTs für ätiologische Forschung zu möglichen Gefahrstoffen unethisch sind und RCTs zu beruflichen Interventionen aus organisatorischen Gründen nicht immer durchführbar sind, müssen einige Review-Tools und -Methoden für Beobachtungsstudien angepasst werden.

Ein gemeinsames Merkmal aller systematischen Übersichten, unabhängig vom Forschungsthema, ist jedoch ihr Ablauf (Khan et al. 2013; Higgins et al. 2019). Dies beginnt mit einer klaren und präzisen Forschungsfrage.

Schritt 1: Forschungsfrage definieren

Es wird zuerst eine Forschungsfrage klar und möglichst eindeutig definiert. Dies geschieht mit Hilfe eines PICO(S)- oder PECO(S)-Schemas. Das bedeutet, dass die Fragestellung des systematischen Reviews im Hinblick auf eine (Ziel-)Population
(Patient/Population), eine Intervention oder Exposition, die Vergleichsbedingungen (Comparison) und eine Erkrankung oder Indikation (Outcome) definiert wird. Die Forschungsfrage kann weiter eingegrenzt werden, indem die Art der einbezogenen Studiendesigns (Study Designs) eingeschränkt wird.

Schritt 2: Studienprotokoll erstellen

Um die Objektivität und Transparenz des Review-Prozesses zu erhöhen, sollte ein Studienprotokoll erstellt und bekannt gemacht werden. Das Protokoll legt vorab fest, wie die einzelnen Phasen des Reviews durchgeführt werden. Zum Beispiel wird im Studienprotokoll dargelegt, wie die Studien ausgewählt werden (z. B. welche Sprachen einbezogen werden), wie das Risiko einer Verzerrung bewertet und wie eine Metaanalyse durchgeführt wird. Die Prospero-Datenbank bietet zum Beispiel eine kostenlose Plattform für die Registrierung und Mitteilung von Review-Protokollen (Booth et al. 2012, 2013).

Schritt 3: Systematische Suche nach Literatur

Anschließend werden Forschungsdatenbanken nach Veröffentlichungen durchsucht. Die Entwicklung eines Suchstrings für die Suche in Literaturdatenbanken ist eine Wissenschaft für sich. Suchstrings bestehen aus Suchbegriffen (Keywords) in Kombination mit Booleschen Operatoren (AND, OR, NOT) und sind oft so aufgebaut, dass Begriffsgruppen dem PICO(S)- oder PECO(S)-Schema zuzuordnen sind. Es können bereits veröffentlichte Suchstrings für berufsbezogene Studien (Mattioli et al. 2010, 2013) und Studien zur Luftverschmutzung (Curti et al. 2016) herangezogen werden. Der Suchstring kann auch so konstruiert werden, dass er eher sensitiv oder spezifisch ist. Es ist nicht ungewöhnlich, Tausende von Treffern zu finden.

Nachdem mehrere Fachdatenbanken (z. B. Pubmed, Embase, Web of Science) durchsucht wurden, ist es sinnvoll, Expertinnen und Experten zu kontaktieren und Datenbanken für „graue Literatur“ zu durchsuchen, um Studien zu finden, die nicht in peer-reviewed Fachzeitschriften veröffentlicht wurden. Die Referenzlisten der eingeschlossenen Studien sollten nach weiteren relevanten Studien durchsucht werden. Darüber hinaus können neuere Studien gefunden werden, indem eine Vorwärtssuche aller eingeschlossenen Volltexte oder Schlüsselstudien mit der „Citation Tracking“-Funktion von Google Scholar oder Web of Science durchgeführt wird.

Nach dem Zusammentragen und Entfernen doppelter Treffer in einer Literaturverwaltungssoftware prüfen zwei oder mehr unabhängige Reviewerinnen und Reviewer die Titel und Abstracts nach geeigneten Artikeln. Anschließend werden die Volltexte daraufhin geprüft, ob die im Vorfeld festgelegten Einschlusskriterien erfüllt werden. Die Gründe für den Ausschluss von Volltexten sind festzuhalten und zu dokumentieren.

Schritt 4: Daten extrahieren

Relevante Studienmerkmale müssen kurz und präzise aus den Studien extrahiert und in Evidenztabellen gesammelt werden. Diese Tabellen fassen grundlegende Studienmerkmale zusammen, wie Autorin/Autor, Veröffentlichungsjahr, Studiendesign, Setting (Region, Beruf), Populationsgröße, Antwortrate, Intervention oder Expositionsbewertung, Ergebnisbestimmung sowie die wichtigsten Studienergebnisse. Da dieser Schritt anfällig für menschliche Fehler ist, ist es am besten, wenn er von zwei Personen unabhängig voneinander durchgeführt wird. Beim Vergleich der Ergebnisse können Fehler aufgedeckt und behoben werden.

Schritt 5: Studienqualität und ­Verzerrung der Studien beurteilen

Das Verzerrungsrisiko der eingeschlossenen Studien sollte bewertet werden. Es gibt verschiedene Checklisten (Marshall et al. 2021, s. „Weitere Infos“), die eine konsistente Bewertung des Verzerrungsrisikos unterstützen. Qualitäts-Scores, wie die Newcastle-Ottawa Scale (Wells et al., o. J.) stehen auch zur Verfügung, aber es hat sich gezeigt, dass die Gesamtbewertung eine geringe Zuverlässigkeit und eine geringe Interrater-Übereinstimmung aufweist (Stang 2010; Hartling et al. 2013; Lo et al. 2014). Deshalb ist die Angabe der einzelnen Verzerrungsquellen, wie beim Cochrane Risk of Bias (das zur Berücksichtigung von Verzerrungen in RCTs verwendet wird), vorzuziehen (Higgins et al. 2019). Die Beurteilung der Gesamtverzerrung einer Studie kann anhand einer Vorauswahl der wichtigsten Verzerrungsquellen und Kriterien für die jeweilige Forschungsfrage erfolgen. Die Verzerrung der Studienergebnisse sollte bei der qualitativen Zusammenfassung und gegebenenfalls bei der statistischen Zusammenführung der Ergebnisse berücksichtigt werden.

Schritt 6: Qualitative beziehungsweise quantitative Datensynthese

Die Zusammenfassung der Ergebnisse muss zumindest auf der qualitativen Ebene erfolgen. Dabei werden die Ergebnisse der Studien ohne Datenanalyse zusammengefasst, betrachtet und beschrieben.

Wenn die Studienmerkmale und Analysemethoden der Einzelstudien weitgehend zusammenpassen, kann eine Metaanalyse durchgeführt werden. Stark vereinfacht kann man sich eine Metaanalyse als einen gewichteten Mittelwert der Studienergebnisse vorstellen. Dabei werden die einzelnen Studien entweder mit dem Kehrwert der studieninternen („within-study“) Varianz gewichtet („fixed effects“) oder mit dem Kehrwert der studieninternen plus der studienübergreifenden („between-study“) Varianz („random effects“). Fixed-Effect-Modelle gehen davon aus, dass die einzelnen Studien dieselbe Population beschreiben, während Random-Effect-Modelle von unterschiedlichen Studienpopulationen ausgehen. Daher werden Random-Effect-Modelle häufiger angewendet. Das Buch „Introduction to Meta-Analysis“ von Borenstein et al. (2009) bietet eine klare Einführung in die Statistik anhand einfacher Beispiele. Die Ergebnisse werden dann in Form eines Forest Plot grafisch dargestellt. Für die Durchführung von Metaanalysen und die zahlreichen damit verbundenen Analysen (z. B. Funnel Plots zur Publikationsverzerrung) und Erweiterungen (Metaregression) stehen inzwischen zahlreiche Statistikprogramme zur Verfügung (Borenstein et al. 2009).

Schritt 7: Evidenzlage betrachten und interpretieren

Zur Interpretation und Beurteilung der Zuverlässigkeit der zusammengefassten Studienergebnisse müssen viele Merkmale der einbezogenen Studien berücksichtigt werden. Unter anderem müssen die Anzahl und Größe der Studien, die Art der Studien, das Risiko einer Verzerrung in den einzelnen Studien sowie die Stärke des beobachteten Effekts und die Heterogenität der Studien berücksichtigt werden. Die GRADE-Methode bietet eine strukturierte Methode zur transparenten Beurteilung der Evidenzzuverlässigkeit (Guyatt et al. 2011).

Reporting Guidelines

Obwohl die Review-Schritte im Allgemeinen dieselben sind, ist eine gewisse Variation in ihrer Umsetzung möglich. Um Transparenz zu gewährleisten ist es wichtig, dass jede methodische Entscheidung erläutert und gemäß den Reporting-Richtlinien, wie PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses; Moher et al. 2009) und MOOSE (Meta-analysis Of Observational Studies in Epidemiology; Stroup et al. 2000), dargelegt wird.

Variationen von systematischen Reviews

Es gibt verschiedene Arten von systematischen Reviews. Die „(plain) vanilla“-Version von systematischen Reviews versucht, alle verfügbare Literatur zu einer bestimmten Forschungsfrage zusammenzufassen. Bei den so genannten Scoping-Reviews hingegen sind die Forschungsmethoden eher explorativ und die Forschungsfragen weniger spezifisch (Tricco et al. 2016). Um zum Beispiel die gesamte Bandbreite der Literatur zu einer Exposition zu erfassen, kann die Forschungsfrage in Bezug auf die betrachteten Outcomes offengelassen werden. Scoping-Reviews sind nützlich, um Forschungsdefizite zu identifizieren und Hypothesen zu generieren. Diese Art von Review kann, muss aber nicht unbedingt eine Bewertung der methodischen Qualität und des Verzerrungsrisikos beinhalten.

Eine andere Variante des systematischen Reviews, das Rapid Review, wird seit Beginn der COVID-19-Pandemie häufig angewandt. Dabei handelt es sich gewissermaßen um die „abgespeckte“ Version eines systematischen Reviews. Die Bestandteile des Reviews bleiben dieselben, aber vordefinierte Kompromisse reduzieren den Zeit- und Personalaufwand für die Durchführung. Während zum Beispiel viele Review-Schritte normalerweise von zwei bis drei unabhängigen Personen durchgeführt werden sollten, kann bei einem Rapid Review nur eine Teilstichprobe (z. B. 20%) doppelt gesichtet werden. Das kürzlich veröffentlichte Manuskript von Seidler et al. (2021) stellt Empfehlungen für die standardisierte Durchführung eines Rapid Review vor.

Die Metaebene von systematischen Übersichten umfasst Übersichten von Übersichten, auch bekannt unter den Begriffen Umbrella-Reviews, Reviews of Reviews, Overviews und Meta-Reviews (Pollock et al. 2021). Viele Forschungsthemen sind wiederholt mit systematischen Reviews untersucht worden, und diese Übersichtsarbeiten fassen die Reviews anstelle von Primärstudien zusammen. Für den Bereich der Arbeitswelt wurden von der Occupational Safety and Health (OSH) Evidence Arbeitsgruppe der Partnership for European Research in Occupational Safety and Health (PEROSH) Empfehlungen für die Durchführung von Reviews of Reviews (OSH Evidence Group 2014, s. „Weitere Infos“) und eine Online-Sammlung von Reviews zu Themen der Sicherheit und Gesundheit bei der Arbeit (OSH Evidence Group, o. J.) erstellt.

Diskussion und Fazit

Systematische Reviews sind eine wertvolle Forschungsmethode, die es ermöglicht, mehrere Einzelstudien zu kombinieren und einen umfassenden Überblick über die Evidenz zu gewinnen. Weil so viele Schritte des Review-Prozesses die Beurteilung der beteiligten Wissenschaftlerinnen und Wissenschaftler erfordern, ist Transparenz eines der wichtigsten Qualitätsmerkmale eines systematischen Reviews. Daher ist ein vor Beginn der Überprüfung veröffentlichtes Protokoll ein wesentliches Qualitätsmerkmal für eine Überprüfung. Die ausführliche Dokumentation des Review-Prozesses trägt zur Objektivität des Reviews bei und ermöglicht die Reproduzierbarkeit im Falle späterer Aktualisierungen.

Verbreitete Instrumente zur Bewertung der Qualität von Übersichten, wie AMSTAR 2, wurden in erster Linie zur Evaluierung von Reviews entwickelt, die Interventionsstudien untersuchen (Shea et al. 2017). Für die Bewertung von Reviews über Beobachtungsstudien sind Anpassungen oft erforderlich. Alternativ kann auch das ROBIS-Tool verwendet werden (Whiting et al. 2016). Woodruff und Sutton (2014) haben in einem „Navigation Guide“ die besten Vorgehensweisen (Best Practices) für die Synthese von Forschungsergebnissen im Bereich Umwelt und Gesundheit beschrieben. Die erläuterten Vorgehensweisen sind weitgehend auch auf die Forschung in der Arbeitsmedizin übertragbar. Der „Navigation Guide“ enthält auch eine Reihe von Empfehlungen, die die GRADE-Bewertungsmethoden erweitern und zusätzliche Regeln für die Einstufung von Beobachtungsstudien zu Umweltexpositionen festlegen (Lam et al. 2016). Die Anwendung dieser Regeln erfordert eine gewisse Abwägung, da zum Beispiel die pauschale Definition einer beträchtlichen Effektgröße möglicherweise nicht für alle Expositionen geeignet ist.

Auch die auf Tierversuchen basierende Forschung kann von einer systematischen Synthese profitieren. Allerdings werden diese Methoden bei Tierversuchen bisher seltener angewandt. Vergleiche der systematischen Forschung an Tieren und Menschen zeigen, dass die Erkenntnisse aus Tierversuchen nicht immer auf den Menschen übertragbar sind (Perel et al. 2007).

Ausblick

Zunehmend steht Software für die Durchführung systematischer Reviews zur Verfügung. Im Internet wird eine Toolbox für systematische Reviews angeboten (Marshall et al. 2021, s. „Weitere Infos“). Hier kann nach digitalen Hilfsmitteln gesucht werden, die bei den verschiedenen Schritten des systematischen Review-Prozesses eingesetzt werden können. Künstliche Intelligenz und maschinelles Lernen beginnen bereits, den mühsamen Prozess der Sichtung zahlreicher Titel und Abstracts zu übernehmen (van de Schoot et al. 2021).

Interessenkonflikt: Die Autorinnen geben an, dass keine Interessenkonflikte vorliegen.

Literatur

Borenstein M et al.: Introduction to meta-analysis. Hoboken: John Wiley, 2019.

Higgins JP et al.: Cochrane handbook for systematic reviews of interventions. Hoboken: John Wiley, 2019.

Khan KS et al.: Systematische Übersichten und Meta-Analysen: ein Handbuch für Ärzte in Klinik und Praxis sowie Experten im Gesundheitswesen. Berlin: Springer, 2013.

Mattioli S et al.: Search strings for the study of putative occupational determinants of disease. Occup Environ Med 2010; 67: 436–443.

Moher D et al.: Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. PLoS Med 2009; 6: e1000097.

Seidler A et al.: Rapid Reviews in Zeiten von COVID-19 – Erfahrungen im Zuge des Kompetenznetzes Public Health zu COVID-19 und Vorschlag eines standardisierten Vorgehens. Gesundheitswesen 2021; 83: 173–179.

doi:10.17147/asu-1-166772

Weitere Infos

Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF) – Ständige Kommission Leitlinien (2020). AWMF-Regelwerk „Leitlinien“. Marburg
http://www.awmf.org/leitlinien/awmf-regelwerk.html

Ärztlicher Sachverständigenbeirat: Empfehlung des Ärztlichen Sachverständigenbeirats „Berufskrankheiten“ – Koxarthrose durch Lastenhandhabung, Bek. d. BMAS v. 25.03.2020 – IVa 4-45226-2 – Koxarthrose – GMBl. 25.03.2020, S. 218–227
https://www.baua.de/DE/Angebote/Rechtstexte-und-Technische-Regeln/Beruf…

Marshall C et al.: The Systematic Review Toolbox. 2021
http://www.systematicreviewtools.com/

OSH Evidence Group (2014). Clearinghouse of Systematic Reviews – Methods, Partnership for European Research in ­Occupational Safety and Health (PEROSH), 2014
https://perosh.eu/wp-content/uploads/2013/06/PEROSH-Clearinghouse-Metho…

Kernaussagen

  • Systematische Übersichten von arbeitsepidemiologischen Studien, die den Qualitätsstandards der evidenzbasierten Medizin genügen, bieten eine sehr gute Basis für Empfehlungen in der arbeitsmedizinischen Praxis.
  • Bei der Erstellung systematischer Reviews kann man auf geeignete Handbücher und Guide­lines zurückgreifen.
  • Auch für die kritische Bewertung von Übersichtsarbeiten stehen entsprechende Qualitäts­bewertungsinstrumente zur Verfügung.
  • Koautorin

    An der Erstellung des Beitrags beteiligt war Dr. Uta Wegewitz, Gruppe 3.5 „Evidenz­basierte Arbeitsmedizin, Betriebliches Gesundheitsmanagement““, Fachbereich 3 „Arbeit und Gesundheit“, Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA), Berlin.

    Kontakt

    Dr. rer. biol. hum. Janice Hegewald M.Sc.
    Fachbereich 3 „Arbeit und Gesundheit“; Bundesanstalt für Arbeitsschutz und Arbeitsmedizin;  (BAuA)Nöldnerstraße 40/42; 10317 Berlin

    Foto: Stephan Wiegand

    Das PDF dient ausschließlich dem persönlichen Gebrauch! - Weitergehende Rechte bitte anfragen unter: nutzungsrechte@asu-arbeitsmedizin.com.

    Jetzt weiterlesen und profitieren.

    + ASU E-Paper-Ausgabe – jeden Monat neu
    + Kostenfreien Zugang zu unserem Online-Archiv
    + Exklusive Webinare zum Vorzugspreis

    Premium Mitgliedschaft

    2 Monate kostenlos testen