Das PDF dient ausschließlich dem persönlichen Gebrauch! - Weitergehende Rechte bitte anfragen unter: nutzungsrechte@asu-arbeitsmedizin.com.
doi:10.17147/asu-1-411954
AI-based assessment of dermal exposure – preprocessing of fluorescence images for improving the results of convolutional neural networks
AI-supported image analysis is used to quantify dermal exposure to hazardous substances and thus support risk assessment. We thereby compare how well models perform when the images have been preprocessed. The article provides an overview of the current research results and outlines perspectives for further research.
KI-basierte Bewertung dermaler Exposition – Vorverarbeitung von Fluoreszenzbildern zur Verbesserung der Ergebnisse von Convolutional Neural Networks
KI-gestützte Bildanalyse wird eingesetzt, um die dermale Exposition gegenüber Gefahrstoffen zu quantifizieren und somit bei der Gefährdungsbeurteilung zu unterstützen. Dabei wird verglichen, wie leistungsstark Modelle performen, wenn die Bilder zuvor vorverarbeitet worden sind. Der Artikel gibt einen Überblick über die aktuellen Forschungsergebnisse und die sich daraus ergebenden Perspektiven für zukünftige Forschung.
Kernaussagen
Motivation
Die Bewertung der dermalen Exposition gegenüber Gefahrenstoffen und die Entwicklung und Validierung von entsprechenden Modellen sind ein wichtiges Thema sowohl für die Arbeitsschutzforschung als auch für die Chemikalienregulation. Trotz umfangreicher Maßnahmen durch Arbeitsschutzfachleute (Levy 2004) bleiben chemische Gefahren am Arbeitsplatz ein erhebliches Risiko für die Gesundheit der Beschäftigten (Rim u. Lim 2015). Die Herausforderung bei der Entwicklung und Validierung von Modellen bildet dabei vor allem der Mangel an fundierten Daten, um solche Modelle zu erstellen. Hinzu kommen unterschiedliche Expositionssituationen sowie verschiedene Methoden zur Datenerfassung. Bisherige Expositionsstudien der dermalen Exposition gegenüber Chemikalien befassten sich im Allgemeinen hauptsächlich mit einem Vergleich von Messmethoden herkömmlicher Probenahmeverfahren (vgl. Gorman Ng et al. 2014). Für die Ermittlung der Höhe der dermalen Exposition werden drei Probenahmeprinzipien unterschieden: sammelnde Verfahren, entfernende Verfahren und In-situ-Methoden (s. ➥ Tabelle 1; Kasiotis et al. 2020). Die sammelnden, entfernenden Verfahren und die In-situ-Methode zählen zu den traditionellen Methoden zur Messung der Exposition, sind zeitaufwendig und erfordern chemische Analysen. Eine weitere In-situ Auswertungsmethode erstellt Fluoreszenzaufnahmen vor und nach verschiedenen Tätigkeiten mit Chemikalien und wertet die Bilder durch die Helligkeitsanalyse der einzelnen Pixel aus (Franken et al. 2021). Eine vielversprechende Erweiterung dieser Methode stellt die Auswertung von Fluoreszenzaufnahmen mittels künstlicher Intelligenz (KI) dar, um aus den Pixelintensitäten ein Maß für die chemische Belastung der Haut zu bestimmen. In der hier vorgestellten Machbarkeitsstudie wird untersucht, inwieweit die Vorverarbeitung der Fluoreszenzbilder die Auswertung durch Convolutional Neural Networks (CNN) im Vergleich zu den unbearbeiteten Originalaufnahmen verbessert.
Experimentelle Methoden
Für unsere Machbarkeitsstudie wurde ein Teil des Fluoreszenzbilderdatensatzes aus dem Forschungsprojekt „Systematische Untersuchung der dermalen Exposition gegenüber Gefahrstoffen am Arbeitsplatz (SysDEA)“ der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA) verwendet. Ziel der SysDEA-Studie war es, durch präzise und reproduzierbare Experimente bestehende Verfahren zur Messung der Hautexposition systematisch zu vergleichen, ihre Anwendung zu optimieren und Standards für deren Einsatz zu entwickeln (Franken et al. 2021). Die gesammelten Daten sollten genutzt werden, um die Vor- und Nachteile der Messmethoden darzustellen, die beste Methode für bestimmte Aufgaben zu ermitteln und die Unterschiede in den gemessenen Hautexpositionen zwischen verschiedenen Verfahren zu analysieren (Kasiotis et al. 2020).
Im Forschungsprojekt SysDEA wurden die drei traditionellen Methoden zur Messung der dermalen Exposition gegenüber Chemikalien verglichen. Bei den sammelnden Verfahren wurden Schutzanzüge, sogenannte Patches, Handschuhe und Kopfbänder verwendet, um Chemikalien abzufangen (Kasiotis et al. 2020). Ergänzend kamen entfernende Verfahren zum Einsatz, bei denen Chemikalien durch Händewaschen oder das Abwischen von der Haut erfasst wurden (Kasiotis et al. 2020). Schließlich wurde eine In-situ-Methode angewendet, bei der die eingesetzte Fluoreszenzchemikalie mittels UV-Licht auf der Haut sichtbar gemacht, fotografiert und mittels Bildauswertung quantifiziert wurde (Franken et al. 2021).
In ihrer Studie untersuchten Kasiotis et al. (2020) fünf verschiedene Aufgabengruppen sowie drei unterschiedliche Stoffe. Die Anzahl der Versuche und der analytische Aufwand wurden so gewählt, dass ein effizienter Vergleich der Messmethoden ermöglicht werden konnte. Die Aufgaben umfassten Expositionssituationen wie das Gießen, Rollen, Sprühen, Tauchen und Hantieren mit Gegenständen, die zuvor in flüssige Formulierungen eingetaucht waren, sowie das Auskippen und den Umgang mit Gegenständen, die mit Pulver kontaminiert worden waren. Die praktischen Versuchsbedingungen wurden anhand von Pilotversuchen optimiert, so dass sie als aussagekräftig für eine Vielzahl von häufig ausgeführten Aufgaben im Umgang mit Chemikalien betrachtet werden können. Jede dieser Expositionssituationen wurde insgesamt viermal von vier Testpersonen durchgeführt, Vor- und Rückansicht der kontaminierten Person fotografiert und die entsprechenden Expositionswerte chemisch-analytisch ermittelt. Somit umfasste der Originaldatensatz 320 Einzelexperimente, in denen Expositionsmessungen an Körper, Händen und Kopf erfasst wurden (Kasiotis et al. 2020).
Erste quantitative Auswertungen der
Fluoreszenzaufnahmen waren nur bedingt erfolgreich (Franken et al. 2021), weshalb die KI-basierte Bewertung hier als weitere Methode der Auswertung untersucht werden soll. Der Einsatz von maschinellem Lernen, also KI, bietet großes Potenzial, die Grenzen klassischer Bildverarbeitungsmethoden zu überwinden. Damit ein Modell jedoch präzise Ergebnisse liefern kann, ist eine ausreichende Datenmenge erforderlich, mit der das Modell trainiert werden kann.
Die für die Machbarkeitsstudie verwendeten Bilddaten stammen aus einem Teildatensatz des im Rahmen des SysDEA-Projekts generierten Datenbestands, der Bild- und Expositionsdaten umfasst. Die Merkmalsverteilungen in den Bilddaten der verschiedenen Tätigkeiten zeigen jedoch erhebliche Varianz, was die Entwicklung eines universellen Modells erschwert. Zudem ist der Datensatz zu klein für ein umfassendes Training und eine generalisierbare Modellierung. Deshalb ist es sinnvoller, einzelne tätigkeitsbezogene KI-Modelle zu entwickeln. Da im Rahmen der SysDEA-Studie die Pulver- und Sprühexperimente mit der dort entwickelten In-situ-Methode zuverlässig erfasst und analysiert werden konnten, liegt der Schwerpunkt der KI-gestützten Analyse auf den Roll- und Tauchexperimenten mit Flüssigkeiten, deren komplexe Muster mit der bisherigen Methode nur unzuverlässig interpretiert werden konnten (Franken et al. 2021).
Die Bilder aus den Roll- und Tauchexperimenten wurden zunächst einer Vorverarbeitung unterzogen. Verschiedene morphologische Bildverarbeitungsoperatoren (s. ➥ Tabelle 2) wurden in MATLAB implementiert und ermöglichten eine klare Segmentierung der auf den Bildern abgebildeten Personen von ihren Hintergründen (vgl. ➥ Abb. 1, Bild 2). Zusätzliche Schwellenwertsetzungen (Thresholding) erlaubten zudem die gezielte Extraktion der Fluoreszenzmuster aus den Bildern (vgl. Abb. 1, Bild 3).
Im Folgenden werden diese Merkmalsbilder zur Vereinfachung als verarbeiteter Datensatz bezeichnet.
Anschließend dienten sowohl der Originaldatensatz als auch der verarbeitete Datensatz dazu, zwei mehrschichtige Convolutional Neural Networks (CNN) in Python zu trainieren und deren Modellgüte mittels des Bestimmtheitsmaßes zu evaluieren. Das Bestimmtheitsmaß (R²) ist eine statistische Kennzahl zur Beurteilung der Anpassungsgüte eines Regressionsmodells. Es kann Werte zwischen 0 und 1 annehmen, wobei ein R² von 0 auf keinerlei Erklärung der Varianz durch das Modell hinweist, während ein R² von 1 eine vollständige Erklärung bedeutet (Fahrmeir et al. 2024). Ein hohes Bestimmtheitsmaß ist jedoch kein ausreichender Indikator für die Modellgüte, da es auch auf eine Überanpassung (Overfitting) hinweisen kann. Overfitting beschreibt eine Situation, in der ein Modell die Trainingsdaten zu genau lernt und dadurch unwichtige Details oder Rauschen mit einbezieht, was seine Fähigkeit zur Generalisierung auf neue, unbekannte Daten verschlechtert.
Die Experimente wurden auf einem System mit einer NVIDIA RTX 3080 Ti Mobile GPU mit 16 GB VRAM, einem Intel 12th Gen Core i7-12700H (14 Kerne, 20 Threads) und 64 GB DDR4 RAM (3200 MHz) ausgeführt. Das Betriebssystem war Ubuntu 20.04. Dank des leistungsstarken Rechners mit großem Arbeitsspeicher und moderner Grafikkarte konnte eine Batchgröße von 20 Bildern festgelegt werden. Die Batchgröße, also die Anzahl der Bilder, die das Modell gleichzeitig verarbeitet, beeinflusst dabei die Effizienz und Geschwindigkeit des Trainingsprozesses erheblich.
Ergebnisse und Diskussion
Zur Auswertung der Modellperformance wurde das Bestimmtheitsmaß ermittelt. Der Originaldatensatz erzielte ein Bestimmtheitsmaß von R2 = 0,28. Das Bestimmtheitsmaß des verarbeiteten Datensatzes betrug R2 = 0,76. Die Vorverarbeitung der Bilder führte durch die gezielte Extraktion der Fluoreszenzmuster zu einer Informationsreduktion. Das Modell war dadurch besser in der Lage, sich nur auf die relevanten Muster für die Bestimmung der Expositionshöhe zu fokussieren und somit bessere Werte zu ermitteln.
Neben Einschränkungen der Modellleistung, wie zum Beispiel einer unzureichenden Datenbasis oder nicht-optimalen Parametern im Trainingsprozess, beeinflussen weitere Faktoren die Zuverlässigkeit der Auswertung. Die zur Verfügung stehende Rechenkapazität kann die Leistungsfähigkeit des Modells erheblich beeinflussen. Es muss also anhand der Rechenleistung abgewogen werden, welchen Umfang die Batchgröße haben darf, um eine durch das Modell effiziente Merkmalsextraktion zu gewährleisten. Durch die Vorverarbeitung der Bilder findet eine Informationsreduktion vor der Modellbildung statt. Durch diese Informationsreduktion können bei nicht ausreichender Rechenkapazität gute KI-Modellleistungen erzielt werden, da die irrelevanten Daten nicht verarbeitet werden müssen.
Ein Ansatz für künftige Forschung könnte darin bestehen, die Anzahl der parallel verarbeiteten Bilder, also der Batchgröße, zu reduzieren, auch wenn dies längere Rechenzeiten erfordert, um die Modellleistung weiter zu verbessern. Des Weiteren kann die unzureichende Datenbasis durch synthetische Daten erweitert werden, um die Genauigkeit des CNN weiter zu erhöhen. Diese künstlich erzeugten Daten können entweder durch Bearbeitung der Originaldaten oder anhand bekannter Eigenschaften neu erstellt werden. Der Nachteil bei diesem Vorgehen besteht darin, dass Informationen zur Exposition auf den synthetischen Bilddaten bereits bekannt sein und geeignete Methoden zur Reproduktion angewendet werden müssen. Die Verwendung synthetischer Daten bietet jedoch den Vorteil, Verzerrungen oder Inkonsistenzen im ursprünglichen Datensatz auszugleichen und so eine vollständigere Grundlage für das Modelltraining zu schaffen.
Interessenkonflikt: Das Autorenteam gibt an, dass keine Interessenkonflikte vorliegen.
Literatur
Brouwer DH et al: Assessment of dermal exposure during airless spray painting using a quantitative visualisation technique. Ann Occup Hyg 2000; 44: 543–549.
Fahrmeir L et al.: Statistik: Der Weg zur Datenanalyse. 9. Aufl. Berlin, Heidelberg: Springer Spektrum, 2024.
Fenske RA, Birnbaum SG: Video-Imaging-Technik der zweiten Generation zur Bewertung der dermalen Exposition (VITAE-System). Am Ind Hyg Assoc J 1997; 58: 636–645.
Franken R et al: Prediction of dermal exposure to chemical substances using a fluorescence method within the SysDEA project. Ann Work Expo Health 2021; 65: 668–681.
Gorman Ng M, Milon A, Vernez D, Lavoué J: A web-based tool to aid the identification of chemicals potentially posing a health risk through percutaneous exposure. Ann Occup Hyg. 2015; 60: 276–289.
ISO: ISO/TR 14294:2011: Workplace atmospheres – Measurement of dermal exposure – Principles and methods. Geneva, Switzerland: International Organization for Standardization, 2011.
Kasiotis KM et al: Comparison of measurement methods for dermal exposure to hazardous chemicals at the workplace: the SysDEA Project. Ann Work Expo Health 2020; 64: 55–70.
Levy L: Chemical hazards in the workplace: an overview. Occup Med (Lond) 2004; 54: 67–68.
Rim K-T, Lim C-H: Chronic inhalation/carcinogenicity studies and their applications to prevent occupational cancers: a review of recent reports. Toxicol Environ Health Sci 2015; 7: 171–183.
Soille P: Morphologische Bildverarbeitung: Grundlagen, Methoden, Anwendung. 1. Aufl. Berlin, Heidelberg: Springer, 1998.
Zartarian V, Bahadori T, McKone T: Adoption of an official ISEA glossary. J Expo Anal Environ Epidemiol 2005; 15: 1–5.
Online-Quellen
Fotografien der Durchführungen jeder Expositionssituation werden in den Abbildungen S2A-L in den ergänzenden Informationen (SI) (online verfügbar bei Annals of Work Exposures and Health) gezeigt
https://academic.oup.com/annweh/article/64/1/55/5648934?login=true#supp…
Detailliertere Beschreibung von CNN bei MATHWORKS
https://de.mathworks.com/discovery/convolutional-neural-network.html
Info
MATLAB & Python
MATLAB ist eine Programmiersprache und Entwicklungsumgebung, die hauptsächlich für technische Berechnungen, Datenanalyse und die Visualisierung von Daten verwendet wird, oft in Bereichen wie Ingenieurwesen und Wissenschaft (https://de.mathworks.com/products/matlab.html).
Python ist eine vielseitige Programmiersprache, die in Bereichen wie Datenanalyse, Webentwicklung, maschinellem Lernen und Wissenschaft weit verbreitet ist (https://www.python.org/).
Beide Sprachen bieten umfangreiche Bibliotheken und Funktionen für Datenanalyse und numerische Berechnungen. MATLAB ist besonders für mathematische und technische Aufgaben sowie den Einsatz in Ingenieursprojekten optimiert. Python ist eine Open-Source-Sprache, die flexibler und in der allgemeinen Programmier-Community stark verbreitet ist, was zu einer breiteren Anwendung in verschiedenen Bereichen führt. Python ermöglicht eine einfachere Integration in Software-Systeme und Anwendungen, während MATLAB oft in spezialisierten Bereichen und mit kostenpflichtigen Lizenzen eingesetzt wird.
Info
In-situ-Methode
In-situ-Methoden wie Video-Imaging und Visualisierungstechniken (Fenske u. Birnbaum 1997; Brouwer et al. 2000b) ermöglichen eine Expositionsmessung ohne Probenahme, was Probenverluste minimiert und Unsicherheiten in der Analyse ausschließt. Es besteht jedoch das Risiko, dass der Stoff vor der Messung absorbiert wird. Außerdem könnte bei stark belasteten Oberflächen die maximale Messgrenze erreicht werden (Kasiotis et al. 2020). Eine hohe räumliche und zeitliche Präzision bleibt jedoch gegeben (Kasiotis et al. 2020).