Direkt zum Inhalt
Symbolfoto: Das AIT ist Österreichs größte außeruniversitäre Forschungseinrichtung

AIT entwickelt Masketeer: Ein Tool zur Pseudonymisierung deutscher medizinischer Freitexte

08.08.2024
Das AIT Digital Health Team steht für sicheren Umgang mit sensiblen Gesundheitsdaten

Das AIT Digital Health Team des Center for Health and Bioresources hat mit dem Masketeer-Algorithmus eine wichtige Lösung zur Pseudonymisierung unstrukturierter medizinischer Freitexte entwickelt. Dieses Werkzeug zielt darauf ab, den Datenschutz sensibler Gesundheitsdaten zu gewährleisten und gleichzeitig deren Nutzung für wissenschaftliche Zwecke zu ermöglichen.

Herausforderung bei der Anonymisierung medizinischer Freitexte

Medizinische Freitexte enthalten oft unverzichtbare Informationen über Patienten und ihre Gesundheitszustände. Diese Texte sind jedoch meist unstrukturiert und enthalten sensible Daten, die dem Datenschutz unterliegen. Die Herausforderung besteht darin, diese Informationen zu anonymisieren, ohne den Kontext zu verlieren. "Gerade bei deutschen Texten fehlen oft umfassende Forschungsgrundlagen.", erklärt Martin Baumgartner, Entwicklungsleiter des Algorithmus.

Innovativer Ansatz des Masketeer-Algorithmus

Der Masketeer-Algorithmus des AIT nutzt eine Kombination aus verschiedenen Maskierungslogiken, um Daten anhand der HIPAA Safe Harbor Guidelines aus klinischen Notizen zu entfernen, die die Identität von einzelnen Personen preisgeben könnten. Die Kennzeichnung, welche Information entfernt wurde (z.B. Patientenname, Telefonnummer) und die Vergabe von konsistenten Pseudonymen über alle Notizen hinweg, hilft dabei kontextuelle Informationen in den Texten zu bewahren. "Unser Algorithmus bietet eine außergewöhnlich hohe Sensitivität von 0,943 und eine Spezifität von 0,933", betont Karl Kreiner, Senior Research Engineer, der die Entwicklungen beaufsichtigt.

Zukunftsaussichten für Datenschutz und Forschung

Der Masketeer-Algorithmus ist als ein zentrales Element zur Verbesserung des Datenschutzes und Wahrung der Privatsphäre von Patienten bereits in den Health Data Space Nodes zum Einsatz, die auch im aktuellen Datenspende-Projekt Smart FOX eingesetzt werden sollen. Künftige Entwicklungen könnten durch die Integration von großen Sprachmodellen noch effektiver werden, um die Anonymisierung zu verbessern und gleichzeitig die Nutzung wertvoller medizinischer Daten für Forschungszwecke zu fördern. Das AIT wird weiterhin die Entwicklung von Datenschutzlösungen im Gesundheitswesen vorantreiben und damit den Fortschritt in der medizinischen Forschung und Versorgung unterstützen.

Link zum Paper: https://www.mdpi.com/1999-5903/16/8/281