PriSyn

Repräsentative, synthetische Gesundheitsdaten mit starken Privatsphärengarantien

Hochwertigen Gesundheitsdaten haben ein großes Potenzial für eine bessere Medizin. © Adobe Stock / Elnur

Motivation

Gesundheitsdaten bergen ein großes Potenzial für die Entwicklung neuer Diagnose- und Behandlungsmethoden bis hin zu einer Vision der personalisierten Medizin. Solche Daten sind jedoch hochsensibel und ihre Nutzung und Weitergabe sind stark reglementiert. Dank der methodischen Fortschritte im Bereich der differenziellen Privatsphäre gibt es heute Möglichkeiten, die Privatsphäre zu quantifizieren und Garantien für Datenschutz auszuweisen. An solche Mechanismen zum Schutz der Privatsphäre bei der Datenanalyse werden jedoch hohe Herausforderungen gestellt: So sind spezielle Algorithmen erforderlich, um bei jedem Datenzugriff Prüfungen durchzuführen und die Daten rechtskonform auch für explorative Datenanalysen zu nutzen.

Ziele und Vorgehen

Das Ziel des Projektes „Repräsentative, synthetische Gesundheitsdaten mit starken Privatsphärengarantien“ (PriSyn) besteht darin, Gesundheitsdaten so zu synthetisieren, das diese für die Forschung an Behandlungsmethoden und Medikamenten nutzbar sind. Synthetische Daten verfügen über die gleichen Eigenschaften wie reale, geben aber keine privaten Informationen preis. Darüber hinaus werden im Rahmen des Projekts Metriken und Prüfmethoden ausgearbeitet, um die Qualität und Anwendbarkeit der synthetischen Daten in verschiedenen Anwendungsfällen, wie der medizinischen Diagnostik und pharmazeutischen Forschung zu bewerten und sicherzustellen. Die Forschenden optimieren generative Modelle zur Datensynthese in Hardware und Software, um eine verteilte Datenverarbeitung über verschiedene Standorte hinweg zu ermöglichen. Dadurch werden die Effizienz der Verarbeitung und die Verfügbarkeit der Daten maßgeblich gesteigert.

Innovationen und Perspektiven

Im Projekt schaffen die Forschenden mithilfe eines innovativen Ansatzes auf der Basis differentieller Privatsphäre effektive Möglichkeiten, um medizinische Daten gemeinsam zu nutzen – und zwar bei gleichzeitig starken Datenschutzgarantien. Dies kann zum besseren Verständnis einer Reihe von Krankheiten beitragen sowie die Präzisionsmedizin und die Entwicklung von Arzneimitteln optimieren. Darüber hinaus werden die datenschutzkonformen generativen Modelle auch für andere datenschutzkritische Produkte und Einrichtungen nützlich sein, wie etwa zum Schutz digitaler Identitäten. Somit leistet das Projekt einen wichtigen Beitrag zur Entwicklung neuer, datenbasierter Dienstleistungen und Geschäftsmodelle in Deutschland.