AnigeD

Rechtskonforme Anonymisierung bei der Kombination von Datensätzen mit Georeferenzierung

Mobilfunkmast vor blauem Himmel
Im Mobilfunk werden Daten erhoben, die auch Ortsangaben enthalten und dadurch mit anderen Daten kombiniert werden können – die Anonymisierung dieser sogenannten angereicherten Daten ist eine besondere Herausforderung.© Adobe Stock / Valmedia

Motivation

Situations- und Trendanalysen sind wichtige Grundlagen für zukunftsweisende Entscheidungen in Politik und Wirtschaft. Die Qualität dieser Analysen steht und fällt mit der Güte der Datengrundlage. Diese ist besonders hoch, wenn unterschiedliche Datensätze miteinander kombiniert werden. Die Kombination dieser sogenannten angereicherten Datensätze kann aber nur unter Einhaltung höchster Standards zum Schutz von individuellen Personen und Organisationen geschehen. Beispielsweise könnten aus Mobilfunkdaten und Zensusinformationen detaillierte Rückschlüsse auf die sozio-demographische Struktur einzelner Nachbarschaften, Unternehmen oder Personen abgeleitet werden. Deshalb ist es wichtig, Datensätze für tiefgreifende Analysen datenschutzkonform zu anonymisieren. Seit einigen Jahren beschäftigen sich Forschungsdatenzentren, die Daten archivieren und diese über verschiedene Zugangswege für wissenschaftliche Zwecke zugänglich machen, mit dieser Problematik und weisen darauf hin, dass gängige Anonymisierungsverfahren teilweise unzureichenden Schutz bei stark angereicherte Datensätze bieten. Eine besondere Gefahr geht dabei von der Verknüpfung von Daten mittels Lokationsangaben wie zum Beispiel Adressen oder Verbindungen zu Mobilfunkmasten aus.

Ziele und Vorgehen

Ziel des Kompetenzclusters „Anonymität bei integrierten und georeferenzierten Daten (AnigeD)“ ist die Vernetzung wissenschaftlicher und anwendungsorientierter Akteure zur Erforschung von Anonymisierungstechniken für georeferenzierte und verknüpfte Daten. Diesen Herausforderungen begegnet das Kompetenzcluster mit drei verschiedenen Schwerpunkten. Erstens untersuchen die Forschenden das Potenzial des vielversprechenden Ansatzes der Anonymisierung durch künstlich erzeugte, sogenannte synthetische Daten, die von Natur aus keiner Einzelperson zuzuordnen sind, aber trotzdem den untersuchten Sachverhalt korrekt abbilden. Zweitens werden bestehende Verfahren der Anonymisierung vor allem für die Kombination unstrukturierter Mobilfunkdaten mit strukturierten Umfragedaten erforscht. Drittens werden ein rechtliches Rahmenwerk zur Anonymisierung sowie Werkzeuge zur effizienten Bereitstellung von anonymen, georeferenzierten Daten entwickelt.

Innovationen und Perspektiven

Die Verfahren zur Anonymisierung von kombinierten Datensätzen ermöglichen es Akteuren aus Wissenschaft und Wirtschaft, in Zukunft Daten-sätze in Forschungsprojekte und Datenbanken einzubringen, ohne dass das Risiko besteht, persönliche oder personenbezogene Daten preis zu geben. Mittel- und langfristig tragen die auf dieser Basis gewonnenen Forschungsergebnisse zur gesteigerten Verfügbarkeit angereicherter Daten-sätze bei. Somit wird die Grundlage für eine rechtskonforme Verwendung von georeferenzierten Daten geschaffen, die Persönlichkeitsrechte schützt und Entwicklungspotenziale erschlossen. Der Wirtschaftsstandort Deutschland, vor allem die Informations- und Datenindustrie, wird somit nachhaltig gestärkt.