Anonymisierung von Gerichtsentscheidungen für die digitale Justiz
In Deutschland werden aktuell nur sehr wenige Gerichtsentscheidungen veröffentlicht, vor allem, weil Menschen sie recht aufwändig manuell anonymisieren müssen. Jedoch ist eine große Menge von rechtlich relevanten Dokumenten unerlässlich für Rechtspraxis und Rechtswissenschaft sowie für die Entwicklung digitaler Angebote in Wirtschaft, Staat und Verwaltung. Damit Gerichtsurteile in großem Umfang gemäß den gültigen Datenschutzvorschriften zeit- und ressourceneffizient zur Verfügung gestellt werden können, sind automatische Verfahren zur Anonymisierung dieser Texte notwendig. Die auf diese Art bereitgestellten Urteile könnten zum Beispiel als Trainingsdaten eingesetzt werden, um auf Künstlicher Intelligenz (KI) basierende Verfahren zu entwickeln, die Gerichten und Behörden künftig die Arbeit erleichtern.
Das Forschungsprojekt „Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)“ verfolgt das Ziel, die Möglichkeiten automatischer Verfahren zur datenschutzkonformen Nutzung von Gerichtsurteilen zu erforschen. Dafür werden die Forschenden an wesentlichen Innovationen mithilfe von Verfahren der Computerlinguistik, der Informatik und der KI arbeiten. Mit Unterstützung des Bayerischen Staatsministeriums der Justiz werden rechtsgebietsspezifische Demonstratoren zur automatischen Anonymisierung von Gerichtsurteilen entwickelt, beispielsweise im Bau-, Familien- und Handelsrecht. Um die maschinellen Lernverfahren zu trainieren und zu evaluieren, erstellt das Forschungsteam sogenannte Goldstandards. Damit sind Datensätze gemeint, in denen zu anonymisierende Textstellen aufwändig manuell identifiziert und pseudonymisiert wurden. Zur Pseudonymisierung setzen die Forschenden realistische Phantasiebezeichnungen ein, um die tatsächliche Identität einer Person zu verschleiern. Durch dieses Verfahren können die Urteile anschließend datenschutzkonform wissenschaftlich genutzt werden. Im Idealfall können die Forschenden mithilfe der Goldstandards sogar rechtsgebietsübergreifende automatische Verfahren erarbeiten, um Urteile im Umfang von Big Data als „Treibstoff“ für die Innovationsfelder E-Justice, E-Government und Legal-Tech zur Verfügung zu stellen. Um die Forschungsergebnisse wirtschaftlich verwerten zu können, ist die Gründung eines Unternehmens beabsichtigt.
Der Einsatz rechtsgebietsspezifischer Softwarelösungen zur automatischen Anonymisierung von Gerichtsurteilen ist für den Bereich E-Justice und Legal-Tech völlig neu. Zudem leisten die Forschenden Pionierarbeit, indem sie erstmals Ergebnisse aus verschiedenen Rechtsgebieten systematisch zusammenführen sowie Gerichtsurteile flächendeckend anonymisieren und pseudonymisieren. Damit wird dringend benötigtes Datenmaterial für die digitale Transformation von Prozessen in staatlichen Institutionen großflächig verfügbar. Darüber hinaus profitieren von der großen Datenbasis mit anonymisierten und pseudonymisierten Urteilen nicht nur die privatwirtschaftliche Legal-Tech-Community und bereits existierende Start-ups, sondern auch die Digitalisierung von Staat und Verwaltung sowie die Innovationskraft des Standorts Deutschland insgesamt.