EBCONT überzeugt im LegalTech: wie die Kombination von heuristischen und KI-Methoden Rechtsdokumente anreichern kann.
14. September 2022
·
3 MIN Lesedauer

EBCONT überzeugt im LegalTech: wie die Kombination von heuristischen und KI-Methoden Rechtsdokumente anreichern kann.

Mit Herbst 2021 wird das Bundesministerium für Justiz (BMJ) das gemeinsam mit dem österreichischen IT Spezialisten EBCONT entwickelte Gesamtkonzept zur automatischen Bearbeitung von Rechtsdokumenten und im Besonderen deren automatische Anonymisierung final implementieren. Dies ist ein Meilenstein hin zur ressourcenschonenden Bearbeitung und Verbesserung der Datenschutzstandards von Rechtsdokumenten. Das österreichische IT-Unternehmen EBCONT konnte hier als langjähriger kompetenter Partner mit reichhaltigen Kenntnissen sowohl in Data Science als auch Machine Learning den Prozess professionell begleiten.

Jeden Tag erreichen die Justiz unzählige Rechtsdokumente, die keiner klaren Themen- oder Fallkategorie zugeordnet sind, es fehlen etwa wichtige Informationen über die Beteiligten und Inhalte oder Scans sind teils wahllos in Dokumenten zusammengefasst. Richter und Sachbearbeiter benötigen jedoch  Dokumente in einer bestimmten Struktur und Benennung, um effizient arbeiten zu können. Um nun die Bearbeitung überhaupt zu ermöglichen und einen Austausch zwischen Gerichten, aber auch eine Kontrolle der Arbeit der Gerichte zu ermöglichen, mussten Akten bis dato noch nachbearbeitet – also anonymisiert werden,  um Persönlichkeitsrechte zu schützen.

Das alles kostet Zeit und Geld und ist intensive manuelle Arbeit!

So erforderten Modelle zur Erkennung von Kategorien, Entitäten, Rollen in Verfahren und Mustern in juristischen Dokumenten bislang feste, formularartige Strukturen. Tatsächlich deckten diese aber nicht die gesamte Bandbreite möglicher Dateien ab, die im Rechtsverkehr vorkommen. Daten, die nicht nur in Tabellenform, sondern als Fließtext oder etwa mit Bildern versehen in Rechtstexten vorkommen, konnten bis dato gar nicht ausreichend erfasst werden.

Für das österreichische Bundesministerium für Justiz (kurz BMJ) hat der IT Spezialist EBCONT daher in einer Reihe von Anwendungsfällen ein Gesamtkonzept zur automatischen Verarbeitung juristischer Dokumente erstellt und implementiert, das nach einigen bereits erfolgten Teilimplementierungen nun mit mit Herbst komplett aufgeschalten wird.

Besonders erwähnenswert ist hier die von EBCONT entwickelte bahnbrechende automatische Anonymisierung von Rechtsdokumenten und hier speziell von Urteilen, die mit Herbst 2021 im Vollausbau den aktuellen Explorer für Österreichs Gerichte ablösen wird.

Was zuvor auf manuellem, sehr zeit- und ressourcenintensive Wege durchgeführt worden war, kann nun nach der bereits erfolgreichen Implementierung in wenigen Augenblicken bewerkstelligt werden. Auch über 1 Million alte bzw. bisher unbearbeitete Urteile aller gerichtlichen Dienststellen konnten so digitalisiert und anonymisiert werden. 

Was das Projekt für EBCONT so herausfordernd machte war, dass es weder Qualitätsmetriken noch 100% verwendbaren Trainingsdaten gab, nämlich für keine der Zwischeninformationen, sondern nur Daten für “geschwärzt” und “nicht geschwärzt” und so durch komplexe Heuristiken vom Team erst welche erzeugt werden mussten. 

Sowohl das BMJ als auch EBCONT erwarten sich hier nennenswerte Verbesserungen in der Datenverarbeitung nicht nur für Richter:innen, sondern allen Beteiligten in einem Verfahren unter Berücksichtigung der Datenschutzstandards. 

Martin Hackl, Chief Digital Officer des Bundesministeriums für Justiz: “Wichtig ist jetzt, dass wir die Prozesse etablieren. Menschen wie Maschinen machen Fehler, daher müssen wir für die Akzeptanz der automatischen Bearbeitung noch entsprechende Prozesse schaffen.” 

Frederick Bednar, Data Analytics and Data Science Consultant von EBCONT kann auf langjährige Erfahrung im Bereich Textverarbeitung bzw. semantischer Use Cases zurückblicken: „Das BMJ schätzt unsere Kompetenz und hat so voll auf unsere reichhaltigen Kenntnisse sowohl in Data Science als auch Machine Learning vertraut. Im konkreten Beispiel der Anonymisierung nehmen wir als wertvolle Erfahrung mit, dass gerade für hochkomplexe Domänen eine Kombination mehrerer Methoden die zielführendste Lösung verspricht. Wir freuen uns sehr, zum Vollausbau der Anonymisierung der Rechtsdokumente des BMJ beigetragen zu haben.