Ein KI-Sprachmodell kann die alltägliche Arbeit von Justizmitarbeitenden wesentlich unterstützen. Es kann beispielsweise Fragen über den Inhalt von langen Dokumenten beantworten und schnell relevante Abschnitte in Texten finden. Zu den fortgeschrittenen Anwendungsmöglichkeiten gehören die strukturierte Darstellung von Argumenten der Parteien in Gerichtsakten oder die Zusammenfassung von wichtigen rechtlichen Regeln aus Urteilen höherer Instanzen. Es könnte außerdem Richtern zum Urteil passende Leitsätze vorschlagen und als Teil eines komplexeren Systems vergleichbare Fälle zur Zitierung empfehlen. Die übergeordnete Motivation ist dabei, den Zugang zu rechtlichen Informationen mithilfe von KI zu vereinfachen und die Gerichte bei ihrer täglichen Arbeit, insbesondere in Massenverfahren und Umfangsverfahren, zu unterstützen und zu entlasten.
Wie verlässlich können Sprachmodelle bestimmte Aufgaben im Alltag von Richterinnen und Richtern unterstützen? Welche Aufgaben kommen hierfür besonders in Frage? Wie kann ein Modell durch technische Entwicklung und Training mit speziellen Daten aus dem deutschen Recht diesbezüglich optimiert werden? Wie kann die Justiz ihre Anforderungen an Funktionen von Sprachmodellen qualifiziert definieren und Modellkandidaten evaluieren?
Das Projekt „Generatives Sprachmodell der Justiz (GSJ)" hat zum Ziel, diese grundlegenden Forschungsfragen anhand der Entwicklung eines experimentellen Sprachmodells zu ergründen. Dieses soll an die spezifischen Anforderungen der Justiz angepasst, hinsichtlich Sicherheitsaspekten optimiert und in Pilotstudien mit realen Analyseaufgaben evaluiert werden.
Bei der Entwicklung des Sprachmodells wird die bestehende Systemlandschaft der deutschen E-Akten-Verbünde berücksichtigt. Hierzu erfolgt eine Abstimmung mit dem parallel erstellten „Konzept einer KI-Plattform für die deutsche Justiz“.
Erste und nächste Schritte
Es handelt sich um ein gemeinsames Projekt des Ministeriums der Justiz des Landes Nordrhein-Westfalen und des Bayerischen Staatsministeriums der Justiz. In Nordrhein-Westfalen wird das Projekt durch den Think Tank Legal Tech und KI der Justiz NRW koordiniert. Die technische Durchführung des Projekts wird durch die Technische Universität München (TUM) übernommen. Die Universität zu Köln koordiniert die Annotation von Trainings- und Evaluationsdaten für das Modell. Ferner unterstützt sie bei der Beantwortung rechtlicher Fragestellungen rund um die Entwicklung und den Einsatz des Modells.
Zum Training des Modells werden u. a. juristische Daten aus Nordrhein-Westfalen und Bayern bereitgestellt, die zunächst durch spezielle Software anonymisiert werden.
Gemeinsam mit Expertinnen und Experten aus beiden Ländern werden passende Unterstützungsfunktionen für Sprachmodelle ausgewählt und mit Methoden des Legal Design Thinking als Use-Case-Pilotprojekte für die Erprobung des experimentellen Modells geplant. Im nächsten Schritt werden Richtlinien für die Annotation dieser Daten erstellt. Anschließend wird das Modell von Praktikerinnen und Praktikern aus beiden Ländern getestet. Der bei dieser Evaluation sowie bereits im Laufe des Projekts entstehende Erkenntnisgewinn hinsichtlich der Forschungsfragen kann in die strategische Planung der Digitalisierung der Justiz in Deutschland einfließen.
Folgende drei Arbeitspakete sind vorgesehen:
- Fachliche Anpassung und Entwicklung eines Modells: Basierend auf Forschungsergebnissen werden Modellarchitektur und Trainingsprozeduren spezifiziert. Ein experimentelles Sprachmodelle wird mit öffentlich verfügbaren Justizdaten, anonymisierten juristischen Daten und im Projektverlauf zu annotierenden Daten für spezielle Use-Cases trainiert.
- Abstimmung an Sicherheitsanforderungen: Das entwickelte Modell wird mit bestimmten Trainingsmethoden gesichert, um eingebettete Informationen und problematische Inhalte zu berücksichtigen (z. B. Voreingenommenheit durch vorurteilsbehaftete Textmuster).
- Evaluation in Form von Pilotstudien: Das experimentelle Sprachmodell wird in der Praxis in 2 Pilotprojekten ausführlich getestet und die Ergebnisse umfänglich aufgearbeitet. Sofern keine rechtlichen Hindernisse entgegenstehen, wird das Modell im Anschluss als Open Source veröffentlicht.