FachartikelLegal KI & ChatGPT

Legal AI und Large Language Models werden die Zukunft aller Juristen prägen

Large Language Models (im Folgenden LLM) haben, insbesondere durch ChatGPT-3, im vergangenen Jahr einen erheblichen Hype erfahren. Wie schon Blockchain und Konsorten durchlaufen neue Technologien regelmäßig einen sog. Hype-Cycle. Auf dem Weg zum „Plateau der Produktivität“ lässt sich jedoch bereits jetzt sagen, dass im Falle von LLMs ein erhebliches Potenzial besteht, den (Arbeits-)Alltag aller Juristen nachhaltig zu verändern. Dabei ist wesentlich, die neue Technologie als Chance zu begreifen und sich bereits jetzt mit ihrer Funktion und ihren Möglichkeiten vertraut zu machen. Denn wie mit einer Vielzahl von disruptiven Technologien verhält es sich meist so, dass der Wettbewerb nicht zwangsläufig an die Technik verloren geht, sondern vielmehr an diejenigen Mitbewerber, die sich frühzeitig auf einen Wandel eingestellt haben.

Die Funktionsweise von Large Language Models

Large Language Models wie ChatGPT, kurz für „Generative Pretrained Transformer“, sagen – vereinfacht – das wahrscheinlichste nächste Wort in einem Satzzusammenhang voraus. „Generative“ steht dabei für die Fähigkeit, eigene Texte als Antwort zu generieren. „Pretrained“ stellt auf die Konditionierung des Modells ab, das mit großen, frei verfügbaren Datenmengen aus dem Internet initial trainiert wird. „Transformer“ beschreibt die Architektur des Programms. Diese ermöglicht, durch eine Mehrzahl von „hidden layers“ (das Herzstück eines neuronalen Netzes), eine gleichzeitige Verarbeitung von Informationen und das Herstellen von Rückbezügen. Die Berechnung erfolgt nicht mehr nur linear, sondern es werden Verbindungen zwischen den verschiedenen Teilen der Eingabe hergestellt.

LLMs wie ChatGPT-4 sind nunmehr in der Lage, auch Sentiment Analysis, d.h. den Kontext und Tonus eines Textes zu erfassen, „kreative“ Eigenschaften zu simulieren, wie den Schreibstil eines Schriftstellers zu imitieren, eigene Computerprogramme zu schreiben oder bemerkenswerte Ergebnisse im US-amerikanischen „bar exam“ zu erreichen. Für das Training der LLMs auf dem Weg zu inhaltlich richtigen und ethisch vertretbaren Antworten ist Feedback wesentlich. Dabei handelt es sich u.a. um sog. Humans in the Loop. Diese menschliche Prüfung der Ergebnisse wird vor allem für die Verwendung im juristischen Bereich wichtig sein. Denn insbesondere in Bezug auf inhaltliche, deutsche juristische Arbeit sind die Ergebnisse bislang unzuverlässig – befinden sie sich auch im Gewand der überzeugenden, natürlichen Sprache.

Einsatzmöglichkeiten in der juristischen Praxis

Doch warum sollte sich gerade die juristische Welt um diesen neuen Hype kümmern? Die hochgradig sprach- und textbasierte Rechtswissenschaft steht durch die Möglichkeiten der neuen Entwicklungen im Bereich der Large Language Models im Zentrum der Umwälzung. Large Language Models werden zukünftig das neue Werkzeug der juristischen Arbeit, mit der sich bereits jetzt viele Aufgaben automatisiert und effizienter erledigen lassen. Anwendungsbereiche der LLMs sind sowohl die Generierung von Texten als auch die Überarbeitung sowie das Strukturieren und Zusammenfassen von großen (Text-) Datenmengen. Mit den aktuellen LLMs lassen sich bei einfacheren juristischen Aufgaben bereits gute Ergebnisse erzielen. Momentan scheitern die Modelle aber, sobald die Fragestellung komplexer wird.

Die noch nicht überzeugende Qualität der Antworten im juristischen Bereich von momentan frei zugänglichen Modellen, wie ChatGPT-4, lässt sich damit erklären, dass diese nur anhand öffentlich zugänglichen, fachbereichsunspezifischen Texten trainiert wurden. Das Training anhand juristischer Texte ist jedoch unerlässlich, sollen die Modelle zukünftig einen echten Mehrwert in der juristischen Arbeit übernehmen. Dass sich sog. Fine-Tuning anhand fachspezifischer Texte auszahlt, zeigen Versuche aus den USA oder China. Dort konnte die Antwortqualität für komplexe juristische Fragestellungen mittels Trainings anhand von Gerichtsentscheidungen deutlich gesteigert werden. Damit sind diejenigen, die bereits jetzt über eigene strukturierte Datensätze verfügen, im Vorteil. Denn je konkreter die Anforderungen an das Modell, desto spezifischer müssen auch die für das Training verwendeten Datensätze sein. Soll das Modell den eigenen Stil in Verträgen erkennen und anwenden, muss es vorher mit entsprechenden Daten gefüttert werden. Wer frühzeitig in das Training des eigenen Modells investiert, wird langfristig erhebliche Wettbewerbsvorteile haben. Mit Harvey oder Lexis+ AI sind aktuell bereits die ersten Legal Large Language Models im Einsatz.

Legal Prompting

Um diese Modelle bedienen und hierdurch repetitive, administrative und besonders zeitintensive Aufgaben effizienter erledigen zu können, müssen Nutzer in der Lage sein die Eingabeaufforderungen (“Prompt”) anwendungsgerecht formulieren zu können. Large Language Models verwenden als Kernstück ihrer Funktionsweise das sog. Natural Language Processing, d.h. die Eingabeaufforderung erfolgt in natürlicher Sprache. Die Genauigkeit der Interaktion mit dem Modell und damit auch das Resultat wird damit durch die Prompts beeinflusst. Je präziser der Nutzer seine Eingabeaufforderung formuliert, desto brauchbarer können die generierten Ergebnisse sein. “Prompt Engineering” wird ein wichtiger Teil der juristischen Arbeitswelt.

Status quo

Laut der neusten Studie von Goldman Sachs könnte bis zu 44 % der juristischen Arbeit durch KI ersetzt werden – dabei fällt die Juristerei auf Platz zwei der von der Automatisierung betroffenen Berufsgruppen. In Anbetracht dieser Zahlen ist es bemerkenswert, dass sich lediglich 5 % der Kanzleien aktuell mit den Einsatzmöglichkeiten von KI – und im Besonderen LLMs – beschäftigen. Über 90 % der 443 befragten Kanzleien aus den USA, UK und Kanada gaben an, sich noch gar keine Gedanken über den Einsatz der neuen Technologie gemacht zu haben. Vor dem Hintergrund des Vorgenannten wird sich ein inhärentes Interesse an der Funktionsweise der neuen Technologie in jedem Fall lohnen: Denn durch ein eigenes Grundverständnis können sowohl Chancen als auch Grenzen von LLMs für die eigene Praxis besser beurteilt werden. Mit dem Abbauen von Berührungsängsten, dem Auseinandersetzen mit Legal Prompting und einer gesunden Neugierde für die künftigen Möglichkeiten, kann die deutsche Rechtspraxis von dem technischen Fortschritt enorm profitieren. Das Ergebnis wird eine (Zusammen-)Arbeit mit LLMs sein – und kein Ersatz des Volljuristen.

Autor: Dr. Nils Feuerhelm ist Rechtsreferendar bei Hughes, Hubbard & Reed LLP in New York, Mitglied bei recode.law e.V. und Gründer von jur.innovation.

Autorin: Julia Sophie Dieball ist Rechtsreferendarin bei Noerr mbB in New York City und Gründungs- sowie Beiratsmitglied des recode.law e.V.

- WERBUNG -