Was ist ChatGPT und wie funktioniert es?
Vor dem Einsatz von KI war maschinengestützte Textanalyse nur durch die Definition von Regeln möglich. Bei der Vielfältigkeit von Text und der daraus folgenden Komplexität war diese Lösung nur sehr eingeschränkt einsetzbar. Durch den Einsatz von KI konnte die Definition von Regeln nun dadurch ersetzt werden, dass das System durch die statistische Auswertung großer Textmengen Korrelationen ermittelt, also die Regeln ohne Hilfe oder zugeführte Definition zu ermitteln sucht. Wenn die Textmengen groß genug sind, ist die Wahrscheinlichkeit auch hoch genug, dass tatsächlich Kausalität gegeben ist, wo Korrelationen ermittelt wurden.
KI, von der linearen Regression bis hin zum neuronalen Netzwerk, ist im Kern also ein System zur statistischen Auswertung großer Datenmengen, um signifikante Korrelationen zu ermitteln. So können bspw. in großen Listen mit vielen Details mit medizinischen Daten Korrelationen ermittelt und in mathematischen Formeln (dem sogenannten Modell) ausgedrückt werden. Diese mathematischen Formeln können dann später eingesetzt werden, um zu ermitteln, ob für eine neue Datenkombination eine der zuvor ermittelten Korrelation gesehen wird.
Traditionell wurde eine KI für diesen Prozess mit Text befüttert, Wort für Wort, und diese ermittelte dann, wie das jeweilige Wort zu den vorhergehenden zu bewerten ist. Um die hier noch recht begrenzte Effektivität zu verbessern, wurden die für die Bedeutung eher unbedeutenden Wörter entfernt, bevor der Text analysiert wird oder es wurden semantische Bewertungen eingearbeitet.
Fortschritt brachte der Einsatz von BERT (Bidirectional Encoder Representations from Transformers), wo nicht nur entweder die Wörter zuvor oder die Wörter danach berücksichtigt werden konnten. Mit BERT ist es möglich, Text zu beiden Seiten eines Wortes für dessen Bedeutung zu berücksichtigen. BERT ist dadurch zuverlässig in der Lage, Eigennamen oder Wochentage zu erkennen, auch wenn es ihnen zuvor nicht begegnet ist, allein aufgrund ihrer Stellung im Satz, aber auch Emotionalitäten eines Textes oder dessen Kernpunkte zu ermitteln.
ChatGPT
Die große Neuerung durch ChatGPT besteht aus zwei Bestandteilen. ChatGPT analysiert Text in ganzen Sätzen und erstellt in Reaktion auf die Eingabe des Nutzers einen Text Wort für Wort. Die meisten werden es von Textnachrichten aus dem Handy kennen; Sobald man ein Wort eingegeben hat, wird eines als mögliches darauffolgendes vorgeschlagen. Kinder spielen sehr gerne damit und tippen solange auf das erste Wort, bis der Text sich zu wiederholen beginnt. Doch im Gegensatz zu den aktuellen in Handys eingesetzten Technologien, wird bei ChatGPT eine Formel zur Ermittlung des nächsten Wortes eingesetzt (das wäre die generative Komponente), die bei vereinfachter Betrachtung 175.000.000.000 Variablen enthält.
Zusätzlich betrachtet ChatGPT den gesamten Kontext um die einzusetzenden Wörter und bewertet einige von ihnen als bedeutender für den Kontext als andere (was mit Transformer gemeint ist). Hinzu kommt, dass ChatGPT auch für das Big-Data Zeitalter an enormen Mengen von Text trainiert wurde (pretrained). Dazu gehören 570 GB Text (Webseiten, Wikipedia etc.) aber auch technische Webseiten wie Github, Stack Overflow und ähnliche, auf denen nicht nur Code geteilt, sondern auch darüber diskutiert wird, was u.a. begründet, warum ChatGPT gerade in diesem Bereich gut eingesetzt werden kann.
Was nun kommt
In dieser neuen Reihe im Legal Tech Verzeichnis werden wir uns in den kommenden Wochen mit den verschiedenen Anwendungsbereichen beschäftigen, mit möglichen Geschäftsmodellen, die sich tatsächlich ergeben können und – polemisch formuliert – wer mit ChatGPT reich wird und wer arbeitslos.
Autor: Nuri Khadem ist Legal Engineer bei Noerr, Rechtsanwalt und Lehrbeauftragter an der HU-Berlin. Er hat einen umfangreichen IT-Background aus seiner mehrjährigen Arbeit als IT-Dienstleister und Systemadministrator.