Generative KI erreicht bei Jura-Prüfungen erstmals A+ Niveau
Eine aktuelle Studie vom 10. Juni 2025 der University of Maryland Francis King Carey School of Law zeigt, dass das neueste generative KI-Modell von OpenAI mit dem Namen „o3“ acht rechtswissenschaftliche Abschlussprüfungen im Frühjahr erfolgreich bewältigt hat – mit Bewertungen zwischen A+ und B. Hier die Ergebnisse in den einzelnen Bereichen im Überblick:
- A+: Constitutional Law, Professional Responsibility, Property
- A: Income Taxation
- A‑: Criminal Procedure
- B+: Secured Transactions, Torts
- B: Administrative Law
Dies stellt eine deutliche Verbesserung gegenüber früheren ChatGPT-Versionen dar, die meist zwischen B und C lagen und manchmal sogar nur ein D erhielten. Der entscheidende Unterschied: Die ChatGPT Version o3 arbeitet als „Reasoning Model“, also mit interner Antwortbewertung und Anpassung, bevor ein Endergebnis präsentiert wird.
Folgende Einschränkungen und Beobachtungen konnten gemacht werden:
- Im Fach Administrative Law schnitt o3 schlechter ab, da es das 2024 ergangene Urteil Loper Bright Enterprises v. Raimondo nicht kannte.
- Bei einem Test mit Zugang zu Professoren-Notizen verschlechterte sich die Leistung – vermutlich wegen Informationsüberladung.
- Die Studie diskutiert mögliche Betrugsszenarien durch KI, etwa durch das Einfügen absichtlicher Grammatikfehler, um Täuschung zu verschleiern.
- OpenAI hat sich bislang nicht zu den Ergebnissen geäußert.
Fazit: ChatGPT in der Version o3 erweist sich als fähiger „Jurastudent“, der Law-School-Prüfungen auf hohem Niveau bestehen kann. Die Studie zeigt sowohl die Stärken des neuen Reasoning-Ansatzes als auch die Risiken durch veraltetes Wissen und mögliche Fehlanwendungen im akademischen Kontext. Die neuen Ergebnisse fachen weiter die Diskussionen über die Ersetzung von Anwälten durch KI an.






