Fachartikel

Datenanalyse in der anwaltlichen Beratung – Extraktion, Transformation, Simulation

Die strukturierte Auswertung und Aufbereitung von Daten gewinnt in der anwaltlichen Tätigkeit immer mehr an Bedeutung und ermöglicht neue Beratungsleistungen. Damit einher geht eine Öffnung zu anderen Fachbereichen und eine interdisziplinäre Zusammenarbeit.

Ausgangspunkt

Die Nutzbarmachung von Daten für die anwaltliche Beratung erfordert zunächst, die im konkreten Zusammenhang relevanten Daten zu identifizieren und in einem nächsten Schritt zu extrahieren. Idealerweise zusammen mit der – teilweise automatisierten – Extraktion erfolgt die Umwandlung von Informationen in Form von unstrukturierten Daten aus Texten in einen strukturierten Datensatz. Dieser Datensatz ist dann der Ausgangspunkt für die rechtliche Analyse und Grundlage für das Reporting der Ergebnisse.

Extraktion und Klassifikation

Informationen aus Verträgen, Schriftsätzen oder regulatorische Vorgaben zu identifizieren und relevante Passagen aus Dokumenten zur Lösung eines rechtlichen Problems heranzuziehen, gehört zum Kerngeschäft des Anwalts. Am Anfang jeder Extraktion steht die Festlegung eines Suchprogramms, etwa die Einschränkung auf konkrete Typen von Klauseln in einem Vertrag oder auf bestimmte aus einem Schriftsatz zu extrahierende Informationen, wie Angaben zu Sachverhaltsparametern.

Unabhängig davon, ob die Extraktion automatisiert oder manuell erfolgt, ist es für die Weiterverwertung ein essenzieller Unterschied, wie das Suchprogramm aufgebaut ist. Wird beispielsweise lediglich der Wortlaut einer Change-of-Control Klausel extrahiert, oder geht die angewandte Lösung einen Schritt weiter und ermittelt, ob eine CoC-Klausel vorliegt, zu wessen Gunsten diese besteht und ob die Rechtsfolge eines Verstoßes in einem Kündigungsrecht oder einer bloßen Informationspflicht liegt. Entscheidend ist in allen Fällen, die gewünschten Datenpunkte vorab sauber herauszuarbeiten, um im weiteren Verlauf bei der Datenanalyse profitieren zu können.

Eine automatisierte Extraktion ermöglicht erhebliche Effizienzgewinne und ist bei großen Datenmengen – gerade bei Transaktionen oder Massenverfahren – vielfach Voraussetzung für eine unter Wirtschaftlichkeitsgesichtspunkten sinnvolle Bearbeitung.

Um die Extraktion zu automatisieren, können die gesuchten Informationen entweder formelhaft durch Regeln (z.B. RegEx) abgebildet werden. Scheidet dies aus, etwa für die Klassifizierung von unterschiedlich formulierten Vertragsklauseln oder wegen Unbekanntheit der Formen, in welchen die Informationen auftreten könnten, so müssen Machine Learning Modelle durch Trainingsbeispiele angelernt werden. Erforderlich ist eine enge Abstimmung zum Bedeutungsgehalt zwischen Anwälten und Machine Learning Experten. Dies erlaubt „intelligente“ Extraktion und Klassifikation (also die Zuordnung von Informationen zu Sinneinheiten) von unstrukturierter Information aus Dokumenten.

Transformation und Validierung

Um Daten strukturiert zu erfassen, genügt vielfach nicht die reine Extraktion von Text aus der Quelle (z.B. Vertrag oder Schriftsatz). Vielmehr müssen – um beispielsweise ein Datum oder Beträge maschinenlesbar zu machen – die Informationen entsprechend transformiert werden.

Ein weiterer Aspekt, der vielfach auch durch rechtliche Vorgaben je nach Zweck der Extraktion hinzutritt, ist die erforderliche Validierung durch mindestens ein menschliches Augenpaar. Die besten Systeme zur automatisierten Extraktion sind trotz beträchtlicher Fortschritte in keinem Bereich so gut (entity recognition, classification etc.), dass sie komplett ohne menschliche Validierung die im juristischen Kontext notwendige Präzision aufweisen. Die daher in vielen Bereichen unumgängliche Validierung kann mit unterschiedlichen Tools unterstützt werden. Sogenannte Validation Stations helfen hier durch Anzeige der Datenquelle, also meist des Dokuments, das die extrahierten Daten bunt markiert hervorhebt und zugleich extrahiert in einem Feld unter der Bezeichnung des gesuchten Datenpunkts angibt.

Simulation und Visualisierung

Die erfolgreiche Umwandlung der Daten erlaubt es, die Ergebnisse der Datenanalyse in Relation zueinander zu betrachten. Dies schafft neue Möglichkeiten für die Rechtsberatung:

Visualisierungen der Ergebnisse einer Vertragsanalyse ermöglichen etwa den Mandanten, mit wenigen Klicks zu den für sie relevanten Informationen zu gelangen, anstatt diese in umfangreichen Textdokumenten suchen zu müssen. Von Diagrammen ausgehend kann man zu allen relevanten Details navigieren, etwa den konkreten Formulierungen von Vertragsklauseln bis hin zum Volltext des ursprünglichen Dokuments. Außerdem ermöglicht die Darstellung in interaktiven Dashboards, dass Mandanten auf Basis der Ergebnisse der rechtlichen Prüfung eine eigene Datenanalyse durchführen und durch Zusammenschau der Visualisierungen rechtliche Risiken unter kommerziellen Gesichtspunkten selbst würdigen können, was eine bessere Risikoeinschätzung erleichtert. Der strukturierte Datensatz kann zudem in das Asset Management-System des Mandanten übertragen und so – bei Unternehmenstransaktionen – für die spätere Verwaltung des Targets genutzt werden.

Strukturierte Daten und deren Visualisierung schaffen darüber hinaus Transparenz und erlauben es, das Produkt der Rechtsberatung einem weiteren Kreis von Interessierten zugänglich zu machen. Bei der Beleuchtung von Anforderungen an Produktcompliance in zahlreichen Jurisdiktionen und der vereinfachten Darstellung von regulatorischen Vorgaben in einem nutzerfreundlichen Ampelsystem können beispielsweise Marketingexperten der Mandantin direkt mit dem anwaltlichen Produkt arbeiten, statt für jede Anfrage entweder auf die internen Experten aus der Rechtsabteilung zuzugehen oder direkt die externen Rechtsberater anzusprechen. Entscheidungswege werden verkürzt und Informationen zugänglicher.

Strukturierte Daten ermöglichen schließlich auch die quantitative Simulation von Risiken. In Massenverfahren können die erhobenen strukturierten Daten zueinander in Relation gesetzt werden (Klagegegenstand, Streitwert, Instanz etc.) und so deren quantitative Bedeutung simuliert werden. Die Aggregation der Ergebnisse ermöglicht ein Optimieren, um für die Mandanten das beste kommerzielle Ergebnis zu erzielen oder in der Verhandlungssituation (etwa für einen Vergleich) für jede Verhandlungsposition stets die quantitativen Auswirkungen zu kennen.

Zusammenfassend ergeben sich durch Schaffung von strukturierten Daten und deren Analyse zahlreiche neue Möglichkeiten, das Produkt Rechtsberatung neu zu denken, mehr Transparenz zu gewährleisten und Effizienzsteigerung nicht nur bei der Analyse, sondern vor allem bei Verwertung der erteilten Rechtsberatung auf Mandantenseite zu schaffen.

Autor: Dr. Gerrit Beckhaus, Partner und Co-Head Freshfields Lab, Freshfields Bruckhaus Deringer, Hamburg/Berlin. Gerrit Beckhaus berät nationale und internationale Investoren in allen Fragen des Immobilienwirtschaftsrechts, insbesondere bei Immobilientransaktionen. In seiner Funktion als Co-Head des Freshfields Lab leitet er daneben eine Reihe von Projekten zur Umsetzung von technologiebasierten Lösungen für Mandanten.

Autor: Lukas Treichl, Associate und Co-Head Freshfields Lab, Freshfields Bruckhaus Deringer, Wien/Berlin. Lukas Treichl berät im Bereich Digitalisierung und Datenmanagement sowie bei komplexen IT-Projekten und den damit verbundenen gesellschaftsrechtlichen Transaktionen. Als Co-Head des Freshfields Lab arbeitet er an der Umsetzung von digitalen Lösungen für Mandanten an der Schnittstelle von Recht und Technologie.

- WERBUNG -