Fachartikel

Interview mit Dr. Haberler von LeReTo

Anfang August führten wir ein Interview mit Dr. Veronika Haberler, geschäftsführende Gesellschafterin von LeReTo, über die Aufgaben und Use Cases der Recherche-Technologie Software aus Österreich.

Liebe Veronika, wie kann man LeReTo in einem Satz umschreiben?

Veronika: Das ist gar nicht (mehr) so einfach. Wir bringen Dokumente mit Wissen zusammen.

Und in der „Langversion“? Bei welchen Aufgaben oder Use Cases kann man eure Technologie besonders gut einsetzen?

Veronika: Im Prinzip helfen wir überall dort, wo Menschen basierend auf einem Dokument Recherchen beginnen. Diese manuelle Arbeit erledigen wir mit unseren Tools automatisch und erzeugen intelligente Dokumente, die mit Links zu Content-Datenbanken oder Knowledge-Tooltips angereichert werden. Unsere User arbeiten dann mit unseren SmartPDFs in ihren elektronischen Akten weiter und ersparen sich das repetitive manuelle Googlen. In der Rechtsberatung oder Justiz sind unsere Core Use Cases etwa das Nachschlagen von referenzierten Fundstellen, wie Rechtsprechung, Gesetze und Literatur. Aber auch Fachbegriffe können mit Definitionen vollautomatisch angereichert werden. Wenn man also in einem Rechtsgutachten oder einem Schriftsatz auf einen Verweis trifft, genügt ein Klick und man gelangt auf kürzestem Wege zum benötigten Wissen.

In welchen Bereichen und Branchen wird eure Recherche-Technologie eingesetzt?

Veronika: Bei der ursprünglichen Entwicklung unserer Tools hatten wir vor allem den streitigen Bereich, also Litigation, Arbitration sowie die Rechtsmittelabteilungen der Gerichte im Blick. Denn hier wird besonders viel mit Dokumenten Dritter, wie etwa von gegnerischen Parteien oder Behörden, gearbeitet. Solche Dokumente enthalten oft eine Vielzahl an Fundstellen, die kritisch überprüft werden müssen.
Mittlere und große Kanzleien haben oft sogar eigene Knowledge-Teams, die solche Recherchen erledigen und die Quellen manuell zusammentragen. Bei den Gerichten sind dies in Österreich die Evidenzbüros der Rechtsmittelgerichte. Je höher die Instanz, umso wichtiger werden auch mit Judikatur untermauerte Argumente in der juristischen Auseinandersetzung. Unsere Technologien sorgen in diesen Bereichen für besonders hohe zeitliche Einsparungen und spielen für die eigentliche Kernarbeit frei.
Seit unserem Going Public hat sich so Einiges getan. Wir arbeiten nicht nur mit Hochdruck daran, Rechtsprechung aus ganz Europa in unsere Knowledge-Database zu integrieren, sondern treten vermehrt als Technologiepartner für Datenbank-Anbieter und die Verlagsbranche auf. Wir haben uns von einer App hin zu einem modularen Framework entwickelt, das nun flexibel an bestehende Systeme andocken kann. Unsere dokumenten-basierte Suchtechnologie wurde etwa direkt in die Soldan Fachsuche integriert und reichert nun PDFs der UserInnen mit Links zu deutscher Landes- und Bundesrechtsprechung an.

Welche Datenbanken und Quellen können über euch verlinkt werden?

Veronika: Unser Datenbestand wächst ständig weiter. Derzeit machen wir vor allem Rechtsprechung aus der gesamten DACH-Region inklusive Liechtenstein, den Niederlanden, Polen und UK sowie Rechtsprechung des EuGH zugänglich. Hier nutzen wir bevorzugt die offiziellen Datenbanken der Justizbehörden. Auch Dispute Settlements der World Trade Organization, oder etwa Kollektivverträge, Industrienormen, Firmenbuch- oder Handelsregisterverweise oder Fachtermini erkennen und verlinken wir. Wo immer technisch möglich, erkennen und verlinken wir auch Content von Verlagsdatenbanken, oder binden diesen Content gleich direkt in unsere Produkte ein.
Unser neuestes Feature „Knowledge-Tooltips“ eröffnet uns weitere Anwendungsbereiche abseits der Profi-Juristerei: Mit dem österreichischen Universitätsverlag facultas binden wir Glossartexte zu juristischen Fachbegriffen als Tooltips in PDFs ein. Dieser Anwendungsfall ist natürlich nicht auf Rechtswissenschaften beschränkt und macht insbesondere auch in fächerübergreifenden Texten sehr viel Sinn. So können ganze Lexika oder interne Datenbestände auf völlig neue Art zugänglich gemacht werden.

Wird man eure Technologie also auch in anderen Anwendungsfeldern antreffen?

Veronika: Das ist gut möglich! Wir lieben es an neuen Ideen zu arbeiten und innovative Lösungen für Wissensarbeit zu entwickeln. Dafür wurden wir auch bereits mehrfach ausgezeichnet. Zuletzt etwa beim EU-Datathon im Sommer 2019, ein europaweiter Wettbewerb, bei welchem wir mit dem ersten Platz ausgezeichnet wurden. Im Projekt setzten wir unsere Basis-Technologie ein, um Rechtsprechung des EuGH in Knowledge-Graphen zu visualisieren und mittels Netzwerkanalyse-Methoden in einer interaktiven Karte aufzubereiten. Dafür haben wir verschiedene wissenschaftliche Ansätze und Technologien miteinander kombiniert. Dieses Projekt und unsere Lösungen durften wir zu Beginn des Jahres sogar dem Europäischen Gerichtshof präsentieren. Zu diesem Anlass haben wir erstmals auch nicht-juristische Thesauri genutzt, um bei der vertiefenden Recherche eine semantische Simultan-Suche über mehrere europäische Datenbanken hinweg zu ermöglichen. Dieses Feature haben wir in nur zwei Wochen entwickelt und sogar mehrsprachig implementiert.

LeReTo Framework

Für alle Technik-Nerds: Was macht eure Technologie so besonders?

Veronika: Wenn man Daten in Echtzeit verarbeiten und aufbereiten möchte, und es dabei noch mit dem herausfordernden Format „PDF“ zu tun bekommt, muss man schon sehr tief in die Technik-Trickkiste greifen, um gute Resultate bei voller Skalierbarkeit zu erzielen. Unsere Kern-Technologie ist mittlerweile ein hochkomplexer Mix aus Daten-Extraktion, -Erkennung, Knowledge Management und PDF-Anreicherung. Um ein paar Zahlen zu nennen: Wir können 32MB reinen Text mit einer 2TB Datenbank in unter einer Sekunde abgleichen. Das ist richtig schnell. Wir haben unser Framework darauf ausgerichtet, große Mengen an Daten in Echtzeit mit einer sehr hohen Genauigkeit zu verarbeiten. Die Methoden und Techniken, die wir dabei einsetzen, ähneln jener der Google-Suchengine: Massively Parallel Processing unter der Anwendung von MapReduce, Divide&Conquer und Data Stream Analysis.
Es ist schon beeindruckend, wenn man „den Rechberger“ (Anm.: ein über 2.000 Seiten starker Standardkommentar zur öZPO aus dem Hause VERLAG ÖSTERREICH) binnen einer Sekunde mit weit über 15.000 Treffern in unserer Datenbank abgeglichen bekommt. Unsere Codebasis ist weitgehend in Python und Javascript geschrieben, teils setzen wir sogar auf Gaming-Technologie, um Datenvisualisierungen in Echtzeit zu rendern.

Gibt es noch einen abschließenden Tipp für all jene, die sich dieser Tage, möglicherweise erstmals, mit der Digitalisierung ihres Arbeitsalltags auseinandersetzen müssen?

Veronika: Beginnt mit kleinen Schritten. Nehmt euch zu Beginn nicht zu viel vor und erwartet auch von Technologie keine Perfektion. Kommt ins Tun und habt Spaß daran!

Herzlichen Dank für das Interview.

- WERBUNG -