Technologie

Eine Suchmaschine, die zitieren muss.

Retriva ist kein Chatbot mit angeschlossener Datenbank, sondern eine Recherche-Pipeline mit Quellenpflicht: Das Sprachmodell darf nur aussprechen, was die Suche vorher in Ihren Dokumenten belegt hat. Diese Seite zeigt, wie das technisch funktioniert.

Die vier Bausteine

Hybride Suche, Feinsortierung, Konfidenz-Prüfung, Quellenpflicht.

Jede Anfrage durchläuft vier Stationen. Keine davon ist optional, denn jede einzelne verhindert eine eigene Klasse von Fehlern.

Hybride Suche

Zwei Verfahren laufen parallel: eine exakte Stichwortsuche für Paragraphen, Aktenzeichen und Fachbegriffe sowie eine Bedeutungssuche, die auch Umschreibungen findet. Wer nach "Geschäftsessen" fragt, findet auch "Bewirtungsaufwendungen".

Re-Ranking

Ein zweites, genaueres Modell liest die Kandidaten tatsächlich und sortiert sie neu: Frage und Abschnitt werden Satz für Satz verglichen. Nur die besten Fundstellen erreichen die nächste Station.

Konfidenz-Prüfung

Vor der Antwort prüft Retriva die Beleglage: Sind die Fundstellen gut genug, um die Frage zu tragen? Liegt der beste Treffer unter dem Schwellwert, wird keine Antwort erzeugt. Punkt.

Quellenpflicht

Das Sprachmodell erhält ausschließlich die geprüften Fundstellen, nicht das offene Internet und nicht sein Trainingswissen. Jede Aussage in der Antwort verweist auf Dokument, Abschnitt und Seite.

Der Weg einer Frage

Von Ihrer Frage zur belegten Antwort in fünf Schritten.

Alle fünf Schritte laufen auf Ihrer Hardware. Keine Anfrage, kein Dokument und kein Zwischenergebnis verlässt die Kanzlei.

  1. Schritt 01

    Frage verstehen

    Retriva erkennt Fachbegriffe, Abkürzungen und Normzitate in Ihrer Frage. Aus "Bewirtung Mandant absetzbar?" werden präzise Suchbegriffe und ihre juristischen Synonyme.

    Eingabe: Bewirtung Mandant Erkannt: § 4 Abs. 5 EStG, Betriebsausgabe

  2. Schritt 02

    Hybride Suche

    Stichwortsuche und Bedeutungssuche durchkämmen den Index parallel. Die Stichwortsuche trifft exakte Normen, die Bedeutungssuche findet Umschreibungen und verwandte Sachverhalte.

    22.000 Abschnitte durchsucht 62 Kandidaten in 0,4 s

  3. Schritt 03

    Re-Ranking

    Der Feinsortierer liest jeden Kandidaten im Wortlaut und bewertet, wie gut er die Frage wirklich beantwortet. Aus 62 Kandidaten werden die 5 tragfähigsten Fundstellen.

    62 gelesen, 5 behalten Bestwert: 0,94

  4. Schritt 04

    Konfidenz-Prüfung

    Das Gate entscheidet: Trägt die Beleglage eine Antwort? Wenn nicht, bekommen Sie das ehrlich gesagt, statt einer plausibel klingenden Vermutung.

    Beleglage: ausreichend Gate: offen

  5. Schritt 05

    Antwort mit Quelle

    Das lokale Sprachmodell formuliert die Antwort ausschließlich aus den geprüften Fundstellen. Jede Aussage trägt Quelle und Seitenzahl, klickbar bis ins Originaldokument.

    Quelle: BMF-Schreiben, S. 4 Quelle: § 4 Abs. 5 EStG

Halluzinations-Schutz

Lieber keine Antwort als eine falsche.

Sprachmodelle können überzeugend klingen und trotzdem falsch liegen. Retriva begegnet dem nicht mit Hoffnung, sondern mit drei technischen Sperren.

Konfidenz-Gate

Ohne ausreichende Beleglage entsteht gar keine Antwort. Das Gate sitzt vor dem Sprachmodell, nicht dahinter: Was die Suche nicht belegt hat, kann das Modell nicht behaupten.

Zitierpflicht

Jede Aussage muss auf eine konkrete Fundstelle zeigen. Sätze ohne Beleg werden verworfen, bevor Sie sie sehen. Sie prüfen jede Behauptung mit einem Klick im Original.

Geschlossener Wissensraum

Das Modell antwortet nur aus den gefundenen Abschnitten Ihrer Dokumente, nie aus seinem Trainingswissen. Erfundene Urteile und Phantasie-Paragraphen haben damit keine Eintrittspforte.

So sieht eine verweigerte Antwort aus. Das wirkt im ersten Moment unbequem, ist aber der Kern des Produkts: Eine Recherche, die nicht rät, können Sie gegenüber Mandanten verantworten.

Hardware

Läuft auf einem Mac mini im Schrank Ihrer Kanzlei.

Kein Serverraum, kein Rack, kein Vertrag mit einem Rechenzentrum. Retriva läuft auf einem einzelnen Kleinrechner, der neben die Aktenordner passt und etwa so viel Strom braucht wie eine helle Glühbirne.

Die Einrichtung übernehmen wir: Gerät anschließen, Dokumente einlesen, Team-Konten anlegen. Ab dann arbeitet Retriva im Hintergrund. Updates für Gesetze und Rechtsprechung spielen Sie per geprüftem Update-Paket ein, eine dauerhafte Internetverbindung ist nicht nötig.

Ehrlich dazu: Für Kanzleien ab etwa 20 gleichzeitig recherchierenden Personen empfehlen wir ein zweites Gerät. Auch das beraten wir vor dem Kauf.

GerätMac mini, Apple M4 Pro
Arbeitsspeicher64 GB
Stellfläche12,7 x 12,7 cm
Leistungsaufnahme unter Lastca. 40 W
Lautstärke im Betriebpraktisch unhörbar
Internet für den Betriebnicht erforderlich
Einmalige Anschaffungca. 2.500 bis 4.000 Euro

Messwerte

Zahlen, die wir nicht schönrechnen.

Gemessen an 100 Fachfragen aus Steuer- und Zivilrecht, gestellt gegen einen Index mit 22.000 Abschnitten, auf der oben beschriebenen Hardware.

0,9 s

mittlere Suchzeit pro Anfrage, inklusive Re-Ranking

89 von 100

Testfragen korrekt beantwortet, jede Aussage mit prüfbarer Fundstelle

8 von 100

Fragen ohne Antwort: das Konfidenz-Gate hat die Beleglage abgelehnt

Bleiben 3 von 100: Diese Antworten waren unvollständig oder in einem Detail falsch und fielen erst beim Quellencheck auf. Genau deshalb zeigt Retriva zu jeder Antwort die Fundstellen. Wir runden diese Zahl nicht weg: Sie sollen wissen, was Sie kaufen, und die Quellenprüfung bleibt Teil Ihrer Arbeit.

Sehen Sie die Pipeline mit Ihren eigenen Akten.

In 30 Minuten zeigen wir Ihnen Suche, Konfidenz-Gate und Quellenangaben live an Ihren Dokumenten. Danach wissen Sie, ob Retriva zu Ihnen passt.