Die BLU DELTA KI lernt anhand von Trainingsdaten. In diesem Artikel erfahren Sie, wie dieser Prozess funktioniert und warum die Positionsinformation der Trainingsdaten, auch als Bounding Box bezeichnet, eine zentrale Rolle spielt. Über die Learn-API-Schnittstelle können Trainingsdaten, auch bekannt als Ground Truth, zur Verfügung gestellt werden, um die Künstliche Intelligenz zu schulen.

Künstliche Intelligenz benötigt Kontext, Text und Layout-Informationen, um Dokumente zu verstehen. Der Kontext kann von externen Quellen stammen, wie der Industrie, dem Land, in dem die Rechnung ausgestellt wurde, oder direkt aus Unternehmensdaten. Text und Bilder sind entscheidend, um die Bedeutung der Informationen zu erfassen. Das Layout des Dokuments liefert implizite Informationen über die Position und Gruppierung von Texten und Bildern, einschließlich Tabellen, Listen und Textblöcken.

In den meisten Fällen benötigt eine KI all diese Informationen während des Trainingsprozesses sowie später zur Qualitätsmessung (Benchmarking). Daher ist es unerlässlich, die Positionsdaten einer Information für das Trainings an die Künstliche Intelligenz weiterzugeben.

Betrachten wir ein konkretes Beispiel:

Wenn die KI in einem bestimmten Dokument die Bestellnummer erlernen soll, sind folgende Trainingsdaten (Ground Truth) erforderlich:

„Value“: “258934”,

„X“: 479,

„Y“: 915,

„Width“: 127,

„Height“: 30

Diese Werte definieren die sogenannte Bounding Box, also die konvexe Hülle, die die Zeichenkette am Dokument umgibt und dessen Position festlegt.

Integration der BLU DELTA Learn-API

Die BLU DELTA KI bietet eine eigene Schnittstelle, die Learn-API, an. Diese ermöglicht es, korrigierte Werte direkt in den KI-Trainingsprozess einzuspeisen, sei es aus einem Workflow oder einem Geschäftsprozess. Die Learn-API akzeptiert sowohl das Dokument als auch die essenziellen Dokumenteninformationen sowie deren Positionsdaten.

Es ist entscheidend, dass Positionsdaten bei der Korrektur im eigenen Prozess oder in der Oberfläche zwingend erfasst und dann an die Learn-API weitergeleitet werden. Die Oberfläche muss die Dokumente als Bilder mit einer Auflösung von 300 dpi darstellen und dem Benutzer ermöglichen, Textfelder im Dokument zu markieren.

Bei einer optimalen Integration werden dem Workflow nur die Dokumente oder Rechnungen angezeigt, bei denen die BLU DELTA KI unsicher ist. Ein Sachbearbeiter überprüft diese und korrigiert sie gegebenenfalls, indem er das betreffende Wort markiert, das dann direkt von der Learn-API übernommen wird. Im Hintergrund überträgt der Workflow diese Information direkt an die Learn-API, sodass diese Korrektur bereits im nächsten Training berücksichtigt wird.

Optional kann die Learn-API auch Werte ohne Positionsangaben akzeptieren. In solchen Fällen versucht ein intelligenter Algorithmus in Kombination mit KI, die Ground Truth (also die zugehörigen Positionsdaten zu den Werten) zu ermitteln. Dies ist jedoch nicht immer erfolgreich. Sollte dies nicht gelingen, muss ein BLU DELTA Data Labeler die fehlenden Informationen manuell ergänzen, wodurch das System langsamer lernt.

Natürlich kann die Learn-API auch nur die Dokumente übernehmen. In diesem Fall müssen alle Trainingsdaten manuell überprüft werden. Die Informationen werden nach Relevanz (Clustergröße, Active Learning) priorisiert und vom Kunden oder einem BLU DELTA Data Labeler manuell erfasst, bevor sie in das Training einfließen.

Weitere technische Details zur BLU DELTA Learn-API finden Sie auf www.bludelta.dev.

Porträt Martin Loiperdinger

Machen Sie Ihre Rechnungsprozesse
fit für die Zukunft!

blumatix NEWSLETTER

Am Puls der Zeit

Einordnung statt Hype. Relevante Entwicklungen rund um KI, Sicherheitsthemen und dokumentenbasierte Prozesse.

Mit dem Absenden des Formulars melden Sie sich zu unserem Newsletter an. Ihre E Mail Adresse wird zum Zweck des Versands über den Dienstleister Brevo gespeichert und verarbeitet. Die Anmeldung erfolgt im Double Opt in Verfahren. Rechtsgrundlage ist Ihre Einwilligung gemäß Art. 6 Abs. 1 lit. a DSGVO, die Sie jederzeit mit Wirkung für die Zukunft widerrufen können. Weitere Informationen finden Sie in unserer Datenschutzerklärung.