Die Logik für Erkennung von Lieferanten- und Empfängernummern ist in JobRouter® implementiert.
Parashift liefert nur die Rohdaten für den Algorithmus und hat keinen Einfluss auf die eigentliche Erkennung dieser Informationen.
Voraussetzungen
Für die Erkennung von Lieferanten- und Empfängernummern sind Stammdaten notwendig, die zuvor dem System bereitgestellt werden müssen.
Beachten Sie dazu das Kapitel der Abgleichsdaten.
Sollten Sie auf extern gespeicherte Abgleichsdaten zugreifen wollen, beachten Sie dazu das UInterkapitel Externe Abgleichsdaten.
Durchführung
Der Erkennungs-Algorithmus bedient sich an den extrahierten Daten von Parashift. In der folgenden Tabelle finden Sie die relevanten Felder.
Parameter |
Typ |
||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Lieferanten-Nummer |
|
||||||||||||||||
Empfänger-Nummer |
|
Die in der "Felder"-Spalte genannten Felder werden verwendet für die Erkennung der Lieferanten- bzw. Empfängernummer.
Sollte eines oder mehrere dieser Felder fehlen, werden diese im Algorithmus nicht berücksichtigt.
Bitte beachten Sie: Fehlen Fehler aus dieser genannten Liste in Ihrer ausgewählten Dokumentklasse, kann es sein, dass die Erkennung nicht die gewünschte Genauigkeit erreicht.
Empfängerbasierte Lieferantenerkennung
Hinweis: Dieses Feature wurde in 2024.1.24 erstmals eingeführt.
Sofern in den Abgleichsdaten der Lieferanten ein dedizierter Rechnungsempfänger zugeordnet ist, erfolgt die Lieferantenerkennung auch empfängerbasiert. D.h. es werden nur die Lieferanten in Betracht gezogen, die dem zuvor erkannten Empfänger zugeordnet sind. Dieses Verfahren wird nur angewendet, wenn der Empfänger zuvor sicher erkannt wurden ist, wenn nicht, dann wird die Lieferantenerkennung nicht auf den Empfänger eingeschränkt.
Die Empfänger-Nummer kann - sofern diese bekannt ist - für eine schnellere und bessere Lieferantenerkennung in den Eingabeparametern vorbelegt werden. In dem Fall wird die Empfängererkennung deaktiviert und die vorgegebene Empfänger-Nummer für die empfängerbasierte Lieferantenerkennung herangezogen.
Hinweis: Die Vorbelegung der Empfänger-Nummer ist seit 2024.1.28 möglich.
Algorithmus und Ergebnisse
Der Algorithmus liefert immer den Kandidaten mit der höchsten Confidence zurück in die Ausgabeparameter.
Zur Nachvollziehbarkeit wie der Algorithmus die Kreditoren- bzw. Empfänger-Nummern erkennt, finden Sie in der Log-Datei von JobActivity eine detaillierte Auflistung der Kandidaten und der Confidence des Systems in der Erkennung des Datensatzes. Das Log wird nur erzeugt, wenn der JobActivity-Dienst im "Info"-Modus läuft.
Extracted Values from OCR:
Name: Office Depot GmbH
Address: –Soldnerstraße 12 68219 Mannheim
Vendor Matches:
Match #1 (Returned Vendor):
Id: 888888 | Total Confidence: 68.97%
Address with a confidence of '68.97%': Besselstraße 26 68219 Mannheim
2024-11-28 16:31:47.920 +01:00 [INF] Recipient Search Request
Extracted Values from OCR:
Name: JobRouter Industries AG
Address: Besselstraße 26 68219 Mannheim
Recipient Matches:
Match #1 (Returned Recipient):
Id: 101 | Total Confidence: 76.67%
Name with a confidence of '52.38%': JobRouter AG
Address with a confidence of '92.86%': Besselstrasse 26 68219 Mannheim
Match #2:
Id: 4017 | Total Confidence: 59.37%
Name with a confidence of '42.86%': JobRouter Democloud
Address with a confidence of '70.37%': Jobstrasse 26 68219 Mannheim
Match #3:
Id: 3010 | Total Confidence: 34.38%
Address with a confidence of '34.38%': Bergfeldstrasse 9 83607 Holzkirchen
Pro Dokument gibt es im Log einen Eintrag mit der Aufteilung zwischen Kreditoren-Erkennung (Vendor) und Empfänger-Erkennung (Recipient).
Parameter |
Typ |
---|---|
Extracted Values from OCR |
Hier werden alle von Parashift erhaltenen Daten aufgelistet. Die Daten werden aus den Feldern, wie oben in "Durchführung" beschrieben, verwendet. |
Vendor Matches & Recipient Matches |
Bis zu 10 Kandidaten absteigend nach Confidence werden aufgelistet. Kandidaten unter 30% werden nicht berücksichtigt. |
Id |
Id des Datensatzes aus der Stammdaten-Datenbank |
Total Confidence |
Gewichtete Quersumme der Confidence aus den Adressbestandteilen |
... with a confidence of |
Levenshtein Distanz zwischen Wert aus Parashift und Stammdaten-Information. |
Rückgabe der Total Confidence für die Empfänger-/Lieferantenerkennung
Damit bei der Empfänger- und Lieferantenerkennung eingeschätzt werden kann, wie gut ein Empfänger/Lieferant erkannt wurde, kann die Total Confidence des 1. und 2. Treffers an den Vorgang zurückgegeben werden. Mit den Zahlen kann dann entschieden werden, ob die Erkennungsqualität ausreichend ist oder das Ergebnis verifiziert werden sollte.
Parameter |
Erklärung |
---|---|
Empfänger-Nummer (Total Confidence) |
Die Sicherheit mit der der Empfänger erkannt wurde. |
Empfänger-Nummer (Total Confidence 2. Match) |
Die Sicherheit mit der der 2. Kandidat als Empfänger erkannt wurde. |
Lieferanten-Nummer (Total Confidence) |
Die Sicherheit mit der der Lieferant erkannt wurde. |
Lieferanten-Nummer (Total Confidence 2. Match) |
Die Sicherheit mit der der 2. Kandidat als Lieferant erkannt wurde. |
Die Total Confidence wird als Wert zwischen 0 und 1 zurückgegeben, wobei der Wert 1 = 100% entspricht.
Mit der Total Confidence des 2. Matches kann abgeschätzt werden, inwiefern die Total Confidence des 1. Treffers aussagekräftig ist. Liegt z.B. die Total Confidence bei 0,91 (91%) und die Total Confidence des 2. Matches bei 0,9 (90%), dann ist die Erkennungsrate insgesamt zwar sehr hoch, aber auch unsicher, weil es sich um 2 Empfänger/Lieferanten handelt, deren Adressdaten sehr ähnlich zueinander sind.
Hinweis: Dieses Feature wurde in 2024.1.28 erstmals eingeführt.