Please enable JavaScript to view this site.

Prozess Designer

Navigation: Module > JobMind > Verwendung der Systemaktivität JobMind powered by Parashift

Stammdaten-Erkennung

Scroll Zurück Oben Weiter Mehr

Die Logik für Erkennung von Lieferanten- und Empfängernummern ist in JobRouter® implementiert.
Parashift liefert nur die Rohdaten für den Algorithmus und hat keinen Einfluss auf die eigentliche Erkennung dieser Informationen.

Voraussetzungen

Für die Erkennung von Lieferanten- und Empfängernummern sind Stammdaten notwendig, die zuvor dem System bereitgestellt werden müssen.
Beachten Sie dazu das Kapitel der Abgleichsdaten.
Sollten Sie auf extern gespeicherte Abgleichsdaten zugreifen wollen, beachten Sie dazu das UInterkapitel Externe Abgleichsdaten.

Durchführung

Der Erkennungs-Algorithmus bedient sich an den extrahierten Daten von Parashift. In der folgenden Tabelle finden Sie die relevanten Felder.

Parameter

Typ

Lieferanten-Nummer

Name

ID

Tax ID (Sender)

pp-tax-id-sender

IBAN

pp-banking-details-iban

Company name

pp-sender-address-company-name

Street

pp-sender-address-street

House number

pp-sender-address-house-number

Postal code

pp-sender-address-postal-code

City

pp-sender-address-city

Empfänger-Nummer

Name

ID

Tax ID (Receiver)

pp-tax-id-receiver

Company name

pp-receiver-address-company-name

Street

pp-receiver-address-street

House number

pp-receiver-address-house-number

Postal code

pp-receiver-address-postal-code

Die in der "Felder"-Spalte genannten Felder werden verwendet für die Erkennung der Lieferanten- bzw. Empfängernummer.
Sollte eines oder mehrere dieser Felder fehlen, werden diese im Algorithmus nicht berücksichtigt.

Bitte beachten Sie: Fehlen Fehler aus dieser genannten Liste in Ihrer ausgewählten Dokumentklasse, kann es sein, dass die Erkennung nicht die gewünschte Genauigkeit erreicht.

Empfängerbasierte Lieferantenerkennung

Hinweis: Dieses Feature wurde in 2024.1.24 erstmals eingeführt.

Sofern in den Abgleichsdaten der Lieferanten ein dedizierter Rechnungsempfänger zugeordnet ist, erfolgt die Lieferantenerkennung auch empfängerbasiert. D.h. es werden nur die Lieferanten in Betracht gezogen, die dem zuvor erkannten Empfänger zugeordnet sind. Dieses Verfahren wird nur angewendet, wenn der Empfänger zuvor sicher erkannt wurden ist, wenn nicht, dann wird die Lieferantenerkennung nicht auf den Empfänger eingeschränkt.

Die Empfänger-Nummer kann - sofern diese bekannt ist - für eine schnellere und bessere Lieferantenerkennung in den Eingabeparametern vorbelegt werden. In dem Fall wird die Empfängererkennung deaktiviert und die vorgegebene Empfänger-Nummer für die empfängerbasierte Lieferantenerkennung herangezogen.

Hinweis: Die Vorbelegung der Empfänger-Nummer ist seit 2024.1.28 möglich.

Algorithmus und Ergebnisse

Der Algorithmus liefert immer den Kandidaten mit der höchsten Confidence zurück in die Ausgabeparameter.

Zur Nachvollziehbarkeit wie der Algorithmus die Kreditoren- bzw. Empfänger-Nummern erkennt, finden Sie in der Log-Datei von JobActivity eine detaillierte Auflistung der Kandidaten und der Confidence des Systems in der Erkennung des Datensatzes. Das Log wird nur erzeugt, wenn der JobActivity-Dienst im "Info"-Modus läuft.

Extracted Values from OCR:

 Name: Office Depot GmbH

 Address: –Soldnerstraße 12 68219 Mannheim

Vendor Matches:

Match #1 (Returned Vendor):

Id: 888888 | Total Confidence: 68.97%

 Address with a confidence of '68.97%': Besselstraße 26 68219 Mannheim

 

2024-11-28 16:31:47.920 +01:00 [INF] Recipient Search Request

Extracted Values from OCR:

 Name: JobRouter Industries AG

 Address: Besselstraße 26 68219 Mannheim

Recipient Matches:

Match #1 (Returned Recipient):

Id: 101 | Total Confidence: 76.67%

 Name with a confidence of '52.38%': JobRouter AG

 Address with a confidence of '92.86%': Besselstrasse 26 68219 Mannheim

Match #2:

Id: 4017 | Total Confidence: 59.37%

 Name with a confidence of '42.86%': JobRouter Democloud

 Address with a confidence of '70.37%': Jobstrasse 26 68219 Mannheim

Match #3:

Id: 3010 | Total Confidence: 34.38%

 Address with a confidence of '34.38%': Bergfeldstrasse 9 83607 Holzkirchen

Pro Dokument gibt es im Log einen Eintrag mit der Aufteilung zwischen Kreditoren-Erkennung (Vendor) und Empfänger-Erkennung (Recipient).

Parameter

Typ

Extracted Values from OCR

Hier werden alle von Parashift erhaltenen Daten aufgelistet. Die Daten werden aus den Feldern, wie oben in "Durchführung" beschrieben, verwendet.

Vendor Matches & Recipient Matches

Bis zu 10 Kandidaten absteigend nach Confidence werden aufgelistet.

Kandidaten unter 30% werden nicht berücksichtigt.

Id

Id des Datensatzes aus der Stammdaten-Datenbank

Total Confidence

Gewichtete Quersumme der Confidence aus den Adressbestandteilen

... with a confidence of

Levenshtein Distanz zwischen Wert aus Parashift und Stammdaten-Information.

Rückgabe der Total Confidence für die Empfänger-/Lieferantenerkennung

Damit bei der Empfänger- und Lieferantenerkennung eingeschätzt werden kann, wie gut ein Empfänger/Lieferant erkannt wurde, kann die Total Confidence des 1. und 2. Treffers an den Vorgang zurückgegeben werden. Mit den Zahlen kann dann entschieden werden, ob die Erkennungsqualität ausreichend ist oder das Ergebnis verifiziert werden sollte.

Parameter

Erklärung

Empfänger-Nummer (Total Confidence)

Die Sicherheit mit der der Empfänger erkannt wurde.

Empfänger-Nummer (Total Confidence 2. Match)

Die Sicherheit mit der der 2. Kandidat als Empfänger erkannt wurde.

Lieferanten-Nummer (Total Confidence)

Die Sicherheit mit der der Lieferant erkannt wurde.

Lieferanten-Nummer (Total Confidence 2. Match)

Die Sicherheit mit der der 2. Kandidat als Lieferant erkannt wurde.

Die Total Confidence wird als Wert zwischen 0 und 1 zurückgegeben, wobei der Wert 1 = 100% entspricht.

Mit der Total Confidence des 2. Matches kann abgeschätzt werden, inwiefern die Total Confidence des 1. Treffers aussagekräftig ist. Liegt z.B. die Total Confidence bei 0,91 (91%) und die Total Confidence des 2. Matches bei 0,9 (90%), dann ist die Erkennungsrate insgesamt zwar sehr hoch, aber auch unsicher, weil es sich um 2 Empfänger/Lieferanten handelt, deren Adressdaten sehr ähnlich zueinander sind.

Hinweis: Dieses Feature wurde in 2024.1.28 erstmals eingeführt.