Franciszek Grzeganek hat sich in seinem ersten Projekt damit beschäftigt, den Dienst Azure Form Recognizer in Microsoft Dynamics einzubauen. Dabei hatte er auch mit verschiedenen Herausforderungen zu kämpfen, denn schnell wurde ihm das Projekt anvertraut, auch wenn es sich dabei um komplett neues Thema für ihn und die Entwicklungsabteilung handelte. Am Ende hat sich die Herausforderung aber gelohnt. Azure bietet verschiedene Technologien an, darunter auch das OCR (Optical Character Recognition) Tool. OCR ermöglicht, Text aus Dokumenten zu filtern. Azure Form Recognizer lässt sich auf verschiedene Dokumententypen trainieren und ist somit in der Lage, Schlüssel-/Wert-Paare zu erlernen und diese zu finden.
Projektkontext
Bisher mussten Daten von Dokumenten (z.B. Fahrzeug-Id. Nr., Kennzeichen von Fahrzeugscheinen) manuell in das System eingetippt werden. Manuelle Handhabung und komplizierte Zeichenketten machen das Verfahren sehr zeitaufwendig und fehleranfällig. Die Arbeitsweise ist dadurch auf Dauer nicht effizient und ressourcensparend. Mit dem Azure Form Recognizer wird ein großer Teil der Arbeit vom System übernommen. Es wird lediglich eine digitale Version des Dokuments benötigt, die durch fotografieren oder scannen des Dokuments erstellt wird. Diese digitale Version wird im Anschluss hochgeladen und nach wenigen Sekunden sind alle wichtigen Daten aus dem Dokument herausgefiltert.
Realisierung
Beim Hochladen der Datei ins CRM wird diese dann zum Formrecognizer gesendet, um dort erkannt zu werden. Während dessen wartet das CRM. Sobald der Formrecognizer fertig ist, werden die erkannten Daten zurück ins CRM geschickt und eingetragen.
Durchführung
Im ersten Schritt muss ein OCR-Model einmalig auf einen bestimmten Dokumententyp trainiert werden, beispielsweise auf Fahrzeugscheine oder Personalausweise. Mehr Beispiel-Exemplare in verschiedenen Qualitäten und aus verschiedene Winkeln fotografiert, verbessern das Gesamtergebnis. Auf den Bildern der Dokumente werden dann erkannte Felder gezeigt. Die Felder, die später in jedem Dokument erkannt werden sollen, müssen vom Benutzer markiert und benannt werden. Das Modell ist fertig trainiert und muss mit Dokumenten gefüttert werden.