Wie werden Dokumente in Papierform eigentlich digitalisiert?
Eine Möglichkeit ist es, die Dokumente händisch in den Computer zu übertragen, indem sie einfach abgetippt werden. Das ist jedoch mit viel Zeitaufwand und Tippfehlern verbunden.
Eine deutliche schnellere Methode ist Optical Charakter Recognition (OCR). Hierbei wird zunächst ein Bild von dem Dokument in Papierform mithilfe eines Scanners oder einer Kamera erstellt. Anschließend verwendet man OCR-Technologie, um den Inhalt des Dokumentes aus dem Bild zu extrahieren und in bearbeitbare und durchsuchbare Dateien umzuwandeln.
Was genau ist Optical Character Recognition?
OCR ist ein Prozess, bei dem Text aus Bildern (getippt, handgeschrieben oder gedruckt) in maschinenlesbare Textdokumente umgewandelt wird. Vereinfach gesagt ist OCR also eine Methode, um Text aus Bildern und gescannten Dokumenten zu erkennen.
Wo wird OCR angewendet?
OCR ist die Grundlage zahlreicher Digitalisierungsprozesse, da häufig die Notwendigkeit besteht, analoge Dokumente in digitale Formate zu überführen. In Kombination mit robotergestützter Prozessautomatisierung (RPA) und künstlicher Intelligenz (KI) ermöglicht OCR somit die Automatisierung von dokumentenbasierten Workflows.
Zudem wird OCR-Technologie beispielsweise beim Versand von Briefen und Paketen eingesetzt, um diese zu sortieren. Ein anderes Beispiel für den Einsatz von OCR-Technologie ist das automatische Auslesen von Kennzeichen auf Blitzerfotos. Darüber hinaus können immer mehr Smartphones automatisch Texte aus Fotos auslesen und umwandeln.
Auch bei claimflow verwenden wir OCR als ersten Schritt unserer digitalen Dokumentenverarbeitung, um im nächsten Schritt mithilfe unserer eigenen KI den erkannten Text auch inhaltlich zu verstehen und die extrahierten Informationen weiter zu verarbeiten.
Quellen: Bots and People und IBM (übersetzt)
Schaden gut. Alles gut.