OCR-Software - die optische Zeichenerkennung

OCR ist die Abkürzung für den englischen Begriff Optical Character Recognition und heißt übersetzt: optische Zeichenerkennung. OCR-Software wird genutzt, um ein gescanntes Bild mit Text in maschinenlesbaren Text umzuwandeln. Wenn ein Dokument, zum Beispiel ein Artikel aus der Tageszeitung, gescannt wird, wird es normalerweise als Bild auf einem Computer gespeichert. Der Computer kann dieses Bild am Monitor anzeigen und Menschen können es lesen. Für den Computer enthält das Bild jedoch nur eine Reihe von schwarzen und weißen Punkten. Der Computer erkennt keine Wörter auf dem Bild.

ocr-software

© Mediamodifier | pixabay.com


Die Vorteile von OCR-Software

Viele Unternehmen, Bildungseinrichtungen und andere Organisationen nutzen OCR-Software, um die Eingabe von Daten in den Computer zu beschleunigen. OCR-Software kann den Zeitaufwand für die Erfassung unterschiedlichster gedruckter oder handschriftlicher Dokumente erheblich verkürzen. Darüber hinaus reduziert die Verwendung von OCR-Software menschliche Fehler, die während der Dateneingabe auftreten können. Der größte Vorteil ist, dass gedruckte Dokumente nach der Texterkennung wie andere am Computer erstellte Dokumente weiter bearbeitet und durchsucht werden können.

Wie funktioniert die optische Zeichenerkennung?

Der erste Schritt bei der optischen Zeichenerkennung besteht darin, ein gescanntes Dokument so weit wie möglich zu "säubern". OCR-Software verwendet eine Vielzahl von Techniken, um Artefakte von Scans geringer Qualität zu entfernen, krumme Bilder zu begradigen, Unschärfe zu entfernen, um den OCR-Prozess so genau wie möglich zu machen. Darüber hinaus wird die Bilddatei in relevante Bereiche, das heißt Bereiche mit Texten und in für die Texterkennung irrelevante Bereiche mit Bildern, weißen Flächen oder einfachen Linien unterteilt. OCR-Programme nutzten im Wesentlichen zwei verschiedene Methoden zur Texterkennung. Die erste Methode beruht auf der Erkennung von vollständigen Zeichen, der sogenannten Mustererkennung. Bei der zweiten Methode, der Merkmalserkennung werden Schriftzeichen und Zahlen durch die Analyse der einzelnen Zeilen und Striche, aus denen sie zusammengesetzt sind, identifiziert.

ocr-books

© Free-Photos | pixabay.com


Texterkennung durch Mustererkennung

OCR-Software, die mit der Mustererkennung arbeitet, ist so programmiert, dass sie Buchstaben erkennen kann, die in einer Reihe gebräuchlicher Schriftarten geschrieben sind. Wie etwa Times New Roman, Helvetica, Courier, Arial oder Verdana. Die Mustererkennung ist also im Prinzip ein Vergleich der Schrift eines Dokumentes mit in einer Datenbank des Programms gespeicherten bekannten Schrifttypen. Das bedeutet, dass die Software mit geringer Fehlerquote gedruckten Text mit bekannten Schrifttypen erkennen kann, aber bei unbekannten Schriftarten oder bei handgeschriebenen Dokumenten kaum brauchbare Ergebnisse liefert.

Texterkennung durch Merkmalserkennung

Die Merkmalserkennung wird auch als Merkmalsextraktion oder intelligente Zeichenerkennung (ICR für Intelligent Character Recognition) bezeichnet. Bei der Merkmalserkennung werden Buchstaben in die einzelnen Bestandteile wie Linien, geschlossene Schleifen, Linienrichtung und Linienüberschneidungen zerlegt. Die extrahierten Merkmale reduzieren die Dimensionalität der Darstellung und machen den Erkennungsprozess rechnerisch effizient. Diese Merkmale werden mit einer abstrakten Darstellung eines Zeichens verglichen. Sogenannte Nächste-Nachbarn-Klassifikatoren, wie der k-nearest neighbors-Algorithmus, werden eingesetzt, um die extrahierten Bildmerkmale mit gespeicherten Merkmalen zu vergleichen und die am nächsten gelegene Übereinstimmung auszuwählen. Diese Technik wird in den meisten modernen Omnifont-OCR-Programmen eingesetzt, die nahezu jeden gedruckten Text erkennen können. Die Intelligent Character Recognition wird üblicherweise auch bei der Handschrifterkennung genutzt.

ocr-pc

© StartupStockPhotos | pixabay.com


Anwendungsgebiete für OCR-Software

OCR-Software wir eingesetzt für die Erfassung von Geschäftsdokumenten wie Rechnungen, Kontoauszügen und Quittungen. Anwalts- und Steuerberatungskanzleien nutzen diese Software, um zum Beispiel gedruckte Gerichtsurteile maschinenlesbar und durchsuchbar zu machen. Bei der Verkehrsüberwachung dienen OCR-Programme zur automatischen Kennzeichenerkennung. Ebenso können damit die Informationen auf einer Visitenkarte in eine Kontaktliste oder gedruckte Bücher für die Bearbeitung mit einer Textverarbeitung eingelesen werden. Bei der Post und Paketdienstleistern wird OCR-Software zur Sortierung von Briefen und Paketen genutzt. OCR-Software wird darüber hinaus verwendet, um blinden und stark sehbehinderten Menschen den Zugang zu gedruckten Texten zu erleichtern.

Freeware vs. gekaufte OCR-Programme

Kostenlose Software nutzt meist die Musterkennung und ist für die Anwendung zu Hause und die Erkennung von Standard Schrifttypen gut geeignet. Freeware OCR Programme liefern für die gelegentliche Texterkennung akzeptable Ergebnisse ohne, dass allzu viele Korrekturen erforderlich sind. Für den regelmäßigen Einsatz in Büros und Behörden und die Möglichkeit, handgeschriebene Texte erkennen zu können, ist der Kauf einer professionellen OCR-Software unverzichtbar. Die Genauigkeit bei der Texterkennung ist in der Regel wesentlich besser, als bei Freeware OCR Programmen und der Korrekturaufwand deutlich geringer. OCR-Software ist eine leistungsfähige Software, wenn es darum geht, gedruckte Texte in maschinenlesbare Dokumente umzuwandeln. Die Dateneingabe und -erfassung kann durch den Einsatz dieser Software erheblich vereinfacht werden und bei der manuellen Dateneingabe vorkommende Fehler werden vermieden. Mit OCR-Software umgewandelte Dokumente können wie andere digitale Dokumente durchsucht, bearbeitet und archiviert werden.



Sollte Ihr Drucker nicht einwandfrei funktionieren, können Sie gern kostenfrei einen Kostenvoranschlag anfragen!


Newsletter abonnieren
Der printer4you.com-Newsletter informiert Sie bequem über News, Trends und Angebote aus der Welt des Druckens. Diese Einwilligung kann jederzeit am Ende jeder E-Mail widerrufen werden.


Drucker Online-Management

Drucker Online-Management Überwachen Sie völlig kostenlos Ihre Drucker. Füllstände, Zählerstände, Status der Geräte uvm. Auf Wunsch können Ihre Drucker auch ganz von alleine benötigte Tinten & Toner nachbestellen.



Druckkosten berechnen

Druckkosten berechnen Berechnen Sie die Druckkosten Ihres Druckers oder finden Sie den günstigsten Drucker für Ihre Anforderungen.

Das sagen unsere Kunden


Alle Kundenmeinungen
eKomi - The Feedback Company
Bewertungen anzeigen >>