Texterkennung Downloads kostenlos

Texterkennung in Bildern mithilfe von OCR-Software

Software zur Texterkennung basiert auf einem technischen Verfahren, welches Buchstaben und Zeichen in Bildern automatisch als Texte filtert. Dabei werden die Zeichen von der OCR-Software als dreidimensionale Kurven betrachtet. Bei der automatischen Texterkennung oder auch optischen Zeichenerkennung werden im ersten Schritt Bilder in relevante und nicht relevante Bereiche eingeteilt. Danach erfolgt eine Mustererkennung, in der die herausgefilterten Muster mit den in der Texterkennung abgelegten Daten verglichen werden. Auf Zeichen- und Wortebene werden so Musterkorrekturen vorgenommen, um die Fehlerquoten bei der Texterkennung möglichst gering zu halten. Im letzten Schritt der Schrifterkennung erfolgt die Codierung der Zeichen und die Konvertierung in das neue Dateiformat. Die gängigsten Formate dabei sind html, xml oder pdf; die Texte lassen sich jedoch auch in Word öffnen. Im Internet werden mittels Shareware unterschiedliche Programme zur automatischen Texterkennung angeboten. Hier können die Nutzer vor dem Kauf zunächst testen, welches Programm für ihre Zwecke am geeignetsten erscheint.

Automatische Worterkennung und Schrifterkennung in der Praxis

Fragmentarisch wurde die automatische Worterkennung bereits in den 70ger Jahren angewendet und kontinuierlich weiterentwickelt. Hier wurde noch mit einer eigens für das Programm zur Texterkennung entworfenen Schriftart gearbeitet. Die Algorithmen wurden bis heute kontinuierlich verbessert, sodass mittlerweile sogar Handschriften von der Texterkennung gelesen werden können. Praktische Anwendung findet die OCR Texterkennung zum Beispiel bei Digitalkameras oder Scannern, um den Nutzern das Abschreiben von Texten aus Bildern zu ersparen.