17.3.2023

OCR – nosná technologie digitalizace

Častokrát jsme dostali otázku od zákazníka nebo obchodního partnera – „jaká je úspěšnost OCR“? Dnes si dovolím odpovědět exaktně…

Optické rozpoznávání znaků či OCR je metoda, která zajišťuje zpracování strojově psaného textu z elektronického obrazu. Takzvané OCRko je dnes velmi používanou technologií. Dokonce, je tato technologie i zdarma. Zde si dovolím použít otřepanou frázi „co nic nestojí, za nic nestojí“. Co dnes OCRko musí splňovat, aby bylo v praxi použitelné:

  • Přijmout elektronický obraz z emailu nebo souborového systému
  • Spustit OCR technologii nad dokumenty
  • Dodat výsledek předat do systému, který vytvoří ze znaků metadata k dokumentu
  • Vytvořit prohledávatelné PDF a metadat ve standardním formátu (xml, csv, txt)
  • Musí to být serverová instance
  • Uživatelsky přístupná, pro případnou korekci, lépe řečeno opravu OCR chyb nebo chybných informací na dokumentu
  • Nesmí licenčně limitovat uživatele.

Jaká je tedy dnes úspěšnost OCR?

..úspěšnost OCR od INFOMATICu na softwarové platformě MetaServer je +95%.

Důkaz místo slibů:

Kvalitní OCR zajišťuje automatizaci dokumentů. Systém správně přiřadí metadata, která definují dokument. Tedy dávájí dokumentům „duši“ a je možné dále s dokumenty pracovat a dohledávat je. Každý core systém firmy nebo organizace, tj. BPM /DMS / ERP / CRM potřebuje dokumenty, která obsahují metadata. A buď metadata dáte core systému manuálně nebo automatizovaně.

Správná cesta k digitalizaci je konzultace s námi, abychom našli řešení a nehledali technologii.

David Večeřa
david.vecera@infomatic.cz

Mohlo by vás zajímat

Potřebujete pomocnou ruku? Ozvěte se!