Системи оптичного розпізнавання тексту

OCR зазвичай працює з великим растровим зображенням сторінки з сканера. Зображення із стандартним ступенем дозволу виходять скануванням з точністю 9600 пікселів на дюйм. Зображення листа формату A4 при цьому дозволі займає близько 1 МБ пам'яті.  

Основне призначення OCR-систем полягає в аналізі растрової інформації (відсканованого символу) і привласненні фрагменту зображення відповідного символу. Після завершення процесу розпізнавання OCR-системы повинні уміти зберігати форматування початкових документів, привласнювати в потрібному місці атрибут абзацу, зберігати таблиці, графіку і так далі Сучасні програми розпізнавання підтримують всі відомі текстові і графічні формати і формати електронних таблиць, а деякі підтримують такі формати, як HTML і PDF.

Робота з OCR-системами, як правило, не повинна викликати особливих утруднень. Більшість таких систем мають простий автоматичний режим «скануй і розпізнавай» (Scan & Read). Крім того, вони підтримують і режим розпізнавання зображень з файлів. Проте для того, щоб досягти кращих з можливих для даної системи результатів, бажано (а нерідко і обов'язково) заздалегідь уручну набудувати її на конкретний вид тексту, макет бланка і якість паперу.

Дуже важливим при роботі з OCR-системой є зручність вибору мови розпізнавання і типу розпізнаваного матеріалу (машинка, що пише, факс, матричний принтер, газета і т. д. ), а також інтуїтивна зрозумілість призначеного для користувача інтерфейсу. При розпізнаванні текстів, в яких використано декілька мов, ефективність розпізнавання залежить від уміння OCR-системы формувати групи мов. В той же час в деяких системах вже є комбінації для найчастіше використовуваних мов, наприклад: російський і англійський.

На даний момент існує величезна кількість програм, що підтримують розпізнавання тексту як одну з можливостей. Ми не розглядатимемо такі системи, як AUTOCAD, оскільки розпізнавання тексту не є їх основним завданням.

Почнемо огляд з лідера в цій області — Finereader. Це програмний продукт фірми ABBYY Software, раніше розроблявся фірмою Bit Software. Остання версія програми (6

0) тепер має засоби для розробки нових систем на базі технології Finereader 6. 0. До складу сімейства Finereader 6. 0 тепер входять Finereader 6. 0 Professional, Finereader 6. 0 Corporate Edition, Finereader Scripting Edition 6. 0 і Finereader Engine 6. 0. Finereader 6. 0 крім того, що знає величезна кількість форматів для збереження, включаючи PDF, має можливість прямого розпізнавання з PDF-файлов. Нова технологія Intelligent Background Filtering (інтелектуальній фільтрації фону) дозволяє відсіяти інформацію про текстуру документа і фоновий шум зображення: іноді для виділення тексту в документі використовується сірий або кольоровий фон. Людині це не заважає читати, але звичайні алгоритми розпізнавання тексту випробовують серйозні утруднення при роботі з буквами, розташованими поверх такого фону. Тепер програма FineReader уміє визначати зони, що містять подібний текст, відокремлюючи текст від фону документа, знаходячи крапки, розмір яких менше певної величини, і видаляючи їх. При цьому контури букв зберігаються, так що точки фону, близько розташовані до цих контурів, не вносять перешкод, здатних погіршити якість розпізнавання тексту.

Використовуючи всі можливості сучасних програм верстки, дизайнери часто створюють об'єкти складної форми, такі, як обтікання непрямокутної картинки багатоколоночним текстом. У Finereader 6. 0 реалізована підтримка розпізнавання таких об'єктів і їх збереження у файлах формату MS Word. Тепер документи складної верстки будуть точно відтворені в цьому текстовому редакторові. Навіть таблиці розпізнаються з

1 2 3 4

Схожі роботи

Реферати

Курсові

Дипломні