Спустя два года появилась вторая версия, в ней был реализован принцип адаптивного самообучения, что значительно расширило возможности по распознаванию символов и улучшило качество распознавания. К третьей версии программа научилась использовать контекст и выдвигать гипотезы о целых словах. Таким образом, был осуществлен переход на новый уровень — от букв к целому слову.

В отличие от большинства существующих OCR-программ, ABBYY FineReader 10 умеет распознавать документ на уровне его структуры

Известность ABBYY принесла четвертая версия, с которой компания вышла на мировой рынок и в которой была, в частности, реализована процедура повторной обработки неуверенно распознанных символов и увеличено количество распознаваемых языков. Следующий шаг в развитии OCR (Optical Character Recognition — «оптическое распознавание символов») — распознавание на уровне страницы — был сделан частично в пятой и в особенности в шестой версии, которая научилась производить анализ физической структуры документа, то есть отделять текст от таблиц и изображений. Как заявила Прокашева, большинство известных OCR-программ работает на первых трех уровнях распознавания, в то время как ABBYY удалось перейти от уровня страницы к уровню документа.

В FineReader 10, при помощи второго поколения адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), документ анализируется как единое целое, с полным восстановлением его логической структуры, что облегчает пользователю дальнейшую работу, поскольку избавляет от повторного форматирования распознанного текста. Программа также научилась лучше работать с документами, содержащими сложный фон. Кроме того, был сделан следующий шаг в технологии обработки изображений, полученных с помощью фотоаппарата, и в десятой версии появилась возможность распознавать снимки, сделанные камерой мобильного телефона.

Количество распознаваемых языков достигло 186. В частности, появилась возможность работать с документами на идиш, а также на корейском языке, что Прокашева объяснила растущим интересом ABBYY к продвижению на восточных рынках. Что касается точности распознавания, то в юбилейной версии программы она повысилась на 30% для азиатских языков и на 20% — для европейских. Был существенно переработан пользовательский интерфейс: в редакторе предварительной обработки появился ряд специальных настроек для распознавания изображений, полученных с камеры мобильного телефона, а во встроенном текстовом редакторе наиболее популярные настройки вынесены на верхнюю панель, что существенно облегчило доступ пользователя.

Изменения претерпел также процесс постобработки документов и экспорт их в популярные форматы. Так, при создании pdf-файлов в FineReader 10 используется позволяющая получить меньший размер файла без потери качества технология сжатия MRC (Mixed Raster Content), которая разбивает полученное изображение на слои исходя из содержимого (текст, картинка, таблица) и сжимает каждый слой отдельно наиболее эффективным способом. Еще одно изменение коснулось сохранения в формате HTML: программа может автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие им главы книги, что облегчает создание электронных книг. 

Поделитесь материалом с коллегами и друзьями

Купить номер с этой статьей в PDF