Вышла очередная версия системы распознавания документов FineReader
Среди новшеств FineReader 8.0 — умение распознавать документы, снятые цифровой фотокамерой, и скриншоты; наличие менеджера сценариев; новые возможности по работе с PDF-файлам; режим ускоренного распознавания; возможность сохранить в распознанном документе такие свойства, как описание, автор, тема, ключевые слова

За 12 лет, прошедшие с момента выпуска OCR-системы FineReader компанией ABBYY (в годы создания первых версий — Bit Software), актуальность проблемы преобразования бумажных документов в электронные форматы нисколько не потеряла остроты. В конце августа 2005 года ABBYY представила очередную версию своего ПО — FineReader 8.0.

По данным от IDC, приведенным на пресс-конференции генеральным директором ABBYY Russia Григорием Липичем, мировой рынок ПО для ввода документов растет сейчас на 15% в год. По прогнозам, объем этого рынка в 2005 году превысит 1 млрд. долл. Этот рост Липич связывает с несколькими факторами, в частности с ростом количества бумажных документов (предсказания о переходе на исключительно электронный документооборот не сбылись).

Лицензий на предыдущую, седьмую версию FineReader, вышедшую в сентябре 2003 года, было продано в 2,4 раза больше по сравнению с шестой версией, а общее количество легальных копий FineReader в России за ее «время жизни» увеличилось более чем на 35 тыс. Следует отметить, правда, что 43% пользователей FineReader 7.0 приобрели облегченный вариант системы (Home Edition), а ABBYY пока не планирует выпуска такой версии FineReader 8.0.

Около 65% объема продаж в 2004 году пришлось на Северную Америку и Западную Европу, около 25% — на Россию и страны СНГ без Украины и около 10% — на Восточную Европу с Украиной. В Германии программа занимает более 40% рынка персональных OCR, в США — более 10%.

FineReader 8.0 выпущена в вариантах Professional Edition и Corporate Edition, предназначенных соответственно для небольшого офиса (либо индивидуального использования) и для офиса более крупного, то есть такого, где распознавать документы требуется более чем двум сотрудникам. Основное отличие вариантов в том, что в Corporate Edition включено приложение-планировщик ABBYY Hot Folder & Scheduling, способное вести по заданному пользователем расписанию автоматическую пакетную обработку изображений из папки в локальной сети или на FTP-сервере.

Среди новшеств версии — умение распознавать документы, снятые цифровой фотокамерой, и скриншоты; наличие менеджера сценариев; новые возможности по работе с PDF-файлам; режим ускоренного (в 2‑2,5 раза быстрее «обычного») распознавания, предназначенного для работы с документами высокого качества печати; поддержка формата электронных книг Microsoft Reader; возможность сохранить в распознанном документе такие свойства, как описание, автор, тема, ключевые слова.

Программа умеет распознавать и устранять искажения, вызванные неудачным освещением или фокусировкой, «изогнутыми» строками на краях фотографии. ABBYY рекомендует для фотографирования документа на листе А4 применять камеру с разрешением от 4 мегапикселов и выше.

Еще один новый источник изображений для распознавания — снимок экрана. Утилита ABBYY Screenshot Reader способна распознать и сохранить текст с любой области экрана компьютера, включая тексты, которые нельзя получить стандартными методами, например Web-страницы, созданные с применением флэш-технологий.

Менеджер сценариев позволяет автоматизировать однотипные действия по распознаванию. В нем имеется несколько распространенных сценариев по обработке документов, например сканирование с дальнейшей передачей результата в Word.

Новая версия способна извлекать информацию из всех текстовых слоев PDF-файлов и умеет создавать PDF-файлы, защищенные паролем (как на открытие документа, так и, например, на его печать), при этом используется 128‑битное шифрование на основе стандартов RC4 или AES. Появилась возможность создавать PDF-файлы с тэгами — такие файлы автоматически переформатируются под размер экрана, что удобно, например, для пользователей карманных компьютеров. При открытии многостраничного PDF- или TIFF-файла теперь можно указать диапазон страниц для открытия, а не открывать документ полностью.

И наконец, в FineReader 8.0 улучшены языковая и словарная поддержка. Программа распознает тексты на 179 языках; словарная поддержка и функции проверки правописания имеются для 36 языков, для немецкого и английского языков добавлены словари юридических и медицинских терминов.

В новой версии, по заверению представителей ABBYY, точность распознавания факсов выросла на 30%, цифровых фотографий — на 40%, документов, отсканированных с низким разрешением (актуально для документов, отсканированных на МФУ), — на 15%, а также повышена точность распознавания специализированных документов за счет возможности подключения пользовательского словаря.

Продажи FineReader 8.0 в России начнутся в сентябре.

Поделитесь материалом с коллегами и друзьями