Компания Cognitive Technologies широко известна в относительно узком кругу лиц и фирм, занимающихся корпоративным документооборотом. Так случилось, что торговая марка одного из крупнейших российских производителей программного обеспечения почти незнакома рядовым пользователям. Между тем, будучи одним из двух непосредственных наследников еще советского научного задела в области распознавания образов, выдвинувшего нашу страну в мировые лидеры этого направления (другой – всем известная ABBYY со своим FineReader), Cognitive периодически выдает интереснейшие продукты. Один из них она наконец-то решила представить и широкой публике.

Основное назначение программы под названием Compressimo — сжатие сканированных документов с целью хранения их в архиве. При этом содержимое полученного pdf-файла сохраняет все особенности оригинала -- логотипы, печати, рукописные подписи и резолюции остаются на своих местах. Причем результат работы Compressimo имеет два важнейших отличия от простого изображения. Во-первых, такой документ содержит текстовый слой, куда автоматически помещается все, что можно распознать. Он будет доступен для индексации в базах данных, для поисковиков в Интернете или для обычного копирования текста с целью переноса его в другой документ. Во-вторых, сжатый оригинальным фирменным алгоритмом полученный файл, по уверению разработчиков, будет иметь объем примерно в 100 раз меньший, чем исходная картинка в несжатом формате. Понятно, что такой pdf-файл удобно не только хранить в архиве, но и использовать самыми разными способами, например в качестве компактного вложения для отправки по электронной почте (для чего в программе предусмотрена специальная опция).

Программа рассчитана на рядового пользователя и потому максимально облегчена: например, разработчики удержались от обычного в подобных случаях искушения ввести многочисленные настройки сканирования. Она состоит из единственного окна.

 

Compesso? Compressimo!

 

(рис. 1). Здесь всего три настройки: можно задать источник (по умолчанию — сканер, отметив пункт «Читать изображения с диска», или выбрать уже готовый скан), язык распознавания, а также, выбрав пункт «Потоковое сканирование», обрабатывать многостраничные документы в сканере со входным лотком. Собственно, работа заключается в том, чтобы уложить документ в сканер и нажать кнопку «Сканирование» (или загрузить имеющуюся картинку). По окончании обработки всех страниц следует нажать кнопку «Готово», а затем сохранить полученный документ на диске или отправить его по почте.

Поначалу несколько напрягает отсутствие привычного окна с установлением области сканирования (весь процесс протекает скрыто от пользователя), но к этому быстро привыкаешь. Зато не происходит никаких задержек: от начала сканирования до сохранения файла страницы у меня проходило не более 1 мин (просто мой старенький сканер не в состоянии работать быстрее).

Обычные документы с печатями и подписями, как и ожидалось, программа распознает безупречно – для проверки я сканировал последнюю страницу своего договора с издательством, специально уложив ее в сканер вверх ногами и слегка перекосив. Фрагмент результата показан на рисунке, где голубым выделен распознанный текст.

 

Compesso? Compressimo!

 

Внешне страница полностью соответствует оригиналу, причем с нее большей частью вычищена грязь, лист развернут в нормальном положении, а pdf-файл занимает на диске меньше 60 Кбайт (JPEG-картинка той же страницы с разрешением 300 dpi и средним качеством сжатия заняла 1,7 Мбайт).

Как показали эксперименты, трудности возникают, если использовать программу вне той области, для которой она предназначена. Например, сканирование официальных документов на муаровом фоне также может быть осуществлено, но лишь в чисто технических целях. Скан банального паспорта у меня приобрел устрашающий внешний вид (как очень сильно пережатый JPEG), хотя текст на сложном узорчатом фоне в общем был распознан без ошибок. Разработчики уверяют, что у компании для этой цели есть специальные продукты (например, для личных документов -- Cognitive Passport). Так что стоит принять за данность, что Compressimo работает именно в той области, для которой создана, и не стоит требовать от продукта того, чего он не в состоянии выполнить.

Резюме: если Compressimo использовать по назначению, то она дает просто восхитительные результаты. Причем это касается и степени сжатия, и качества распознавания текста, и представления результатов. Стоящая 19,99 евро, программа Compressimo вполне достойна внимания практически всех категорий пользователей.

Купить номер с этой статьей в PDF
1356