CuneiForm для Linux

Международное сообщество независимых разработчиков выпустило очередную версию системы распознавания текста CuneiForm для платформы Linux. Номер версии — 1.0 вводит в заблуждение: представляется, что это первая стабильная сборка программы. Однако никакой официальной информации не предоставлено, версия скромно названа «очередной». В новом релизе проведена большая работа по исправлению ошибок и чистке исходных текстов, благодаря чему, по словам разработчиков, достигнута стабилизация кодовой базы проекта.

В настоящее время код CuneiForm для Linux, распространяющийся под упрощенной лицензией BSD, основан на коде, открытом компанией Cognitive Technologies в 2007 г.

Как заявлено разработчиками, новая версия CuneiForm способна распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров, за исключением декоративных и рукописных. Программа понимает более 20 языков, имеется и поддержка распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т. д.).

Правда, новая версия уже вызвала множество нареканий — пользователи отмечают, что по сравнению с предыдущей версией 0.9 изменений в функционале почти незаметно. CuneiForm по-прежнему во многом проигрывает популярному OCR-приложению для Windows — ABBYY FineReader. Однако в случае отсутствия работающих и при этом свободно распространяемых альтернатив для Linux (ко всему прочему поддерживающих русский язык) CuneiForm вполне подойдет для распознавания простых текстов с минимальным числом таблиц, изображений и сложного форматирования.

Paragon PenReader

Компания Paragon Software выпустила девятую версию программы PenReader, обеспечивающей перевод в электронный формат текста, написанного от руки на планшетных ПК и обычных компьютерах (с планшетом).

Программа «знает» 30 языков (русский, все европейские, арабский и иврит) и автоматически определяет, на каком из них написан текст. Перевод рукописного текста в набранный осуществляется мгновенно. При этом не имеет значения, в каком месте экрана или планшета и под каким углом он был написан. Теперь PenReader способна понимать практически любой почерк. Кстати, можно определить способы собственного написания отдельных символов, и тогда распознавание улучшится. Если же написанное от руки покажется утилите неясным, она предложит несколько вариантов сомнительного фрагмента. А чтобы повысить скорость распознавания, в словарь программы предлагается добавить часто используемые сокращения, аббревиатуры, специфическую лексику. При этом она работает в двух режимах: при полноэкранном распознавании, а также посредством интеграции в штатную панель распознавания Windows.

По заявлениям разработчиков, продукт был протестирован на 80 тыс. примеров текстов, написанных от руки, и 97 % из них были удачно распознаны.

Новая версия PenReader совместима с планшетными и настольными ПК, работающими под управлением MS Windows 9х/2000/NT/Me/XP/Vista/7.

Купить номер с этой статьей в PDF
737