необходимую информацию среди всех ваших документов, будь то письма, статьи, договора, электронная почта, рукописи или фотографии.

Комплекс CuneiForm Collection занимает один компакт-диск и включает в себя системы распознавания текстов CuneiForm 98 Direct и CuneiForm 96 Gold, а также электронный архив "Евфрат 97@SOHOII", разработанные фирмой Cognitive Technologies. Остановимся подробнее на системе CuneiForm 98 Direct - именно она является новинкой и составляет сегодня предмет нашего рассмотрения.

По мнению специалистов Cognitive Technologies, эта система существенно отличается от других программ распознавания.

Прежде всего в ней реализованы алгоритмы самообучения, которые обеспечивают точность распознавания документов среднего и даже низкого качества на 30-40% выше, чем методы, используемые в обычных системах.

Это означает, что если раньше подобные программы на странице текста, например, низкого качества оставляли 10 ошибок, то теперь их число снизится до шести-семи.

Как же происходит самообучение? CuneiForm 98 Direct распознает текcт за два прохода. В первый раз она читает текст как обычная омнифонтовая система и на основе хорошо пропечатанных символов сама генерирует шрифт - автоматически оценивает "веса уверенности распознавания символов" и выбирает те из них, которые обладают достаточно высокими весовыми коэффициентами.

При втором проходе CuneiForm 98 Direct работает по шрифтовому методу, "накладывая" на плохо пропечатанные символы этот сгенерированный шрифт (в качестве шаблонов). Осуществляется как бы "привязка" к данному шрифту, полученному, например, на какой-то конкретной пишущей машинке с учетом его характерных особенностей и дефектов, в результате степень распознавания текста повышается.

Предусмотрен здесь и словарный контроль, который позволяет подобрать альтернативы неуверенно распознанному слову, что тоже увеличивает точность распознавания.

За повышение качества приходится, конечно, расплачиваться снижением на 20-25% скорости работы (из-за необходимости выполнения двух проходов). Однако по оценкам специалистов фирмы Cognitive Technologies, для пользователей важнее оказывается именно качество распознавания.

В CuneiForm 98 Direct довольно удобный интерфейс: реализованы ниспадающие контекстные меню, панели быстрого доступа, мастер распознавания, система помощи.

Модуль распознавания поддерживает технологию Intel Pentium MMX. Есть в CuneiForm 98 Direct и собственный полнофункциональный встроенный редактор. Она распознает тексты на русском, украинском, английском (а также смешанные на русском и английском) языках. Дополнительно могут поставляться модули распознавания еще для 11 языков: немецкого, французского, испанского, итальянского, шведского и др.

Все стили и начертания распознанных символов сохраняются в формате RTF. Cистема тесно интегрирована с прочими приложениями - возможен непосредственный вызов ее из электронного архива, прямой экспорт результатов распознавания в MS Word, "Евфрат", передача текста через буфер обмена в другие программы, печать текста и графики. Поддерживаются выходные форматы ANSI, Smart ANSI, RTF, DBF.

В заключение следует сказать о том, что CuneiForm 98 Direct является полностью 32-разрядным приложением Windows и работает в среде Windows 95 и Windows NT 4.0. Ее демонстрационную версию можно переписать с Web-узла фирмы Cognitive Technologies по адресу www.cognitive.ru.


CuneiForm Collection

Комплекс из трех программ, предназначенный для автоматического ввода и быстрого поиска документов. Включает две системы OCR, CuneiForm 98 Direct и CuneiForm 96 Gold, и электронный архив "Евфрат 97@SOHOII"

Системные требования: 486DX-66 (желательно Pentium), 8-Мбайт ОЗУ, видеоплата SVGA, 2Х-дисковод CD-ROM, мышь.
Платформа: Windows 95, Windows NT 4.0
Цена: 199 долл. (для пользователей предыдущих версий CuneiForm - 59 долл.).
Cognitive Technologies, тел.:(095)135-89-68, 135-55-10,
http://www.cognitive.ru

543