Открыть за два хода

Владимир Арлазаров: «Наша цель — создать лучшую в мире систему распознавания текстов не для какой-то конкретной операционной системы, а для любой» Компания Cognitive Technologies открыла коды интерфейса системы распознавания текстов OCR Cuneiform. На выставке SofTool 2008 директор компании по маркетингу Николай Никольский назвал этот шаг знаковым, поскольку теперь не только специалисты, но и все желающие для своих офисных или домашних задач смогут пользоваться этой системой.

В декабре прошлого года в Cognitive Technologies объявили о том, что начинают активно действовать на рынке свободного программного обеспечения (СПО), и перевели OCR Cuneiform в разряд бесплатных систем (freeware). Первым этапом стала публикация исходных текстов ядра распознавания («интеллекта» программной системы, как называют ядро разработчики) в апреле 2008 года. В рамках этого этапа потребовалось решить достаточно много сложных вопросов, связанных с лицензированием и патентной очисткой. Второй этап, завершившийся в конце сентября, — публикация исходных текстов пользовательского интерфейса.

Сложности встречались на обоих этапах. Сначала были вопросы, на условиях какой лицензии открывать исходные тексты, чтобы, с одной стороны, представители сообщества Open Source могли их эффективно использовать, а с другой — не пострадали бы коммерческие интересы Cognitive. После выбора лицензии была произведена лицензионная и патентная очистка ядра кода, что «оказалось сложнее архивации исходного кода». Как утверждает Владимир Арлазаров, руководитель направления СПО компании Cognitive, «специалистам пришлось просмотреть сотни тысяч строк кода на предмет скрытых лицензий, во многих файлах содержались старые лицензионные ограничения, которые были устранены».

По словам представителей Cognitive, они не ожидали такой огромной активности от сообщества Open Source — после публикации исходного кода сотни тысяч посетителей заходили на сайт openocr.org; большое количество людей участвовало в разработках. Буквально за несколько месяцев была решена сложнейшая задача — перенос системы на платформу Linux.

Развернуты портал проекта, репозиторий, куда выложены исходные тексты, система журналирования ошибок и «википедия», чтобы позволяет наполнение информацией на разных языках по проекту. Все эти информационные ресурсы открыты и регулярно обновляются.

В данный момент OCR Cuneiform поддерживает форматы .html, .rtf, .txt и обеспечивает распознавание текстов на 22 языках (в том числе европейские языки и языки некоторых стран СНГ).

Патентная очистка исходного текста интерфейса, по словам Арлазарова, оказалась еще сложнее той же задачи с ядром распознавания, поскольку в интерфейсе задействовано больше компонентов сторонних фирм.

Отныне представители сообщества Open Source имеют возможность, наряду с развитием функциональных возможностей, вносить улучшения в текущий и создавать новые пользовательские интерфейсы системы. Цель программы Cognitive «Распознавание должно быть на каждом компьютере» — сделать общедоступными технологии OCR благодаря открытости кода и нулевой стоимости базовых программных компонентов. Поскольку открытие кода дает возможность только посмотреть сам исходный код, следующим этапом должно стать открытие технологии создания и отладки систем распознавания.