Владимир Арлазаров: «Наша цель – создать лучшую в мире систему распознавания текстов не для какой-то конкретной операционной системы, а для любой»

В декабре прошлого года в Cognitive Technologies объявили о том, что начинают активно действовать на рынке свободного программного обеспечения (СПО), и перевела OCR Cuneiform в разряд бесплатных систем (freeware). Первым этапом стала публикация исходных текстов ядра распознавания ("интеллекта" программной системы, как называют ядро разработчики) в апреле 2008 года. В рамках этого этапа потребовалось решить достаточно много сложных вопросов, связанных с лицензированием и патентной очисткой. Второй этап, завершившийся в конце сентября, - публикация исходных текстов пользовательского интерфейса.

Сложности встречались на обоих этапах. Сначала были вопросы, на условиях какой лицензией открывать исходные тексты, чтобы, с одной стороны, представители сообщества Open Source могли их эффективно использовать, а с другой – не пострадали бы коммерческие интересы Cognitive. После выбора лицензии была произведена лицензионная и патентная очистка ядра кода, что «оказалось сложнее архивации исходного кода». Как утверждает Владимир Арлазаров, руководитель направления СПО компании Cognitive, «специалистам пришлось просмотреть сотни тысяч строк кода на предмет скрытых лицензий, во многих файлах содержались старые лицензионные ограничения, которые были устранены».

По словам представителей Cognitive, они не ожидали такой огромной активности от сообщества Open Source — после публикации исходного кода сотни тысяч посетителей заходило на сайт openocr.org; большое количество людей участвовало в разработках. Буквально за несколько месяцев была решена сложнейшая задача — перенос системы на платформу Linux.

Развернуты портал проекта, репозиторий, куда выложены исходные тексты, система журналирования ошибок и "википедия", чтобы позволяет наполнение информацией на разных языках по проекту. Все эти информационные ресурсы открыты и регулярно обновляются.

В данный момент OCR Cuneiform поддерживает форматы .html, .rtf, .txt и обеспечивает распознавание текстов на 22 языках (в том числе, европейские языки и языки некоторых стран СНГ).

Патентная очистка исходного текста интерфейса, по словам Арлазарова, оказалась еще сложнее той же задачи с ядром распознавания, поскольку в интерфейсе задействовано больше компонентов сторонних фирм.

Отныне представители сообщества Open Source имеют возможность, наряду с развитием функциональных возможностей, вносить улучшения в текущий и создавать новые пользовательские интерфейсы системы. Цель программы Cognitive «Распознавание должно быть на каждом компьютере» - сделать общедоступными технологии OCR благодаря открытости кода и нулевой стоимости базовых программных компонентов. Поскольку открытие кода дает возможность только посмотреть сам исходный код, следующим этапом должно стать открытие технологии создания и отладки систем распознавания.