Компания Cognitive Technologies на рынке распознавания речи
Intel «принимает работу» у Cognitive Technologies

Компании Cognitive Technologies и Intel 28 ноября анонсировали выход речевого корпуса RuSpeech — собрания голосовых фрагментов, которые совершенно необходимы для разработчиков технологий распознавания слитной речи и могут оказаться полезными для применения во многих других областях, с речью так или иначе связанных. Продукт создан совместно с филологическим факультетом МГУ. Для русского языка такой «корпус» создан впервые. Скорее всего, инвестор разработки — Intel сделает его общедоступным.

«Корпус» содержит около 50 часов непрерывной речи, наговоренной 220 дикторами. Обрабатывая речь различных дикторов, произносящих одни и те же фразы, в которых задействованы все фонемы русского языка и основные их сочетания, можно будет эффективно строить системы распознавания, независимые от индивидуальных особенностей произносящего. Звуковые файлы сопровождаются фонетической разметкой, выполненной с участием специалистов-филологов. Корпус состоит из четырех частей: Train — для обучения алгоритмов распознавания, Test — для тестирования системы, Develop — для разработки и тестирования алгоритмов и Bad — для проверки устойчивости системы к ошибкам.

Выполнив заказную работу, Cognitive разработала инструментарий сбора и обработки речевых записей. Теперь его можно использовать для аналогичных целей. В компании считают, что RuSpeech даже имеет шансы стать стандартом де-факто речевых корпусов. Зарубежные аналоги значительно меньше по объему и не так хорошо структурированы.

Распространение технологий распознавания речи — вопрос времени и денег. Аналитики предрекают многомиллиардный рынок через пару-тройку лет. Сейчас технология сложна, далека от совершенства, и никто не может гарантировать, что рынок примет ее в том виде, в котором она будет существовать в оцениваемый промежуток времени. Пока что в реальной жизни используется распознавание команд в компьютерной телефонии — задача гораздо более простая, чем распознавание слитной речи. Среди ближайших ожидаемых применений технологии — распознавание и синтез речи в телефонии. Cognitive ведет переговоры с рядом производителей оборудования и провайдеров услуг, работающими в этой области.

Но есть еще одна область применения, которая была и будет всегда. При упоминании о любом «распознавании» (образов, речи) приходят на ум заказчики из оборонных и прочих силовых ведомств — ключевым заказчиком на системы распознавания у американских разработчиков неоднократно выступало агентство DARPA.

Недаром и в нашей стране искусственному интеллекту правительство уделяло столь пристальное внимание. Так или иначе, в этой области потенциал отечественных исследователей очень высок, и Cognitive Technologies, при всей своей авторитетности в данной сфере, — лишь одна среди команд, занимающихся или способных заниматься распознаванием речи.

Поделитесь материалом с коллегами и друзьями