Исследователи NTT DoCoMo учат мобильные телефоны «читать» слова по лицевым мышцам

Оператор мобильной связи, первым предложивший нам Internet-телефоны в рамках своей службы I-mode, не останавливается на достигнутом. В перспективе абонентов ждет появление поистине революционной системы распознавания речи. Компания NTT DoCoMo представила прототип такой системы во время недавней выставки уникальных достижений своего центра исследований и разработки.

Система-прототип использует методы электромиографии (electromyography, EMG) для измерения изменений электростатических характеристик в лицевых мышцах, сокращающихся в момент речи человека.

Возможность восстанавливать слова при отсутствии звука означает, что пользователи подобной системы могут говорить даже из очень шумного помещения. Для того чтобы эта система работала, необходимо присоединить к определенным частям поверхности тела три электрода. Во время демонстрации пользователь установил датчики на большом, указательном и среднем пальце. Большим пальцем он касался шеи под подбородком, указательный палец держал вертикально вдоль скулы, а средний палец — над верхней губой. И такая странная поза вовсе не мешала системе правильно восстанавливать «непроизнесенные» звуки.

Три года разработки ушли на то, чтобы представленный прототип смог распознавать пять японских гласных звуков. Разработчики также намерены «научить» систему распознавать звуки и других языков. Однако сначала, как подчеркнул Томоюки Ахайа, директор лаборатории NTT DoCoMo Multimedia Signal Processing Lab, «следует как следует освоиться с согласными звуками японского языка».