по прочтениям

Компьютер научили читать по губам с помощью глубинного обучения

Ученые Оксфордского университета сообщили о разработке компьютерной программы, которая читает по губам. Возможности искусственного интеллекта и в этой области превысили человеческие: как сообщается, профессиональный чтец по губам, выполняя аналогичную задачу, справился с ней в четыре раза хуже.

Работая над проблемой, ученые воспользовались технологиями машинного обучения компании DeepMind, ранее приобретенной Google.

Чтобы научить свою программу распознавать речь по движению губ, разработчики воспользовались записями телепередач и субтитрами к ним — более 5 тыс. новостных выпусков BBC Breakfast и Newsnight, а также аналитическую передачу Question Time. Программа должна была устанавливать соответствие движений на лице говорящего на записи, аналогичную аудиоинформацию и напечатанный текст. Всего программа отследилп произнесение более 118 тыс. фраз; общий словарь составил 17,5 тыс. слов.

Качество работы программы проверили на фильме без звука, показав его компьютеру и профессиональному чтецу по губам. Искусственный интеллект расшифровал 50% текста, а человек — всего 12%.

11.04.2017

Теги: Google DeepMind, Искусственный интеллект, Машинное обучение, Технологии

DeepMind научится диагностировать заболевания глаз

Технологии глубинного обучения призваны улучшить диагностику двух глазных болезней: возрастной макулярной дегенерации и диабетической ретинопатии

Бизнес-подразделение искусственного интеллекта Google DeepMind надеется обучить компьютеры диагностике глазных заболеваний путем анализа данных пациентов одной из клиник Великобритании.

Используя технологию глубинного обучения, система DeepMind должна улучшить диагностику двух глазных болезней: возрастной макулярной дегенерации и диабетической ретинопатии. Обе они ведут к потере зрения. В случае раннего обнаружения заболевания зрение пациенту, возможно, удастся сохранить.

Один из способов поиска признаков этих заболеваний заключается в изучении внутренней части глаза, находящейся напротив хрусталика – области глазного дна. Делать это можно как напрямую, с помощью офтальмоскопа, так и путем цифрового сканирования глазного дна. Еще одним методом неинвазивного трехмерного сканирования сетчатки является процесс оптической когерентной томографии.

Проект стартовал после того, как консультант-офтальмолог клиники Пирс Кин обратился в DeepMind за помощью в анализе полученных изображений, который отнимал очень много времени. Если бы интерпретацию снимков удалось ускорить за счет использования компьютеров, врачи смогли бы обслуживать больше пациентов.

 

читать дальше > 08.07.2016

Теги: Google DeepMind, IBM Watson, Искусственный интеллект, Машинное обучение, Технологии