Пешеходы на тротуарах, как и водители на дорогах, обычно придерживаются определенных правил: идут по правой стороне, обгоняют слева, держат дистанцию и всегда готовы обойти препятствие, не меняя темпа передвижения. Исследователи из Массачусетского технологического института научили робота передвигаться в плотном пешеходном потоке, соблюдая эти правила и не мешая другим пешеходам. Исследователям предстояло научить робота решать четыре основные задачи: определять свое местоположение, распознавать окружение, планировать маршрут и, наконец, двигаться по нему. Если первые две задачи удалось решить уже известными методами с помощью камер, датчиков глубины и лидаров, то планирование маршрута в толпе непредсказуемо перемещающихся людей оказалось гораздо сложнее. Здесь исследователи применили методы машинного обучения с подкреплением. Перемещения в течение долгого времени моделировали на компьютере, подкрепляя верное поведение робота (например, обход людей слева) и наказывая неверное.

Источник: MIT