Michelangelo помогает Uber составлять прогнозы

В обширном посте в блоге Uber Engineering Джереми Херманн, руководитель Uber по платформе машинного обучения, и менеджер по продуктам Майк Дельбальсо описывают Michelangelo так: «Внутренняя платформа, демократизирующая машинное обучение и позволяющая с помощью масштабируемого искусственного интеллекта выполнять требования бизнеса так же просто, как заказывать такси».

Создав Michelangelo, в Uber составили стандартную последовательность операций по вводу в действие новых решений машинного обучения в организации. Последовательность состоит из шести этапов: управление данными, обучение, оценка и развертывание моделей, выдача и контроль прогнозов. Система поддерживает традиционные модели машинного обучения, прогнозирование на основе временных рядов и глубокое обучение, поясняют авторы поста.

Michelangelo продолжает работу, начатую в Uber под руководством Дэнни Ланжа, который раньше возглавлял соответствующий отдел.

До Michelangelo в Uber были сложности с масштабированием используемых в компании алгоритмов машинного обучения, продолжают Херманн и Дельбальсо: «Наши ученые по данным пользовались большим количеством инструментов для создания прогнозных моделей (в том числе языком R, фреймворком scikit-learn, произвольными алгоритмами и др.), а отдельная команда инженеров занималась тем, что создавала разовые системы для применения этих моделей в рабочей среде. До Michelangelo не было возможности обучать модели более масштабные, чем те, что умещались на рабочих компьютерах специалистов по данным, и не было ни специального места для хранения результатов экспериментов с обучением, ни простого способа сравнить эксперименты друг с другом. Что самое важное, не было стандартного процесса ввода модели в рабочую эксплуатацию — в большинстве случаев приходилось создавать отдельный контейнер для каждого конкретного проекта».

Сама по себе Michelangelo — это набор соединенных инженерами Uber систем и компонентов с открытым кодом, в том числе HDFS, Spark, Samza, Cassandra, MLLib, XGBoost и TensorFlow. Система развернута поверх собственного озера данных Uber и вычислительной инфраструктуры компании.

Саму платформу Michelangelo, отмечают в Uber, пока что выпускать в открытых кодах не собираются: «Выпуск платформ машинного обучения в открытых кодах сопряжен с определенными трудностями, к тому же другие организации не смогут извлекать из Michelangelo ощутимую пользу, поскольку платформа построена на наших внутренних данных».

В UberEats применяют модели Michelangelo, в том числе для прогнозирования времени доставки, сортировки поисковых результатов и составления рейтинга ресторанов

Michelangelo на службе доставки еды

Персонал UberEats, службы Uber по доставке еды, применяет несколько моделей Michelangelo для прогнозирования времени доставки, сортировки поисковых результатов, автозавершения поисковых запросов и составления рейтинга ресторанов, отмечается в блоге: «Для прогнозирования времени доставки ученые по данным UberEats пользуются регрессионными моделями на основе деревьев принятия решений с градиентным бустингом».

Чтобы обеспечить точность прогнозирования, модель учитывает время суток, адрес доставки, среднее время приготовления заказа за последние семь дней и данные о приготовлении, поступающие в реальном времени.

Модели развертываются в центрах обработки данных Uber в контейнерах, предоставляющих их в виде сервиса, и вызываются по сети с помощью запросов микросервисами UberEats. Прогнозы отображаются для клиентов UberEats непосредственно перед заказом и затем по мере приготовления и доставки.

Что дальше?

Инженеры Uber постоянно дорабатывают Michelangelo; в частности, сейчас идет работа над функцией под названием AutoML.

«Это будет система автоматического поиска и распознавания конфигураций моделей (алгоритм, набор признаков, значения гиперпараметров и пр.), благодаря ей можно выбирать оптимальные по характеристикам модели для конкретных задач, — говорится в блоге. — Ученые по данным смогут задавать в системе набор меток и целевую функцию, а затем платформа, используя данные Uber с соблюдением принципов безопасности и конфиденциальности, найдет оптимальную модель. Смысл в том, чтобы с помощью интеллектуальных инструментов повысить продуктивность работы ученых по данным и облегчить их труд».

Идет также работа над инструментом визуализации, помогающим в отладке моделей глубинного обучения. Кроме того, в Uber хотят расширить корпоративный портал онлайн-обучения — добавить курс по Michelangelo, чтобы обеспечить еще более широкое применение платформы внутри организации.

Экономика пассажиров

Как полагают в Intel, благодаря развитию технологий автономного вождения транспорт станет видом сервиса.

В рамках дискуссии на ежегодной конференции Code Conference генеральный директор корпорации Intel Брайан Кржанич поделился результатами свежего исследования, где был изучен потенциальный объем новой зарождающейся экономики, которая может возникнуть в процессе того, как водители постепенно становятся обычными пассажирами, не управляющими автомобилем. В Intel новую экономику назвали «экономикой пассажиров». По результатам анализа, проведенного специалистами компании Strategy Analytics, потенциал взрывного роста новой экономики — от 800 млрд долл. в 2035 году до 7 трлн долл. к 2050-му.

История доказывает, что технологии способны выступать в роли катализатора фундаментальных общественных изменений, под воздействием которых компаниям приходится прибегать к радикальной трансформации или вовсе уходить с рынка. Инновационные цифровые бизнес-модели, возникшие в результате массового внедрения персональных компьютеров, Интернета, телекоммуникационных технологий и смартфонов, привели к появлению принципиально новых секторов экономики. Похожей ситуации стоит ожидать и с появлением беспилотных автомобилей.

Как полагает Кржанич, многим компаниям необходимо задуматься о стратегии развития в мире беспилотных автомобилей. К примеру, всего десять лет назад никто и не представить не мог объемы рынков, которые в итоге возникли на базе мобильных приложений и долевой экономики. Опираясь на этот опыт, стоит уже сегодня задуматься о потенциальных возможностях экономики пассажиров, которые появятся по мере того, как автомобили станут одними из главных используемых устройств для генерации данных, а люди будут тратить все меньше своего времени на управление ими.

По оценке Strategy Analytics, коммерциализация использования беспилотных автомобилей наберет полные обороты к 2040 году.

Авторы исследования сделали ряд ключевых выводов.

• Выручка от предоставления транспортных сервисов (Mobility as a Service, MaaS) в сегменте B2B достигнет 3 трлн долл. Выручка от предоставления транспортных сервисов потребителям составит 3,7 трлн долл.

• Выручка от использования потребителями инновационных приложений и сервисов, построенных на базе эксплуатации беспилотных автомобилей, достигнет 200 млрд долл.

• По самым скромным оценкам, в период с 2035-го по 2045 год массовое внедрение беспилотных автомобилей позволит спасти от гибели в ДТП 585 тыс. человек.

• Применение беспилотных автомобилей позволит ежегодно высвобождать более 250 млн часов за счет времени, которое жители крупнейших мегаполисов сегодня проводят в пробках по пути на работу и с работы.

• Экономия расходов, связанных с дорожными авариями, в эпоху экономики пассажиров с 2035-го по 2045 год составит более 234 млрд долл.