Математические модели сегодня помогают рекрутерам и заменяют их, а в перспективе будут работать лучше людей.

В чем прелесть цифрового бизнеса? Создаваемые в компании инструменты работы с данными можно использовать для оптимизации внутренних процессов, для совершенствования продуктов и улучшения взаимодействия с заказчиками, а также предоставлять клиентам в виде сервисов.

Рекрутмент – благодатная сфера такого комплексного применения цифрового инструментария. О том, как машинное обучение помогает решать простые, но крайне трудоемкие задачи рекрутинга, директор по развитию компании HeadHunter Борис Вольфсон рассказал на VI Российском форуме Big Data 2017, организованном издательством «Открытые системы». По его словам, математические модели сегодня помогают рекрутерам и заменяют их, а в перспективе будут работать лучше людей.

Опыт рекрутеров может также пригодиться в других отраслях специалистам, отвечающим за цифровизацию бизнеса и работу с данными.

Технология, сберегающая время

Первая задача, которую в HeadHunter решили с помощью технологий машинного обучения, – ранжирование откликов на опубликованные вакансии. Чтобы понять, кого приглашать на интервью, HR-специалисты тратят очень много времени, оно уходит в основном на разбор резюме и составление списка для собеседования. Особенно обильно поступают нерелевантные отклики на самые привлекательные вакансии с высокой зарплатой. На следующий этап отбора HR таких соискателей не пропускает, но их отсев обходится рекрутинговой компании в несколько сотен миллионов рублей в год.

Оценивая резюме на этом этапе, рекрутер обычно обращает внимание всего на пять-десять основных критериев. Однако, когда список критериев определяется экспертами и базируется на их опыте, а не на данных, всегда есть риск упустить что-то важное. Например, известны случаи, когда самыми хорошими работниками оказываются бывшие заключенные. Кроме того, при отборе по формальным признакам отсекаются вакансии с зарплатой в 99 тыс. руб., если соискатель установил планку от 100 тыс. руб.

В системе машинного обучения для оценки резюме используются сотни критериев. При этом список критериев составляется программой, которой исследователь данных (data scientist) дает задание посмотреть, например, насколько значима для человека разница между зарплатными ожиданиями и зарплатной вилкой в вакансии либо насколько точно текст резюме должен соответствовать тексту вакансии.

Для обучения системы в компании использовали выборку, насчитывающую около 200 млн соискателей и вакансий. На основе уже имеющихся данных о том, каких кандидатов в итоге пригласили на собеседование, система машинного обучения строит «лес» из сотен тысяч «деревьев» решений и с минимальной погрешностью вычисляет среднюю оценку кандидата. Для этого используется градиентный бустинг (gradient boosting) – простой стандартный подход, позволяющий за несколько недель сделать модель, работающую в промышленном масштабе. Полученные модели «весят» около 100 Гбайт, так что, строго говоря, эту работу нельзя назвать анализом Больших Данных, отметил Вольфсон, но при этом данные для рекрутмента требуют быстрой обработки и выдачи результатов в режиме онлайн или близком к нему.

Для HR-специалиста система выглядит как кнопка сортировки кандидатов в его рабочем интерфейсе, с ее помощью поднимаются вверх те соискатели, которые с большей вероятностью будут приглашены на собеседование. Эта функция весьма ощутимо экономит время кадровиков. Возможно, подобный инструмент будет полезен и в ИТ-инфрастуктуре кадровых служб крупных предприятий.

Это не вся статья. Полная версия доступна только подписчикам журнала. Пожалуйста, авторизуйтесь либо оформите подписку.
Купить номер с этой статьей в PDF