На приведенном изображении можно видеть игрока на теннисном корте с ракеткой в руках, который гонится с нею за… лимоном? Компьютер легко может сделать подобную ошибку при распознавании объектов, человек — нет. Воспользовавшись экспериментальным сервисом Google под названием Google Sets, который выдает списки взаимосвязанных терминов, исследователи из Университета Калифорнии в Сан-Диего создали систему автоматической классификации цифровых изображений, полагающуюся на распознавание объектов с учетом контекста. Процесс классификации состоит из трех этапов. На первом выполняется сегментация изображения различными способами и отбор наиболее стабильных сегментов в качестве объектов. На втором происходит их распознавание с формированием списка наиболее вероятных наименований. На третьем с помощью Google Sets отбрасываются названия объектов, «выпадающих» из контекста.

Поделитесь материалом с коллегами и друзьями