Хотя для устройства на должность cпециалиста по данным обычно требуется профильное образование, в действительности большую часть времени им приходится заниматься подготовкой, очисткой и организацией данных. Так ответили 60% участников опроса, проведенного краудсорсинговой компанией CrowdFlower. Для совершенствования алгоритмов или построения обучающих выборок времени почти не остается. Тратить время специалиста одной из самых дефицитных профессий на подготовку данных — большое расточительство, считают в CrowdFlower. Дефицит cпециалистов по обработке данных усилился. В прошлом году о нем говорили 79% опрошенных, а в этом — 83%. Наиболее востребованы специалисты по SQL, Hadoop, Python, Java, R, Hive, MapReduce, NoSQL, Pig и SAS. Но особенно важными более половины участников опроса называют методы машинного обучения. А следовательно, главам компаний, интересовавшимся в последние годы в основном технологиями Больших Данных, пора обратить внимание на эту область.