Искусственные нейронные сети

Определение

Искусственная нейронная сеть (ANN — artificial neural network) представляет собой вычислительную архитектуру для обработки сложных данных с помощью множества связанных между собой процессоров и вычислительных путей. Искусственные нейронные сети, созданные по аналогии с человеческим мозгом, способны обучаться и анализировать большие и сложные наборы данных, которые с помощью более линейных алгоритмов обработать крайне сложно.

Традиционный цифровой компьютер способен успешно решать множество различных задач. Он делает это достаточно быстро и в точном соответствии с указаниями пользователя. К сожалению, он бессилен в ситуациях, когда сам пользователь не до конца понимает проблему, которую ему предстоит решить. Хуже того, стандартные алгоритмы не могут работать с «зашумленными» или неполными данными, при том что в реальной жизни зачастую приходится иметь дело именно с такой информацией. Здесь может помочь искусственная нейронная сеть — способная к обучению вычислительная система.

Первая искусственная нейронная сеть была создана в 1958 году психологом Френком Розенблатом. Она получила название Perceptron и была предназначена для моделирования деятельности мозга человека при обработке визуальных данных и при обучении распознаванию объектов. Впоследствии были разработаны аналогичные искусственные нейронные сети с целью изучения процесса познания.

Со временем стало понятно, что помимо анализа деятельности мозга человека они могут выполнять и другие очень полезные функции. Благодаря способности устанавливать соответствия шаблонам и обучаться эти сети нашли применение для анализа многих проблем, которые крайне сложно или невозможно решить с помощью традиционных вычислительных или статистических методов. В конце 80-х началось активное использование искусственных нейронных сетей в самых разных целях.

Искусственные нейронные сети часто для простоты называют нейронными сетями, однако это выражение относится к головному мозгу биологических существ, деятельность которого сети ANN первоначально были призваны моделировать.

Структура

Принцип действия искусственной нейронной сети состоит в формировании связей между множеством различных обрабатывающих элементов, каждый из которых служит аналогом одного нейрона в головном мозге биологического существа. Нейроны могут быть воспроизведены физически или смоделированы с помощью цифрового компьютера. Каждый нейрон получает множество входных сигналов, а затем, с учетом внутренней системы весовых коэффициентов, порождает один выходной сигнал, который, как правило, служит входным для другого нейрона.

Нейроны тесно взаимосвязаны друг с другом и организованы в несколько различных уровней. Входной уровень получает входные данные, а выходной — порождает конечный результат. Обычно между этими двумя уровнями находятся один или несколько скрытых уровней. В такой структуре невозможно предсказать или точно узнать, как именно передаются данные.

Обучение

Сначала для искусственных нейронных сетей, как правило, создается система случайным образом назначенных весовых коэффициентов. Это значит, что сети ничего «не знают», и для решения конкретной проблемы их требуется обучить. Вообще говоря, существуют два метода обучения, которые применяются в зависимости от того, для решения какой проблемы предназначена данная сеть.

Самоорганизующаяся искусственная нейронная сеть (ее часто называют сетью Кохонена по имени создателя) рассчитана на обработку больших объемов данных и должна находить закономерности и определять взаимосвязи между ними. Ученые часто применяют такого рода сети для анализа экспериментальных данных.

Сеть с обратным распространением ошибки, наоборот, обучается человеком для выполнения конкретных задач. Во время обучения человек оценивает, корректен ли результат, полученный искусственной нейронной сетью. Если он корректен, увеличиваются те весовые коэффициенты, которые использовались при его получении. Если результат некорректен, эти весовые коэффициенты уменьшаются. Сети такого типа часто применяются для изучения процесса познания и для приложений, решающих конкретные задачи.

Искусственная нейронная сеть, созданная на базе одного компьютера, как правило, работает медленнее, чем более традиционное алгоритмическое решение. Однако параллельная природа подобной вычислительной среды дает возможность использовать для обработки несколько процессоров и получать значительно более высокую скорость при очень низких затратах на разработку. Параллельная архитектура также позволяет очень эффективно обрабатывать большие объемы данных. При работе с крупными непрерывными потоками информации, как в случае распознавания речи или обработки данных, поступающих с машинных датчиков, искусственные нейронные сети могут действовать значительно быстрее, чем их линейные «конкуренты».

Искусственные нейронные сети оказываются полезными в самых разных приложениях, где используются сложные и часто неполные данные. Так, они применяются для распознавания образов и речи. Кроме того, искусственные нейронные сети используются и в последних версиях программ, выполняющих преобразование текстов в речь. На них базируются, в частности, многие программы анализа рукописных текстов (к примеру, применяемые в популярных карманных компьютерах).

Мониторинг автоматизированного производства также выполняется с помощью искусственных нейронных сетей, которые контролируют работу машин, следят за температурным режимом, диагностируют неисправности и т. д. Эти искусственные нейронные сети расширят возможности работников или позволят частично заменять опытных рабочих, благодаря чему усилиями меньшего числа сотрудников можно выполнять больший объем работ.

Применение в экономике

Использование искусственных нейронных сетей в экономике может дать самые невероятные результаты.

Крупные финансовые институты используют их для увеличения производительности в таких областях, как оценка платежеспособности эмитента, расчет скидок, целевой маркетинг и оценка кредитов. Эти системы, как правило, обеспечивают лишь на несколько процентов более высокую точность, чем их предшественники, но учитывая, о каких суммах идет речь, оказываются весьма рентабельными. Искусственные нейронные сети теперь применяются для анализа транзакций с кредитными картами для выявления сделок, которые с большой долей вероятности могут оказаться мошенническими.

Используют их и для выявления других видов преступлений. Они применяются в детекторах, установленных во многих западных аэропортах для анализа микроэлементов на присутствие взрывчатых химических веществ. В чикагском полицейском управлении искусственные нейронные сети помогают выявлять коррупцию среди сотрудников полиции.

Иерархическая нейронная сеть

Здесь приведен один из возможных способов объединения процессоров в нейронную сеть. В этой многоуровневой иерархии каждый процессор передает свой результат всем процессорам следующего уровня. Как следствие в такой структуре невозможно определить, каков был путь обработки данных, позволивший получить конкретный результат