|
Наш Блог
|
Математическое моделирование замкнутых системНам иногда приходят письма с вопросами про то как можно
математически моделировать замкнутые системы? Например не возможно разработать серийное производство замкнутых экосистем, как например Аквамир. Нами разработана компьютерная, математическая модель
экологической системы, основанной на теории стохастических автоматов
(вероятностный автомат), авторегуляции и термодинамики. Успешное применение
такой концепции моделирования замкнутых экосистем привело к созданию замкнутых
аквариумов (Аквамир). Для жизнедеятельности которых требуется внешний источник
энергии - свет и комнатная температура. Мы все таки не теряем надежды, что нам когда-нибудь поручат спроектировать замкнутую систему или хотя бы разработать концепцию системы для исследования дальнего космоса человеком. Но мы отвлеклись от темы. Небольшая лекция про моделирование биологических замкнутых систем. Использовались материалы следующих книг: ВведениеНачатья бы хотел с высказывания Мартина Сандера (Техническое
оснащение аквариума, 2002 г.) Зеленым шрифтом ниже выделены понятия слов из Большой Российской энциклопедии. Существует три основных метода моделирования экосистем:
повсеместно накладываются стохастические явления. Большую роль здесь принадлежит оценке экспериментальных данных о состоянии системы. Детерминистический имитационный метод (использование классических методов для изучения экосистем). Динамика каждого процесса изучается с помощью экспериментов, которым отвечают дифференциальные уравнения, входящие в одну общую модель системы. Модельные эксперименты для проверки различных теоретических предположений относительно экзогенных явлений
и эндогенных изменений состояния системы выполняются с помощью компьютера. Кибернетический метод (подход к экосистеме как к самооптимизирующейся системе).
При исследовании экологических процессов и систем, характеризующихся взаимосвязью детерминированных и стохастических процессов, используются соответствующим образом модифицированные методы, разработанные и апробированные в теоретической и прикладной кибернетике. Изменения в состоянии системы воспроизводятся на ЭВМ. Еще одна тенденция связана с использованием законов термодинамики необратимых процессов и применения этой теории для изучения экосистем. В модели Краснобородько эти методы объединены для моделирования замкнутых биологических систем. Ведь не секрет, что на стыки нескольких дисциплин вероятность прорыва в науки очень велика. Теория систем и экосистемыИзучение сложных взаимосвязей между различными элементами объективной реальности привело к возникновению общей теории, получившей название теории систем. Теория систем применяется на этапе обобщения для исследования законов динамики различных систем и абстрактного выделения из реальных систем отдельных характеристик, являющихся общими для всех или хотя бы для одного класса систем. Это стимулировало интерес к кибернетическим системам, которые поддаются управлению, т.е. целенаправленному воздействию. Вместе с тем повысился интерес к математическим моделям, которые можно использовать для получения дополнительной информации о реальных системах. Все методы, предусматриваемые таким подходом, были объединены под общим названием системный анализ. Основные этапы системного анализа:1. Специалист исследует реальную замкнутую систему. 2. При проведении исследования реальной действительности благодаря индуктивной (как правило, статистической)
и дедуктивной (теоретической) абстракции приводят к идеализации системы, определяемой как вербальная модель. Конкретная форма модели обычно обусловлена результатом объединения теоретических концепций с экспериментальными (эмпирическими) данными. При этом любая вербальная модель базируется на более или менее развитой теории моделируемой системы. 3. Вербальная модель формализуется посредством математических методов, в результате чего мы получаем математическую модель. Формализованная теория позволяет выполнить описание большинства явлений на основе лишь конечного, небольшого количества фундаментальных закономерностей. Модель обеспечивает обозримость объекта путем сокращения его избыточности и, следовательно, является звеном между теоретическим и эмпирическим познанием. Модели используются для замены реальных процессов и систем, однако их поведение должно быть сравнимо с поведением реальных процессов. Отсюда вытекает, что любая модель является компромиссом между теорией и экспериментом. Вычислительный алгоритм модели, реализуемый на компьютере, делает возможным имитацию явлений с помощью модели. Полученные в результате имитации данные можно использовать для сравнения с результатами наблюдений, а также с имеющейся информацией о поведении реальных систем. Отношения между основными переменными состояния данной модели обычно не согласуются полностью с отношениями между переменными состояния реальной системы. Таким образом действительность искажается (погрешностью оценки отношений). сравнение модели и объекта с целью оценки погрешности дает возможность улучшить согласование модели с реальной системой. Такое испытание позволяет улучшить вербальную и (или) математическую модель или же расширить наши знания о реальной системе. Эта процедура может выполняться многократно. По завершении испытания математической модели ее можно применять для изучения других состояний той же системы и даже иных систем. Такой подход называется прогнозированием. Использование моделей с целью увеличения наших теоретических и экспериментальных знаний называется анализом модели. В основе системного анализа лежит абстрагирование, позволяющее выявить главные свойства математической модели. Оно означает предельное упрощение реальности, рассматриваемой под определенным углом зрения. Модель никогда не идентична реальности, а скорее всего является продуктом нашего собственного воображения. Создание и практическое использование моделей является главным проблемами в теории систем и системного анализа при подходе к проблемам замкнутых экосистем, где необходимо уделять внимание следующему: модель должна строиться на основе гибкой гипотезы с тем, чтобы информацию можно было извлекать даже из ошибок. Модель основанная на гибкой гипотезе, способствует поступательному движению в перед, даже если в данный момент времени не имеется математического решения. Такой подход получил название гипотетико-дедуктивной методологии. Эта методология отличается от ранее возникшей более описательной научной методологии главным образом тем, что она допускает существование неточностей и риска ошибочной интерпретации результатов. Любая модель, позволяющая лучше понять суть проблемы, играет не мене важную роль, чем факты и наблюдения. Системы и виды системСистема — это часть объективной реальности, ограниченная рядом условий, Она состоит из более мелких единиц — элементов (отдельностей), связанных между собой различными отношениями (связями). Все, что находится за пределами системы, называется окружающей средой. Система и окружающая среда разделены оболочкой — границей системы. Например, все популяции в аквариуме, связанные друг с другом, а также с «сопутствующими» факторами (например, свет, кислород), составляют одну экосистему, в то время как стекло аквариума будет являться для этой системы окружающей средой. Граница системы проходит по стеклу и водной поверхности. Определение границ системы носит условный характер и строится на ряде предположений. Один и тот же элемент может быть частью системы или окружающей среды в зависимости от того, в каком аспекте он рассматривается. Однако это не значит, что мы не располагаем критериями, которые позволяют относить элементы к системе или окружающей ее среде. Поскольку связи между элементами системы представляют собой важную характеристику, граница системы обычно проводится таким образом, чтобы большая часть взаимосвязей, в особенности обратных связей, находилась внутри системы и лишь некоторые из них выходили за ее пределы. Можно выделить два вида наиболее важных связей: прямую и обратную. Экосистемы относятся к разряду систем, именуемых сложными, и имеют следующие характеристики. 1. Сложность: количество и разнообразие видов связей между
элементами системы, а также между системой и окружающей средой, очень велико.
10. Функции экосистемы обусловлены характером циркуляции вещества и энергии, взаимодействием элементов, входящих в систему, а также взаимосвязью между экосистемой и окружающей средой. Между взаимодействующими популяциями на различных трофических уровнях имеются особые экологические функции (например, соперничество, отношения хищник — жертва и др.), В целом системы имеют следующие переменные: Входные переменные х1, через которые осуществляется воздействие окружающей среды на систему (например, биологические, химические, метеорологические условия, географическое местоположение экосистемы и т, д.). Выходные переменные у1, характеризующие реакцию системы на воздействие окружающей среды. Переменные состояния u1, характеризующие способность системы к сохранению и осуществлению обратной связи, а также ее реакцию на влияние случайных факторов. В экосистемах на эти три переменные обычно накладываются возмущающие переменные d1. Действие этих переменных в пространстве и времени обычно описывается при помощи детерминированных или стохастических функций в зависимости от того, можно ли связать определенное значение или вероятностное распределение возможных значений зависимых переменных с каждым значением независимых переменных. Обычно системы считаются изолированными, открытыми или замкнутыми. В замкнутых системах не происходит обмена энергией, веществом и информацией с окружающей средой, и в большинстве случаев они представляют собой идеализацию реальной действительности. Имея дело с естественными системами, в Лучшем случае можно говорить о замкнутости лишь в отношении вещества. Например, Аквамир с точки зрения обмена веществ может быть замкнутым, но с точки зрения энергии не замкнутым, т.к. получает последнюю из вне в виде света. Управление в экологических системахЛюбой процесс управления заранее предполагает существование управляемых объектов и системы, управляющей этими объектами. В этом смысле управление означает целенаправленное воздействие управляющей системы на один или несколько управляемых элементов. Регулирование — это процесс управления с обратной связью (частный случай управления), в котором ведется непрерывное измерение управляемой переменной и ее сравнение с заданной переменной. Цель управления формализуется посредством целевой функции или целевого функционала, причем целью в первом случае служат фиксированные величины, а во втором — переменные. Выражение экстремальное управление используется в тех случаях, когда речь идет о минимуме или максимуме целевого функционала по управляющим переменным. Если же речь идет лишь об одной управляющей переменной, то получение минимума или максимума целевой функции определяется как оптимальное управление. При наличии нескольких управляющих переменных между различными целями управления может существовать лишь компромиссное решение. Все процессы управления как в технологических, так и нетехнологических системах (а значит, и в экосистемах) носят информативный характер. Процесс управления предполагает наличие управляющего элемента и управляемой системы (управляемого элемента). Управляющий элемент производит сбор и обработку информации, получаемой из окружающей среды или из самой системы, и оказывает необходимое воздействие на управляемую систему. Свойства любой управляемой системы зависят от ряда факторов, таких как параметры системы, структура системы, возмущения, алгоритмы управления и т. д. В экологических процессах и системах трудно провести линию
раздела между управляющей и управляемой системами, поскольку, как правило,
участвующие процессы ввиду их сложности физически неразделимы. И если иногда
подобная дифференциация проводится, несмотря на существующие трудности, то она
выполняется в виде умозрительного эксперимента, В экологических системах различают три группы управления: 1) естественное внутреннее управление (саморегуляция или
самооптимизация); Информационное содержание экосистемы тесно связано с управлением. Вся информация о процессах, проходящих в подсистемах, а также данные о качественном составе и состоянии отдельных частей системы и окружающей среды, служат информационными источниками для управления системой. Например, температура играет информативную роль для биологического блока модели, поскольку она дает информацию о важных характеристиках окружающей среды и управления интенсивностью различных процессов. Потоки энергии и массы в экосистемах служат для переноса информации. Некоторые определяют информацию как совокупность механизмов с обратной связью, где каждый отдельный перенос энергии и массы вызывает встречный поток информации. В результате экспериментов с Phragmites, проведенных в отстойниках, куда не могли проникнуть рыбы, состав популяций высших растений, перифитона, зоопланктона и других животных организмов изменился до неузнаваемости. Информация о подобном изменении окружающей среды существенно сказалась даже на тех популяциях, которые не были непосредственно связаны с данным процессом. Аналогичную картину можно получить с помощью модельной имитации. Например, при экспериментировании с моделью AQUAMOD-3 обмен (диффузия) между гиполимнионом и осадками является чисто физической переменной, которая строго запрограммирована в модели. Однако интенсивность обмена чутко реагирует на изменение скорости роста фитопланктона, возникающее из-за переменного освещения в эпилимнионе. На рисунке схематически представлена концепция саморегуляции, целевой функции, управляющего элемента и управляемой системы в экосистеме. Целевая функция Q характеризует генетически фиксированную способность организмов к выживанию. Управляющий элемент является «мозгом», действующим на двух уровнях. Информация обрабатывается при помощи возмущающих переменных и подсистем, сопоставляется с целевой функцией и затем передается в виде сигнала w. Этот сигнал определяет, какая активность микроорганизмов является наиболее оптимальной для данного отрезка времени, Данный уровень получил название оптимизатора — термин, заимствованный из технической кибернетики. Управляемая система располагает рядом возможностей для реализации сигнала w. Одна из них связана с выбором соответствующих значений параметров. Этот уровень определяется как управляющий элемент (контроллер), так как он оказывает влияние на управляемую систему сигналом w*. Иерархическая структура экосистемВведение понятия «иерархия» в биологии будет играть такую же роль, как введение концепции обратной связи. Это в особенности относится к системам хищник — жертва, где существование иерархической структуры давно считается общепризнанным фактом. Иерархическую организацию экосистемы можно рассматривать под
тремя Иерархия биологической организации считается классической
характеристикой биологических систем: различные уровни организации (экосистема,
сообщество, популяция, особь, надклеточный уровень физиологических процессов,
клеточный и подклеточный уровни) являются типичными примерами организационной
иерархии. Координация в этом случае направлена от Трофическая иерархия — классический экологический термин,
который по смыслу согласуется с термином «эшелон», на рисунке а) показана схема многоуровневой системы. Информационные связи в ней действуют в обоих направлениях. Информация поступает из нижних эшелонов в верхние в ходе процесса. И именно сверху осуществляется координация параллельных единиц на нижнем уровне. Иерархия управления. На рисунке б) процессы прямого управления, адаптации и выбора разделены. В экологии прямое управление означает непосредственное, всегда фиксированное воздействие переменной на процесс (например, влияние экзогенных возмущающих переменных в соответствии с фиксированным уравнением ). Адаптация — это такое явление, при котором действующие параметры меняются в соответствии с поступающей информацией. Под выбором понимается отбор нескольких возможных путей реализации (например, из-за присутствия в системе нескольких различных видов) путем изменения структуры системы посредством включения или выключения отдельных связей. Этот процесс получил название самоорганизации системы. В тех случаях, когда генетический код настолько сильно меняется, что это служит началом биологической эволюции, применяется термин самоэволюция. Целевая функция, или стратегия системы и ее элементов, также подвергается изменению в ходе этого процесса. Кибернетическая классификация моделей экосистемВ прикладной кибернетике основой для классификации систем служат различные виды управления. Это связано с разнообразными техническими реализациями управления. При рассмотрении экосистем природа самих систем остается неизменной, в то время как наши представления и модели меняются. Тем не менее подобная классификация применима к этим моделям в соответствии с теми видами управления, которым мы отдаем предпочтение.
На рисунке показано разделение между классами тех моделей экосистем, которые характеризуются самым высоким типом управления. Иерархические модели вводятся здесь как новый класс моделей. В процессе развития экологии пресноводных водоемов модели различных процессов или подсистем претерпели многократные изменения. К примеру, ......................................... Модели бывают: 1. Гидрохимические. .......................................... Основы теории нейронных сетейПод искусственными нейронными системами подразумевается вычислительные структуры, состоящие из большого числа однотипных элементов, каждый из которых выполняет относительно простые функции. Такой принцип построения был заимствован у нервной системы живых организмов. В последние десятилетия в мире бурно развивается новая прикладная область математики, специализирующаяся на искусственных нейронных сетях (НС). Актуальность исследований в этом направлении подтверждается массой различных применений НС. Это автоматизация процессов распознавания образов, адаптивное управление, аппроксимация функционалов, прогнозирование, создание экспертных систем, организация ассоциативной памяти и многие другие приложения. С помощью НС можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту и конечно управлять сложными замкнутыми системами. Модели НС могут быть программного и аппаратного исполнения. В дальнейшем речь пойдет в основном о первом типе. Несмотря на существенные различия, отдельные типы НС обладают несколькими общими чертами.
Рис.1 Искусственный нейрон Во-первых, основу каждой НС составляют относительно простые, в большинстве случаев – однотипные, элементы (ячейки), имитирующие работу нейронов мозга. Далее под нейроном будет подразумеваться искусственный нейрон, то есть ячейка НС. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов – однонаправленных входных связей, соединенных с выходами других нейронов, а также имеет аксон – выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов. Общий вид нейрона приведен на рисунке 1. Каждый синапс характеризуется величиной синаптической связи или ее весом wi, который по физическому смыслу эквивалентен электрической проводимости. Текущее состояние нейрона определяется, как взвешенная сумма его входов:
Выход нейрона есть функция его состояния: y = f(s) (2)
Рис.2 а) функция единичного скачка; б) линейный порог (гистерезис); в) сигмоид – гиперболический тангенс; г) сигмоид – формула (3) Нелинейная функция f называется активационной и может иметь различный вид, как показано на рисунке 2. Одной из наиболее распространеных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида)[2]:
При уменьшении a сигмоид становится более пологим, в пределе при a=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении a сигмоид приближается по внешнему виду к функции единичного скачка с порогом T в точке x=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем.
Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон.
Рис.3 Однослойный перцептрон Возвращаясь к общим чертам, присущим всем НС, отметим, во-вторых, принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно. В качестве примера простейшей НС рассмотрим трехнейронный перцептрон (рис.3), то есть такую сеть, нейроны которой имеют активационную функцию в виде единичного скачка* . На n входов поступают некие сигналы, проходящие по синапсам на 3 нейрона, образующие единственный слой этой НС и выдающие три выходных сигнала:
Очевидно, что все весовые коэффициенты синапсов одного слоя нейронов можно свести в матрицу W, в которой каждый элемент wij задает величину i-ой синаптической связи j-ого нейрона. Таким образом, процесс, происходящий в НС, может быть записан в матричной форме: Y=F(XW) (6) где X и Y – соответственно входной и выходной сигнальные векторы, F( V) – активационная функция, применяемая поэлементно к компонентам вектора V. Теоретически число слоев и число нейронов в каждом слое может быть произвольным, однако фактически оно ограничено ресурсами компьютера или специализированной микросхемы, на которых обычно реализуется НС. Чем сложнее НС, тем масштабнее задачи, подвластные ей. Выбор структуры НС осуществляется в соответствии с особенностями и сложностью задачи. Для решения некоторых отдельных типов задач уже существуют оптимальные, на сегодняшний день, конфигурации, описанные, например, в [2],[3],[4] и других изданиях, перечисленных в конце статьи. Если же задача не может быть сведена ни к одному из известных типов, разработчику приходится решать сложную проблему синтеза новой конфигурации. При этом он руководствуется несколькими основополагающими принципами: возможности сети возрастают с увеличением числа ячеек сети, плотности связей между ними и числом выделенных слоев (влияние числа слоев на способность сети выполнять классификацию плоских образов показано на рис.4 из [5]); введение обратных связей наряду с увеличением возможностей сети поднимает вопрос о динамической устойчивости сети; сложность алгоритмов функционирования сети (в том числе, например, введение нескольких типов синапсов – возбуждающих, тромозящих и др.) также способствует усилению мощи НС. Вопрос о необходимых и достаточных свойствах сети для решения того или иного рода задач представляет собой целое направление нейрокомпьютерной науки. Так как проблема синтеза НС сильно зависит от решаемой задачи, дать общие подробные рекомендации затруднительно. В большинстве случаев оптимальный вариант получается на основе интуитивного подбора. Очевидно, что процесс функционирования НС, то есть сущность действий, которые она способна выполнять, зависит от величин синаптических связей, поэтому, задавшись определенной структурой НС, отвечающей какой-либо задаче, разработчик сети должен найти оптимальные значения всех переменных весовых коэффициентов (некоторые синаптические связи могут быть постоянными). Этот этап называется обучением НС, и от того, насколько качественно он будет выполнен, зависит способность сети решать поставленные перед ней проблемы во время эксплуатации. На этапе обучения кроме параметра качества подбора весов важную роль играет время обучения. Как правило, эти два параметра связаны обратной зависимостью и их приходится выбирать на основе компромисса. Обучение НС может вестись с учителем или без него. В первом случае сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей. Во втором случае выходы НС формируются самостоятельно, а веса изменяются по алгоритму, учитывающему только входные и производные от них сигналы. Существует великое множество различных алгоритмов обучения, которые однако делятся на два больших класса: детерминистские и стохастические. В первом из них подстройка весов представляет собой жесткую последовательность действий, во втором – она производится на основе действий, подчиняющихся некоторому случайному процессу. Развивая дальше вопрос о возможной классификации НС, важно отметить существование бинарных и аналоговых сетей. Первые из них оперируют с двоичными сигналами, и выход каждого нейрона может принимать только два значения: логический ноль ("заторможенное" состояние) и логическая единица ("возбужденное" состояние). К этому классу сетей относится и рассмотренный выше перцептрон, так как выходы его нейронов, формируемые функцией единичного скачка, равны либо 0, либо 1. В аналоговых сетях выходные значения нейронов способны принимать непрерывные значения, что могло бы иметь место после замены активационной функции нейронов перцептрона на сигмоид. Еще одна классификация делит НС на синхронные и асинхронные[3]. В первом случае в каждый момент времени свое состояние меняет лишь один нейрон. Во втором – состояние меняется сразу у целой группы нейронов, как правило, у всего слоя. Алгоритмически ход времени в НС задается итерационным выполнением однотипных действий над нейронами. Далее будут рассматриваться только синхронные НС.
Рис.4 Двухслойный перцептрон Сети также можно классифицировать по числу слоев. На рисунке 4 представлен двухслойный перцептрон, полученный из перцептрона с рисунка 3 путем добавления второго слоя, состоящего из двух нейронов. Здесь уместно отметить важную роль нелинейности активационной функции, так как, если бы она не обладала данным свойством или не входила в алгоритм работы каждого нейрона, результат функционирования любой p-слойной НС с весовыми матрицами W(i), i=1,2,...p для каждого слоя i сводился бы к перемножению входного вектора сигналов X на матрицу W(S)=W(1)×W(2) ×...×W(p) (7) то есть фактически такая p-слойная НС эквивалентна однослойной НС с весовой матрицей единственного слоя W(S): Y=XW(S) (8) Продолжая разговор о нелинейности, можно отметить, что она иногда вводится и в синаптические связи. Большинство известных на сегодняшний день НС используют для нахождения взвешенной суммы входов нейрона формулу (1), однако в некоторых приложениях НС полезно ввести другую запись, например:
или даже
Вопрос в том, чтобы разработчик НС четко понимал, для чего он это делает, какими ценными свойствами он тем самым дополнительно наделяет нейрон, и каких лишает. Введение такого рода нелинейности, вообще говоря, увеличивает вычислительную мощь сети, то есть позволяет из меньшего числа нейронов с "нелинейными" синапсами сконструировать НС, выполняющую работу обычной НС с большим числом стандартных нейронов и более сложной конфигурации[4]. Многообразие существующих структур НС позволяет отыскать и другие критерии для их классификации, но они выходят за рамки данной статьи. Теперь рассмотрим один нюанс, преднамеренно опущенный ранее. Из рисунка функции единичного скачка видно, что пороговое значение T, в общем случае, может принимать произвольное значение. Более того, оно должно принимать некое произвольное, неизвестное заранее значение, которое подбирается на стадии обучения вместе с весовыми коэффициентами. То же самое относится и к центральной точке сигмоидной зависимости, которая может сдвигаться вправо или влево по оси X, а также и ко всем другим активационным функциям. Это, однако, не отражено в формуле (1), которая должна была бы выглядеть так:
Дело в том, что такое смещение обычно вводится путем добавления к слою нейронов еще одного входа, возбуждающего дополнительный синапс каждого из нейронов, значение которого всегда равняется 1. Присвоим этому входу номер 0. Тогда
где w0 = –T, x0 = 1. Очевидно, что различие формул (1) и (12) состоит лишь в способе нумерации входов.
Рис.5 Однонейронный перцептрон Из всех активационных функций, изображенных на рисунке 2, одна выделяется особо. Это гиперболический тангенс, зависимость которого симметрична относительно оси X и лежит в диапазоне [-1,1]. Забегая вперед, скажем, что выбор области возможных значений выходов нейронов во многом зависит от конкретного типа НС и является вопросом реализации, так как манипуляции с ней влияют на различные показатели эффективности сети, зачастую не изменяя общую логику ее работы. Пример, иллюстрирующий данный аспект, будет представлен после перехода от общего описания к конкретным типам НС. Какие задачи может решать НС? Грубо говоря, работа всех сетей сводится к классификации (обобщению) входных сигналов, принадлежащих n-мерному гиперпространству, по некоторому числу классов. С математической точки зрения это происходит путем разбиения гиперпространства гиперплоскостями (запись для случая однослойного перцептрона)
Таблица 1
Каждая полученная область является областью определения отдельного класса. Число таких классов для одной НС перцептронного типа не превышает 2m, где m – число выходов сети. Однако не все из них могут быть разделимы данной НС. Например, однослойный перцептрон, состоящий из одного нейрона с двумя входами, представленный на рисунке 5, не способен разделить плоскость (двумерное гиперпространоство) на две полуплоскости так, чтобы осуществить классификацию входных сигналов по классам A и B (см. таблицу 1). Уравнение сети для этого случая
является уравнением прямой (одномерной гиперплоскости), которая ни при каких условиях не может разделить плоскость так, чтобы точки из множества входных сигналов, принадлежащие разным классам, оказались по разные стороны от прямой (см. рисунок 6). Если присмотреться к таблице 1, можно заметить, что данное разбиение на классы реализует логическую функцию исключающего ИЛИ для входных сигналов. Невозможность реализации однослойным перцептроном этой функции получила название проблемы исключающего ИЛИ.
Рис.6 Визуальное представление работы НС с рисунка 5 Функции, которые не реализуются однослойной сетью, называются линейно неразделимыми[2]. Решение задач, подпадающих под это ограничение, заключается в применении 2-х и более слойных сетей или сетей с нелинейными синапсами, однако и тогда существует вероятность, что корректное разделение некоторых входных сигналов на классы невозможно. Наконец, мы можем более подробно рассмотреть вопрос обучения НС, для начала – на примере перцептрона с рисунка 3. Рассмотрим алгоритм обучения с учителем[2][4]. 1. Проинициализировать элементы весовой матрицы (обычно небольшими случайными значениями). 2. Подать на входы один из входных векторов, которые сеть должна научиться различать, и вычислить ее выход. 3. Если выход правильный, перейти на шаг 4. Иначе вычислить разницу между идеальным и полученным значениями выхода: Модифицировать веса в соответствии с формулой: где t и t+1 – номера соответственно текущей и следующей итераций; n – коэффициент скорости обучения, 0<nЈ1; i – номер входа; j – номер нейрона в слое. Очевидно, что если YI > Y весовые коэффициенты будут увеличены и тем самым уменьшат ошибку. В противном случае они будут уменьшены, и Y тоже уменьшится, приближаясь к YI. 4. Цикл с шага 2, пока сеть не перестанет ошибаться. На втором шаге на разных итерациях поочередно в случайном порядке предъявляются все возможные входные вектора. К сожалению, нельзя заранее определить число итераций, которые потребуется выполнить, а в некоторых случаях и гарантировать полный успех. * Иногда перцептроном называют любую НС слоистой структуры, однако здесь и далее под перцептроном понимается только сеть, состоящая из нейронов с активационными функциями единичного скачка (бинарная сеть). Использование нейронной сети в управлении УЗВ, удобно тем, что не надо придумывать инструкции и алгоритм управления. НС, при обучении, сама все придумает за вас. Поэтому это и называется искусственным интеллектом. Пока на этом все. Если эта рубрика понравиться нашим читателям, то мы продолжим дальше нашу лекцию. Следите за новостями.
в начало страницы |
Вопросы и предложения относительно того, что представлено на сайте, можно направлять по адресу:
|