НЕЙРОУПРАВЛЕНИЕ

Авторы: А. И. Галушкин

НЕЙРОУПРАВЛЕ́НИЕ (англ. Neurocontrol), применение нейронных сетей для выработки управляющих сигналов в системах управления; частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Н. – новый раздел теории управления динамическими системами, появление которого обусловлено активным развитием нейрокомпьютеров, сложностью построения алгоритмов управления нелинейными многомерными распределёнными системами, а также системами, функционирующими в условиях неопределённости. Термин «нейроуправление» впервые был использован одним из авторов метода обратного распространения ошибки Полом Дж. Вербосом в 1976. Н. находится на стыке таких дисциплин, как искусственный интеллект, нейрофизиология, теория автоматического управления, робототехника.

Схемы управления на базе контроллеров

В кон. 20 – нач. 21 вв. проблематика Н. активно развивается. Одной из причин этого является то, что традиционные методы управления в основном опираются на теорию линейных систем, в то время как реальные объекты по своей природе нелинейны. В действительности часто представляется сложным сделать работу оборудования полностью автоматической. Управление должно осуществляться людьми.

ПИ- и ПИД-контроллеры

Одними из первых систем управления были пропорционально-интегральные и пропорционально-интегрально-дифференциальные регуляторы (ПИ и ПИД-контроллеры). Их использование не требует знания точной модели процесса, поэтому они эффективны в управлении промышленными процессами, математические модели которых достаточно сложно определить. ПИ- и ПИД-контроллеры строятся на основе классической теории управления и просты для понимания. Установление связей между параметрами и управление действиями системы могут осуществляться инженерами-практиками и операторами. Наряду с вышеуказанными достоинствами, ПИ- и ПИД-контроллеры имеют ряд недостатков. Например, если рабочая точка процесса изменяется из-за возмущений, параметры контроллера требуется перенастроить вручную, чтобы получить новую оптимальную настройку. Настройка при этом должна выполняться опытным оператором. Для систем с взаимодействующими контурами эта процедура может быть сложной и занимать много времени. Кроме того, для процессов с переменными параметрами, временны́ми задержками, существенными нелинейностями и значительными помехами использование ПИ- и ПИД-контроллеров может не обеспечить оптимальных характеристик.

Самонастраивающиеся системы

В методе настройки требуется человеко-машинное взаимодействие, в ходе которого оператор должен генерировать входные сигналы каждый раз, когда требуется изменение параметров с целью адаптации к изменению динамики процесса. По этим причинам разработчиками была предложена идея управления с самонастройкой, в которой параметры контроллера настраивались бы в оперативном режиме. Идея самонастраивающихся (СН) систем была выдвинута ещё в 1950-е гг. и активно развивалась в 1970–80-е гг. в связи с развитием микропроцессорной техники. Рудольф Калман предложил концепцию машины, которая автоматически выполняла бы самонастройку в целях управления произвольным динамическим процессом. Эта идея была важной в общем ходе развития самонастраивающихся средств управления, однако она не получила активной поддержки из-за неадекватности теории и технологии. «Вторым рождением» данной теории, вызвавшим большой интерес среди инженеров и исследователей в области управления, стала концепция, согласно которой в ряде случаев комбинация оценок, полученных по обычному методу наименьших квадратов, и управления по минимальной дисперсии обеспечивает свойство самонастраиваемости. За этой работой последовал ряд практических приложений, которые, в свою очередь, породили новые теоретические разработки.

Рис. 1. Общая схема управления с самонастройкой.

Управление с самонастройкой можно рассматривать как вид управления, выполняющий две основные задачи в замкнутом цикле обратной связи (рис. 1). Первая из них – сбор информации о текущем состоянии управляемого процесса. К данной задаче относится постоянное определение текущего состояния управляемого процесса на основе измеряемых данных о входе и выходе процесса, а также сигналов состояния. Полученная информация используется для идентификации системы, которая включает в себя определение структуры модели, оценку её параметров, а также оценку параметров неконтролируемых сигналов (например, шумовых сигналов в стохастических системах). Определение структуры модели требует построения некоторого вида математического представления системы, соответствующего решаемой задаче. Оценка параметров модели – ключевой элемент самонастройки, выполняется в оперативном режиме (в реальном времени функционирования объекта управления). Вторая задача самонастройки – проектирование контроллера. Её решение обычно базируется на оптимизации критерия оптимальности управления. Цель управления задаётся для каждой конкретной системы. При этом требуется принять решение в отношении того, как контроллер должен адаптироваться или настраиваться. На этой основе рассчитывается новый набор параметров контроллера взамен прежних параметров в цикле управления. Одно из достоинств системы самонастройки состоит в том, что данный процесс выполняется в оперативном режиме и в реальном времени.

Многомерные ПИ- и ПИД-контроллеры с самонастройкой

Реализация идеи самонастройки позволила реально перейти к построению самонастраивающихся ПИД-контроллеров со многими переменными. При построении таких СН ПИД-контроллеров учитываются те же проблемы управления, что и для контроллеров с одним входом и одним выходом (нелинейности, переменная динамика объекта управления, детерминированные и стохастические возмущения, временны́е задержки). Для многомерного случая присущи также сложности, которые отсутствуют в системах с одним входом и выходом. К ним относятся, в частности, проблемы, описываемые хорошо известными разделами теории управления многомерными системами, а также проблемы, связанные с параметризацией, неравными временны́ми задержками и устойчивостью. Поэтому при синтезе многомерных ПИ- и ПИД-контроллеров с самонастройкой, как правило, предполагают, что при описании объекта управления как линейной системы в виде$$A(z^{–1})y(t) = B(z^{–1})u(t – d) + C(z^{–1})ξ(t)$$

A(z1)y(t)=B(z1)u(td)+C(z1)ξ(t)

выполняются следующие условия: шум $ξ(t)$, нарушающий работу системы, стабилен в том смысле, что нули полинома $C(z^{-1})$ лежат внутри круга единичного радиуса на z-плоскости; полиномы $A(z^{-1})$ и $B(z^{-1})$ являются взаимно простыми; верхние границы порядков всех скалярных полиномов, входящих в матрицы $A(z^{-1})$$B(z^{-1})$$C(z^{-1})$, известны; связанное с каждым каналом передачи транспортное запаздывание, составляющее не менее $d$ интервалов времени, предполагается известным и одинаковым для всех каналов; звенья $A(z^{-1})$$B(z^{-1})$ устойчивы, т. е. система является минимально фазовой.

 

Управление на базе нечёткой логики

Один из новейших и наиболее эффективных способов управления – управление на базе нечёткой логики. Теория нечёткой логики была разработана Л. Заде в нач. 1960-х гг. и сейчас успешно применяется во многих промышленных системах и бытовых изделиях. Применение нечёткой логики для управления процессами имеет ряд преимуществ по сравнению с использованием традиционных контроллеров. Одно из основных преимуществ нечётко-логических контроллеров состоит в том, что их можно разрабатывать по лингвистическим правилам, что тесно связано с искусственным интеллектом. Одна из целей искусственного интеллекта состоит в том, чтобы заменить человека машиной при выполнении точных операций; таким образом, связь между искусственным интеллектом и теорией управления очевидна. Нечёткий контроллер состоит из набора условных лингвистических операторов, или правил (называемых нечёткими ассоциативными матричными правилами, или НАМ-правилами), задающих конкретные ситуации управления. Эти условные лингвистические операторы могут быть легко получены из соображений здравого смысла или технических сведений о процессе, которым необходимо управлять. Для многих процессов сложно обеспечить точное управление. Оно обычно является многомерным, нелинейным и изменяющимся во времени. Управление на основе нечёткой логики может успешно применяться для таких процессов. Кроме того, нечёткие контроллеры могут работать с не полностью описанными системами с неизвестной динамикой, т. к. для них (в отличие от многих традиционных адаптивных контроллеров) не требуется априорная математическая модель объекта управления. Ещё одно преимущество нечётких контроллеров состоит в том, что они могут быть реализованы на базе цифровых или аналоговых сверхбольших интегральных схем (СБИС), в которых информация может кодироваться по параллельно-распределённой схеме.

Нейронное управление (нейроуправление)

Во многих реальных системах имеются нелинейные характеристики, сложные для моделирования динамические элементы, неконтролируемые шумы и помехи, множество обратных связей и другие факторы, затрудняющие реализацию стратегий управления. Как современная (в т. ч. теория адаптивного и оптимального управления), так и классическая теория управления в значительной степени базировалась на идее линеаризации систем. Для практического применения данного подхода необходима прежде всего разработка математических моделей. Однако математическое моделирование, реализуемое на основе предположения о линейности системы, может не отражать её действительных физических свойств. Но даже если удастся построить сложные математические модели, точно отражающие физические соотношения между входом и выходом системы, они могут оказаться бесполезными для целей управления. Практически приемлемыми могут быть только модели с низкой чувствительностью по параметрам. Обеспечить это для нелинейных систем достаточно сложно.

Под Н. понимается использование нейронных сетей (НС) для выработки управляющих сигналов в системах управления. Нейронные сети нашли широкое применение как в Н., так и во многих других задачах науки и техники, т. к. нейронные сети – наилучший из возможных способ аппроксимации и экстраполяции функций. Это справедливо при наличии в процессе обучения нейронных сетей достаточно большого объёма обучающей информации, а также грамотного синтеза многослойной нейронной сети (наличие множественных нелинейных функций активации в многослойной нейронной сети обеспечивает эффективную реализацию достаточно гибких нелинейных преобразований). Это важно для решения задач с существенными нелинейностями, для которых традиционные подходы пока не дают практически реализуемых решений. Необходимым условием применения традиционных методов оптимального адаптивного управления является наличие большого объёма априорной информации об объекте управления, например данных математического моделирования. Благодаря способности нейронных сетей к обучению и самообучению для нейроконтроллеров такой объём информации не требуется. В связи с этим можно полагать, что нейроконтроллеры пригодны для управления в условиях существенных неопределённостей. Высокая параллельность нейронных сетей является предпосылкой эффективной реализации аппаратной и программно-аппаратной поддержки нейросетевых контроллеров в контуре управления. Это свойство нейронных сетей позволяет монотонно (а не катастрофически) уменьшать качество работы при увеличении числа вышедших из строя элементов. Ниже рассматриваются основные способы включения нейроконтроллеров в контур управления динамическими системами.

Нейроуправление на основе инверсно-прямой модели

Рис. 2. Общая схема получения инверсной нейросетевой модели объекта управления.
Рис. 3. Блок-схема и условное обозначение линии задержки.
Рис. 4. Структура инверсно-прямого нейроуправления.

Одной из наиболее распространённых схем стала схема нейронного управления на основе инверсно-прямой модели. Популярность этого подхода связана с его простотой. Сущность подхода состоит в следующем: сначала нейронная сеть (НС) обучается на инверсии объекта управления, а затем она может быть настроена на непосредственное управление этим объектом. На рис. 2 представлена общая схема получения инверсной нейросетевой модели объекта управления. Здесь и в последующих схемах линия задержки для формирования многомерного входного сигнала нейронной сети представляется так, как указано на рис. 3. Обученная таким образом сеть настраивается на работу в качестве контроллера в обычной системе управления с обратной связью (рис. 4).

Общая схема нейроуправления

Рис. 5. Общая схема нейроуправления.

Блок-схема Н. показана на рис. 5. Для получения желаемых результатов управления, т. е. для поддержания максимального соответствия выходного сигнала объекта управления опорному сигналу, можно настраивать два элемента схемы: контроллер прямой связи (КПС) и контроллер обратной связи (КОС). На схеме они обозначены стрелками. Контроллер обратной связи (КОС) используется для стабилизации замкнутой системы. Стабилизация достигается на основе сигнала ошибки (ε), представляющего собой разность между опорным сигналом и выходным сигналом объекта управления. Если объект управления имеет существенное временнóе запаздывание, то воздействие управляющего входного сигнала на выход объекта управления будет проявляться с запаздыванием; получаемый таким образом выходной сигнал будет подаваться обратно (по цепи обратной связи) и сравниваться с опорным сигналом. По разности между сигналами определяется очередной входной управляющий сигнал (управляющее воздействие). Таким образом, временнóе запаздывание может привести к тому, что замкнутая система потеряет устойчивость.

При отсутствии возмущений контроллер прямой связи (КПС) не даёт полной гарантии того, что выходной сигнал объекта управления будет соответствовать опорному сигналу, однако обеспечивает быструю передачу выработанного входного сигнала на объект управления. В результате достигается высокая скорость реакции системы. То есть КОС обеспечивает стабильность системы, а КПС — быстроту ее реакции. Таким образом, если требуется, чтобы выходной сигнал объекта управления быстро изменялся в соответствии с опорным сигналом, то следует использовать КОС. Различают последовательные и параллельные схемы управления.

Последовательная схема нейроуправления

Рис. 6. Последовательная схема нейроуправления.

Последовательную схему Н. (рис. 6) называют также «инверсно-прямое управление»; это означает, что нейронная сеть может реализовывать обратную динамику объекта управления.

Если подать на нейронную сеть опорный сигнал $r$, то выходной сигнал объекта управления $y$ принимает значение $r$, т. к. $u$ – входной сигнал объекта управления, соответствующий опорному сигналу $r$, а $y$ – выходной сигнал, соответствующий $u$.

Один из вариантов последовательной схемы Н. состоит в том, чтобы выполнить имитационное моделирование объекта управления, используя другую нейронную сеть. В этом случае нейронная сеть служит в качестве идентификатора объекта управления. Для нейронных сетей вместо термина «идентификатор» объекта управления применяется термин «эмулятор объекта управления» или «эмулятор». Эмулятор является в этом случае косвенным средством вычисления или, точнее, оценки объекта управления.

Рис. 7. Простейшая схема обучения для получения эмулятора.

Простейшая схема обучения эмулятора (рис. 7) реализует схему обучения нейронной сети, при которой минимизируется ошибка предсказания; здесь $y'$   выходной сигнал эмулятора, обозначающий предсказанную оценку величины.

Рис. 8. Простейшая внутренняя структура эмулятора.

В соответствии с этим на рис. 8 представлена простейшая внутренняя структура нейроэмулятора.

Параллельная схема управления

Рис. 9. Параллельная схема нейроуправления.

Параллельная архитектура Н. показана на рис. 9, где в качестве контроллера используется обычный ПИД-контроллер. Примером такой схемы Н. является метод «обучения с ошибкой обратной связи».

В этой схеме нейронная сеть настраивается параллельно обычному контроллеру с обратной связью (схема параллельного нейронного управления). Сеть обучается путём повторения циклов желаемой траектории; при этом ошибка обратной связи распространяется по сети в обратном направлении. Сходимость достигается, когда нейронная сеть, завершив обучение на инверсии объекта управления, принимает на себя управление объектом, устраняя действие контроллера с обратной связью.

Сферы применения нейроуправления

Выделяются следующие сферы применения Н.: промышленные направления; системы управления движением; функциональные системы; сложные объекты управления.

Промышленные направления

Авиационная (управление динамикой полёта, автоматическая посадка, выполнение специальных манёвров, управление воздушным боем, управление пилотируемым и беспилотным вертолётом и др.); космическая техника (управление положением космического аппарата, управление коррекцией орбиты, управление манипулятором на борту космического аппарата, автоматическая фокусировка фотоаппаратуры или др. систем получения изображений, активная виброзащита космических аппаратов; управление гибкими структурами и подавление в них колебаний, возбуждаемых реактивными двигателями); биотехнология (задачи нейросетевого моделирования биохимических процессов в целях идентификации объекта управления, а также управления отдельными процессами); электронная промышленность (управление процессами плазменного травления, фотоионизации с помощью лазеров, управление сверхпрецизионными системами позиционирования с высоким быстродействием); химическая промышленность (управление синтезом веществ, различными химическими объектами, отдельными процессами); металлургия и металлообработка (управление прокатными станами, дуговыми печами, температурой и радиальным распределением газового потока в доменных печах, температурой охладителя агломерата в составе сталелитейной установки, электронной системой при плавке алюминия машинами для литья под давлением); сельское хозяйство (управление теплицами для максимизации роста биомассы, системы контроля влажности и вентиляции в овощехранилищах, идентификация объекта хранения – модель теплопроводности овощей и фруктов, а также овощехранилища) и др.

Системы управления движением

Системы управления электродвигателями,  управления пьезодвигателями, сервоприводы; гидравлические и электрогидравлические системы; пневматические системы; системы управления роботами и микророботами; системы управления подъёмными кранами и др.

Функциональные системы

Системы активной виброзащиты (различные гибкие структуры, в частности космические антенны и конструкции, амортизаторы в автомобилях, гибкие звеньевые структуры типа манипуляторов, кривошипно-шатунные механизмы, бронемашины с поглощением ударов, турбогенераторы и др. подобные изделия); системы шумопоглощения (система генерации сигнала, противодействующая входному шуму, с целью сделать минимальным шум на выходе в наушниках у человека); системы управления температурой (управления температурой реализованы в криостатах с жидким гелием, в системах быстрой тепловой обработки, регулирования температуры печей, воды в бассейнах, в административных зданиях и других объектах) и др.

Сложные объекты управления

Интеллектуальное здание (проект «нейродом», в котором Н. применяется для управления вентиляцией, освещением, температурой воздуха, воды в доме, системой высокоскоростных лифтов в целях минимизации суммарного времени ожидания); строительные конструкции (нейросистема вырабатывает сигналы управления на воздействующие активные элементы, чтобы минимизировать эквивалентную деформацию фермы и, следовательно, уменьшить степень её изнашивания и увеличить долговечность эксплуатации); морские суда (управление движением судна – двигателем, автопилотом, манёвром, причаливанием, обходом препятствий); оптические системы (автоматическая настройка оптической системы на резкость изображения, создание адаптивных составных телескопов, зеркало которых состоит из нескольких десятков или даже сотен фрагментов, и их настройка в динамическом режиме) и др.  

Объективной причиной активного развития Н. является то, что попытки классическими приближёнными методами описать процессы, происходящие в нелинейных системах, как правило, не приводят к качественным результатам.

Лит.: Neural network applications in control / Ed. G. W. Irwin, К. Warwick, K. J. Hunt. L.,1995; Neural networks for control / Ed. W. T. Miller, R. S. Sutton, P. J. Werbos. Camb., 1996; Neural systems for control / Ed. Omid Omidvar, D. L. Elliot. San Diego, 1997; Нrусеj Т. Neurocontrol. Towards an industrial control methodology. N. Y., 1997; Neural network systems techniques and applications / Ed. C. T. Leondes. San Diego, 1998. Vol. 7: Control and dynamic systems; Neural network engineering in dynamic control systems / Ed. K. J. Hunt, G. W. Irwin, К. Warwick. B.,1999; Neural networks for modelling and control of dynamic systems. B.; N. Y., 2000; Чимишкян С.  Распределенные алгоритмы управления... // Мир компьютерной автоматизации. 2000. №1; Галушкин А. И. Теория нейронных сетей. М., 2000; он же. Нейрокомпьютеры. М., 2000; Головко В. А. Нейронные сети: обучение, организация и применение. М., 2001; Нейронные сети: история развития теории / Под ред. А. И. Галушкина, Я. 3. Цыпкина. М., 2001; Терехов В. А., Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления. М., 2002; Нейроматематика / Под ред. А. И. Галушкина. М., 2002; Нейроуправляемые конструкции и системы. М., 2003; Нейрокомпьютеры в авиации (самолеты). М., 2004; Нейрокомпьютеры в космической технике. М., 2004.

Вернуться к началу