Нейроуправление
Нейроуправле́ние (англ. neurocontrol), применение нейронных сетей для выработки управляющих сигналов в системах управления; частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Нейроуправление – новый раздел теории управления динамическими системами, появление которого обусловлено активным развитием нейрокомпьютеров, сложностью построения алгоритмов управления нелинейными многомерными распределёнными системами, а также системами, функционирующими в условиях неопределённости. Термин впервые был использован одним из авторов метода обратного распространения ошибки – П. Дж. Вербосом (Уэрбосом) в 1976 г. Нейроуправление находится на стыке таких дисциплин, как искусственный интеллект, нейрофизиология, теория автоматического управления, робототехника.
Схемы управления на базе контроллеров
В конце 20 – начале 21 вв. проблематика нейроуправления активно развивается. Одной из причин этого является то, что традиционные методы управления в основном опираются на теорию линейных систем, в то время как реальные объекты по своей природе нелинейны. В действительности часто представляется сложным сделать работу оборудования полностью автоматической. Управление должно осуществляться людьми.
ПИ- и ПИД-контроллеры
Одними из первых систем управления были пропорционально-интегральные и пропорционально-интегрально-дифференциальные регуляторы (ПИ и ПИД-контроллеры). Их использование не требует знания точной модели процесса, поэтому они эффективны в управлении промышленными процессами, математические модели которых достаточно сложно определить. ПИ- и ПИД-контроллеры строятся на основе классической теории управления и просты для понимания. Установление связей между параметрами и управление действиями системы могут осуществляться инженерами-практиками и операторами. Наряду с вышеуказанными достоинствами, ПИ- и ПИД-контроллеры имеют ряд недостатков. Например, если рабочая точка процесса изменяется из-за возмущений, параметры контроллера требуется перенастроить вручную, чтобы получить новую оптимальную настройку. Настройка при этом должна выполняться опытным оператором. Для систем со взаимодействующими контурами эта процедура может быть сложной и занимать много времени. Кроме того, для процессов с переменными параметрами, временны́ми задержками, существенными нелинейностями и значительными помехами использование ПИ- и ПИД-контроллеров может не обеспечить оптимальных характеристик.
Самонастраивающиеся системы
В методе настройки требуется человеко-машинное взаимодействие, в ходе которого оператор должен генерировать входные сигналы каждый раз, когда требуется изменение параметров с целью адаптации к изменению динамики процесса. По этим причинам разработчиками была предложена идея управления с самонастройкой, в которой параметры контроллера настраивались бы в оперативном режиме. Идея самонастраивающихся систем была выдвинута ещё в 1950-е гг. и активно развивалась в 1970–1980-е гг. в связи с развитием микропроцессорной техники. Р. Калман предложил концепцию машины, которая автоматически выполняла бы самонастройку в целях управления произвольным динамическим процессом. Эта идея была важной в общем ходе развития самонастраивающихся средств управления, однако она не получила активной поддержки из-за неадекватности теории и технологии. «Вторым рождением» данной теории, вызвавшим большой интерес среди инженеров и исследователей в области управления, стала концепция, согласно которой в ряде случаев комбинация оценок, полученных по обычному методу наименьших квадратов, и управления по минимальной дисперсии обеспечивает свойство самонастраиваемости. За этой работой последовал ряд практических приложений, которые, в свою очередь, породили новые теоретические разработки.
Управление с самонастройкой можно рассматривать как вид управления, выполняющий 2 основные задачи в замкнутом цикле обратной связи (рис. 1).
Первая из них – сбор информации о текущем состоянии управляемого процесса. К данной задаче относится постоянное определение текущего состояния управляемого процесса на основе измеряемых данных о входе и выходе процесса, а также сигналов состояния. Полученная информация используется для идентификации системы, которая включает в себя определение структуры модели, оценку её параметров, а также оценку параметров неконтролируемых сигналов (например, шумовых сигналов в стохастических системах). Определение структуры модели требует построения некоторого вида математического представления системы, соответствующего решаемой задаче. Оценка параметров модели – ключевой элемент самонастройки – выполняется в оперативном режиме (в реальном времени функционирования объекта управления). Вторая задача самонастройки – проектирование контроллера. Её решение обычно базируется на оптимизации критерия оптимальности управления. Цель управления задаётся для каждой конкретной системы. При этом требуется принять решение относительно того, как контроллер должен адаптироваться или настраиваться. На этой основе рассчитывается новый набор параметров контроллера взамен прежних параметров в цикле управления.
Реализация идеи самонастройки позволила реально перейти к построению самонастраивающихся ПИД-контроллеров со многими переменными. При построении таких самонастраивающихся ПИД-контроллеров учитываются те же проблемы управления, что и для контроллеров с одним входом и одним выходом (нелинейности, переменная динамика объекта управления, детерминированные и стохастические возмущения, временны́е задержки).
Управление на базе нечёткой логики
Один из новейших и наиболее эффективных способов управления – управление на базе нечёткой логики. Теория нечёткой логики была разработана Л. Заде в начале 1960-х гг. и сейчас успешно применяется во многих промышленных системах и бытовых изделиях. Применение нечёткой логики для управления процессами имеет ряд преимуществ по сравнению с использованием традиционных контроллеров. Одно из основных преимуществ нечётко-логических контроллеров состоит в том, что их можно разрабатывать по лингвистическим правилам, что тесно связано с искусственным интеллектом. Одна из целей искусственного интеллекта состоит в том, чтобы заменить человека машиной при выполнении точных операций; таким образом, связь между искусственным интеллектом и теорией управления очевидна. Нечёткий контроллер состоит из набора условных лингвистических операторов, или правил (называемых нечёткими ассоциативными матричными правилами, или НАМ-правилами), задающих конкретные ситуации управления. Эти условные лингвистические операторы могут быть легко получены из соображений здравого смысла или технических сведений о процессе, которым необходимо управлять. Для многих процессов сложно обеспечить точное управление. Оно обычно является многомерным, нелинейным и изменяющимся во времени. Управление на основе нечёткой логики может успешно применяться для таких процессов. Кроме того, нечёткие контроллеры могут работать с не полностью описанными системами с неизвестной динамикой, т. к. для них (в отличие от многих традиционных адаптивных контроллеров) не требуется априорная математическая модель объекта управления. Ещё одно преимущество нечётких контроллеров состоит в том, что они могут быть реализованы на базе цифровых или аналоговых сверхбольших интегральных схем, в которых информация может кодироваться по параллельно-распределённой схеме.
Нейронное управление (нейроуправление)
Во многих реальных системах имеются нелинейные характеристики, сложные для моделирования динамические элементы, неконтролируемые шумы и помехи, множество обратных связей и другие факторы, затрудняющие реализацию стратегий управления. Как современная (в том числе теория адаптивного и оптимального управления), так и классическая теория управления в значительной степени базировалась на идее линеаризации систем. Для практического применения данного подхода необходима прежде всего разработка математических моделей. Однако математическое моделирование, реализуемое на основе предположения о линейности системы, может не отражать её действительных физических свойств. Но даже если удастся построить сложные математические модели, точно отражающие физические соотношения между входом и выходом системы, они могут оказаться бесполезными для целей управления. Практически приемлемыми могут быть только модели с низкой чувствительностью по параметрам. Обеспечить это для нелинейных систем достаточно сложно.
Нейронные сети нашли широкое применение как в нейроуправлении, так и во многих других задачах науки и техники, т. к. нейронные сети – наилучший из возможных способ аппроксимации и экстраполяции функций. Это справедливо при наличии в процессе обучения нейронных сетей достаточно большого объёма обучающей информации, а также грамотного синтеза многослойной нейронной сети (наличие множественных нелинейных функций активации в многослойной нейронной сети обеспечивает эффективную реализацию достаточно гибких нелинейных преобразований). Это важно для решения задач с существенными нелинейностями, для которых традиционные подходы пока не дают практически реализуемых решений. Необходимым условием применения традиционных методов оптимального адаптивного управления является наличие большого объёма априорной информации об объекте управления, например данных математического моделирования. Благодаря способности нейронных сетей к обучению и самообучению для нейроконтроллеров такой объём информации не требуется. В связи с этим можно полагать, что нейроконтроллеры пригодны для управления в условиях существенных неопределённостей. Высокая параллельность нейронных сетей является предпосылкой эффективной реализации аппаратной и программно-аппаратной поддержки нейросетевых контроллеров в контуре управления. Это свойство нейронных сетей позволяет монотонно (а не катастрофически) уменьшать качество работы при увеличении числа вышедших из строя элементов. Ниже рассматриваются основные способы включения нейроконтроллеров в контур управления динамическими системами.
Нейроуправление на основе инверсно-прямой модели
Одной из наиболее распространённых схем стала схема нейронного управления на основе инверсно-прямой модели. Популярность этого подхода связана с его простотой. Сущность подхода состоит в следующем: сначала нейронная сеть обучается на инверсии объекта управления, а затем она может быть настроена на непосредственное управление этим объектом.
На рис. 2 представлена общая схема получения инверсной нейросетевой модели объекта управления. Здесь и в последующих схемах линия задержки для формирования многомерного входного сигнала нейронной сети представляется так, как указано на рис. 3.
Обученная таким образом сеть настраивается на работу в качестве контроллера в обычной системе управления с обратной связью (рис. 4).
Общая схема нейроуправления
Блок-схема нейроуправления показана на рис. 5.
Для получения желаемых результатов управления, т. е. для поддержания максимального соответствия выходного сигнала объекта управления опорному сигналу, можно настраивать 2 элемента схемы: контроллер прямой связи (КПС) и контроллер обратной связи (КОС). На схеме они обозначены стрелками. Контроллер обратной связи (КОС) используется для стабилизации замкнутой системы. Стабилизация достигается на основе сигнала ошибки представляющего собой разность между опорным сигналом и выходным сигналом объекта управления. Если объект управления имеет существенное временнóе запаздывание, то воздействие управляющего входного сигнала на выход объекта управления будет проявляться с запаздыванием; получаемый таким образом выходной сигнал будет подаваться обратно (по цепи обратной связи) и сравниваться с опорным сигналом. По разности между сигналами определяется очередной входной управляющий сигнал (управляющее воздействие). Таким образом, временнóе запаздывание может привести к тому, что замкнутая система потеряет устойчивость.
При отсутствии возмущений контроллер прямой связи (КПС) не даёт полной гарантии того, что выходной сигнал объекта управления будет соответствовать опорному сигналу, однако обеспечивает быструю передачу выработанного входного сигнала на объект управления. В результате достигается высокая скорость реакции системы. Т. е. КОС обеспечивает стабильность системы, а КПС – быстроту её реакции. Таким образом, если требуется, чтобы выходной сигнал объекта управления быстро изменялся в соответствии с опорным сигналом, то следует использовать КОС. Различают последовательные и параллельные схемы управления.
Последовательная схема нейроуправления
Последовательную схему нейроуправления (рис. 6) называют также «инверсно-прямое управление»; это означает, что нейронная сеть может реализовывать обратную динамику объекта управления.
Если подать на нейронную сеть опорный сигнал то выходной сигнал объекта управления принимает значение т. к. – входной сигнал объекта управления, соответствующий опорному сигналу а – выходной сигнал, соответствующий
Один из вариантов последовательной схемы нейроуправления состоит в том, чтобы выполнить имитационное моделирование объекта управления, используя другую нейронную сеть. В этом случае нейронная сеть служит в качестве идентификатора объекта управления. Для нейронных сетей вместо термина «идентификатор объекта управления» применяется термин «эмулятор объекта управления» (или «эмулятор»). Эмулятор является в этом случае косвенным средством вычисления или, точнее, оценки объекта управления.
Простейшая схема обучения эмулятора (рис. 7) реализует схему обучения нейронной сети, при которой минимизируется ошибка предсказания; здесь – выходной сигнал эмулятора, обозначающий предсказанную оценку величины.
В соответствии с этим на рис. 8 представлена простейшая внутренняя структура нейроэмулятора.
Параллельная схема управления
Параллельная архитектура нейроуправления показана на рис. 9, где в качестве контроллера используется обычный ПИД-контроллер. Примером такой схемы нейроуправления является т. н. метод обучения с ошибкой обратной связи.
В этой схеме нейронная сеть настраивается параллельно обычному контроллеру с обратной связью (схема параллельного нейронного управления). Сеть обучается путём повторения циклов желаемой траектории; при этом ошибка обратной связи распространяется по сети в обратном направлении. Сходимость достигается, когда нейронная сеть, завершив обучение на инверсии объекта управления, принимает на себя управление объектом, устраняя действие контроллера с обратной связью.
Сферы применения нейроуправления
Промышленные направления
Авиационная техника (управление динамикой полёта, автоматическая посадка, выполнение специальных манёвров, управление воздушным боем, управление пилотируемым и беспилотным вертолётом и др.); космическая техника (управление положением космического аппарата, управление коррекцией орбиты, управление манипулятором на борту космического аппарата, автоматическая фокусировка фотоаппаратуры или других систем получения изображений, активная виброзащита космических аппаратов; управление гибкими структурами и подавление в них колебаний, возбуждаемых реактивными двигателями); биотехнология (задачи нейросетевого моделирования биохимических процессов в целях идентификации объекта управления, а также управления отдельными процессами); электронная промышленность (управление процессами плазменного травления, фотоионизации с помощью лазеров, управление сверхпрецизионными системами позиционирования с высоким быстродействием); химическая промышленность (управление синтезом веществ, различными химическими объектами, отдельными процессами); металлургия и металлообработка (управление прокатными станами, дуговыми печами, температурой и радиальным распределением газового потока в доменных печах, температурой охладителя агломерата в составе сталелитейной установки, электронной системой при плавке алюминия машинами для литья под давлением); сельское хозяйство (управление теплицами для максимизации роста биомассы, системы контроля влажности и вентиляции в овощехранилищах, идентификация объекта хранения – модель теплопроводности овощей и фруктов, а также овощехранилища) и др.
Системы управления движением
Системы управления электродвигателями, управления пьезодвигателями, сервоприводы; гидравлические и электрогидравлические системы; пневматические системы; системы управления роботами и микророботами; системы управления подъёмными кранами и др.
Функциональные системы
Системы активной виброзащиты (различные гибкие структуры, в частности космические антенны и конструкции, амортизаторы в автомобилях, гибкие звеньевые структуры типа манипуляторов, кривошипно-шатунные механизмы, бронемашины с поглощением ударов, турбогенераторы и другие подобные изделия); системы шумопоглощения (система генерации сигнала, противодействующая входному шуму, с целью сделать минимальным шум на выходе в наушниках у человека); системы управления температурой (управление температурой реализовано в криостатах с жидким гелием, в системах быстрой тепловой обработки, регулирования температуры печей, воды в бассейнах, в административных зданиях и других объектах) и др.
Сложные объекты управления
Интеллектуальное здание (проект «нейродом», в котором нейроуправление применяется для управления вентиляцией, освещением, температурой воздуха, воды в доме, системой высокоскоростных лифтов в целях минимизации суммарного времени ожидания); строительные конструкции (нейросистема вырабатывает сигналы управления на воздействующие активные элементы, чтобы минимизировать эквивалентную деформацию фермы и, следовательно, уменьшить степень её изнашивания и увеличить долговечность эксплуатации); морские суда (управление движением судна – двигателем, автопилотом, манёвром, причаливанием, обходом препятствий); оптические системы (автоматическая настройка оптической системы на резкость изображения, создание адаптивных составных телескопов, зеркало которых состоит из нескольких десятков или даже сотен фрагментов, и их настройка в динамическом режиме) и др.
Объективной причиной активного развития нейроуправления является то, что попытки описать процессы, происходящие в нелинейных системах, классическими приближёнными методами, как правило, не приводят к качественным результатам.