Стабилизация
Стабилиза́ция (от лат. stabilis – устойчивый), приведение чего-либо в устойчивое состояние, изменение поведения системы, с тем чтобы после возникших нарушений в поведении вернуть её в устойчивое состояние; придание чему-либо большей стойкости. Примеры употребления: стабилизация положения, стабилизация обстановки или ситуации, стабилизация напряжения, стабилизация экономики или курса валюты, стабилизация курса самолёта или траектории движения космического аппарата и т. д.
Задача стабилизации возникает при изучении динамики различных систем и процессов управления. Например, при решении задач управления различного рода техническими объектами и технологическими процессами встаёт вопрос об устойчивости управляемого движения. Устойчивость заданного режима достигается путём удержания движения рассматриваемого объекта в некоторой его достаточно малой окрестности, а при выходе объекта из этой окрестности движение объекта должно быть стабилизируемо – переведено с помощью подходящих управляющих воздействий в устойчивый режим. Стабилизация осуществляется, как правило, построением соответствующего управляющего устройства – регулятора. Одним из первых регуляторов в истории техники был центробежный регулятор Уатта. Он был изобретён шотландским инженером Дж. Уаттом и предназначен для обеспечения постоянной угловой скорости вращения вала паровой машины, основным элементом которой является маховое колесо, приводимое во вращательное движение силой пара и способное совершать полезную работу. Центробежный регулятор присоединяется к паровой машине с целью поддержать равномерность её хода: если скорость вращения махового колеса оказывается слишком большой, то уменьшает подачу пара, а если она оказывается слишком малой – увеличивает подачу пара. В результате таких взаимодействий машины и регулятора скорость вращения маховика будет стабилизироваться. Это и наблюдалось в паровых машинах до середины 19 в. Однако после середины 19 в. стали наблюдаться нарушения работы регулятора для новых видов паровых машин из-за явления самораскачивания. Для выяснения причин нарушения необходимо было точно изучить динамику работы системы «машина – регулятор» и исследовать её устойчивость, что было сделано в работах Дж. К. Максвелла, И. А. Вышнеградского и А. Стодолы. Эти работы в значительной степени стимулировали развитие теории устойчивости систем управления.
Содержательная постановка задачи о стабилизации
В общих чертах задача о стабилизации состоит в следующем. Рассматривают управляемый объект (под которым понимается некоторое техническое устройство, технологический процесс, социально-экономическая система и т. п.), снабжённый управляющим устройством (органом), представляющим собой совокупность элементов – «рулей», с помощью которых осуществляется воздействие на объект управления. Задача стабилизации состоит в том, чтобы, манипулируя «рулями» в пределах имеющихся ресурсов управления, удержать параметры управляемого объекта около желаемых значений. Последнее может осуществляться за счёт стремления параметров объекта управления к параметрам желаемого режима при неограниченном возрастании времени или за счёт близости параметров управляемого объекта к параметрам желаемого режима при всех моментах времени, если в начальный момент они были близки. Например, технологический процесс осуществления химической реакции, рассматриваемой как последовательность элементарных стадий, можно считать управляемым объектом, а «рулями» – концентрации ингредиентов, количество катализатора, поддерживающую температуру и другие факторы, влияющие на течение процесса. Для того чтобы стабилизировать управляемый объект, необходимо иметь уравнения, описывающие закон изменения объекта, причём в эти уравнения должны входить управляющие параметры, характеризующие положение «рулей».
Математическая постановка задачи о стабилизации
Рассматривается произвольный управляемый объект, динамика которого описывается системой обыкновенных дифференциальных уравнений
где – фазовые координаты, характеризующие состояние объекта в момент времени ( – это переменные, связанные, например, с движением объекта: координаты, скорости и т. д.), а описывают управляющие воздействия, приложенные к рассматриваемому объекту; – заданные функции от своих аргументов.
К системе вида обычно приводятся уравнения движения в случае управляемых механических объектов с конечным числом степеней свободы. Управление объектом означает выбор управляющих воздействий как функций времени и фазовых координат
или как функций только времени : , с теми ограничениями, накладываемыми на них (в связи с имеющимися возможностями управления объектом), при которых должны быть достигнуты цели управления. Например, необходимо перевести вектор фазовых координат системы из начального состояния в конечное состояние за время , аналогично можно поставить задачу и для бесконечного промежутка времени Далее, функции могут принадлежать каким-либо определённым классам функций. При этом условия на функции должны быть таковы, чтобы функции удовлетворяли условиям, обеспечивающим существование и единственность решения системы , определённого на бесконечном промежутке при любых начальных данных , из некоторой области допустимых значений. Такое решение системы : вектор-функция с начальным значением где – называется движением управляемой системы соответствующим выбранному управлению
Пусть – некоторое частное решение (иначе говоря, движение) системы (интерпретируемой как система уравнений движения некоторого механического объекта), порождаемое управляющими воздействиями или управляющими воздействиями, зависящими только от времени в этом случае называется программным управлением системы а соответствующее движение – программным движением системы отвечающим программному управлению. Движение называется невозмущённым движением. Наряду с невозмущённым движением рассматриваются возмущённые движения описываемые также системой уравнений но уже при управлениях или управлениях отличных, вообще говоря, от или от
Невозмущённое движение системы соответствующее управлению называется устойчивым (в смысле А. М. Ляпунова), если для любого положительного числа (как бы мало оно ни было) существует другое положительное число такое, что для всех возмущённых движений отвечающих некоторым управляющим воздействиям для которых в начальный момент выполняются неравенства будут при всех выполняться неравенства
Если невозмущённое движение не только устойчиво, но и все возмущённые движения для которых начальные возмущения достаточно малы, стремятся асимптотически к невозмущённому при неограниченном возрастании времени то невозмущённое движение называется асимптотически устойчивым.
Задача стабилизации невозмущённого движения состоит в таком выборе функций – отклонений переменных от при которых движение оказывается устойчивым или асимптотически устойчивым.
В задаче о стабилизации предполагается, что в процессе управления можно измерять текущие значения всех фазовых координат объекта. На основе этого измерения управляющее устройство должно выработать воздействия на объект управления так, чтобы обеспечить устойчивость или асимптотическую устойчивость заданного невозмущённого движения
Если в каждый момент времени измерению доступны не фазовые координаты а некоторое количество, скажем наблюдаемых переменных связанных с переменными соотношениями то в задаче о стабилизации требуется найти управляющие воздействия как функции от переменных (при этом управляющие воздействия будут сложными функциями от переменных
Для исследования проблемы стабилизации обычно переходят к новым переменным где – возмущения движения, а – отклонения управляющих воздействий от Тогда задача о стабилизации невозмущённого движения сводится к задаче о стабилизации нулевого решения соответствующей системы уравнений в новых переменных и
Прикладные задачи о стабилизации наряду с требованием асимптотической устойчивости заданного движения содержат обычно и требования:
О наилучшем (с какой-либо точки зрения) качестве приближения возмущённого движения к движению при неограниченном возрастании времени
О наименьшей возможной затрате ресурсов (например, энергии, импульсов и т. д.), расходуемых на формирование управляющих воздействий Эти требования можно выразить в виде условия минимальности некоторого интеграла
Здесь – некоторая неотрицательная функция от своих аргументов (во многих случаях функцию выбирают в виде суммы двух положительно определённых квадратичных форм от переменных и соответственно), – движение системы , порождаемое управлением
Задачу о стабилизации заданного движения системы при условии минимума интеграла в (как критерия качества) называют задачей об оптимальной стабилизации. Более точно, требуется найти такие управляющие воздействия которые обеспечивали бы асимптотическую устойчивость невозмущённого движения системы при причём каковы бы ни были другие управляющие воздействия должно выполняться неравенство
для всех начальных данных и
В частности, если речь идёт о задаче об оптимальной стабилизации в целом, то вышеуказанное неравенство должно выполняться для всех начальных возмущений
Функции называются оптимальным управлением.
Примером задачи о стабилизации может служить задача о переводе материальной точки, движущейся под действием центральной силы (например, силы тяготения или Кулона), с эллиптической траектории на круговую орбиту, достаточно близкую к эллиптической.
Для решения проблемы стабилизации динамических систем, описываемых системой дифференциальных уравнений вида , широко используются методы теории устойчивости, основы которой были заложены выдающимся русским математиком А. М. Ляпуновым. Во многих случаях решение проблемы стабилизации нелинейной системы определяется её линейным приближением – системой линейных дифференциальных уравнений, получаемых в результате процедуры линеаризации системы Суть метода линеаризации в том, что он заменяет изучение нелинейной системы исследованием её линейного приближения. Для линейных дифференциальных уравнений имеется достаточно полная теория, которая служит фундаментом для развития теории стабилизации по первому приближению.
Наиболее эффективные методы и алгоритмы стабилизации разработаны для линейных стационарных систем управления, в которых поведение объекта описывается системой линейных дифференциальных и алгебраических уравнений вида (в векторно-матричной форме)
где и – вещественные, соответственно, -, - и -мерные вектор-столбцы а – постоянные вещественные матрицы размерности соответственно (здесь обозначает транспонирование). Векторные функции и характеризуют, соответственно, состояние, управление (вход) и выход системы в момент времени. Уравнения можно рассматривать и как линеаризованные уравнения для нелинейной системы записанной в векторной форме и нелинейного уравнения выходной переменной в окрестностях точек и соответственно, в предположении, что и В этом случае где и – матрицы Якоби функции относительно и , соответственно, в точке и функции относительно в точке Для системы в рамках линейной теории управления ставятся задачи стабилизации с помощью линейной обратной связи в различных формах. Ниже приведены постановки типичных задач линейной стабилизации.
1. Задача о статической стационарной стабилизации по выходу. Требуется найти обратную связь вида
где – постоянная вещественная -матрица, такую, чтобы нулевое положение равновесия замкнутой системы
было бы асимптотически устойчивым. Сформулированную задачу называют ещё задачей о построении статического регулятора по выходу (англ. Static Output Feedback Problem). Эта задача в терминах матриц эквивалентна следующей: для данной тройки вещественных матриц найти вещественную матрицу , такую, чтобы матрица оказалась бы гурвицевой, т. е. чтобы все собственные значения этой матрицы были расположены в левой полуплоскости плоскости комплексного переменного: Несмотря на простоту формулировки задачи 1, полного, исчерпывающего ее решения не существует, хотя для ряда частных случаев она полностью исследована.
Если в системе – единичная матрица, т. е. выходом системы является вектор состояния, то говорят о задаче статической стабилизации по состоянию. Последняя задача значительно проще: достаточным условием существования решения, т. е. стабилизирующего регулятора вида , является полная управляемость системы – выполнение равенства .
2. Задача о статической нестационарной стабилизации по выходу (проблема Брокетта). Требуется найти нестационарную обратную связь вида
где – зависящая от вещественная -матрица, такую, чтобы нулевое решение замкнутой системы
было бы асимптотически устойчивым. Эта проблема была сформулирована Р. Брокеттом (R. Brockett. 1999). Следует отметить, что в частном случае задача 2 до формулировки в общем виде Р. Брокеттом была рассмотрена и решена Г. М. Розенблатом для случая и А. П. Жабко, В. Л. Харитоновым (для общего случая в классе периодических матриц В проблеме Брокетта, в частности, требуется выяснить, насколько введение в обратную связь зависимых от матриц расширяет возможности стационарной стабилизации. Решение проблемы Брокетта в ряде важных для практики случаев было дано в разных классах стабилизирующих обратных связей Г. А. Леоновым и Л. Моро, Д. Аэлсом. Были построены алгоритмы низкочастотной и высокочастотной стабилизации системы обратной связью вида Позже решение стабилизационной проблемы Брокетта для системы и ее обобщения на случай переменных матриц и в достаточно широких классах стабилизирующих матриц было предложено И. В. Бойковым. Проблема Брокетта в ряде работ рассматривалась также и для систем дифференциальных уравнений с запаздывающим аргументом.
В следующих двух задачах обратная связь включает запаздывание во времени.
3. Задача о стабилизации обратной связью с запаздыванием в обычной (классической) форме. Требуется найти обратную связь вида
где – постоянная вещественная -матрица, а – положительное число, такую, чтобы нулевое решение замкнутой системы с запаздывающим аргументом
было бы асимптотически устойчивым.
4. Задача (формулируется аналогично задаче 3) о стабилизации обратной связью с запаздыванием в форме Пирагаса. Требуется найти обратную связь вида
где – постоянная вещественная -матрица и – положительное число, такую, чтобы нулевое решение замкнутой системы
было бы асимптотически устойчивым.
Обратная связь вида была предложена К. Пирагасом в 1992 г. для стабилизации неустойчивых состояний равновесия и неустойчивых периодических орбит, встроенных в странные аттракторы систем с хаотическим поведением, в частности классических систем Лоренца и Рёсслера. Метод, основанный на введении в систему обратной связи вида (англ. Time-Delay Feedback Control), оказался весьма эффективным для стабилизации хаоса. Ему и его различным модификациям было посвящено большое количество публикаций [более тысячи (!) статей].
Имеются и другие, отличные от 1–4, постановки задач о стабилизации, требующие введения соответствующей обратной связи в систему Например, для решения проблемы стабилизации системы используют часто динамическую обратную связь (англ. Dynamic Output Feedback), представляющую собой динамическую систему, описываемую, как и алгебро-дифференциальными уравнениями. Соответствующий регулятор (называемый иногда динамическим компенсатором) рассматривается как альтернатива статическому регулятору
Для линейной системы ставится также задача линейно-квадратичной стабилизации: найти регулятор в форме обратной связи который стабилизирует систему и минимизирует интеграл (квадратичный показатель качества)
где и – некоторые положительно определённые матрицы.
Существуют далеко идущие обобщения постановок задач стабилизации 1–4, как, например, задача о робастной стабилизации, частным случаем которой является задача об одновременной стабилизации: даны линейных систем управления вида найти обратную связь по состоянию стабилизирующую все эти системы. По аналогии с детерминированным случаем рассматриваются и задачи о стабилизации управляемых стохастических систем. Совершенно аналогично формулируются также задачи о стабилизации для дискретных динамических систем.
Рассмотренные выше управления построены по принципу обратной связи, который предполагает измерение выходного сигнала и подачи на вход системы соответствующего управляющего сигнала. Однако на практике встречаются и такие системы, требующие автоматического управления, для которых невозможно провести какие-либо измерения и/или введение аддитивных управляющих сигналов. Для таких ситуаций в 1973 г. С. М. Меерковым был предложен новый принцип автоматического управления, названный им вибрационным управлением (англ. Vibrational Control). Этот принцип восходит к идее ранее известного эффекта стабилизации верхнего, неустойчивого, положения равновесия математического маятника, точка подвеса которого совершает вдоль вертикали колебания со сколь угодно малой амплитудой и достаточно большой частотой. Эффект стабилизации перевернутого положения маятника был впервые обнаружен А. Стефенсоном в 1908 г., а математическое объяснение этому явлению дал академик П. Л. Капица; им была построена теория динамической стабилизации (1951). Метод вибрационного управления (регулирования) Мееркова представляет собой способ изменения динамических свойств систем управления за счёт вибрационного возмущения коэффициентов уравнений движения. Следует отметить, что вибрационное управление не совпадает с управлением по принципу обратной связи. Задачи исследования вибрационной стабилизации линейных и нелинейных неустойчивых систем при помощи периодических возмущений их параметров рассматривались в работах разных авторов (П. Л. Капица, В. Н. Челомей, К. Г. Валеев, С. М. Меерков, С. А. Гришин, Н. Х. Розов, Г. М. Розенблат, А. П. Жабко, В. Л. Харитонов и др.).
Вопросы стабилизации управляемых динамических систем занимают важное место в современной теории управления. Теории и практике стабилизации посвящено много книг, статей и обзоров. Рост интереса к проблемам стабилизации мотивируется как запросами практики управления, так и формулировками открытых проблем многими известными учёными.