Особый оптимальный режим
Осо́бый оптима́льный режи́м (особое оптимальное управление), оптимальное управление, для которого на некотором участке времени одновременно выполняются условия
где – функция Гамильтона. В векторном случае, когда особый оптимальный режим имеет место по компонентам управления, , условие (1) заменяется на условий
а вместо равенства (2) требуется обращение в нуль определителя
На особом оптимальном режиме функция Гамильтона стационарна, но её второй дифференциал не является отрицательно определённым, т. е. максимум по (при , изменяющемся внутри допустимой области) оказывается «размытым».
Наиболее типичными задачами, в которых может иметь место особый оптимальный режим, являются задачи оптимального управления, в которых подынтегральная функция и правые части линейно зависят от управления.
Ниже рассматриваются задачи такого рода сначала со скалярным особым управлением.
Пусть требуется определить минимум функционала
при условиях связи
граничных условиях
и ограничениях на управление
Необходимые условия, которым должен удовлетворять особый оптимальный режим, позволяют заранее исследовать задачу (5) – (8) и выделить многообразия особых участков, на которых оптимальное управление лежит внутри допустимой области: . Пристраивая к ним неособые участки, удовлетворяющие граничным условиям (7), с управлением , определяемым из принципа максимума Понтрягина, можно получить оптимальное решение задачи (5) – (8).
Согласно принципу максимума, оптимальное управление при любом должно доставлять максимум функции Гамильтона
где
а – некоторая не обращающаяся в нуль сопряжённая вектор-функция, удовлетворяющая системе уравнений
Условие (2) выполняется для любого управления, а не только для особого оптимального режима.
На тех участках времени, на которых , условие (9) определяет неособое оптимальное управление, принимающее граничные значения
Таким образом, участки с оптимальным особым управлением
могут появиться лишь при выполнении условия (1):
при котором функция Гамильтона перестаёт явно зависеть от управления . Следовательно, для задач, линейных по управлению, условие (9) не позволяет непосредственно определить оптимальное особое управление .
Пусть функция дифференцируется по в силу систем (6), (10) до тех пор, пока управление не войдёт с ненулевым коэффициентом в очередную производную. Доказывается (Келли. 1964; Robbins. 1965; Копп. 1965), что управление может войти с ненулевым коэффициентом лишь в чётную производную, т. е.
и что необходимым условием оптимальности особого управления является выполнение неравенства
Если на всём отрезке, то оптимальное особое управление
Поскольку условия (12) получены в результате последовательного дифференцирования (11), то на участке особого режима, в частности в точках сопряжения к особого и неособого участков, помимо равенства (11), выполняется равенств
Анализ условий (11), (14) показывает, что для случаев чётного и нечётного характер сопряжения особого и неособого участков траектории различен (Берщанский. 1979).
При чётном оптимальное управление на неособом участке не может быть кусочно непрерывным. Разрывы управления (точки переключения) сгущаются к точке сопряжения с особым участком, так что оптимальное управление оказывается измеримой по Лебегу функцией со счётным множеством точек разрыва.
При нечётном только две кусочно гладкие оптимальные траектории могут входить в точку, лежащую на особом участке (или исходить из неё). Пусть размерность многообразия особых участков в -мерном пространстве фазовых координат равна . Тогда в рассматриваемом случае нечётного оптимальные траектории с кусочно непрерывным управлением заполняют в фазовом пространстве лишь некоторую поверхность размерности . Поэтому при почти все оптимальные траектории будут иметь управление с бесконечным числом точек переключения.
Сформулировано предположение (Берщанский. 1979), что . Если это так, то при сгущение точек переключения перед выходом на особый участок (или сходом с него) является типичным явлением для задач типа (5) – (8).
Пример сопряжения неособого и особого участков оптимального управления с бесконечным числом переключений приведён в труде: Фуллер. 1961.
При чётном , , оптимальное особое управление на неособом участке, примыкающем к особому, не может быть кусочно непрерывным, а имеет бесконечное число точек переключения, сгущающихся к точке входа , т. е. не существует такого, что в промежутке оптимальное управление постоянно.
В наиболее часто встречающемся особом оптимальном режиме величина . Для этого случая сопряжение неособого и особого участков осуществляется с помощью кусочно непрерывного оптимального управления.
В более общем случае особого оптимального режима, в котором рассматривается управлений, :
(как и в скалярном случае) условие (4), в силу линейности, выполняется для любого управления. На участке особого оптимального режима по компонентам с должны выполняться условий (3):
где
а определяются из (10).
Дальнейшие необходимые условия оптимальности для особого оптимального режима по нескольким компонентам отличаются от рассмотренного выше случая особого оптимального режима по одной компоненте следующим. На участке особого оптимального режима должны выполняться необходимые условия двух видов. Одно из них, типа неравенства, является аналогом условия (13). Другие необходимые условия являются условиями типа равенства и не имеют более ранних аналогий (Вапнярский. 1967).
Дифференцируя (17) полным образом по , получают систему линейных уравнений относительно неизвестных :
Матрица коэффициентов системы (18)
является кососимметричной: . Отсюда, в частности, следует, что элементы , стоящие на главной диагонали матрицы , равны нулю. Остальные элементы , , в системе (18) в общем случае на произвольной траектории, соответствующей некоторому неоптимальному управлению, отличны от нуля. На особом оптимальном режиме по компонентам должны выполняться необходимые условия, требующие обращения в нуль всех коэффициентов системы (18) (Вапнярский. 1967):
Кроме этих условий, должно выполняться условие типа неравенства [являющееся аналогом условия (13) для особого оптимального режима по одной компоненте при ]:
Условия (13), (20) можно рассматривать как обобщение условия Лежандра и условия Клебша на случай особого оптимального режима, поэтому указанные неравенства называются иногда обобщённым условием Лежандра – Клебша.
Важность выявления и исследования особого оптимального режима в задачах оптимального управления объясняется следующим свойством особого оптимального режима (Берщанский. 1979): если оптимальная траектория, исходящая из некоторой точки, содержит участок особого оптимального режима, то этим же свойством обладают все оптимальные траектории, исходящие из близких точек.
Исследованы некоторые вопросы, связанные с определением порядка особого оптимального режима для линейных и нелинейных по управлению задач (Lewis. 1980).
Все приведённые выше результаты по особому оптимальному режиму получены из рассмотрения второй вариации функционала. Оказывается, что можно получить дополнительные необходимые условия оптимальности особого режима из рассмотрения третьей и четвёртой вариаций функционала (Скородинский. 1979).