Оптимальное управление в математике
Оптима́льное управле́ние в матема́тике, раздел, в котором изучаются неклассические задачи вариационного исчисления. В отличие от классических вариационных задач, где управляющие параметры меняются в некоторой открытой области (без границы), теория оптимального управления охватывает и тот случай, когда управляющие параметры могут принимать и граничные значения.
Основным результатом теории оптимального управления является принцип максимума Понтрягина, дающий общее необходимое условие оптимальности управления. Этот результат и связанные с ним исследования, проведённые с начала 1950-х гг. Л. С. Понтрягиным и его сотрудниками, послужили исходным пунктом разработки теоретических, вычислительных и прикладных аспектов теории оптимального управления. При решении ряда задач оптимального управления с успехом используются идеи метода динамического программирования, основы которого разработаны Р. Беллманом и его сотрудниками.
В качестве типичной для теории оптимального управления можно привести задачу об оптимальном управлении объектом, математическая модель которого даётся системой обыкновенных дифференциальных уравнений где – фазовые координаты, характеризующие состояние объекта в момент , а – управляющие параметры. Управление объектом означает выбор управляющих параметров как функций времени, являющихся допустимыми с учётом имеющихся возможностей управления объектом. Например, в прикладных задачах часто требуется, чтобы в каждый момент времени точка принадлежала заданному замкнутому множеству . Последнее обстоятельство делает рассматриваемую вариационную задачу неклассической.
Пусть заданы начальное и конечное состояния объекта (1). Об управлении (2) говорят, что оно реализует цель управления, если найдётся такой момент времени , что решение задачи удовлетворяет условию . Качество этого управления оценивают значением функционала где – заданная функция. Задача оптимального управления состоит в отыскании такого реализующего цель управления, для которого функционал (4) принимает наименьшее возможное значение. Таким образом, математическая теория оптимального управления – это раздел математики, в котором рассматриваются неклассические вариационные задачи отыскания экстремумов функционалов на решениях уравнений, описывающих управляемые объекты, и управлений, на которых реализуются экстремумы.
Для этих задач справедливо следующее необходимое условие оптимальности управления.
Принцип максимума Понтрягина. Пусть вектор-функция – оптимальное управление, а вектор-функция – соответствующее ему решение задачи (3). Рассматривают вспомогательную линейную систему обыкновенных дифференциальных уравнений и функцию зависящую, помимо и , от вектора . Тогда у линейной системы (6) существует такое нетривиальное решение что для всех значений из отрезка , в которых функция (5) непрерывна, выполнено соотношение причём – постоянная, не превосходящая нуля.
К виду (1) обычно приводятся уравнения движения в случае управляемых механических объектов с конечным числом степеней свободы. В многочисленных реальных ситуациях возникают и иные постановки задач оптимального управления, отличающиеся от приведённых выше: задачи с фиксированным временем, когда продолжительность процесса заранее задана; задачи со скользящими концами, когда про начальное и конечное состояния известно лишь, что они принадлежат некоторым множествам; задачи с фазовыми ограничениями, когда решение задачи (3) в каждый момент времени должно принадлежать фиксированному замкнутому множеству, и др. В задачах механики сплошных сред характеризующая состояние управляемого объекта величина является функцией не только времени, но и пространственных координат (например, величина может описывать распределение температуры в теле с течением времени), а закон движения будет дифференциальным уравнением с частными производными или интегро-дифференциальным уравнением. Часто приходится рассматривать управляемые объекты в случае, когда независимая переменная принимает дискретные значения, а закон движения представляет собой систему конечно-разностных уравнений. Наконец, отдельную теорию составляет оптимальное управление стохастическими объектами.