WikiDer > Линейно-квадратично-гауссовское управление
В теория управления, то линейно-квадратично-гауссовский (LQG) проблема управления один из самых фундаментальных оптимальный контроль проблемы. Это касается линейные системы которую вел аддитивный белый гауссов шум. Задача состоит в том, чтобы определить закон обратной связи по выходу, который был бы оптимальным в смысле минимизации математического ожидания квадратичного Стоимость критерий. Предполагается, что выходные измерения искажены гауссовским шумом, и исходное состояние также считается гауссовским случайным вектором.
При этих предположениях оптимальная схема управления в классе линейных законов управления может быть получена с помощью аргумента пополнения квадратов.[1] Этот закон управления, известный как LQG контроллер, уникален и представляет собой просто комбинацию Фильтр Калмана (линейно-квадратичная оценка состояния (LQE)) вместе с линейно-квадратичный регулятор (LQR). В принцип разделения утверждает, что средство оценки состояния и обратная связь по состоянию могут быть разработаны независимо. Контроль LQG применяется к обоим линейные инвариантные во времени системы а также линейные нестационарные системы, и представляет собой линейный закон управления с динамической обратной связью, который легко вычислить и реализовать: сам контроллер LQG является динамической системой, как и система, которой он управляет. Обе системы имеют одинаковое измерение состояния.
Более глубокое утверждение принципа разделения состоит в том, что контроллер LQG по-прежнему оптимален в более широком классе, возможно, нелинейных контроллеров. То есть использование нелинейной схемы управления не улучшит ожидаемое значение функционала стоимости. Этот вариант принципа разделения является частным случаем принцип разделения стохастического управления в котором говорится, что даже если источники шума процесса и выхода, возможно, являются негауссовыми мартингалы, пока динамика системы линейна, оптимальное управление разделяется на устройство оценки оптимального состояния (которое больше не может быть фильтром Калмана) и регулятор LQR.[2][3]
В классической настройке LQG реализация контроллера LQG может быть проблематичной, когда размерность состояния системы велика. В проблема LQG пониженного порядка (проблема LQG фиксированного порядка) преодолевает это, исправляя априори количество состояний контроллера LQG. Эту проблему решить сложнее, потому что она больше не отделима. Кроме того, решение уже не является уникальным. Несмотря на это, численные алгоритмы доступны.[4][5][6][7] решить связанные оптимальные проекционные уравнения[8][9] которые составляют необходимые и достаточные условия для локально оптимального LQG-регулятора пониженного порядка.[4]
Оптимальность LQG не гарантирует автоматически хорошие свойства устойчивости.[10] Устойчивость замкнутой системы должна проверяться отдельно после проектирования контроллера LQG. Для повышения устойчивости некоторые параметры системы можно считать стохастическими, а не детерминированными. Связанная с этим более сложная проблема управления приводит к аналогичному оптимальному регулятору, у которого отличаются только параметры регулятора.[5]
Можно вычислить ожидаемое значение функции стоимости для оптимального выигрыша, а также для любого другого набора стабильных выигрышей.[11]
Наконец, контроллер LQG также используется для управления возмущенными нелинейными системами.[12]
Математическое описание проблемы и решения
Непрерывное время
Рассмотрим непрерывное время линейная динамическая система
куда представляет собой вектор переменных состояния системы, вектор управляющих входов и вектор измеренных выходов, доступных для обратной связи. Оба аддитивных белого гауссовского системного шума и аддитивный белый гауссовский шум измерения влияют на систему. Задача данной системы - найти историю контрольных входов. который каждый раз может линейно зависеть только от прошлых измерений таким образом, чтобы минимизировать следующую функцию стоимости:
куда обозначает ожидаемое значение. Последний раз (горизонт) может быть конечным или бесконечным. Если горизонт стремится к бесконечности, первый член функции стоимости становится незначительной и несущественной для проблемы. Кроме того, чтобы сохранить конечные затраты, необходимо принять функцию затрат равной .
Контроллер LQG, который решает задачу управления LQG, определяется следующими уравнениями:
Матрица называется Кальман усиление связанных Фильтр Калмана представлен первым уравнением. Каждый раз этот фильтр генерирует оценки государства используя прошлые измерения и исходные данные. Усиление Кальмана вычисляется из матриц , две матрицы интенсивности связанных с белыми гауссовскими шумами и и наконец . Эти пять матриц определяют коэффициент усиления Калмана через следующее связанное матричное дифференциальное уравнение Риккати:
Учитывая решение прирост Калмана равен
Матрица называется усиление обратной связи матрица. Эта матрица определяется матрицами и через следующее связанное матричное дифференциальное уравнение Риккати:
Учитывая решение коэффициент усиления обратной связи равен
Обратите внимание на сходство двух матричных дифференциальных уравнений Риккати: первое работает вперед во времени, а второе - назад во времени. Это сходство называется двойственность. Первое матричное дифференциальное уравнение Риккати решает линейно-квадратичную задачу оценивания (LQE). Второе матричное дифференциальное уравнение Риккати решает линейно-квадратичный регулятор проблема (LQR). Эти задачи двойственны и вместе они решают линейно-квадратично-гауссову задачу управления (LQG). Таким образом, проблема LQG разделяется на проблемы LQE и LQR, которые можно решить независимо. Поэтому проблема LQG называется отделяемый.
Когда и матрицы интенсивности шума , не зависеть от и когда стремится к бесконечности, контроллер LQG становится неизменной во времени динамической системой. В этом случае второе матричное дифференциальное уравнение Риккати может быть заменено соответствующим алгебраическое уравнение Риккати.
Дискретное время
Поскольку дискретное время Задача управления LQG аналогична задаче в непрерывном времени, нижеприведенное описание сосредоточено на математических уравнениях.
Уравнения линейной системы с дискретным временем:
Здесь представляет индекс дискретного времени и представляют собой процессы гауссовского белого шума с дискретным временем с ковариационными матрицами соответственно.
Минимизируемая квадратичная функция стоимости:
Контроллер LQG с дискретным временем
- ,
Прирост Калмана равен
куда определяется следующей матрицей разностного уравнения Риккати, которая проходит вперед во времени:
Матрица усиления обратной связи равна
куда определяется следующей матрицей разностного уравнения Риккати, которое выполняется в обратном направлении во времени:
Если все матрицы в постановке задачи инвариантны во времени и если горизонт стремится к бесконечности, дискретный контроллер LQG становится неизменным во времени. В этом случае матричные разностные уравнения Риккати могут быть заменены соответствующими им дискретными уравнениями алгебраические уравнения Риккати. Они определяют инвариантную во времени линейно-квадратичную оценку и инвариантную во времени линейно-квадратичный регулятор в дискретном времени. Чтобы затраты были конечными, а не нужно учитывать в этом случае.
Смотрите также
Рекомендации
- ^ Карл Юхан Астром (1970). Введение в теорию стохастического управления. 58. Академическая пресса. ISBN 0-486-44531-3.
- ^ Андерс Линдквист (1973). «Об управлении линейными стохастическими системами с обратной связью». SIAM Journal on Control. 11 (2): 323–343. Дои:10.1137/0311025..
- ^ Трифон Т. Георгиу и Андерс Линдквист (2013). «Принцип разделения в стохастическом управлении, Redux». IEEE Transactions по автоматическому контролю. 58 (10): 2481–2494. arXiv:1103.3005. Дои:10.1109 / TAC.2013.2259207.
- ^ а б Ван Виллигенбург Л.Г .; Де Конинг В.Л. (2000). «Численные алгоритмы и вопросы, касающиеся уравнений оптимального проектирования с дискретным временем». Европейский журнал контроля. 6 (1): 93–100. Дои:10.1016 / s0947-3580 (00) 70917-4. Загрузка связанного программного обеспечения из Matlab Central.
- ^ а б Ван Виллигенбург Л.Г .; Де Конинг В.Л. (1999). «Оптимальные компенсаторы пониженного порядка для нестационарных дискретных систем с детерминированными и белыми параметрами». Automatica. 35: 129–138. Дои:10.1016 / S0005-1098 (98) 00138-1. Загрузка связанного программного обеспечения из Matlab Central.
- ^ Zigic D .; Watson L.T .; Collins E.G .; Haddad W.M .; Инь С. (1996). «Гомотопические методы решения оптимальных проекционных уравнений для модельной задачи H2 приведенного порядка». Международный журнал контроля. 56 (1): 173–191. Дои:10.1080/00207179208934308.
- ^ Коллинз-младший E.G; Haddad W.M .; Инь С. (1996). «Алгоритм гомотопии для динамической компенсации пониженного порядка с использованием уравнений оптимальной проекции Хиланда-Бернштейна». Журнал управления и динамики наведения. 19 (2): 407–417. Дои:10.2514/3.21633.
- ^ Хайленд, округ Колумбия; Бернштейн Д.С. (1984). «Оптимальные проекционные уравнения для динамической компенсации фиксированного порядка» (PDF). IEEE Transactions по автоматическому контролю. АС-29 (11): 1034–1037. Дои:10.1109 / TAC.1984.1103418. HDL:2027.42/57875.
- ^ Бернштейн Д.С .; Davis L.D .; Хайленд, округ Колумбия (1986). «Оптимальные проекционные уравнения для дискретного моделирования пониженного порядка оценки и управления» (PDF). Журнал управления и динамики наведения. 9 (3): 288–293. Bibcode:1986JGCD .... 9..288B. Дои:10.2514/3.20105. HDL:2027.42/57880.
- ^ Грин, Майкл; Лаймбир, Дэвид Дж. Н. (1995). Линейное надежное управление. Энглвудские скалы: Прентис-холл. п. 27. ISBN 0-13-102278-4.
- ^ Мацакис, Деметриос (8 марта 2019 г.). «Влияние стратегий пропорционального управления на поведение управляемых часов». Метрология. 56 (2): 025007. Дои:10.1088 / 1681-7575 / ab0614.
- ^ Атанс М. (1971). «Роль и использование стохастической линейно-квадратично-гауссовой задачи в проектировании систем управления». IEEE Transactions по автоматическому контролю. АС-16 (6): 529–552. Дои:10.1109 / TAC.1971.1099818.
дальнейшее чтение
- Стенгель, Роберт Ф. (1994). Оптимальное управление и оценка. Нью-Йорк: Дувр. ISBN 0-486-68200-5.