Αλγεβρική εξίσωση Ρικάτι

Η αλγεβρική εξίσωση Ρικάτι^[1]^[2] είναι ένας τύπος μη γραμμικής εξίσωσης που εμφανίζεται στο πλαίσιο προβλημάτων βέλτιστου ελέγχου με άπειρο ορίζοντα σε συνεχή ή διακριτό χρόνο.

Μια τυπική αλγεβρική εξίσωση Ρικάτι είναι παρόμοια με μία από τις ακόλουθες:

την αλγεβρική εξίσωση Ρικάτι συνεχούς χρόνου (CARE):

A^{T}P+PA-PBR^{-1}B^{T}P+Q=0\,

ή την αλγεβρική εξίσωση Ρικάτι διακριτού χρόνου (DARE):

P=A^{T}PA-(A^{T}PB)(R+B^{T}PB)^{-1}(B^{T}PA)+Q.\,

Ο P είναι ο άγνωστος n επί n συμμετρικός πίνακας και οι A, B, Q, R είναι γνωστοί πραγματικοί πίνακες με συντελεστή, με τους Q και R συμμετρικούς.

Αν και γενικά η εξίσωση αυτή μπορεί να έχει πολλές λύσεις, συνήθως ορίζεται ότι θέλουμε να πάρουμε τη μοναδική σταθεροποιητική λύση, αν υπάρχει τέτοια λύση.

Η προέλευση του ονόματος

Το όνομα Ρικάτι δόθηκε στις εξισώσεις αυτές λόγω της σχέσης τους με τη διαφορική εξίσωση Ρικάτι. Πράγματι, η CARE επαληθεύεται από τις χρονικά αναλλοίωτες λύσεις της σχετικής διαφορικής εξίσωσης Ρικάτι με τιμή πίνακα. Όσον αφορά την DARE, επαληθεύεται από τις χρονικά αναλλοίωτες λύσεις της εξίσωσης διαφορών Ρικάτι με τιμή μήτρας (η οποία είναι το ανάλογο της διαφορικής εξίσωσης Ρικάτι στο πλαίσιο του διακριτού χρόνου LQR).

Πλαίσιο της αλγεβρικής εξίσωσης Ρικάτι διακριτού χρόνου

Στα προβλήματα βέλτιστου ελέγχου με άπειρο ορίζοντα, κάποιος ενδιαφέρεται για την τιμή κάποιας μεταβλητής ενδιαφέροντος αυθαίρετα μακριά στο μέλλον, και πρέπει να επιλέξει βέλτιστα μια τιμή μιας ελεγχόμενης μεταβλητής αυτή τη στιγμή, γνωρίζοντας ότι θα συμπεριφερθεί επίσης βέλτιστα σε όλες τις χρονικές στιγμές στο μέλλον. Οι βέλτιστες τρέχουσες τιμές των μεταβλητών ελέγχου του προβλήματος ανά πάσα στιγμή μπορούν να βρεθούν χρησιμοποιώντας τη λύση της εξίσωσης Ρικάτι και τις τρέχουσες παρατηρήσεις στις εξελισσόμενες μεταβλητές κατάστασης. Με πολλαπλές μεταβλητές κατάστασης και πολλαπλές μεταβλητές ελέγχου, η εξίσωση Ρικάτι θα είναι μια εξίσωση πίνακα.^[3]

Η αλγεβρική εξίσωση Ρικάτι προσδιορίζει τη λύση του προβλήματος γραμμικής τετραγωνικής ρύθμισης (LQR) με άπειρο χρονικό ορίζοντα, καθώς και του προβλήματος γραμμικού τετραγωνικού γκαουσιανού ελέγχου (LQG) με άπειρο χρονικό ορίζοντα. Πρόκειται για δύο από τα πιο θεμελιώδη προβλήματα στη θεωρία ελέγχου.

Μια τυπική προδιαγραφή του προβλήματος γραμμικού τετραγωνικού ελέγχου διακριτού χρόνου είναι η ελαχιστοποίηση

\sum _{t=1}^{T}(x_{t}^{T}Qx_{t}+u_{t}^{T}Ru_{t})

που υπόκειται στην εξίσωση κατάστασης

x_{t}=Ax_{t-1}+Bu_{t-1},

όπου x είναι ένα n × 1 διάνυσμα μεταβλητών κατάστασης, u είναι ένα k × 1 διάνυσμα μεταβλητών ελέγχου, A είναι ο n × n πίνακας μετάβασης κατάστασης, B είναι ο n × k πίνακας πολλαπλασιαστών ελέγχου, Q (n × n) είναι ένας συμμετρικός θετικός ημικαθορισμένος πίνακας κόστους κατάστασης, και R (k × k) είναι ένας συμμετρικός θετικά ορισμένος πίνακας κόστους ελέγχου.

Η επαγωγή προς τα πίσω στο χρόνο μπορεί να χρησιμοποιηθεί για τη λήψη της βέλτιστης λύσης ελέγχου σε κάθε χρονική στιγμή,^[4]

u_{t}^{*}=-(B^{T}P_{t+1}B+R)^{-1}(B^{T}P_{t+1}A)x_{t},

με τον συμμετρικό θετικά ορισμένο πίνακα P που εξελίσσεται προς τα πίσω στο χρόνο από $P_{T}=Q$ σύμφωνα με τη σχέση

P_{t-1}=Q+A^{T}P_{t}A-A^{T}P_{t}B(B^{T}P_{t}B+R)^{-1}B^{T}P_{t}A,\,

η οποία είναι γνωστή ως η δυναμική εξίσωση Ρικάτι διακριτού χρόνου του προβλήματος αυτού. Ο χαρακτηρισμός της P σε μόνιμη κατάσταση, σχετικός με το πρόβλημα άπειρου ορίζοντα στο οποίο η T πηγαίνει στο άπειρο, μπορεί να βρεθεί με επαναληπτική επανάληψη της δυναμικής εξίσωσης μέχρι να συγκλίνει- στη συνέχεια η P χαρακτηρίζεται αφαιρώντας τους χρονικούς δείκτες από τη δυναμική εξίσωση.

Λύση

Συνήθως οι επιλύτες προσπαθούν να βρουν τη μοναδική σταθεροποιητική λύση, αν υπάρχει τέτοια λύση. Μια λύση είναι σταθεροποιητική εάν η χρήση της για τον έλεγχο του σχετικού συστήματος LQR καθιστά το σύστημα κλειστού βρόχου σταθερό.^[5]

Για την CARE, ο έλεγχος είναι

K=R^{-1}B^{T}P

και ο πίνακας μεταφοράς κατάστασης κλειστού βρόχου είναι

A-BK=A-BR^{-1}B^{T}P

η οποία είναι σταθερή εάν και μόνο εάν όλες οι ιδιοτιμές της έχουν αυστηρά αρνητικό πραγματικό μέρος.

Για το DARE, ο έλεγχος είναι

K=(R+B^{T}PB)^{-1}B^{T}PA

και ο πίνακας μεταφοράς κατάστασης κλειστού βρόχου είναι

A-BK=A-B(R+B^{T}PB)^{-1}B^{T}PA

η οποία είναι σταθερή εάν και μόνο εάν όλες οι ιδιοτιμές της βρίσκονται αυστηρά εντός του μοναδιαίου κύκλου του μιγαδικού επιπέδου.

Η λύση της αλγεβρικής εξίσωσης Ρικάτι μπορεί να προκύψει με παραγοντοποιήσεις πινάκων ή με επανάληψη της εξίσωσης Ρικάτι. Ένας τύπος επανάληψης μπορεί να επιτευχθεί στην περίπτωση του διακριτού χρόνου με τη χρήση της δυναμικής εξίσωσης Ρικάτι που προκύπτει στο πρόβλημα πεπερασμένου ορίζοντα: στον τελευταίο τύπο προβλήματος κάθε επανάληψη της τιμής του πίνακα είναι σχετική για τη βέλτιστη επιλογή σε κάθε περίοδο που απέχει πεπερασμένη χρονική απόσταση από μια τελική χρονική περίοδο, και αν επαναληφθεί απείρως πίσω στο χρόνο συγκλίνει στον συγκεκριμένο πίνακα που είναι σχετικός για τη βέλτιστη επιλογή ένα άπειρο χρονικό διάστημα πριν από μια τελική περίοδο—δηλαδή για όταν υπάρχει άπειρος ορίζοντας.

Είναι επίσης δυνατό να βρεθεί η λύση με την εύρεση της ιδιοσύνθεσης ενός μεγαλύτερου συστήματος. Για το CARE, ορίζουμε τον πίνακα Χάμιλτον

Z={\begin{pmatrix}A&-BR^{-1}B^{T}\\-Q&-A^{T}\end{pmatrix}}

Δεδομένου ότι η $Z$ είναι Χαμιλτονιανή, αν δεν έχει καμία ιδιοτιμή στον φανταστικό άξονα, τότε ακριβώς οι μισές από τις ιδιοτιμές της έχουν αρνητικό πραγματικό μέρος. Αν συμβολίσουμε τον πίνακα $2n\times n$ του οποίου οι στήλες αποτελούν βάση του αντίστοιχου υποχώρου, σε Σύνθετο πίνακα, ως

{\begin{pmatrix}U_{1,1}\\U_{2,1}\end{pmatrix}}

τότε

P=U_{2,1}U_{1,1}^{-1}

είναι λύση της εξίσωσης Ρικάτι- επιπλέον, οι ιδιοτιμές της $A-BR^{-1}B^{T}P$ είναι οι ιδιοτιμές της $Z$ με αρνητικό πραγματικό μέρος.

Για το DARE, όταν ο $A$ είναι αντιστρέψιμος, ορίζουμε τον συμπλεκτικό πίνακα

Z={\begin{pmatrix}A+BR^{-1}B^{T}(A^{-1})^{T}Q&-BR^{-1}B^{T}(A^{-1})^{T}\\-(A^{-1})^{T}Q&(A^{-1})^{T}\end{pmatrix}}

Εφόσον το $Z$ είναι συμπλεκτικό, αν δεν έχει καμία ιδιοτιμή στον μοναδιαίο κύκλο, τότε ακριβώς οι μισές ιδιοτιμές του βρίσκονται μέσα στον μοναδιαίο κύκλο. Αν συμβολίσουμε τον $2n\times n$ πίνακα του οποίου οι στήλες αποτελούν βάση του αντίστοιχου υποχώρου, σε Σύνθετο πίνακα, ως

{\begin{pmatrix}U_{1,1}\\U_{2,1}\end{pmatrix}}

όπου $U_{1,1}$ και $U_{2,1}$ προκύπτουν από την ανάλυση ^[6]

Z={\begin{pmatrix}U_{1,1}&U_{1,2}\\U_{2,1}&U_{2,2}\end{pmatrix}}{\begin{pmatrix}\Lambda _{1,1}&\Lambda _{1,2}\\0&\Lambda _{2,2}\end{pmatrix}}{\begin{pmatrix}U_{1,1}^{T}&U_{2,1}^{T}\\U_{1,2}^{T}&U_{2,2}^{T}\end{pmatrix}}

τότε

P=U_{2,1}U_{1,1}^{-1}

είναι μια λύση της εξίσωσης Ρικάτι- επιπλέον, οι ιδιοτιμές της $A-B(R+B^{T}PB)^{-1}B^{T}PA$ είναι οι ιδιοτιμές της $Z$ που βρίσκονται μέσα στον μοναδιαίο κύκλο.

Δημοσιεύσεις

Μαυρογιάννης, Ν. Σ. (Μαΐου 2016). «Μία εισαγωγή στους μιγαδικούς αριθμούς». Εκθέτης Φύλλα Μαθηματικής Παιδείας (16): 1-8. http://ekthetis.gr/Ekthetis016.pdf.
Bronshtein, I. N.· Semendyayev, K. A. (29 Ιουνίου 2013). Handbook of Mathematics. Springer Science & Business Media. ISBN 978-3-662-21982-9.
Belevitch V (1950). «Theory of 2n-terminal networks with applications to conference telephony». Electrical Communication 27: 231–244.
Bareiss, E. H. (1969), «Numerical solution of linear equations with Toeplitz and vector Toeplitz matrices», Numerische Mathematik 13 (5): 404–424, doi:10.1007/BF02163269
Goldreich, O.; Tal, A. (2018), «Matrix rigidity of random Toeplitz matrices», Computational Complexity 27 (2): 305–350, doi:10.1007/s00037-016-0144-9
Diodorus Siculus, Bibliotheca Historica. Vol. 1–2. Immanel Bekker. Ludwig Dindorf. Friedrich Vogel. in aedibus B. G. Teubneri. Leipzig. 1888–1890. Greek text available at the Perseus Digital Library.
Gaius Julius Hyginus, Fabulae from The Myths of Hyginus translated and edited by Mary Grant. University of Kansas Publications in Humanistic Studies. Online version at the Topos Text Project.
Olav Kallenberg; Probabilistic Symmetries and Invariance Principles. Springer -Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4
Durrett, Rick (2019). Probability: Theory and Examples, 5th edition. UK: Cambridge University Press. ISBN 9781108473682.

Δείτε επίσης

Εξωτερικοί σύνδεσμοι

Παραπομπές

↑ Lancaster, Peter· Rodman, Leiba (7 Σεπτεμβρίου 1995). Algebraic Riccati Equations. Clarendon Press. ISBN 978-0-19-159125-9.
↑ «From algebraic Riccati equations to unilateral quadratic matrix equations: old and new algorithms - Deutsche Nationalbibliothek».
↑ Fuhrmann, Paul A. (1985-05-01). «The algebraic Riccati equation — A polynomial approach». Systems & Control Letters 5 (6): 369–376. doi:10.1016/0167-6911(85)90060-X. ISSN 0167-6911. https://www.sciencedirect.com/science/article/abs/pii/016769118590060X.
↑ Chow, Gregory (1975). Analysis and Control of Dynamic Economic Systems. New York: John Wiley & Sons. ISBN 0-471-15616-7.
↑ Bini, Dario A.· Iannazzo, Bruno (2011). Numerical Solution of Algebraic Riccati Equations. Society for Industrial and Applied Mathematics. ISBN 978-1-61197-208-5.
↑ William Arnold; Alan Laub (1984). «Generalized Eigenproblem Algorithms and Software for Algebraic Riccati Equations». https://engineering.purdue.edu/AAECourses/aae564/2008/fall/Notes/ArnoldLaub1984.

Gross, Donald· Carl M. Harris (1998). Fundamentals of Queueing Theory. Wiley. ISBN 978-0-471-32812-4. Online
R Aldrovandi, Special Matrices of Mathematical Physics: Stochastic, Circulant and Bell Matrices, World Scientific, 2001. (preview)
Peter Lancaster; Leiba Rodman (1995), Algebraic Riccati equations, Oxford University Press, σελ. 504, ISBN 0-19-853795-6
Alan J. Laub, «A Schur method for solving algebraic Riccati equations», Laboratory for Information and Decision Systems, MIT (Report LIDS-R-859), http://dspace.mit.edu/bitstream/handle/1721.1/1301/R-0859-05666488.pdf;jsessionid=8CCF9A002524048AFD0F91D1F15EB6AE?sequence=1 .

[1] Lancaster, Peter· Rodman, Leiba (7 Σεπτεμβρίου 1995). Algebraic Riccati Equations. Clarendon Press. ISBN 978-0-19-159125-9.

[2] «From algebraic Riccati equations to unilateral quadratic matrix equations: old and new algorithms - Deutsche Nationalbibliothek».

[3] Fuhrmann, Paul A. (1985-05-01). «The algebraic Riccati equation — A polynomial approach». Systems & Control Letters 5 (6): 369–376. doi:10.1016/0167-6911(85)90060-X. ISSN 0167-6911. https://www.sciencedirect.com/science/article/abs/pii/016769118590060X.

[4] Chow, Gregory (1975). Analysis and Control of Dynamic Economic Systems. New York: John Wiley & Sons. ISBN 0-471-15616-7.

[5] Bini, Dario A.· Iannazzo, Bruno (2011). Numerical Solution of Algebraic Riccati Equations. Society for Industrial and Applied Mathematics. ISBN 978-1-61197-208-5.

[6] William Arnold; Alan Laub (1984). «Generalized Eigenproblem Algorithms and Software for Algebraic Riccati Equations». https://engineering.purdue.edu/AAECourses/aae564/2008/fall/Notes/ArnoldLaub1984.

[1]

[2]

[3]

[4]

[5]

[6]