Μετάβαση στο περιεχόμενο

Αλγεβρική εξίσωση Ρικάτι

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Η αλγεβρική εξίσωση Ρικάτι[1][2] είναι ένας τύπος μη γραμμικής εξίσωσης που εμφανίζεται στο πλαίσιο προβλημάτων βέλτιστου ελέγχου με άπειρο ορίζοντα σε συνεχή ή διακριτό χρόνο.

Μια τυπική αλγεβρική εξίσωση Ρικάτι είναι παρόμοια με μία από τις ακόλουθες:

την αλγεβρική εξίσωση Ρικάτι συνεχούς χρόνου (CARE):

ή την αλγεβρική εξίσωση Ρικάτι διακριτού χρόνου (DARE):

Ο P είναι ο άγνωστος n επί n συμμετρικός πίνακας και οι A, B, Q, R είναι γνωστοί πραγματικοί πίνακες με συντελεστή, με τους Q και R συμμετρικούς.

Αν και γενικά η εξίσωση αυτή μπορεί να έχει πολλές λύσεις, συνήθως ορίζεται ότι θέλουμε να πάρουμε τη μοναδική σταθεροποιητική λύση, αν υπάρχει τέτοια λύση.

Η προέλευση του ονόματος

[Επεξεργασία | επεξεργασία κώδικα]

Το όνομα Ρικάτι δόθηκε στις εξισώσεις αυτές λόγω της σχέσης τους με τη διαφορική εξίσωση Ρικάτι. Πράγματι, η CARE επαληθεύεται από τις χρονικά αναλλοίωτες λύσεις της σχετικής διαφορικής εξίσωσης Ρικάτι με τιμή πίνακα. Όσον αφορά την DARE, επαληθεύεται από τις χρονικά αναλλοίωτες λύσεις της εξίσωσης διαφορών Ρικάτι με τιμή μήτρας (η οποία είναι το ανάλογο της διαφορικής εξίσωσης Ρικάτι στο πλαίσιο του διακριτού χρόνου LQR).

Πλαίσιο της αλγεβρικής εξίσωσης Ρικάτι διακριτού χρόνου

[Επεξεργασία | επεξεργασία κώδικα]

Στα προβλήματα βέλτιστου ελέγχου με άπειρο ορίζοντα, κάποιος ενδιαφέρεται για την τιμή κάποιας μεταβλητής ενδιαφέροντος αυθαίρετα μακριά στο μέλλον, και πρέπει να επιλέξει βέλτιστα μια τιμή μιας ελεγχόμενης μεταβλητής αυτή τη στιγμή, γνωρίζοντας ότι θα συμπεριφερθεί επίσης βέλτιστα σε όλες τις χρονικές στιγμές στο μέλλον. Οι βέλτιστες τρέχουσες τιμές των μεταβλητών ελέγχου του προβλήματος ανά πάσα στιγμή μπορούν να βρεθούν χρησιμοποιώντας τη λύση της εξίσωσης Ρικάτι και τις τρέχουσες παρατηρήσεις στις εξελισσόμενες μεταβλητές κατάστασης. Με πολλαπλές μεταβλητές κατάστασης και πολλαπλές μεταβλητές ελέγχου, η εξίσωση Ρικάτι θα είναι μια εξίσωση πίνακα.[3]

Η αλγεβρική εξίσωση Ρικάτι προσδιορίζει τη λύση του προβλήματος γραμμικής τετραγωνικής ρύθμισης (LQR) με άπειρο χρονικό ορίζοντα, καθώς και του προβλήματος γραμμικού τετραγωνικού γκαουσιανού ελέγχου (LQG) με άπειρο χρονικό ορίζοντα. Πρόκειται για δύο από τα πιο θεμελιώδη προβλήματα στη θεωρία ελέγχου.

Μια τυπική προδιαγραφή του προβλήματος γραμμικού τετραγωνικού ελέγχου διακριτού χρόνου είναι η ελαχιστοποίηση

που υπόκειται στην εξίσωση κατάστασης

όπου x είναι ένα n × 1 διάνυσμα μεταβλητών κατάστασης, u είναι ένα k × 1 διάνυσμα μεταβλητών ελέγχου, A είναι ο n × n πίνακας μετάβασης κατάστασης, B είναι ο n × k πίνακας πολλαπλασιαστών ελέγχου, Q (n × n) είναι ένας συμμετρικός θετικός ημικαθορισμένος πίνακας κόστους κατάστασης, και R (k × k) είναι ένας συμμετρικός θετικά ορισμένος πίνακας κόστους ελέγχου.

Η επαγωγή προς τα πίσω στο χρόνο μπορεί να χρησιμοποιηθεί για τη λήψη της βέλτιστης λύσης ελέγχου σε κάθε χρονική στιγμή,[4]

με τον συμμετρικό θετικά ορισμένο πίνακα P που εξελίσσεται προς τα πίσω στο χρόνο από σύμφωνα με τη σχέση

η οποία είναι γνωστή ως η δυναμική εξίσωση Ρικάτι διακριτού χρόνου του προβλήματος αυτού. Ο χαρακτηρισμός της P σε μόνιμη κατάσταση, σχετικός με το πρόβλημα άπειρου ορίζοντα στο οποίο η T πηγαίνει στο άπειρο, μπορεί να βρεθεί με επαναληπτική επανάληψη της δυναμικής εξίσωσης μέχρι να συγκλίνει- στη συνέχεια η P χαρακτηρίζεται αφαιρώντας τους χρονικούς δείκτες από τη δυναμική εξίσωση.

Συνήθως οι επιλύτες προσπαθούν να βρουν τη μοναδική σταθεροποιητική λύση, αν υπάρχει τέτοια λύση. Μια λύση είναι σταθεροποιητική εάν η χρήση της για τον έλεγχο του σχετικού συστήματος LQR καθιστά το σύστημα κλειστού βρόχου σταθερό.[5]

Για την CARE, ο έλεγχος είναι

και ο πίνακας μεταφοράς κατάστασης κλειστού βρόχου είναι

η οποία είναι σταθερή εάν και μόνο εάν όλες οι ιδιοτιμές της έχουν αυστηρά αρνητικό πραγματικό μέρος.

Για το DARE, ο έλεγχος είναι

και ο πίνακας μεταφοράς κατάστασης κλειστού βρόχου είναι

η οποία είναι σταθερή εάν και μόνο εάν όλες οι ιδιοτιμές της βρίσκονται αυστηρά εντός του μοναδιαίου κύκλου του μιγαδικού επιπέδου.

Η λύση της αλγεβρικής εξίσωσης Ρικάτι μπορεί να προκύψει με παραγοντοποιήσεις πινάκων ή με επανάληψη της εξίσωσης Ρικάτι. Ένας τύπος επανάληψης μπορεί να επιτευχθεί στην περίπτωση του διακριτού χρόνου με τη χρήση της δυναμικής εξίσωσης Ρικάτι που προκύπτει στο πρόβλημα πεπερασμένου ορίζοντα: στον τελευταίο τύπο προβλήματος κάθε επανάληψη της τιμής του πίνακα είναι σχετική για τη βέλτιστη επιλογή σε κάθε περίοδο που απέχει πεπερασμένη χρονική απόσταση από μια τελική χρονική περίοδο, και αν επαναληφθεί απείρως πίσω στο χρόνο συγκλίνει στον συγκεκριμένο πίνακα που είναι σχετικός για τη βέλτιστη επιλογή ένα άπειρο χρονικό διάστημα πριν από μια τελική περίοδο—δηλαδή για όταν υπάρχει άπειρος ορίζοντας.

Είναι επίσης δυνατό να βρεθεί η λύση με την εύρεση της ιδιοσύνθεσης ενός μεγαλύτερου συστήματος. Για το CARE, ορίζουμε τον πίνακα Χάμιλτον

Δεδομένου ότι η είναι Χαμιλτονιανή, αν δεν έχει καμία ιδιοτιμή στον φανταστικό άξονα, τότε ακριβώς οι μισές από τις ιδιοτιμές της έχουν αρνητικό πραγματικό μέρος. Αν συμβολίσουμε τον πίνακα του οποίου οι στήλες αποτελούν βάση του αντίστοιχου υποχώρου, σε Σύνθετο πίνακα, ως

τότε

είναι λύση της εξίσωσης Ρικάτι- επιπλέον, οι ιδιοτιμές της είναι οι ιδιοτιμές της με αρνητικό πραγματικό μέρος.

Για το DARE, όταν ο είναι αντιστρέψιμος, ορίζουμε τον συμπλεκτικό πίνακα

Εφόσον το είναι συμπλεκτικό, αν δεν έχει καμία ιδιοτιμή στον μοναδιαίο κύκλο, τότε ακριβώς οι μισές ιδιοτιμές του βρίσκονται μέσα στον μοναδιαίο κύκλο. Αν συμβολίσουμε τον πίνακα του οποίου οι στήλες αποτελούν βάση του αντίστοιχου υποχώρου, σε Σύνθετο πίνακα, ως

όπου και προκύπτουν από την ανάλυση [6]

τότε

είναι μια λύση της εξίσωσης Ρικάτι- επιπλέον, οι ιδιοτιμές της είναι οι ιδιοτιμές της που βρίσκονται μέσα στον μοναδιαίο κύκλο.

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]