Ανάλυση αποκλιμακωμένης διακύμανσης

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Στις στοχαστικές διεργασίες, τη θεωρία του χάους και την ανάλυση χρονοσειρών, η ανάλυση αποκλιμακωμένης διακύμανσης (DFA) είναι μια μέθοδος για τον προσδιορισμό της στατιστικής αυτοσυσχέτισης ενός σήματος. Είναι χρήσιμη για την ανάλυση χρονοσειρών που φαίνεται να είναι διεργασίες μακράς μνήμης (αποκλίνων χρόνος συσχέτισης, π.χ. συνάρτηση αυτοσυσχέτισης με φθίνουσα συνάρτηση νόμου ισχύος) ή θόρυβος 1/f.

Ο εκθέτης που προκύπτει είναι παρόμοιος με τον εκθέτη Χερστ, με τη διαφορά ότι η DFA μπορεί επίσης να εφαρμοστεί σε σήματα των οποίων τα υποκείμενα στατιστικά στοιχεία (όπως ο μέσος όρος και η διακύμανση) ή η δυναμική είναι μη στάσιμα (μεταβάλλονται με το χρόνο). Σχετίζεται με μέτρα που βασίζονται σε φασματικές τεχνικές, όπως η αυτοσυσχέτιση και ο μετασχηματισμός Φουριέ.

Οι Πενγκ κ.ά. εισήγαγαν την DFA το 1994 σε μια εργασία που έχει αναφερθεί πάνω από 3.000 φορές έως το 2022[1] και αποτελεί μια επέκταση της (συνηθισμένης) ανάλυσης διακύμανσης (FA), η οποία επηρεάζεται από μη σταθερότητες.

Ορισμός[Επεξεργασία | επεξεργασία κώδικα]

Η DFA σε μια διαδικασία κίνησης Μπράουν, με αυξανόμενες τιμές του .

Αλγόριθμος[Επεξεργασία | επεξεργασία κώδικα]

Έστω: μια χρονοσειρά .

Υπολογίζουμε τη μέση τιμή του .

Αθροίστε το σε μια διαδικασία . Πρόκειται για το αθροιστικό άθροισμα, ή προφίλ, της αρχικής χρονοσειράς. Για παράδειγμα, το προφίλ μιας i.i.d.[2] λευκός θόρυβος είναι ένας τυπικός τυχαίος περίπατος[3].

Επιλέξτε ένα σύνολο ακεραίων αριθμών, έτσι ώστε , το μικρότερο , το μεγαλύτερο , και η ακολουθία να είναι περίπου ομοιόμορφα κατανεμημένη στην κλίμακα log: . Με άλλα λόγια, είναι κατά προσέγγιση μια γεωμετρική πρόοδος.[4]

Για κάθε , διαιρέστε την ακολουθία σε διαδοχικά τμήματα μήκους . Μέσα σε κάθε τμήμα, υπολογίστε την ευθεία προσαρμογή των ελαχίστων τετραγώνων (την τοπική τάση). Έστω η προκύπτουσα τμηματικά γραμμική προσαρμογή.

Υπολογίστε τη μέση τετραγωνική απόκλιση από την τοπική τάση (τοπική διακύμανση)

Και η ρίζα μέσου τετραγώνου τους είναι η συνολική διακύμανση:

(Εάν το δεν διαιρείται με το , τότε μπορεί κανείς είτε να απορρίψει το υπόλοιπο της ακολουθίας, είτε να επαναλάβει τη διαδικασία στην αντίστροφη ακολουθία, και στη συνέχεια να πάρει τη ρίζα του μέσου τετραγώνου τους.[5])

Σχεδιάστε τη γραφική παράσταση log-log .[6][7]

Ερμηνεία[Επεξεργασία | επεξεργασία κώδικα]

Μια ευθεία γραμμή με κλίση στο γράφημα log-log υποδηλώνει μια στατιστική αυτοσυγγένειατης μορφής . Δεδομένου ότι η αυξάνεται μονοτονικά με το , έχουμε πάντα .

Ο εκθέτης κλιμάκωσης είναι μια γενίκευση του εκθέτης Χερστ, με την ακριβή τιμή του να δίνει πληροφορίες σχετικά με τις αυτοσυσχετίσεις της σειράς:

  • : αντι-συσχέτιση
  • : ασυσχέτιστος, λευκός θόρυβος
  • : 1/f-noise, ροζ θόρυβος
  • : μη στάσιμος, απεριόριστος
  • : καφέ θόρυβος

Επειδή η αναμενόμενη μετατόπιση σε έναν ασυσχέτιστο τυχαίο περίπατο μήκους N αυξάνεται όπως , ένας εκθέτης θα αντιστοιχούσε σε ασυσχέτιστο λευκό θόρυβο. Όταν ο εκθέτης είναι μεταξύ 0 και 1, το αποτέλεσμα είναι κλασματικός θόρυβος Γκάους.

Παγίδες κατά την ερμηνεία[Επεξεργασία | επεξεργασία κώδικα]

Παρότι ο αλγόριθμος DFA παράγει πάντα έναν θετικό αριθμό για οποιαδήποτε χρονοσειρά, αυτό δεν συνεπάγεται απαραίτητα ότι η χρονοσειρά είναι αυτοομοιόμορφη. Η αυτοομοιότητα απαιτεί το γράφημα log-log να είναι επαρκώς γραμμικό σε ένα ευρύ φάσμα του . Επιπλέον, αποδείχθηκε ότι ένας συνδυασμός τεχνικών που περιλαμβάνει την MLE, αντί των ελαχίστων τετραγώνων, προσεγγίζει καλύτερα τον εκθέτη κλιμάκωσης ή τον εκθέτη power-law.

Επιπλέον, υπάρχουν πολλά μεγέθη που μοιάζουν με εκθέτη κλιμάκωσης και μπορούν να μετρηθούν για μια αυτοομοιογενή χρονοσειρά, συμπεριλαμβανομένης της διάστασης του διαιρέτη και του εκθέτη Χερστ. Ως εκ τούτου, ο εκθέτης κλιμάκωσης δεν είναι μια μορφοκλασματική διάσταση και δεν έχει ορισμένες επιθυμητές ιδιότητες που έχει η διάσταση Χάουσντορφ, αν και σε ορισμένες ειδικές περιπτώσεις σχετίζεται με τη διάσταση καταμέτρησης κουτιών για το γράφημα μιας χρονοσειράς.

Γενικεύσεις[Επεξεργασία | επεξεργασία κώδικα]

Γενίκευση σε πολυωνυμικές τάσεις (DFA υψηλότερης τάξης)[Επεξεργασία | επεξεργασία κώδικα]

Ο τυπικός αλγόριθμος DFA που παρατίθεται παραπάνω αφαιρεί μια γραμμική τάση σε κάθε τμήμα. Εάν αφαιρέσουμε μια πολυωνυμική τάση βαθμού-n σε κάθε τμήμα, ονομάζεται DFAn ή DFA ανώτερης τάξης.[8]

Δεδομένου ότι το είναι ένα αθροιστικό άθροισμα του , μια γραμμική τάση στο είναι μια σταθερή τάση στο , η οποία είναι μια σταθερή τάση στο (ορατή ως μικρά τμήματα "επίπεδων οροπεδίων"). Από αυτή την άποψη, το DFA1 αφαιρεί τον μέσο όρο από τα τμήματα της χρονοσειράς πριν από την ποσοτικοποίηση της διακύμανσης.

Παρομοίως, μια τάση βαθμού n στο είναι μια τάση βαθμού (n-1) στο . Παραδείγματος χάριν, το DFA1 αφαιρεί τις γραμμικές τάσεις από τα τμήματα της χρονοσειράς πριν από την ποσοτικοποίηση της διακύμανσης, το DFA1 αφαιρεί τις παραβολικές τάσεις από το , και ούτω καθεξής.

Η ανάλυση Χερστ R/S αφαιρεί τις σταθερές τάσεις της αρχικής ακολουθίας και, επομένως, ως προς την αποσύνδεσή της είναι ισοδύναμη με την DFA1.

Γενίκευση σε διαφορετικές χρονικές στιγμές ("πολυκμορφολασματικό DFA")[Επεξεργασία | επεξεργασία κώδικα]

Το DFA μπορεί να γενικευτεί υπολογίζοντας

και στη συνέχεια κατασκευάζουμε τη γραφική παράσταση log-log του , Αν υπάρχει ισχυρή γραμμικότητα στη γραφική παράσταση του , τότε η κλίση αυτή είναι .[9] Η DFA είναι η ειδική περίπτωση όπου .

Τα πολυμορφοκλασματικά συστήματα κλιμακώνονται ως συνάρτηση . Στην ουσία, οι εκθέτες κλιμάκωσης δεν χρειάζεται να είναι ανεξάρτητοι από την κλίμακα του συστήματος. Συγκεκριμένα, η DFA μετρά την κλιμάκωση-συμπεριφορά των διακυμάνσεων της δεύτερης στιγμής.

Οι Καντελχάρντ κ.ά. προόριζαν αυτόν τον εκθέτη κλιμάκωσης ως γενίκευση του κλασικού εκθέτη Χερστ. Ο κλασικός εκθέτης Χερστ αντιστοιχεί σε για σταθερές περιπτώσεις και για μη σταθερές περιπτώσεις.[9][10][11]

Εφαρμογές[Επεξεργασία | επεξεργασία κώδικα]

Η μέθοδος DFA έχει εφαρμοστεί σε πολλά συστήματα, π.χ. ακολουθίες DNA,[12][13] νευρωνικές ταλαντώσεις,[11] ανίχνευση παθολογίας ομιλίας,[14] διακύμανση καρδιακών παλμών σε διάφορα στάδια ύπνου,[15] και ανάλυση προτύπων συμπεριφοράς ζώων[16].

Μελετήθηκε η επίδραση των τάσεων στην DFA.[17]

Σχέσεις με άλλες μεθόδους, για συγκεκριμένους τύπους σημάτων[Επεξεργασία | επεξεργασία κώδικα]

Για σήματα με αυτοσυσχέτιση με νόμο ισχύος[Επεξεργασία | επεξεργασία κώδικα]

Στην περίπτωση των αυτοσυσχετίσεων με νόμο δύναμης, η συνάρτηση συσχέτισης διασπάται με εκθέτη : . Επιπλέον, το φάσμα ισχύος διασπάται ως . Οι τρεις εκθέτες σχετίζονται με:

  • και
  • .

Οι σχέσεις μπορούν να προκύψουν χρησιμοποιώντας το θεώρημα Βίνερ-Κίντσιν. Η σχέση της DFA με τη μέθοδο του φάσματος ισχύος έχει μελετηθεί καλά.[18]

Έτσι, το συνδέεται με την κλίση του φάσματος ισχύος και χρησιμοποιείται για την περιγραφή του χρώματος του θορύβου μέσω αυτής της σχέσης: .

Για κλασματικό θόρυβο του Γκάους[Επεξεργασία | επεξεργασία κώδικα]

Για κλασματικό θόρυβο Γκάους (FGN), έχουμε , και επομένως , και , όπου είναι ο εκθέτης Χερστ. Το για το FGN είναι ίσο με .[19]

Για κλασματική κίνηση Μπράουν[Επεξεργασία | επεξεργασία κώδικα]

Για κλασματική κίνηση Brown (FBM), έχουμε , και επομένως , και , όπου είναι ο εκθέτης Χερστ. Το για FBM είναι ίσο με .[10] Σε αυτό το πλαίσιο, η FBM είναι το αθροιστικό άθροισμα ή το ολοκλήρωμα της FGN, επομένως, οι εκθέτες των φασμάτων ισχύος διαφέρουν κατά 2.

Εξωτερικοί σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]

Δείτε επίσης[Επεξεργασία | επεξεργασία κώδικα]

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Peng, C.K. (1994). «Mosaic organization of DNA nucleotides». Phys. Rev. E 49 (2): 1685–1689. doi:10.1103/physreve.49.1685. PMID 9961383. Bibcode1994PhRvE..49.1685P. 
  2. «IID Statistics: Independent and Identically Distributed Definition and Examples». 
  3. Weisstein, Eric W. «Random Walk--1-Dimensional». mathworld.wolfram.com (στα Αγγλικά). Ανακτήθηκε στις 11 Δεκεμβρίου 2023. 
  4. Hardstone, Richard; Poil, Simon-Shlomo; Schiavone, Giuseppina; Jansen, Rick; Nikulin, Vadim; Mansvelder, Huibert; Linkenkaer-Hansen, Klaus (2012). «Detrended Fluctuation Analysis: A Scale-Free View on Neuronal Oscillations». Frontiers in Physiology 3: 450. doi:10.3389/fphys.2012.00450. ISSN 1664-042X. PMID 23226132. 
  5. Zhou, Yu; Leung, Yee (2010-06-21). «Multifractal temporally weighted detrended fluctuation analysis and its application in the analysis of scaling behavior in temperature series». Journal of Statistical Mechanics: Theory and Experiment 2010 (6): P06021. doi:10.1088/1742-5468/2010/06/P06021. ISSN 1742-5468. https://iopscience.iop.org/article/10.1088/1742-5468/2010/06/P06021. 
  6. Peng, C.K. (1994). «Quantification of scaling exponents and crossover phenomena in nonstationary heartbeat time series». Chaos 49 (1): 82–87. doi:10.1063/1.166141. PMID 11538314. Bibcode1995Chaos...5...82P. 
  7. Bryce, R.M.; Sprague, K.B. (2012). «Revisiting detrended fluctuation analysis». Sci. Rep. 2: 315. doi:10.1038/srep00315. PMID 22419991. Bibcode2012NatSR...2E.315B. 
  8. Kantelhardt J.W. (2001). «Detecting long-range correlations with detrended fluctuation analysis». Physica A 295 (3–4): 441–454. doi:10.1016/s0378-4371(01)00144-3. Bibcode2001PhyA..295..441K. 
  9. 9,0 9,1 H.E. Stanley, J.W. Kantelhardt; S.A. Zschiegner; E. Koscielny-Bunde; S. Havlin; A. Bunde (2002). «Multifractal detrended fluctuation analysis of nonstationary time series». Physica A 316 (1–4): 87–114. doi:10.1016/s0378-4371(02)01383-3. Bibcode2002PhyA..316...87K. Αρχειοθετήθηκε από το πρωτότυπο στις 2018-08-28. https://web.archive.org/web/20180828134644/http://havlin.biu.ac.il/Publications.php?keyword=Multifractal+detrended+fluctuation+analysis+of+nonstationary+time+series++&year=*&match=all. Ανακτήθηκε στις 2023-12-11. 
  10. 10,0 10,1 Movahed, M. Sadegh (2006). «Multifractal detrended fluctuation analysis of sunspot time series». Journal of Statistical Mechanics: Theory and Experiment 02. 
  11. 11,0 11,1 Hardstone, Richard; Poil, Simon-Shlomo; Schiavone, Giuseppina; Jansen, Rick; Nikulin, Vadim V.; Mansvelder, Huibert D.; Linkenkaer-Hansen, Klaus (1 January 2012). «Detrended Fluctuation Analysis: A Scale-Free View on Neuronal Oscillations». Frontiers in Physiology 3: 450. doi:10.3389/fphys.2012.00450. PMID 23226132. 
  12. Buldyrev (1995). «Long-Range Correlation-Properties of Coding And Noncoding Dna-Sequences- Genbank Analysis». Phys. Rev. E 51 (5): 5084–5091. doi:10.1103/physreve.51.5084. PMID 9963221. Bibcode1995PhRvE..51.5084B. 
  13. Bunde A, Havlin S (1996). Fractals and Disordered Systems, Springer, Berlin, Heidelberg, New York. 
  14. Little, M.· McSharry, P.· Moroz, I.· Roberts, S. (2006). «Nonlinear, Biophysically-Informed Speech Pathology Detection» (PDF). 2006 IEEE International Conference on Acoustics Speed and Signal Processing Proceedings. 2. σελίδες II–1080–II–1083. doi:10.1109/ICASSP.2006.1660534. ISBN 1-4244-0469-X. 
  15. Bunde A. (2000). «Correlated and uncorrelated regions in heart-rate fluctuations during sleep». Phys. Rev. E 85 (17): 3736–3739. doi:10.1103/physrevlett.85.3736. PMID 11030994. Bibcode2000PhRvL..85.3736B. 
  16. Bogachev, Mikhail I.; Lyanova, Asya I.; Sinitca, Aleksandr M.; Pyko, Svetlana A.; Pyko, Nikita S.; Kuzmenko, Alexander V.; Romanov, Sergey A.; Brikova, Olga I. και άλλοι. (March 2023). «Understanding the complex interplay of persistent and antipersistent regimes in animal movement trajectories as a prominent characteristic of their behavioral pattern profiles: Towards an automated and robust model based quantification of anxiety test data» (στα αγγλικά). Biomedical Signal Processing and Control 81: 104409. doi:10.1016/j.bspc.2022.104409. https://linkinghub.elsevier.com/retrieve/pii/S1746809422008631. 
  17. Hu, K. (2001). «Effect of trends on detrended fluctuation analysis». Phys. Rev. E 64 (1): 011114. doi:10.1103/physreve.64.011114. PMID 11461232. Bibcode2001PhRvE..64a1114H. 
  18. Heneghan (2000). «Establishing the relation between detrended fluctuation analysis and power spectral density analysis for stochastic processes». Phys. Rev. E 62 (5): 6103–6110. doi:10.1103/physreve.62.6103. PMID 11101940. Bibcode2000PhRvE..62.6103H. 
  19. Taqqu, Murad S. (1995). «Estimators for long-range dependence: an empirical study.». Fractals 3 (4): 785–798. doi:10.1142/S0218348X95000692.