Μετάβαση στο περιεχόμενο

Χρήστης:User natm/πρόχειρο

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια


Εφαρμογές MCMC στην Βιολογία Συστημάτων[Επεξεργασία | επεξεργασία κώδικα]

Πολλοί κλάδοι της βιολογίας, και ιδίως η Βιοπληροφορική, η Υπολογιστική Βιολογία και η Γενετική, βρίσκονται εν μέσω μιας επανάστασης, εξαιτίας της ανάπτυξης των Μπεϋζιανών μεθόδων ανάλυσης. Ο λόγος είναι ότι τα βιολογικά φαινόμενα είναι πολύπλοκα και υπάρχει πολύς θόρυβος στα πειραματικά δεδομένα. Οι παραδοσιακές στατιστικές τεχνικές δεν μπορούν να ανταπεξέλθουν στην ανάλυση πολύπλοκων, μη γραμμικών μοντέλων. Ο κυριότερος περιοριστικός παράγοντας στην εφαρμογή Μπεϋζιανών μεθόδων είναι υπολογιστικός. Για μη τετριμμένα προβλήματα, αναλυτικές προσεγγίσεις στην Μπεϋζιανή συμπερασματολογία δεν είναι εφικτές. Τις τελευταίες δεκαετίες έχει σημειωθεί σημαντική πρόοδος στην ταχύτητα των υπολογιστικών συστημάτων καθώς επίσης και στην ανάπτυξη υπολογιστικά αποδοτικών αλγορίθμων για Μπεϋζιανή συμπερασματολογία. Η πιο σημαντική εξέλιξη είναι η ανάπτυξη ενός εύρους τεχνικών που βασίζονται στην MCMC. Προσεκτικά σχεδιασμένοι MCMC αλγόριθμοι που εκτελούνται σε γρήγορους υπολογιστές είναι ικανοί να επιλύσουν ένα εξαιρετικά μεγάλο εύρος βιολογικών προβλημάτων που θεωρούνταν μη επιλύσιμα μόλις λίγα χρόνια πριν.[1]

Ακολουθούν παραδείγματα εφαρμογών της τεχνικής MCMC για επίλυση προβλημάτων βιολογικού ενδιαφέροντος.

Γενετική[Επεξεργασία | επεξεργασία κώδικα]

Ο κλάδος της γενετικής έχει αξιοποιήσει την τεχνική MCMC σε πολλές εφαρμογές Μπεϋζιανής συμπερασματολογίας. Στον τομέα της γενετικής πληθυσμών έχει αξιοποιηθεί για την εκτίμηση παραμέτρων σε δημογραφικά μοντέλα και για τον εντοπισμό συμβάντων φυσικής επιλογής. Στον τομέα της γονιδιωματικής έχει χρησιμοποιηθεί για την ανάλυση ακολουθιών, για την ταυτοποίηση σημειακών μεταλλάξεων, για την εξαγωγή του απλοτύπου μέσω δειγμάτων πληθυσμού και για την εκτίμηση των επιπέδων της γονιδιακής έκφρασης και ρύθμισης. Στον τομέα της γενετικής ανθρώπου έχει χρησιμοποιηθεί κυρίως για την γονιδιακή χαρτογράφηση.[2]

Ανάλυση αλληλουχιών[Επεξεργασία | επεξεργασία κώδικα]

Η τεχνική ΜCMC μπορεί να χρησιμοποιηθεί για την αλληλούχιση γονιδιωμάτων. Σε αντίθεση με τις περισσότερες μεθόδους αλληλούχισης ολόκληρων γονιδιωμάτων, οι οποίες επιλέγουν μόνο μία γονιδιωματική αλληλουχία μεταξύ πολλών εναλλακτικών υποθέσεων, που μπορούν να συναχθούν από τα δεδομένα, η προσέγγιση με χρήση MCMC παράγει κατανομές υποθέσεων συναρμολόγησης του προς αλληλούχιση γονιδιώματος μέσω εκ των υστέρων πιθανοτήτων, παρέχοντας ένα στατιστικό πλαίσιο για την εκτίμηση εναλλακτικών υποθέσεων και της αβεβαιόττας του προτεινόμενου μοντέλου.[3]

Επίσης, έχει αναπτυχθεί μέθοδος για την ανίχνευση ανασυνδυασμών. Η συμπερασματολογία μέσω αυτής της μεθόδου έγινε με Μπεϋζιανό τρόπο, χρησιμοποιώντας την τεχνική MCMC. O σκοπός της μεθόδου ήταν να εντοπιστούν με ακρίβεια σημεία σε στοιχίσεις αλληλουχιών DNA, τα οποία αντιστοιχούν σε σημεία θραύσης και ανασυνδυασμού, σε έναν μικρό αριθμό τάξα. Η προσέγγιση αυτή μοντελοποιεί την αλληλουχία των τοπολογιών  των φυλογενετικών δέντρων σε μια πολλαπλή στοίχιση αλληλουχιών. Ο αλγόριθμος επιστρέφει την εκ των υστέρων πιθανότητα κάθε τοπολογίας δέντρου, η οποία χρησιμοποιείται για την ανίχνευση των περιοχών ανασυνδυασμού και τον εντοπισμό των σημείων θραύσης.[4]

Πρωτεωμική[Επεξεργασία | επεξεργασία κώδικα]

Η τεχνική MCMC χρησιμοποιήθηκε για τον εντοπισμό μοριακών βιοδεικτών σε δεδομένα ανάλυσης υγρής χρωματογραφίας-φαρματομετρίας μάζας (LC-MS). Τα δεδομένα που εξάγονται από μια ανάλυση LC-MS προέρχονται κατά κανόνα από μικρά δείγματα και χαρακτηρίζονται από υψηλή διαστασιμότητα. Η ανάλυση δεδομένων μέσω Μπαεσιανών μοντέλων με χρήση της τεχνικής MCMC φάνηκε να έχει καλύτερα αποτελέσματα σε σχέση με άλλες προσεγγίσεις, όταν το μέγεθος τους δείγματος είναι μικρό ή όταν ο αριθμός των επιλεγμένων πρωτεϊνών για κατηγοριοποίηση είναι μεγάλος.[5]

Γενετικά Ρυθμιστικά Δίκτυα[Επεξεργασία | επεξεργασία κώδικα]

Η κατασκευή ενός λεπτομερούς χάρτη του συνόλου των μοριακών αλληλεπιδράσεων ενός οργανισμού είναι ένας από τους βασικούς στόχους της Βιολογίας Συστημάτων. Επί του παρόντος, αυτά τα πολύπλοκα βιολογικά δίκτυα παραμένουν σε μεγάλο βαθμό άγνωστα. Η διαθεσιμότητα διαφορετικών τύπων μετρήσεων που προέρχονται από διάφορα συστατικά αυτών των δικτύων καθιστά δυνατή την προσπάθεια ανασύστασης ενός δικτύου μέσω τέτοιων μετρήσεων. Τα Μπεϋζιανά δίκτυα είναι κατάλληλα για τον σκοπό αυτόν, εξαιτίας της πιθανοκρατικής τους φύσης και της ευελιξία τους, ως προς την ενσωμάτωση παρεμβάσεων και πρόσθετων πηγών πληροφοριών. Όταν τα Μπεϋζιανά μοντέλα υιοθετούνται ως μοντέλα για Γενετικά Ρυθμιστικά Δίκτυα, συνήθως συνδυάζονται με χρήση της τεχνικής MCMC. Αυτό συμβαίνει γιατί τα διαθέσιμα δεδομένα είναι γενικώς μη επαρκή και είναι αδύνατον να γίνει απαρίθμηση όλων των πιθανών δικτύων ακόμα και για έναν σχετικά μικρό αριθμό κόμβων. Η τεχνική MCMC έχει το πλεονέκτημα ότι είναι εγγυημένο θεωρητικά ότι θα συγκλίνει σε μια εκ των υστέρων κατανομή.[6]

  1. Darren J. Wilkinson. «Bayesian methods in bioinformatics and computational systems biology». Briefings in Bioinformatics, Volume 8, Issue 2, 1 March 2007, Pages 109–116. 
  2. Mark A. Beaumont, Bruce Rannala (2004). «The Bayesian revolution in genetics». Nature Reviews Genetics volume 5, pages 251–261. 
  3. Mark Howison, Felipe Zapata, Erika J. Edwards, Casey W. Dunn (2014). «Bayesian Genome Assembly and Assessment by Markov Chain Monte Carlo Sampling». PLoS ONE 9(6): e99497. CS1 maint: Πολλαπλές ονομασίες: authors list (link)
  4. «Detecting recombination with MCMC». Bioinformatics. 2002;18 Suppl 1:S345-53. 
  5. «Bayesian ABC-MCMC Classification of Liquid Chromatography–Mass Spectrometry Data». Cancer Inform. 2015; 14(Suppl 5): 175–182. 
  6. Nilzair B. Agostinho, Karina S. Machado and Adriano V. Werhli. «Inference of regulatory networks with a convergence improved MCMC sampler». BMC Bioinformatics 2015 16:306.