Μοντελοποίηση-Ανακατασκευή Βιολογικών Δικτύων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Η έκρηξη πληροφοριών που προσφέρουν οι υψηλής απόδοσης (high-throughput) μέθοδοι στη βιολογία οδηγεί αναπόφευκτα στη χρήση νέων αναλυτικών εργαλείων για την επεξεργασία τους. Τα μαθηματικά μοντέλα αποτελούν κορμό της Βιολογίας Συστημάτων και στρέφονται στην ολιστική θεώρηση της επιστήμης, ξεφεύγοντας από την παραδοσιακή ντετερμινιστική προσέγγιση, βοηθώντας στην κατανόηση και εξήγηση των βιολογικών φαινομένων. Επιτρέπουν την θεωρητική και υπολογιστική δυναμική προσομοίωση και ανάλυση των βιολογικών δικτύων και την χρήση μαθηματικών εργαλείων για την κατανόηση των πολύπλοκων βιολογικών μηχανισμών. Τα in silico πειράματα αποτελούν εργαλεία γρήγορης και μαζικής εξακρίβωσης ή μη θεωρητικών υποθέσεων, αντικαθιστώντας έτσι ανά περιπτώσεις τα πολυέξοδα και χρονοβόρα in vivo ή in vitro πειράματα ή βοηθώντας στον καλύτερο σχεδιασμό τους. Μπορούν επίσης να προβλέψουν την απόκριση ενός συστήματος κάτω από συνθήκες που δεν έχουν ή δεν μπορούν να ελεγχθούν.[1]

Ένα υπολογιστικό μοντέλο στρες κυτταρικού δικτύου για μη νοσούντα ιστό πνεύμονα και μυοκαρδίου.

Ένα μαθηματικό μοντέλο περιγράφει ένα σύστημα με μαθηματικούς όρους, χωρίς όμως να είναι μια ακριβής περιγραφή του συστήματος αυτού. Γενικά τα μαθηματικά μοντέλα αποτελούν μια αφαιρετική περιγραφή της πραγματικότητας. Τα βιολογικά φαινόμενα περιγράφονται με μετρήσεις, με αριθμητικές τιμές και μονάδες μέτρησης, και οι σχέσεις μεταξύ των μετρήσεων περιγράφονται με εξισώσεις. Σκοπός τους είναι η κατανόηση του συστήματος, η μελέτη της επίδρασης των διαφόρων συστατικών του και η πρόβλεψη της συμπεριφοράς του.

Η χρήση εφαρμοσμένων μαθηματικών με σκοπό την απάντηση επιστημονικών ερωτήσεων.

Η μοντελοποίηση ακολουθεί τα εξής βήματα:

  1. Ποσοτικοποίηση των μετρήσεων: οι αριθμητικές τιμές που περιγράφουν το σύστημα.
  2. Περιγραφή ενός δυναμικού κανόνα: περιγραφή του πώς οι βασικές μετρήσεις αλλάζουν.
  3. Ανάπτυξη μοντέλου: μαθηματική μετάφραση των παρατηρήσεων.
  4. Εύρεση λύσης: χρήση μαθηματικών μεθόδων για πρόβλεψη της συμπεριφοράς του συστήματος.
  5. Εγγραφή προσομοίωσης: χρήση υπολογιστικών μεθόδων για πρόβλεψη της συμπεριφοράς του συστήματος.

Η επιλογή του μοντέλου πρέπει να βασίζεται στο είδος των δεδομένων και στο στόχο δημιουργίας του. Ένα μοντέλο με πολλές παραμέτρους πρέπει να μπορεί να περιγράψει με λεπτομέρεια απλά φαινόμενα και απαιτεί μεγάλη ποσότητα δεδομένων για να δομηθεί. Αντίθετα ένα αφαιρετικό μοντέλο μικρής πολυπλοκότητας μπορεί να επιτύχει στο να αποτυπώσει υψηλού επιπέδου φαινόμενα και απαιτεί μικρότερο όγκο δεδομένων.[2]

Μοντέλα βιολογικών δικτύων αποτελούν τα δίκτυα αλληλεπιδράσεων πρωτεϊνών (protein-protein interaction network), τα γενετικά ρυθμιστικά δίκτυα (gene regulatory networks), τα μεταβολικά δίκτυα (metabolic network), τα φυλογενετικά δίκτυα, δίκτυα μεταγωγής σήματος (signal transduction networks), τα ανοσολογικά δίκτυα (immunological networks) και τα οικολογικά δίκτυα.

Βασικοί Ορισμοί[Επεξεργασία | επεξεργασία κώδικα]

Ορισμός Γράφου (Δικτύου): ένας γράφος G είναι ο συνδυασμός ενός μη κενού συνόλου N κόμβων n και ενός (όχι απαραίτητα μη κενού) συνόλου M ακμών Ε={vi,vj}

V = (v 1 , v 2 , ..., v n ), n ∈ [1,N], όπου Ν είναι το σύνολο των κόμβων (ή κορυφών).

E = ({v2 , v3 }, {v3 , v1 }, ..., {vm , vn }), 1 ≤ i ≤ M και 

1 ≤ i, j ≤ N είναι το σύνολο των ακμών (ή συνδέσμων).

Ένας γράφος (δίκτυο) είναι ένα σύνολο σημείων (ή κόμβων) που συμβολίζονται αυθαιρέτως και ενώνονται μεταξύ τους από ακμές. Ακμή είναι η κατευθυνόμενη διαδρομή που ενώνει έναν κόμβο (ν1) με έναν άλλον (ν2), που μπορεί και να είναι ο ίδιος κόμβος (ν12). Ο συμβολισμός τους δεν είναι αυθαίρετος, οπότε κάθε ακμή κληρονομεί το συμβολισμό της από τους κόμβους που συνδέει: μία ακμή που ενώνει το ν1-->ν2 συμβολίζεται {ν12}, ενώ ενδέχεται να υπάρχει και η αντίθετή της {ν21}, χωρίς οι δύο να ταυτίζονται, μιας και όπως είπαμε, η ακμή είναι εν γένει μια κατευθυνόμενη διαδρομή. Σε μία ακμή που ορίζει τη σχέση μεταξύ δύο κόμβων, η σχέση αυτή μπορεί να ορίζεται ποικιλοτρόπως: με την τιμή 0, όταν δεν υπάρχει συσχέτιση, με την τιμή 1 όταν υπάρχει πλήρης συσχέτιση ή κάποια εξίσωση που περιγράφει την μεταβλητή σχέση ως προς κάποιον παράγοντα (π.χ. χρόνος). Εκτός από τις ακμές και οι κόμβοι ενδέχεται να παίρνουν τιμές. Τέλος, όπως προκύπτει και από τον ορισμό, ακμές που δεν ενώνουν 2 κόμβους δεν ορίζονται, ενώ κόμβοι που δεν επικοινωνούν με άλλους λόγω απουσίας ακμών μεταξύ τους ορίζονται, γεγονός που επιτρέπει την ύπαρξη ασύνδετων κόμβων, αλλά όχι ακμών που δεν οδηγούν πουθενά.

Η διάταξη των κόμβων και των ακμών δημιουργεί μια μεγάλη ποικιλία τοπολογιών, που προκειμένου να μελετηθούν, πρέπει να οριστούν νέα μέτρα χαρακτηρισμού, καθώς και νέες οντότητες που προκύπτουν.[3]

Βαθμός γειτνίασης k (gradient) ενός κόμβου είναι ένας ακέραιος αριθμός που είναι ίσος με το πλήθος των κόμβων που συνδέονται άμεσα με τον κόμβο αυτό. Ο βαθμός είναι από τα πιο βασικά μεγέθη που χαρακτηρίζουν έναν κόμβο, καθώς ορίζει το πόσο συνδεδεμένος είναι με το υπόλοιπο δίκτυο. Επίσης, αν σε ένα γράφο (δίκτυο) γνωρίζουμε τους βαθμούς k όλων των κόμβων, μπορούμε να υπολογίσουμε την κατανομή που έχει το μέγεθος k ως προς το πλήθος κόμβων N ή πιο απλά να παραστήσουμε γραφικά στο ίδιο διάγραμμα τι πλήθος κόμβων αντιστοιχεί σε κάθε k, που είναι μία συνάρτηση f(k). Η συνάρτηση αυτή κανονικοποιημένη στο πλήθος των κόμβων N, έτσι ώστε το εμβαδόν κάτω απ' την καμπύλη κατανομής να είναι ίσο με 1, μετατρέπεται σε κατανομή πιθανότητας P(k). Αυτή πληροφορεί για το ποια είναι η πιθανότητα, ο κόμβος που διαλέξαμε στην τύχη να έχει π.χ. 8 γείτονες κόμβους P(8). Η κατανομή αυτής της πιθανότητας είναι πληροφορία βαρύνουσας σημασίας, αποτελώντας ένα ισχυρό μέτρο για την περιγραφή ενός γράφου και είναι εύκολο να υπολογιστεί.

Συντελεστής ομαδοποίησης Ci (clustering coefficient) είναι ένα μέτρο που χαρακτηρίζει τον κάθε i γείτονα κόμβο ενός κεντρικού κόμβου με n γείτονες. Ο μέσος όρος <C> των Ci όλων των n γειτόνων είναι μέτρο που χαρακτηρίζει ένα δίκτυο. Ο συντελεστής ομαδοποίησης είναι ο λόγος του πλήθους των υπαρκτών ακμών E προς το πλήθος των δυνατών ακμών n⋅(n−1)/2, που ενώνουν όλους τους n γείτονες ενός κεντρικού κόμβου.

και .

Η πιο απλή μονάδα πλήρους ομαδοποίησης είναι το τρίγωνο, δηλαδή τρεις κόμβοι που ενώνονται όλοι μεταξύ τους με ακμές, οπότε ο μέσος συντελεστής ομαδοποίησης είναι το μέτρο της πυκνότητας τριγώνων ή καλύτερα ο λόγος υπαρκτών προς δυνατών τριγώνων σε ένα δίκτυο.

Ενδιαφέρον παρουσιάζει το θεώρημα που συνδέει το άθροισμα όλων των βαθμών ki με το πλήθος των ακμών E σε ένα δίκτυο Ν κόμβων.

Ισχύει ότι: , δηλαδή σε ένα δίκτυο το άθροισμα όλων των βαθμών είναι διπλάσιο του πλήθους των ακμών, πράγμα λογικό αφού στο άθροισμα όλων των βαθμών κάθε ακμή μετράται διπλά!

Ως μονοπάτι (path) ορίζεται το σύνολο συναπτών και μοναδικών ακμών, η αλληλουχία των οποίων συνήθως αναπαριστά μια φυσική διαδικασία, ενώ ως μήκος του μονοπατιού εκλαμβάνεται το πλήθος των ακμών που το αποτελούν. Το πιο απλό είδος μονοπατιού είναι η θηλιά (loop), ένα μονοπάτι με μόνο μία ακμή που αρχίζει και τελειώνει στον ίδιο κόμβο και συμβολίζει την ανάδραση ενός κόμβου στον εαυτό του. Αν ένα μονοπάτι ξεκινά και τελειώνει στον ίδιο κόμβο, ενώ παρεμβάλλονται και άλλοι, τότε ονομάζεται κύκλος και μπορεί να είναι κατευθυνόμενος ή όχι ανάλογα με το είδος των ακμών που τον αποτελούν. Το σύνολο των κόμβων που ανήκουν σε έναν κατευθυνόμενο κύκλο συνήθως απεικονίζει ένα υποσύστημα αντικειμένων που επιτυγχάνουν κάποια ρυθμιστική διεργασία.

Εγγύτατο μονοπάτι (shortest path) είναι το μονοπάτι με το μικρότερο μήκος που συνδέει δύο κόμβους και ο υπολογισμός του προϋποθέτει τον υπολογισμό όλων των δυνατών μονοπατιών που έχουν την ίδια ιδιότητα. Σε ένα δίκτυο μπορεί να υπολογιστεί και να ταξινομηθεί το σύνολο όλων των εγγύτατων μονοπατιών και αυτό με το μεγαλύτερο μήκος ονομάζεται διάμετρος.

Διάμετρος είναι ένας δείκτης του μεγέθους του δικτύου, αλλά μειονεκτεί λόγω μεγάλων υπολογιστικών απαιτήσεων σε πολυπληθή δίκτυα.

Συμπλέγματα (clusters) ή υποδίκτυα είναι τμήματα δικτύων, που αποτελούνται από κόμβους ομαδοποιούμενους με βάση μια ξεχωριστή, ίσως και αρκετά αφηρημένη, ιδιότητα σε σχέση με το υπόλοιπο δίκτυο ή απλώς ξεχωρίζουν οπτικά από το υπόλοιπο δίκτυο. Ένα από τα βασικά είδη συμπλέγματος είναι οι κλίκες.

Κλίκα (clique) είναι οποιοδήποτε δίκτυο ή υποδίκτυο που διαθέτει τον μέγιστο δυνατό αριθμό ακμών, με αποτέλεσμα όλοι οι κόμβοι να συνδέονται μεταξύ τους.

Άλλη μορφή συμπλέγματος είναι το EGO δίκτυο, που αποτελείται από έναν κόμβο και όλους τους γείτονες ως προς αυτόν. Στην περίπτωση του EGO δικτύου ο μέσος συντελεστής ομαδοποίησης ⟨C⟩ εκφράζει το πόσοι από τους γείτονες του κεντρικού είναι γείτονες μεταξύ τους, ένα μέτρο συνεκτικότητας του EGO δικτύου. Όταν ⟨C⟩=1 η συνεκτικότητα είναι μέγιστη, που σημαίνει ότι όλοι οι γείτονες συνδέονται μεταξύ τους και το EGO δίκτυο ανάγεται σε κλίκα. Παρόλα αυτά, μια κλίκα δεν είναι υποχρεωτικά EGO δίκτυο, μιας και κλίκα σημαίνει δίκτυο πλήρους συνεκτικότητας, που δεν σχετίζεται απαραίτητα με την κεντρική συμμετρία των EGO.[3][4]

Κατασκευαστικά χαρακτηριστικά[Επεξεργασία | επεξεργασία κώδικα]

Μήτρα ή πίνακας Γειτνίασης (adjacency matrix) είναι ένας πίνακας διαστάσεων, όπου Ν το πλήθος των κόμβων του δικτύου. Ο πίνακας αυτός έχει τις τιμές συσχέτισης όλων των οντοτήτων (που στην συνέχεια θα αναπαρασταθούν από κόμβους). Οι τιμές συσχέτισης είναι πλήρως ταυτισμένες με τις τιμές των ακμών που θα προκύψουν και πηγάζουν απ' τα πειραματικά δεδομένα. Ο πίνακας αυτός αποτελεί τον πληροφοριακό πυρήνα της εικόνας του δικτύου, ενώ το δικτύωμα είναι απλώς απεικόνιση του πίνακα αυτού.

Επιπλέον κατασκευαστικό χαρακτηριστικό των δικτύων είναι το κατώφλι (threshold), μία τιμή που ανήκει στο διάστημα (0,1). Η τιμή αυτή χρησιμεύει στο να επεξεργαστούμε, πριν την κατασκευή του δικτύου, τα βιολογικά δεδομένα που οι τιμές συσχέτισης των κόμβων (τιμές ακμών) ενέχουν στοχαστικότητα και θόρυβο. Είναι αναγκαίο πολλές φορές να απαλείφουμε ορισμένους κόμβους και ακμές, όταν παρότι έχουν τιμή, η τιμή αυτή είτε είναι πολύ μικρή είτε δε μας ενδιαφέρει. Το κατώφλι είναι το μέτρο αυτής της απαλοιφής. Όποια ακμή έχει τιμή πάνω απ' το κατώφλι ξαναορίζεται στην τιμή του κατωφλίου, ενώ κάτω απ' αυτό ως 0. Η επιβολή του κατωφλίου είναι μια διαδικασία, που σπανίως παραλείπεται και παίζει σημαντικό ρόλο στην μεταμόρφωση της μήτρας γειτνίασης σε δίκτυο. Η εκλογή του κατάλληλου κατωφλιού είναι μείζονος σημασίας, μιας και η αλλαγή του μπορεί να επηρεάσει ριζικά την εικόνα του δικτύου, με αποτέλεσμα να απαιτούνται πολλές δοκιμές και διερεύνηση για την διαλογή του.[3]

Μοντέλα δικτύων[Επεξεργασία | επεξεργασία κώδικα]

Στην προσπάθεια να περιγραφούν διάφορες βιολογικές σχέσεις με τη θεωρία δικτύων, έχουν δημιουργηθεί πολλά διαφορετικά είδη δικτύων που μοντελοποιούν με διαφορετικό τρόπο, τόσο τους συντελεστές (κόμβους) όσο και τις σχέσεις (ακμές) μεταξύ τους. Έτσι προκύπτουν τα εξής βασικά δίκτυα:

  1. δυαδικά δίκτυα ή Boolean Networks
  2. πιθανολογικά δίκτυα ή Bayesian Networks
  3. μεταβλητά δίκτυα συνήθων και μερικών διαφορικών εξισώσεων ή ODEs & PDEs Netwoks
  4. δίκτυα χωρικής μετάβασης (place-transition) ή δίκτυα Petri

Δυαδικά δίκτυα ή Boolean Networks[Επεξεργασία | επεξεργασία κώδικα]

a) A Boolean network. Each of the entities a, b and c in the network can be in state 0 or 1. State transitions obey the regulation functions shown on the right, which describe the rules of the model. For example, if a is in state 1 and c is in state 0, at the next time step the state of b will be 0. Thin arrows indicate the regulators of each node. Time steps are represented by thick arrows. The global state of the model is the combination of the three entity states. The system cycles through the six global states. A sequence of consecutive global states is called a trajectory. b) A Petri net. The net contains 'places' (light blue circles) that are the model's entities, and 'transitions' (rectangles) that constitute the regulation functions and define the model's dynamics. Arcs connect input places to transitions, and transitions to their output places. Places that receive discrete values are called tokens (dark blue dots). A transition that is activated, or 'fired', reduces the tokens in its input places and increases the number of tokens in each of its output places. At any time step, every transition that has enough tokens in its input places may be fired. In the example, every transition consumes one token from every input place, and produces one token at every output place. Labels at thick arrows indicate which transition fired. Transitions t1 and t3 can be fired in alternation indefinitely, whereas no other transition can be fired after t2 has fired.

Τα Boolean Networks (δυαδικά δίκτυα) παρουσιάζουν μεγάλη ευκολία στην κατασκευή και την ερμηνεία τους λόγω της λιτότητας της φύσης τους. Αποτελούν τον παλαιότερο τρόπο απεικόνισης ενός βιολογικού συστήματος που προτάθηκε από τον Kauffman στις αρχές του 1970. Βέβαια, τα εν λόγω μαθηματικά μοντέλα Boolean, αν και φαινομενικά απλά και εύκολα, κατανοήθηκαν πλήρως στα μέσα της δεκαετίας του 2000. Οι κόμβοι σε ένα τέτοιο δίκτυο αναπαριστούν ένα βιολογικό μόριο και μπορούν να έχουν μόνο δύο καταστάσεις, ενεργοποιημένη (1) ή απενεργοποιημένη (0), εξού και η ονομασία τους ως Boolean. Η κατάσταση του συστήματος καθορίζεται από το σύνολο των καταστάσεων των συστατικών οντοτήτων (κόμβων) και η κατάσταση του κάθε κόμβου απ' τους προηγούμενους.

Ένα δίκτυο Boolean αποτελείται από ένα διακριτό σύνολο μεταβλητών, κάθε μία από τις οποίες έχει μία λειτουργία με βάση την οποία γίνεται η εισροή των πληροφοριών και δίνει ως αποτέλεσμα την κατάσταση της μεταβλητής που εκχωρήθηκε. Η κατάσταση κάθε οντότητας για κάθε επόμενο βήμα είναι ενεργή εάν το σύνολο των παραγόντων ενεργοποίησης της οντότητας είναι μεγαλύτερο από το σύνολο των παραγόντων καταστολής, ενώ είναι ανενεργή σε αντίθετη περίπτωση. Αυτό το σύνολο των λειτουργιών στην πραγματικότητα καθορίζει μια τοπολογία σύνδεσης για το σύνολο των μεταβλητών, οι οποίες στη συνέχεια γίνονται οι κόμβοι σε ένα δίκτυο.

Παρόλα αυτά τα Boolean δίκτυα δε μπορούν να επεξηγήσουν ακριβώς τη λειτουργία ενός γονιδίου καθώς αυτό δε βρίσκεται μόνο σε δύο καταστάσεις μέσα στο κύτταρο. Παρότι τα Boolean δίκτυα δεν μπορούν να αποδώσουν πλήρως τις σχέσεις μεταξύ των κόμβων τους, σε πολλές περιπτώσεις που μια τέτοια λεπτομέρεια βιολογικών δεδομένων δεν υπάρχει ή δεν ενδιαφέρει, αποτελούν μονόδρομο.[5][6][7]

Πιθανολογικά Δίκτυα ή Bayesian Networks[Επεξεργασία | επεξεργασία κώδικα]

Προσέγγιση Bayesian network για τη μοντελοποίηση του μονοπατιού κυτταρικής σήμανσης.
Τα γονίδια αντιστοιχούν σε κόμβους στο δίκτυο και οι ρυθμιστικές σχέσεις μεταξύ των γονιδίων απεικονίζονται με τις κατευθυνόμενες άκρες. Στο απεικονιζόμενο απλό παράδειγμα, το γονίδιο G1 ρυθμίζει το G2, το G3, και το G5, το γονίδιο G2 ρυθμίζει το G4 και το G5, και το γονίδιο G3 ρυθμίζει το G5. Η κατανομή των πιθανοτήτων για τα επίπεδα έκφρασης του κάθε γονιδίου διαμορφώνεται από τις παραμέτρους των μπεϋζιανών δικτύων. Η κατανομή πιθανοτήτων για ένα γονίδιο εξαρτάται μόνο από τους αντίστοιχους ρυθμιστές του στο δίκτυο. Δηλαδή, τα επίπεδα έκφρασης της G4 και G5 σχετίζονται μόνο επειδή μοιράζονται έναν κοινό ρυθμιστή G2.

Τα Bayesian Networks (BNs) χρησιμοποιούνται ευρέως για την ανακατασκευή βιολογικών δικτύων. Βασικός λόγος είναι η ικανότητα να ενσωματώνουν την προηγούμενη γνώση στη διαδικασία μάθησης του μοντέλου.[8] Ο πιθανολογικός φορμαλισμός τέτοιων μοντέλων έχει την ικανότητα να περιγράφει τη στοχαστική φύση των πολύπλοκων βιολογικών διαδικασιών καθώς είναι κατάλληλος για την έκφραση σχέσεων αιτιατότητας, αποφεύγοντας την υπερπροσαρμογή του μοντέλου στα δεδομένα εκπαίδευσης, και λαμβάνοντας γνώση από ελλιπή σύνολα δεδομένων.[9][10]

Τα κύρια χαρακτηριστικά της στατιστικής συμπερασματολογίας των μπεϋζιανών δικτύων είναι: α. Όλες οι άγνωστες ποσότητες αντιμετωπίζονται ως τυχαίες μεταβλητές, ενώ χρησιμοποιούνται κατανομές πιθανότητας για να περιγράψουν την κατάσταση της γνώσης μας για τις άγνωστες αυτές ποσότητες. β. Η συμπερασματολογία για τις άγνωστες ποσότητες γίνεται με βάση τον κανόνα του Bayes, που επιτρέπει την χρήση πιθανοτήτων δεσμευμένων επί των τιμών που παρατηρήθηκαν.[10]

Ένα μπεϋζιανό δίκτυο αποτελείται από έναν κατευθυνόμενο μη-κυκλικό γράφο και μια σειρά κατανομών πιθανότητας. Οι κόμβοι απεικονίζουν τυχαίες μεταβλητές οι οποίες συνδέονται μεταξύ τους με ακμές απεικονίζοντας τις σχέσεις μεταξύ των μεταβλητών.[10] Οι ακμές ενός ΒΝ συνδέονται με τις δεσμευμένες πιθανότητες, ορίζονται από μία λειτουργική «οικογένεια» και τις παραμέτρους της. Τα αλληλεπιδρώντα στοιχεία συνδέονται με τυχαίες μεταβλητές που αντιπροσωπεύουν κάποια μετρούμενη οντότητα που παρουσιάζει ενδιαφέρον, όπως τα επίπεδα σχετικής έκφρασης γονιδίου ή οι συγκεντρώσεις πρωτεΐνης.[11][12]

Τα Βayesian networks  είναι όμοια με τα Boolean, με την διαφορά ότι οι ακμές παίρνουν τιμές στο συνεχές διάστημα [0,1]. Εδώ επίσης χρειάζεται η επιβολή κατωφλίου με τις ίδιες ιδιότητες και δυσκολίες, προκειμένου να εξαιρεθούν οι ακμές που έχουν πολύ μικρή πιθανότητα, κάτω του κατωφλίου, οπότε δεν μπορούν να ξεχωρίσουν απ' το θόρυβο της μέτρησης των δεδομένων.

Τα γενετικά ρυθμιστικά δίκτυα αποτελούν μία από τις πιο χαρακτηριστικές εφαρμογές των μπεϋζιανών δικτύων στα βιολογικά συστήματα. Ακόμη, ένα σύνηθες βιολογικό παράδειγμα σχετικό με τη μάθηση παραμέτρων στα μπεϋζιανά δίκτυα είναι η πρόβλεψη των θέσεων αλληλεπίδρασης πρωτεΐνης χρησιμοποιώντας πληροφορίες σχετικές με τη διατήρηση και την υδροφοβικότητα.

Μεταβαλλόμενα Δίκτυα Διαφορικών Εξισώσεων ή ODEs & PDEs Netwoks[Επεξεργασία | επεξεργασία κώδικα]

Ένα βασικό εργαλείο για τη μελέτη της δυναμικής ενός συνεχούς συστήματος όπως το βιολογικό, είναι οι συνήθεις και οι μερικές διαφορικές εξισώσεις. Ένα σημαντικό πρόβλημα στη διαμόρφωση των βιολογικών συστημάτων είναι να χαρακτηριστεί η εξάρτηση από ορισμένες ιδιότητες στο χώρο και το χρόνο. Μια συχνά εφαρμοζόμενη στρατηγική είναι η περιγραφή της μεταβολής της κατάστασης των μεταβλητών από τις διαφορικές εξισώσεις. Αν οι μεταβολές είναι μόνοπαραμετρικές τότε χρησιμοποιούνται οι συνήθεις διαφορικές εξισώσεις ενώ αν είναι πολυπαραμετρικές οι μερικές διαφορικές εξισώσεις είναι κατάλληλες.[13]

Οι κανονικές διαφορικές εξισώσεις (ODEs) εξηγούν τη στιγμιαία αλλαγή κάποιων οντοτήτων του δικτύου που αλλάζουν εξαιτίας των αλληλεπιδράσεων που επισυμβαίνουν ανάμεσα τους. Έτσι δίνεται η δυνατότητα απεικόνισης των αλλαγών που επισυμβαίνουν στο δίκτυο με την πάροδο του χρόνου. Τα μοντέλα ODEs μπορούν να παρέχουν λεπτομερείς πληροφορίες για τη δυναμική των βιολογικών δικτύων, όμως έχουν εφαρμοστεί σε λίγα δίκτυα λόγω των απαιτήσεών τους σε υψηλής ποιότητας δεδομένα.[14] Παρ' ότι η πληροφορία που δίνουν οι διαφορικές εξισώσεις είναι η πλουσιότερη δυνατή, μπορεί να παρουσιάζουν προβλήματα, κυρίως ως προς τις τεράστιες υπολογιστικές απαιτήσεις. Επίσης, σε ένα βιολογικό σύστημα η απόκτηση μιας τόσο ντετερμινιστικής γνώσης -όπως μια εξίσωση- είναι δύσκολη και αμφισβητήσιμη.[15]

Τα μοντέλα των ODEs εφαρμόζονται κυρίως στην πρόβλεψη δικτύων που απεικονίζουν τις αλληλεπιδράσεις μεταξύ μορίων κατά τη διάρκεια του κυτταρικού κύκλου. Με τη χρήση των κανονικών διαφορικών εξισώσεων μπορούμε για παράδειγμα να απεικονίσουμε λεπτομερώς ένα μεταβολικό ή ένα γενετικό ρυθμιστικό δίκτυο. Ας πάρουμε σαν παράδειγμα ένα μεταβολικό δίκτυο, χαρακτηριστικά του οποίου είναι οι ουσίες με τις συγκεντρώσεις τους και οι αντιδράσεις ή οι διεργασίες μεταφοράς που μεταβάλλουν τις συγκεντρώσεις των ουσιών. Οι αντιδράσεις καταλύονται συνήθως από ένζυμα και τα στάδια μεταφοράς επιτελούνται από τις μεταφορικές πρωτεΐνες ή από τους πόρους. Έτσι υποδεικνύονται αναγνωρίσιμες βιοχημικές ενώσεις. Οι στοιχειομετρικοί συντελεστές μιας αντίδρασης υποδηλώνουν το ποσοστό των μορίων υποστρώματος και του προϊόντος που εμπλέκονται σε αυτή. Η  μεταβολή των συγκεντρώσεων στο χρόνο μπορεί να περιγραφεί με τη χρήση κανονικών διαφορικών εξισώσεων.[13]

Οι μερικές διαφορικές εξισώσεις (PDE) χρησιμοποιούνται για την περιγραφή λειτουργιών που εξαρτώνται και από τον χώρο, εκτός από τον χρόνο. Ένα τυπικό βιολογικό παράδειγμα της χώρο-εξάρτησης είναι η συγκέντρωση ενός μορφογόνου ως συνάρτηση του χώρου, και του χρόνου. Ακόμη, με τις PDEs μπορεί να μελετηθεί η χώρο-εξάρτηση μιας συγκεκριμένης πρωτεΐνης σε ένα μόνο κύτταρο.[16]

Petri Networks (Δίκτυα Χωρικής Μετάβασης)[Επεξεργασία | επεξεργασία κώδικα]

(a) A simple, standard Petri net. The circles denote places, whereas the boxes denote transitions. The distribution of tokens (black dots) in the places at a given time defines a marking. Transitions change the marking by removing a token from each incoming arrow and adding a token to each outgoing arrow. (b) Simplified logical regulatory graph for the biosynthesis of tryptophan in E. coli. Each node of the regulatory graph represents an active component: tryptophan (Trp), the active enzyme (TrpE) and the active repressor (TrpR). The node marked by a rectangle accounts for the import of Trp from external medium. All nodes are binary (that is, can take the value 0 or 1), except Trp, which is represented by a ternary variable (taking the values 0, 1, 2). Arrows represent activation and bars denote inhibition. (c) Petri net of the Trp regulatory network. Each of the four components of b is represented by two complementary places and all the different situations that lead to a change of the state of the system are modeled by one of the nine transitions (t1–t 9).

Τα Petri Networks (δίκτυα χωρικής μετάβασης) αποτελούν μία ειδική κατηγορία δικτύων καθώς έχουν πολλές ιδιομορφίες. Αρχικά αναπτύχθηκαν για να περιγράψουν χημικές διεργασίες από τον Γερμανό, Alan Adam Petri[17], ενώ πλέον χρησιμοποιούνται ως ένας ακόμα τρόπος μοντελοποίησης κυρίως σε συστήματα ταυτοχρονίας και κατανεμημένα συστήματα.

Στα δίκτυα Petri στη θέση των κόμβων υπάρχουν οι θέσεις (places), που η σημασία τους εξαρτάται από το εν λόγω σύστημα προς μοντελοποίηση. Η κάθε θέση αναπαριστάται με έναν κύκλο. Στα δίκτυα Petri, εκτός από τους κόμβους και τις ακμές, υπάρχει ένας επιπλέον συμβολισμός, η μάρκα (token). Οι μάρκες, οι οποίες τοποθετούνται πάνω στις θέσεις, σχετίζονται με την δυναμικότητα του συστήματος και δηλώνουν την ύπαρξη ποσοτήτων. Τέλος, υπάρχει ο συμβολισμός της μετάβασης που υποδηλώνει την ενεργοποίηση μιας διαδικασίας.

Τα δίκτυα Petri σχηματίζουν ένα κατευθυνόμενο διμερές γράφημα, στο οποίο οι κόμβοι αντιπροσωπεύουν τις μεταβάσεις, τα γεγονότα δηλαδή που μπορεί να συμβούν, και τους χώρους, δηλαδή τις συνθήκες. Οι ακμές είναι υποχρεωτικά κατευθυνόμενες και δεν χαρακτηρίζονται ούτε από κάποια τιμή ούτε από εξίσωση, παρά είναι επιφορτισμένες με την μετακίνηση των μαρκών (tokens) από κόμβο σε κόμβο. Οι κόμβοι με την σειρά τους έχουν κάποια χωρητικότητα σε μάρκες, ενώ χωρητικότητα μίας και μόνο μάρκας έχουν και οι ακμές. Συνοπτικά, μπορεί να λεχθεί ότι είναι δίκτυα διακίνησης μαρκών (tokens).

Ο μαθηματικός ορισμός της απλής μορφής των δικτύων Petri είναι ο ακόλουθος:

Ένα Δίκτυο Πέτρι είναι μια 5-άδα N = (P, T, F, W, m0) όπου P και Τ είναι πεπερασμένα σύνολα και

  • P είναι το σύνολο των θέσεων.
  • Τ είναι το σύνολο των μεταβάσεων.
  • Η σχέση F c (PxT)U(TxP), είναι η «σχέση ροής» του Ν, συμπεριλαμβανομένων των ακμών, δηλαδή (p, t) ή (t, p) όπου p είναι μια θέση και t μια μετάβαση.
  • Μια απεικόνιση W: F→ N, η οποία αντιστοιχεί κάθε ακμή (χ, ψ) σε έναν ακέραιο αριθμό, το βάρος της ακμής W(χ,ψ).
  • Ένα αρχικό μαρκάρισμα m0: P→N, το οποίο αντιστοιχεί κάθε θέση p με ένα αρχικό αριθμό σημείων (μάρκα), m0(p).[18]

Το μειονέκτημα των δικτύων Petri είναι ότι δεν μπορούν να απεικονίσουν οποιοδήποτε σύστημα λόγω των περιορισμών τους στην απεικόνιση μεγάλων και περίπλοκων μοντέλων και γι’ αυτόν το λόγο δεν έχουν ευρεία χρήση. Βέβαια, στα βιολογικά δίκτυα, πολλές φορές αποτελούν μία καλή λύση μοντελοποίησης, καθώς πολλές οντότητες οι οποίες έχουν συγκεκριμένη λειτουργία αλληλεπιδρούν μεταξύ τους και την ίδια χρονική στιγμή επιτελούνται πολλαπλές διεργασίες με διαφορετικό ρυθμό η κάθε μία.[19]

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Stochastic modelling of gene regulatory networks. 2005. Αρχειοθετήθηκε από το πρωτότυπο στις 2017-08-09. https://web.archive.org/web/20170809150538/https://engineering.ucsb.edu/~khammash/publications/IJRNC-StochGeneExp.pdf. 
  2. Frederick R Adler (2013). Modeling the Dynamics of Life: Calculus and Probability for Life Scientists (3η έκδοση). Utah, USA: University of Utah. σελ. 5. ISBN 9780840064189. Αρχειοθετήθηκε από το πρωτότυπο στις 24 Ιουνίου 2016. Ανακτήθηκε στις 23 Ιουνίου 2016. 
  3. 3,0 3,1 3,2 Νικολάου, Χ.· Χουβαρδάς Π. (2015). Υπολογιστική βιολογία. Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών. σελ. [327-360]. 
  4. Diestel, Reinhard (2010). Graph Theory (4η έκδοση). New York: Springer. σελίδες 2-9. ISBN 978-3642142789. 
  5. Kauffman, S. A. (March 1969). «Metabolic stability and epigenesis in randomly constructed genetic nets». Journal of Theoretical Biology. doi:10.1016/0022-5193(69)90015-0. http://www.sciencedirect.com/science/article/pii/0022519369900150. 
  6. Albert, Réka; Othmer, Hans G (July 2013). «"The topology of the regulatory interactions predicts the expression pattern of the segment polarity genes in Drosophila melanogaster"». Journal of Theoretical Biology. doi:10.1016/S0022-5193(03)00035-3. 
  7. Drossel, Barbara, Schuster, Heinz Georg, (December 2009). «Chapter 3. Random Boolean Networks». Reviews of Nonlinear Dynamics and Complexit. doi:10.1002/9783527626359.ch3. 
  8. Pei, B., & Shin, D. G. (2012). «Reconstruction of biological networks by incorporating prior knowledge into Bayesian network models.». J Comput Biol. doi:10.1089/cmb.2011.0194. 
  9. Friedman, N., Linial, M., Nachman, I., & Pe'er, D. (2000). «Using Bayesian networks to analyze expression data.». J Comput Biol. 
  10. 10,0 10,1 10,2 Needham, C. J., Bradford, J. R., Bulpitt, A. J., & Westhead, D. R. (2007). «A primer on learning in Bayesian networks for computational biology.». PLoS Comput Biol. doi:10.1371/journal.pcbi.0030129. 
  11. Husmeier, D., & Werhli, A. V. (2007). «Bayesian integration of biological prior knowledge into the reconstruction of gene regulatory networks with Bayesian networks.». Comput Syst Bioinformatics Conf. 
  12. Werhli, A. V., & Husmeier, D. (2007). «Reconstructing gene regulatory networks with bayesian networks by combining expression data with multiple sources of prior knowledge.». Stat Appl Genet Mol Biol. doi:10.2202/1544-6115.1282. 
  13. 13,0 13,1 Klipp, E., Herwig, R., Kowald, A., Wierling, C., & Lehrach, H. (2008). Systems biology in practice: concepts, implementation and application. 
  14. Karlebach, G., & Shamir, R. (2008). «Modelling and analysis of gene regulatory networks.». Nat Rev Mol Cell Biol. doi:10.1038/nrm2503. 
  15. Liu, Y., & Gunawan, R. (2014). «Parameter estimation of dynamic biological network models using integrated fluxes.». BMC Systems Biology. doi:10.1186/s12918-014-0127-x. 
  16. Chirico, G., Edited by: Leah Eldestein-Keshet (2005). «Mathematical Models In Biology. 6th edition.». BioMedical Engineering OnLine. doi:10.1186/1475-925x-4-35. 
  17. Petri, Carl; Reisig, Wolfgang (2008-04-17). «Petri net». Scholarpedia 3 (4). doi:10.4249/scholarpedia.6477. ISSN 1941-6016. http://www.scholarpedia.org/article/Petri_net. 
  18. Rozenburg, G.; Engelfriet, J. (1998). "Elementary Net Systems". In Reisig, W.; Rozenberg, G. Lectures on Petri Nets I: Basic Models - Advances in Petri Nets. Lecture Notes in Computer Science 1491. Springer. pp. 12–121.
  19. Ehrig Hartmut· Juhas Gabriel· Padberg Julia· Rozenberg Grzegorz (2001). Unifying Petri Nets. Berlin, Heidelberg, New York: Springer. σελ. 2-10. ISBN 3-540-43067-9.