Cytoscape

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Cytoscape
Γενικά
Ημερ. Δημιουργίας2002
Είδοςελεύθερο λογισμικό, επιστημονικό λογισμικό
Διανομή
ΛειτουργικάmacOS, Microsoft Windows, Linux
Ανάπτυξη
Γραμμένο σεJava
Άδεια χρήσηςGNU Lesser General Public License
Σύνδεσμοι
Επίσημος ιστότοπος
http://www.cytoscape.org/
Αρχική σελίδα Cytoscape (έκδοση 3.5.0)

Το Cytoscape είναι πλατφόρμα λογισμικού βιοπληροφορικής η οποία κατασκευάστηκε τον Ιούλιο του 2002 για την απεικόνιση και ανάλυση δικτύων μοριακής αλληλεπίδρασης, χρησιμοποιώντας δεδομένα που έχουν προκύψει από πειράματα υψηλής απόδοσης (high-throughput expression data). Πρόσθετες λειτουργίες είναι διαθέσιμες ως plug-ins. Τα plug-ins είναι διαθέσιμα για ανάλυση και σύγκριση δικτύων και μοριακών προφίλ, ομαδοποίηση γράφων, ανάλυση προφιλ γονιδιακής έκφρασης, εντοπισμό συμπλόκων, αναγνώριση μοτίβων σε δίκτυα, νέες διατάξεις, πρόσθετη υποστήριξη μορφής και σύνδεσης αρχείων με βάσεις δεδομένων και αναζήτηση σε μεγάλα πρωτεϊνικά δίκτυα. Τα plug-ins μπορούν να αναπτυχθούν χρησιμοποιώντας το λογισμικό του Cytoscape με αρχιτεκτονική Java [1][2].

Το Cytoscape διαθέτει επίσης ένα συγγενικό πρόγραμμα με όνομα Cytoscape.js το οποίο μπορεί να χρησιμοποιηθεί για την ανάλυση και την απεικόνιση γραφημάτων σε περιβάλλοντα JavaScript, όπως ένα πρόγραμμα περιήγησης.

Ομαδοποίηση γράφων (graph clustering)[Επεξεργασία | επεξεργασία κώδικα]

Μία λειτουργία που προσφέρει το λογισμικό βιοπληροφορικής Cytoscape μέσω χρήσης των plug-ins είναι η ομαδοποίηση γράφων. Η ομαδοποίηση γράφων είναι μια διαδικασία κατά την οποία ακμές (vertices) σε ήδη υπάρχοντες γράφους που πραγματοποιούν παρόμοια διεργασία είτε ακμές οι οποίες συνεργάζονται για να παράξουν μια συγκεκριμένη διεργασία ομαδοποιούνται για την μελέτη και αποσαφήνιση διάφορων λειτουργιών. Στον τομέα της βιοπληροφορικής οι γράφοι χρησιμοποιούνται για την ανάλυση και ερμηνεία βιολογικών δικτύων που στόχο έχουν την κατανόηση των βιολογικών λειτουργιών που λαμβάνουν χώρα σε έναν οργανισμό. Τέτοιες λειτουργίες είναι η ρύθμιση του μεταβολισμού σε έναν οργανισμό (metabolic regulation), η έκφραση ενός γονιδίου (gene expression), οι αλληλεπιδράσεις μεταξύ πρωτεϊνών (Protein to protein Interactions, PPI) όπως και η προέλευση διάφορων παθήσεων.

Cytocluster[Επεξεργασία | επεξεργασία κώδικα]

Ομαδοποίηση γράφων μέσω χρήσης του αλγορίθμου HC-PIN (Cytoscape, έκδοση 3.7.0)

Το CytoCluster[3] δημιουργήθηκε τον Ιούλιο του 2013 απο τους Min Li, Dongyan Li, Yu Tang, Fangxiang Wu και Jianxin Wang και είναι ένα απο τα plug-ins του λογισμικού Cytoscape που διατίθενται για λήψη μέσω του app manager της εφαρμογής διευκολύνοντας τον χρήστη ως προς την μελέτη βιολογικών δικτύων. Με την επιλογή ενός απο τους 6 αλγόριθμους ο χρήστης έχει την δυνατότητα να εντοπίσει πρωτεϊνικά σύμπλοκα και λειτουργικές μονάδες (modules).

Αλγόριθμοι[Επεξεργασία | επεξεργασία κώδικα]

Οι αλγόριθμοι που χρησιμοποιούνται στο plug-in Cytocluster παρατίθενται παρακάτω:

  • HC-PIN (Hierarchical Clustering algorithm in Protein Interaction Networks)
  • OH-PIN (identifying Overlapping and Hierarchical modules in Protein Interaction Networks)
  • IPCA (Identifying Protein Complex Algorithm)
  • ClusterONE (Clustering with Overlapping Neighborhood Expansion)
  • DCU (Detecting Complexes based on Uncertain graph model)
  • IPC-MCE (Identifying Protein Complexes based on Maximal Complex Extension)

To CytoCluster μπορεί να επεκταθεί με ευκολία και να εξοπλιστεί με παραπάνω αλγορίθμους και λειτουργίες.

HC-PIN (Hierarchical Clustering algorithm in Protein Interaction Networks)[Επεξεργασία | επεξεργασία κώδικα]

Ο αλγόριθμος HC-PIN είναι ένας γρήγορος αλγόριθμος ιεραρχικής ομαδοποίησης ο οποίος μπορεί να χρησιμοποιηθεί σε γράφους με βάρη (weighted graph) ή χωρίς βάρη (unweighted graph). Ο αλγόριθμος ακολουθεί συγκεκριμένα βήματα για την ομαδοποίηση. Αρχικά όλες οι κορυφές (vertices) στο δίκτυο αλληλεπιδράσεων πρωτεΐνης-πρωτεΐνης (protein to protein interaction networks) λαμβάνονται ως μία αυτόνομη ομάδα γράφων (clusters). Στην συνέχεια, ο αλγόριθμος υπολογίζει την τιμή ομαδοποίησης (clustering value) όλων των άκρων (edges) και προσθέτει τις άκρες σε μία ουρά με μέγεθος Sq χωρίς αύξουσα σειρά σύμφωνα μόνο με την τιμή ομαδοποίησης τους. Όσο μεγαλύτερη τιμή ομαδοποίσης έχει μία άκρη του δικύου τόσο πιθανότερο είναι οι ακμές της να ανήκουν στο ίδιο υποδίκτυο (module). Κατά την διάρκεια προσθήκης άκρων στην ουρά Sq για να ομαδοποιηθούν σχηματίζονται λ-υποδίκτυα (λ-modules). Τα λ-υποδίκτυα μπορούν να εξαχθούν όταν ο αριθμός των πρωτεϊνών τους δεν είναι μικρότερος απο ένα κατώφλι (threshold) με τιμή s.

OH-PIN (Identifying Overlapping and Hierarchical Modules in Protein Interaction Networks)[Επεξεργασία | επεξεργασία κώδικα]

Ο αλγόριθμος OH-PIN είναι ένας βελτιωμένος αλγόριθμος ιεραρχικής ομαδοποίησης ο οποίος μπορεί να ανιχνεύσει επικαλυπτόμενες ομάδες γράφων. Η βασική ιδέα του αλγόριθμου είναι η εξής. Αρχικά, υπάρχουν δυο σετ τα οποία περιέχουν ομάδες γράφων: το C_set το οποίο αρχικά δεν περιέχει κάποια ομάδα και το B_Cluster το οποίο παράγεται απο κάθε άκρη μέσα στο δίκτυο πρωτεινικών αλληλεπιδράσεων. Στην συνέχεια το κάθε B_Cluster προστίθεται μέσα στο C_set, έως ότου όλα τα B_Cluster των άκρων να είναι μέσα στο C_set. Στην συνέχεια, ο αλγόριθμος ενώνει όλα τα ζεύγη γράφων με υψηλό δείκτη επικαλυπτότητας μέσα απο το το C_set. Έπειτα, συγκεντρώνει όλους τους ομαδοποιημένους γράφους σε λ-υποδίκτυα (λ-modules) ενώνοντας βαθμιαία τα ζεύγη γράφων με τις μέγιστες τιμές των συντελεστών ομαδοποίησης (clustering coefficient, Ci).

IPCA (Identifying Protein Complex Algorithm)[Επεξεργασία | επεξεργασία κώδικα]

Ο IPCA αλγόριθμος είναι είναι ικανός να αναγνωρίζει και να εντοπίζει πυκνές δομές υπογράφων σε ένα δίκτυο πρωτεινικών αλληλεπιδράσεων. Ο IPCA φέρει τέσσερις κυρίως υποαλγόριθμους με τις εξής ονομασίες: weighting vertex, selecting weed, extending cluster and extend-judgment. Πρώτα, ο IPCA υπολογίζει τα "βάρη" της κάθε άκρης μετρώντας τους κοινούς γείτονες των συνδεδεμένων σε αυτήν ακμών και στην συνέχεια υπολογίζει το βάρος της κάθε μίας ακμής αθροίζοντας τα βάρη των προσπίπτοντων άκρων. Όσο υψηλότερο βάρος έχει μία ακμή, τόσο πιο πιθανό είναι αυτή η ακμή να θεωρηθεί ως πηγή (seed). Κατά το ξεκίνημα, η πηγή αρχικοποιείται ως ένας ομαδοποιημένος γράφος. Ο IPCA διευρύνει ένας ομαδοποιημένο γράφο προσθέτοντας αναδρομικά ακμές απο τους γείτονες του λαμβάνοντας υπόψιν τις απαιτήσεις του κάθε κόμβου. Το αν ένας κόμβος είναι ικανός για να για να συμπεριληφθεί σε έναν ομαδοποιημένο γράφο εξαρτάται απο δυό συνθήκες: την πιθανότητα αλληλεπίδρασης του (interaction probability) και το συντομότερο μονοπάτι μεταξύ του ιδίου και των κόμβων στον ομαδοποιημένο γράφο.

ClusterONE (Clustering with Overlapping Neighborhood Expansion)[Επεξεργασία | επεξεργασία κώδικα]

Ο ClusterONE αλγόριθμος αποτελείται απο τρία κυρίως βήματα. Αρχικά, τα γκρουπ αυξάνονται προσθέτοντας ή αφαιρώντας ακμές υψηλής συνεκτικότητας απο επιλεγμένες πρωτεΐνες πηγές (seeds). Έπειτα, η πρωτεΐνη με τον υψηλότερο βαθμό θεωρείται ως η πρώτη πηγή και αναπτύσσει ένα συνεκτικό γκρούπ χρησιμοποιώντας μία "άπληστη" μέθοδο. Ο ClusterONE επαναλαμβάνει αυτή την διαδικασία ανάπτυξης με σκοπό τον σχηματισμό αλληλοεπικαλυπτόμενων συμπλεγμάτων μέχρις ότου να μην υπάρχει διαθέσιμη πρωτεΐνη στο δίκτυο αλληλεπιδράσεων. Έπειτα, ο αλγόριθμος ενώνει τα αλληλοεπικαλυπτόμενα ζεύγη των τοπικά συνεκτικών άριστων γκρούπ με γνώμονα ένα προκαθορισμένο σκορ αλληλοεπικάλυψης. Στο τέλος, ο ClusterONE εξάγει συμπλέγματα πρωτεΐνων τα οποία περιλαμβάνουν τουλάχιστον τρείς πρωτεΐνες των οποίων η πυκνότητα είναι μεγαλύτερη από ένα δοθέν κατώφλι (threshold) ∂ (με αρχική τιμή 0.8).

DCU (Detecting Complexes Based on Uncertain Graph Model)[Επεξεργασία | επεξεργασία κώδικα]

Ομαδοποίηση γράφων κατά αλγόριθμο DCU

Ο αλγόριθμος DCU είναι ένας αλγόριθμος ομαδοποίησης, ο οποίος ανιχνεύει πρωτεϊνικά σύμπλοκα βασισμένα στο μοντέλο του αβέβαιου (πιθανοτικού) γράφου. Αρχικά, ο DCU ξεκινάει απο μία ακμή πηγή (seed) και προσθέτει επιπέον ακμές χρησιμοποιώντας μία άπληστη μέθοδο ούτως ώστε να σχηματίσει έναν υποψήφιο πυρήνα υψηλής συνεκτικότητας και χαμηλής σύζευξης. Έπειτα, ο DCU χρησιμοποιεί μία στρατηγική 'πρόσδεσης σε πυρήνα' έτσι ώστε να προσθέσει επιπλέον προσαρτήματα στα σετ των πυρήνων για τον σχηματισμό συμπλόκων. Συγκεκριμένα, για κάθε πρωτεΐνη ενός υποψήφιου σετ η οποία αποτελείται απο γειτονικές πρωτεϊνικές ακμές, εάν το απόλυτο εσωτερικό της σκόρ είναι μικρότερο από το εξωτερικό της απόλυτο σκόρ, τότε η πρωτεΐνη αυτή πρέπει να αφαιρεθεί απο το υποψήφιο σετ. Τέλος, ο αλγόριθμος, χρειάζεται να λύσει το πρόβλημα των επαναλαμβανόμενων πρωτεϊνικών συμπλόκων ελέγχοντας την τιμή επικάλυψης τους (overlapping value).

IPC-MCE (Identifying Protein Complexes based on Maximal Complex Extension)[Επεξεργασία | επεξεργασία κώδικα]

Ο IPC-MCE είναι ένας αλγόριθμος ομαδοποίησης βασισμένος στην ορισμό της μέγιστης κλίκας (maximal clique). Η βασική ιδέα του αλγόριθμου περιγράφεται ως εξής. Πρώτα, ο IPC-MCE αφαιρεί όλους τους κόμβους οι οποίοι έχουν μόνο έναν γειτονικό κόμβο. Έπειτα, ο αλγόριθμος απαριθμεί όλες τις μέγιστες κλίκες στο εναπομείναν δίκτυο αλληλεπιδράσεων πρωτεϊνών (PPI network) και τις τοποθετεί μέσα στο σετ με όνομα MCS (Maximal Clique Sets). Για κάθε γειτονική ακμή v της μέγιστης κλίκας K απο το σετ MCS, εάν η τιμή της μεταβλητής IPvk είναι μεγαλύτερη ή ίση απο το κατώφλι t, τότε η ακμή v προστίθεται στην μέγιστη κλίκα K. Ο ορισμός της μεταβλητής IPvk δίνεται απο τον παρακάτω τύπο:



όπου Evk είναι ο αριθμός των άκρων μεταξύ της ακμής v και K και όπου Vk είναι ο αριθμός των κόμβων στην μέγιστη κλίκα K.

Ανάλυση δικτύων αλληλεπιδράσεων πρωτεΐνης-πρωτεΐνης (Protein-protein interactions network analysis)[Επεξεργασία | επεξεργασία κώδικα]

Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης (PPIs) είναι φυσικές συνδέσεις υψηλής ειδικότητας μεταξύ δύο ή περισσοτέρων πρωτεϊνικών μορίων ως αποτέλεσμα βιοχημικών διεργασιών που καθοδηγούνται από αλληλεπιδράσεις που περιλαμβάνουν ηλεκτροστατικές δυνάμεις, δημιουργία δεσμών υδρογόνου και υδρόφοβες αλληλεπιδράσεις. Πολλές είναι φυσικές επαφές που καθοδηγούνται από μοριακές σχέσεις μεταξύ πρωτεϊνικών αλυσίδων που λαμβάνουνχώρα σε ένα κύτταρο ή σε έναν ζωντανό οργανισμό σε ένα συγκεκριμένο βιομοριακό πλαίσιο.[4]

Οι πρωτεΐνες σπάνια δρουν αυτόνομα καθώς οι λειτουργίες τους τείνουν να ρυθμίζονται. Πολλές μοριακές διεργασίες μέσα σε ένα κύτταρο πραγματοποιούνται από μοριακές μηχανές που αποτελούνται από πολλά πρωτεϊνικά συστατικά που οργανώνονται με βάση τις πρωτεϊνικές τους αλληλεπιδράσεις. Αυτές οι αλληλεπιδράσεις αποτελούν το αλληλεπίδρωμα του κυττάρου (interactome).

Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης έχουν μελετηθεί εκτενώς με διαφορετικές μεθόδους στην προσπάθεια κατανόησης του τρόπου λειτουργίας των κυττάρων. Με τα δεδομένα που προκύπτουν απο πειραματικές μεθόδους δίνεται η δυνατότητα κατασκευής δικτύων πρωτεϊνικών αλληλεπιδράσεων (protein-protein interactions networks)[5], τα οποία συμβάλλουν στην καλύτερη κατανόηση των μοριακών γεγονότων και την σύνδεσή τους με ασθένειες, ενώ ταυτόχρονα προσφέρουν την δυνατότητα πρόβλεψης πιθανών πρωτεϊνικων στόχων θεραπευτικού ενδιαφέροντος. Στην πλατφόρμα Cytoscape έχουν σχεδιαστεί εργαλεία (plug-ins) που προσφέρουν την δυνατότητα μελέτης τέτοιων δικτύων.

Contextual Hub Analysis Tool (CHAT)[Επεξεργασία | επεξεργασία κώδικα]

Στα βιολογικά δίκτυα, οι υψηλά συνδεδεμένοι κόμβοι είναι τοπολογικά σημαντικοί για την δομή του δικτύου και έχει δειχθεί ότι σχηματίζουν hubs που σχετίζονται ειδικά με συγκεκριμένους φαινοτύπους. Ωστόσο, η σχετική σημασία κάθε κόμβου στο hub μπορεί να επηρεαστεί ανάλογα το βιολογικό πλαίσιο στο οποίο εντάσσονται (biological context). Το Contextual Hub Analysis Tool (CHAT) είναι μια εφαρμογή που έχει αναπτυχθεί για χρήση στο περιβάλλον του Cytoscape για τον προσδιορισμό κόμβων που σχετίζονται με τα συμφραζόμενα (context specific nodes) σε βιολογικά δίκτυα. To CHAT επιτρέπει στον χρήστη την κατασκευή και απεικόνιση δικτύων αλληλεπιδράσεων από λίστες γονιδίων ενδιαφέροντος, την ενσωμάτωση σε αυτά πληροφοριών από το αντίστοιχο βιολογικό πλαίσιο (π.χ. δεδομένα γονιδιακής έκφρασης) και τον προσδιορισμό κόμβων που παρουσιάζουν υψηλότερα επίπεδα σύνδεσης (highly connected nodes) εντός του αντίστοιχου βιολογικού πλαισίου από ότι θα αναμενόταν αν προέκυπταν τυχαία. Τα δεδομένα που εισάγει ο χρήστης πρέπει να προέρχονται από βάσεις δεδομένων που υποστηρίουν την διεπαφή PSICQUIC2, όπως η BioGrid και η IntAct.

Σε αντίθεση με άλλα υπάρχοντα εργαλεία, που προσδιορίζουν απλά αν ένας κόμβος παρουσιάζει υψηλή σύνδεση εντός του δικτύου, το CHAT προσδιορίζει κόμβους εντός του hub οι οποίοι αλληλεπιδρούν περισσοτερο με κόμβους που σχετίζονται με το εκάστοτε βιολογικό πλάισιο (π.χ. δεδομένα διαφορικής έκφρασης γονιδίων) από τους στατιστικά αναμενόμενους. Ταυτόχρονα, δίνει την δυνατότητα σύγκρισης των κορυφαίων κόμβων βάσει του πλαισίου (top contextual hubs) έναντι των κόμβων υψηλού βαθμού (top degree-based hubs). Επίσης, εξαιρεί τους κόμβους που δεν σχετίζονται με τα συμφραζόμενα και επιτρέπει την ανάλυση μεμονωμένων κόμβων με τους γείτονες τους.

Προκειμένου να υπολογιστεί η σημασία ενός κόμβου ή ενός hub με βάση το βιολογικό πλαίσιο (contextual importance of a node or a hub), το CHAT εκτελεί υπεργεωμετρικά τεστ για κάθε κόμβο του δικτύου. Το υπεργεωμετρικό τέστ αξιολογεί την σωρευτική πιθανότητα ότι ένας κόμβος αλληλεπιδρά με contextual κόμβους από ότι με κόμβους που θα προέκυπταν τυχαία.

CytoGEDEVO[Επεξεργασία | επεξεργασία κώδικα]

Το CytoGEDEVO είναι ένα εργαλείο οπτικής και υποβοηθούμενης από τον χρήστη ευθυγράμμισης δικτύων. Στοιχίζει ζεύγη δικτύων και το αποτέλεσμα προκύπτει από στοίχιση κόμβων έναν προς έναν (one-to-one node mapping). Επεκτείνει την προηγούμενη μεθοδολογία GEDEVO για καθολικές ευθυγραμμίσεις ζευγών δικτύων με νέα γραφικά και λειτουργικά χαρακτηριστικά. Οι ευθυγραμμίσεις μπορούν να είναι επαναλήψιμες, δηλαδή οι παράμετροι μπορούν να ρυθμιστούν ανά πάσα στιγμή και η ευθυγράμμιση συνεχίζεται με τις νέες παραμέτρους. Το CytoGEDEVO δεν περιορίζεται στην τοπολογία δικτύου και μπορεί να κάνει χρήση απεριόριστου αριθμού σκορ που παρέχονται εξωτερικά (BLAST E-τιμές ή Bit-score), χωρίς να επιβάλλει περιορισμούς στον τύπο βαθμολογίας. Επιτρέπει επίσης την εισαγωγή αρχείων αποτελεσμάτων που δημιουργούνται από άλλους ευθυγραμμιστές.

Εκτός από την χρήση σταθμισμένων βαρών για τον υπολογισμό των σκορ, η εφαρμογή διαθέτει ενσωματωμένο κλιμακωτό βαθμολογητή, δηλαδή από πολλαπλές βαθμολογίες εισόδου, η πρώτη βαθμολογία λαμβάνεται μόνο εφόσον υπερβαίνει το όριο που ορίζεται από τον χρήστη, διαφορετικά λαμβάνει το επόμενο σκορ και ούτω καθεξής. Με αυτόν τον τρόπο, η τοπολογία μπορεί να ενσωματωθεί ως "αντίγραφο ασφαλείας" που εξετάζεται μόνο εάν μια πιο σχετική βαθμολογία (π.χ.ομοιότητα ακολουθίας που βασίζεται στο BLAST των δύο κόμβων) είναι πολύ χαμηλή. Το CytoGEDEVO μπορεί να χρησιμοποιήσει σταθμισμένο άθροισμα και cascaded σκορ ταυτόχρονα. Αυτό στοχεύει στην εναλλαγή μεταξύ τοπολογικών και βιολογικών χαρακτηριστικών, βελτιστοποιώντας τυπικά και τα δύο, αλλά όχι και τα δύο ταυτόχρονα χωρίς να επηρεάζεται η ποιότητα των αποτελεσμάτων.[6]

Βιολογία συστημάτων[Επεξεργασία | επεξεργασία κώδικα]

Η βιολογία συστημάτων[7] αποτελεί μία συνδυαστική  επιστήμη  που μέσω διαφόρων υπολογιστικών και μαθηματικών μεθόδων, μελετά ολιστικά, πολύπλοκα βιολογικά συστήματα με στόχο μεταξύ άλλων,  την κατανόηση των λειτουργιών των επιμέρους υποσυνόλων ενός συστήματος καθώς και τη μεταξύ τους σχέση ως προς το σύνολο, όπως για παράδειγμα τα μεταβολικά δίκτυα κ.α..  

Time Course Network Enricher (TiCoNE)[Επεξεργασία | επεξεργασία κώδικα]

Μέθοδος ομαδοποίησης επικεντρωμένη σε δεδομένα χρόνου καθώς και ομαδοποίησης δικτύων. Η ομαδοποίηση γίνεται μέσω δημιουργίας αρχικών πρωτότυπων ομάδων (cluster prototype) με βάση μία παράμετρο και στη συνέχεια ακολουθείται ένας επαναλαμβανόμενος αλγόριθμος υπολογισμού πρωτοτύπων και ανακατανομής αντικειμένων. Στον χρήστη προσφέρεται η δυνατότητα να επέμβει με διάφορες ενέργειες όπως ο διαχωρισμός ή η διαγραφή μιας ομάδας κ.τ.λ.. 

Ένα από τα αρκετά διαδεδομένα και χρήσιμα επιπρόσθετα υπο-προγράμματα (plugins)  της πλατφόρμας λογισμικού βιοπληροφορικής για την απεικόνιση και ανάλυση δικτύων μοριακής αλληλεπίδρασης Cytoscape (διατίθεται και αυτόνομη εφαρμογή), αποτελεί το TiCoNE Αρχειοθετήθηκε 2021-03-11 στο Wayback Machine.[8]. To plugin TiCoNE, του οποίου η ονομασία προκύπτει από τη σύμπτυξη του Time Course Network Enricher, αποτελεί ένα εργαλείο για τη συνδυασμένη ανάλυση βιολογικών δικτύων σε συνάρτηση με δεδομένα χρόνου (Time Course). Με το TiCoNE, ο χρήστης έχει τη δυνατότητα να εισαγάγει διάφορα δεδομένα χρόνου-έκφρασης από διαφορετικά δείγματα και να χαρτογραφήσει τα χρονοδιαγράμματα που προκύπτουν πάνω σε γονίδια ή πρωτεΐνες σε ένα επιλεγμένο δίκτυο του Cytoscape. Επιπρόσθετα, παρέχεται η δυνατότητα ο χρήστης να ομαδοποιεί επαναλαμβανόμενα, τα δεδομένα χρόνου για ένα συγκεκριμένο γονίδιο. Παράλληλα, ο χρήστης έχει τη δυνατότητα να συγκρίνει ομάδες γονίδιων με παρεμφερή χρονική συμπεριφορά με στόχο την εύρεση υποδικτύων με γονίδια που εμφανίζουν παρόμοια μοτίβα έκφρασης σε σχέση με τον χρόνο. Το TiCoNE προσφέρει τη δυνατότητα επεξεργασίας των δεδομένων χρόνου που εισάγει ο χρήστης, ενώ είναι δυνατός και ο υπολογισμός σημαντικών στατιστικών παραμέτρων όπως, το ποσοστό σφάλματος (error rate) και η τιμή σημαντικότητας (p-value).  

Το  TiCoNE αποτελεί μια εφαρμογή ομαδοποίησης με δυνατότητα παρέμβασης από τον χρήστη (human-augmented clustering method). Ο χρήστης μπορεί να αξιοποιήσει τo TiCoNE στα περισσότερα βιολογικά μόρια, όπως για παράδειγμα πρωτεΐνες ,RNAs κ.α., καθώς και  στα περισσότερα από τα γνωστά είδη μοριακών δεδομένων από τεχνικές που αφορούν τις αντίστοιχες οντότητες (πρωτεομική κτλ.). Η εφαρμογή προσφέρει τη δυνατότητα για τον διαχωρισμό δεδομένων σε δύο κύριες κατηγορίες,  τα υποκείμενα  της ίδια κατηγορίας που εμφανίζουν ομοιότητες, καθώς και τα υποκείμενα διαφορετικών ομάδων που εμφανίζουν διαφορές, συνήθως με κριτήριο τον χρόνο.  Μετά τη διαδικασία ομαδοποίησης, το TiCoNE προσφέρει πληθώρα δυνατοτήτων στον χρήστη για επεξεργασία και εμπλουτισμό της ομαδοποίησης με μοριακά δίκτυα, με στόχο αναλύσεις ιατρικού-φαρμακευτικού ενδιαφέροντος. Το  TiCoNE βρίσκει εφαρμογή στην εύρεση φαρμακευτικού στόχου με βάση διάφορα χρονικά δίκτυα (temporal networks). Επίσης, αναγνωρίζει μοριακά μονοπάτια (υπό-δίκτυα) που εμφανίζουν ανομοιότητες υπό δύο συνθήκες, όπως για παράδειγμα στην περίπτωση δύο ασθενειών. Τα αποτελέσματα αξιολογούνται με βάση την εμπειρική τιμή σημαντικότητας (p-value).

Αναλυτικότερα, ο χρήστης για να πραγματοποιήσει την ομαδοποίηση μέσω του TiCoNE μπορεί να επιλέξει μεταξύ δύο μεθόδων, της Ευκλείδειας Μετρικής( Euclidean Distance) καθώς και του Δείκτη Συνάφειας Pearson (Pearson correlation coefficient). Η πρώτη μέθοδος χρησιμοποιείται όταν ο χρήστης επιθυμεί να δοθεί έμφαση στο εύρος, ενώ η δεύτερη εστιάζει κυρίως στο σχήμα των δεδομένων χρόνου. Στη συνέχεια, μετά από επεξεργασία των δεδομένων, το TiCoNE δημιουργεί μία αρχική ομαδοποίηση προσφέροντας τη δυνατότητα για χρήση διαφόρων γνωστών μεθόδων ομαδοποίησης ( CLARA[9], k-means[10]  κτλ). Μετά τη δημιουργία  του αρχικού  πρωτοτύπου, το TiCoNE ακολουθεί μια διαδικασία παρεμφερή με τη μέθοδο k-means. Στη συνέχεια, κατηγοριοποιούνται οι βιοχημικές οντότητες με βάση τα δεδομένα χρόνου στο πρωτότυπο με τη μεγαλύτερη ομοιότητα και ακολουθεί η ενημέρωση των πρωτοτύπων. Οι δύο διαδικασίες πραγματοποιούνται εναλλάξ και αυτόματα έως ότου να μην υπάρχουν αλλαγές. Ο χρήστης, και μέσω του οπτικού περιβάλλοντος του προγράμματος, μπορεί να αξιολογήσει και να επέμβει με διάφορους τρόπους στην ομαδοποίηση μετά από κάθε επανάληψη, ώστε τα αποτελέσματα να βρίσκονται πιο κοντά στις ανάγκες του. Κυρίως, προσφέρεται στον χρήστη η δυνατότητα να ομαδοποιήσει πρωτότυπα που εμφανίζουν μεγάλες ομοιότητες ή να διαχωρίσει ομάδες που θεωρεί ότι δεν ανήκουν στο ίδιο σύνολο, ενώ τέλος μπορεί να διαγράφει ομάδες που δεν χρήζουν ενδιαφέροντος. Επιπρόσθετα, μετά το πέρας της ομαδοποίησης, το TiCoNE προσφέρει πολλές μεθόδους εμπλουτισμού του δικτύου βρίσκοντας εφαρμογή σε διάφορα πεδία , όπως η βιολογία συστημάτων. Τέλος, στον ιστότοπο της εφαρμογής Αρχειοθετήθηκε 2021-03-11 στο Wayback Machine. παρατίθενται οδηγοί χρήσης της (tutorials[νεκρός σύνδεσμος]).

CyKEGGParser[Επεξεργασία | επεξεργασία κώδικα]

To CyKEGGParser είναι μια ενσωματωμένη εφαρμογή (plug-in) για το πρόγραμμα Cytoscape. Το συγκεκριμένο plug-in αξιοποιεί τη βάση δεδομένων μονοπατιών (pathway)  KEGG PATHWAY. Ο χρήστης έχει την δυνατότητα να εισαγάγει, να διορθώσει, να επεξεργαστεί και τέλος να οπτικοποιήσει τα μονοπάτια από τη βάση δεδομένων KEGG. Υπάρχουν διάφορες εφαρμογές που αξιοποιούν τη βάση δεδομένων KEGG όπως για παράδειγμα η εφαρμογή KEGGscape. Ωστόσο, καμία από τις διαθέσιμες εφαρμογές δεν αντιμετωπίζει ασυνέπειες στα αρχεία KGML και ούτε διαχειρίζεται τα «κενά»  (abstractions) των μονοπατιών KEGG. Επιπρόσθετα, δύο δυνατότητες ακόμα που κάνουν το CyKEGGParser να ξεχωρίζει σε σχέση με άλλες παρόμοιες εφαρμογές, είναι η ημιαυτόματη διόρθωση (semi-automatic correction) και η βασισμένη στη ρύθμιση ενίσχυση των μονοπατιών (tuning-based enhancement of pathway). Συνεπώς, η εφαρμογή μπορεί να αποτελέσει πολύ χρήσιμο εργαλείο στην βιολογία συστημάτων στο πεδίο της έκφρασης γονιδίων με βάση τα μονοπάτια KEGG[11].

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  1. Shannon, Paul; Markiel, Andrew; Ozier, Owen; Baliga, Nitin S.; Wang, Jonathan T.; Ramage, Daniel; Amin, Nada; Schwikowski, Benno και άλλοι. (2003-11-01). «Cytoscape: a software environment for integrated models of biomolecular interaction networks». Genome Research 13 (11): 2498–2504. doi:10.1101/gr.1239303. ISSN 1088-9051. PMID 14597658. PMC PMC403769. https://www.ncbi.nlm.nih.gov/pubmed/14597658. 
  2. Bell, George W.; Lewitter, Fran (2006-01-01). «Visualizing networks». Methods in Enzymology 411: 408–421. doi:10.1016/S0076-6879(06)11022-8. ISSN 0076-6879. PMID 16939803. https://www.ncbi.nlm.nih.gov/pubmed/16939803. 
  3. Li, Min; Li, Dongyan; Tang, Yu; Wu, Fangxiang; Wang, Jianxin (2017-08-31). «CytoCluster: A Cytoscape Plugin for Cluster Analysis and Visualization of Biological Networks». International Journal of Molecular Sciences 18 (9). doi:10.3390/ijms18091880. ISSN 1422-0067. PMID 28858211. PMC 5618529. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5618529/. 
  4. Rivas, Javier De Las; Fontanillo, Celia (24 Ιουν 2010). «Protein–Protein Interactions Essentials: Key Concepts to Building and Analyzing Interactome Networks» (στα αγγλικά). PLOS Computational Biology 6 (6): e1000807. doi:10.1371/journal.pcbi.1000807. ISSN 1553-7358. PMID 20589078. PMC PMC2891586. https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1000807. 
  5. Mashaghi, A. R.; Ramezanpour, A.; Karimipour, V. (2004-09-01). «Investigation of a protein complex network» (στα αγγλικά). The European Physical Journal B - Condensed Matter and Complex Systems 41 (1): 113–121. doi:10.1140/epjb/e2004-00301-0. ISSN 1434-6036. https://doi.org/10.1140/epjb/e2004-00301-0. 
  6. Malek, Maximilian; Ibragimov, Rashid; Albrecht, Mario; Baumbach, Jan (04 15, 2016). «CytoGEDEVO-global alignment of biological networks with Cytoscape». Bioinformatics (Oxford, England) 32 (8): 1259–1261. doi:10.1093/bioinformatics/btv732. ISSN 1367-4811. PMID 26669930. https://pubmed.ncbi.nlm.nih.gov/26669930/. 
  7. Tavassoly, Iman; Goldfarb, Joseph; Iyengar, Ravi (2018-10-26). «Systems biology primer: the basic methods and approaches» (στα αγγλικά). Essays in Biochemistry 62 (4): 487–500. doi:10.1042/EBC20180003. ISSN 0071-1365. https://portlandpress.com/essaysbiochem/article-abstract/62/4/487/78513/Systems-biology-primer-the-basic-methods-and?redirectedFrom=fulltext. 
  8. Wiwie, Christian; Kuznetsova, Irina; Mostafa, Ahmed; Rauch, Alexander; Haakonsson, Anders; Barrio-Hernandez, Inigo; Blagoev, Blagoy; Mandrup, Susanne και άλλοι. (2019-05). «Time-Resolved Systems Medicine Reveals Viral Infection-Modulating Host Targets» (στα αγγλικά). Systems Medicine 2 (1): 1–9. doi:10.1089/sysm.2018.0013. ISSN 2573-3370. PMID 31119214. PMC PMC6524659. https://www.liebertpub.com/doi/10.1089/sysm.2018.0013. 
  9. «Finding Groups in Data: An Introduction to Cluster Analysis | Wiley». Wiley.com (στα Αγγλικά). Ανακτήθηκε στις 3 Σεπτεμβρίου 2020. 
  10. MacQueen, J. (1967) (στα αγγλικά). Some methods for classification and analysis of multivariate observations. The Regents of the University of California. https://projecteuclid.org/euclid.bsmsp/1200512992. 
  11. Nersisyan, Lilit; Samsonyan, Ruben; Arakelyan, Arsen (2014-08-14). «CyKEGGParser: tailoring KEGG pathways to fit into systems biology analysis workflows» (στα αγγλικά). F1000Research 3: 145. doi:10.12688/f1000research.4410.2. ISSN 2046-1402. PMID 25383185. PMC PMC4215754. https://f1000research.com/articles/3-145/v2.