Οντολογία Γονιδίων: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
NasiaDremp (συζήτηση | συνεισφορές)
NasiaDremp (συζήτηση | συνεισφορές)
Γραμμή 86: Γραμμή 86:
Για την εξασφάλιση και τη συνοχή και την ποιότητα στις πρακτικές εξειδίκευσης των εμπειρογνωμόνων, οι προγραμματιστές βιολογίας της GOC συναντιούνται τακτικά για να συζητήσουν τα ζητήματα επιμέλειας και να συμμετάσχουν σε ασκήσεις που αφορούν το σχολιασμό γονιδίων. Κατά τη διάρκεια αυτών των ασκήσεων, πολλαπλές ομάδες επιμελητών σχολιάζουν ένα ενιαίο έγγραφο, το οποίο οδηγεί σε διευκρινίσεις σχετικά με τη χρήση όρων οντολογίας και κώδικες αποδεικτικών στοιχείων GO και αναπτύσσει βέλτιστες πρακτικές μεταξύ των κατανεμημένων ομάδων σχολιασμού GO. Για παράδειγμα, η διευκρίνιση του τρόπου με τον οποίο τα αποτελέσματα του πειράματος μόλυνσης και λειτουργικής συμπλήρωσης θα μπορούσαν να σημειωθούν, εξασφαλίζουν ότι η πληροφορία βασίζεται σε λειτουργικές γενετικές αλληλεπιδράσεις έναντι του φαινοτύπου, καταγράφεται σαφώς στη βάση δεδομένων GO.
Για την εξασφάλιση και τη συνοχή και την ποιότητα στις πρακτικές εξειδίκευσης των εμπειρογνωμόνων, οι προγραμματιστές βιολογίας της GOC συναντιούνται τακτικά για να συζητήσουν τα ζητήματα επιμέλειας και να συμμετάσχουν σε ασκήσεις που αφορούν το σχολιασμό γονιδίων. Κατά τη διάρκεια αυτών των ασκήσεων, πολλαπλές ομάδες επιμελητών σχολιάζουν ένα ενιαίο έγγραφο, το οποίο οδηγεί σε διευκρινίσεις σχετικά με τη χρήση όρων οντολογίας και κώδικες αποδεικτικών στοιχείων GO και αναπτύσσει βέλτιστες πρακτικές μεταξύ των κατανεμημένων ομάδων σχολιασμού GO. Για παράδειγμα, η διευκρίνιση του τρόπου με τον οποίο τα αποτελέσματα του πειράματος μόλυνσης και λειτουργικής συμπλήρωσης θα μπορούσαν να σημειωθούν, εξασφαλίζουν ότι η πληροφορία βασίζεται σε λειτουργικές γενετικές αλληλεπιδράσεις έναντι του φαινοτύπου, καταγράφεται σαφώς στη βάση δεδομένων GO.


Μέχρι πρόσφατα τα microRNAs σχολιάστηκαν στο GO επειδή η ρύθμιση των μικροοργανισμών των αναπτυξιακών και κυτταρικών διεργασιών ήταν ένα νέο πεδίο μελέτης. Συνεπώς, οι ερευνητές έπρεπε να βασίζονται στους λειτουργικούς σχολιασμούς των microRNA-στόχων ως υποκατάστατο, διότι δεν υπήρχε άμεσος σχολιασμός των ίδιων των microRNAs. Σε διαβούλευση με τους εμπειρογνώμονες στον τομέα της έρευνας microRNA, δόθηκε σημαντική προσπάθεια για την αποκατάσταση αυτής της κατάστασης. Δημιουργήσαμε οδηγίες σχολιασμού για σχολιασμό microRNA και ακολουθώντας αυτές τις οδηγίες, δημιουργήσαμε σχολιασμούς για πάνω από 300 ανθρώπινα microRNAs, 70 στο Drosophila melanogaster, και σχεδόν 200 στο ''Arabidopsis thaliana''.
Μέχρι πρόσφατα τα microRNAs σχολιάστηκαν<ref>{{Cite journal|title=Guidelines for the functional annotation of microRNAs using the Gene Ontology|url=http://dx.doi.org/10.1261/rna.055301.115|journal=RNA|date=2016-02-25|issn=1355-8382|pages=667–676|volume=22|issue=5|doi=10.1261/rna.055301.115|first=Rachael P.|last=Huntley|first2=Dmitry|last2=Sitnikov|first3=Marija|last3=Orlic-Milacic|first4=Rama|last4=Balakrishnan|first5=Peter|last5=D'Eustachio|first6=Marc E.|last6=Gillespie|first7=Doug|last7=Howe|first8=Anastasia Z.|last8=Kalea|first9=Lars|last9=Maegdefessel}}</ref> στο GO επειδή η ρύθμιση των μικροοργανισμών των αναπτυξιακών και κυτταρικών διεργασιών ήταν ένα νέο πεδίο μελέτης. Συνεπώς, οι ερευνητές έπρεπε να βασίζονται στους λειτουργικούς σχολιασμούς των microRNA-στόχων ως υποκατάστατο, διότι δεν υπήρχε άμεσος σχολιασμός των ίδιων των microRNAs. Σε διαβούλευση με τους εμπειρογνώμονες στον τομέα της έρευνας microRNA, δόθηκε σημαντική προσπάθεια για την αποκατάσταση αυτής της κατάστασης. Δημιουργήσαμε οδηγίες σχολιασμού για σχολιασμό microRNA και ακολουθώντας αυτές τις οδηγίες, δημιουργήσαμε σχολιασμούς για πάνω από 300 ανθρώπινα microRNAs, 70 στο Drosophila melanogaster, και σχεδόν 200 στο ''Arabidopsis thaliana''.


Οι σχολιασμοί δέσμευσης πρωτεϊνών είναι χρήσιμοι μόνο αν περιλαμβάνουν τον συγκεκριμένο δεσμευτή πρωτεϊνών. Με την προσθήκη της βάσης δεδομένων IntAct (10) ως φορέα σχολιασμού GO, ο αριθμός των συγκεκριμένων σχολιασμών δέσμευσης πρωτεϊνών έχει αυξηθεί δραματικά. Μόνο οι σχολιασμοί υψηλής πιστότητας ενσωματώνονται στο GO από το IntAct. Σε συνδυασμό με σχολιασμούς από πειράματα μικρής κλίμακας που έχουν συμβάλει στην GO από πολλούς διαφορετικούς παρόχους σχολιασμού, οι σχολιασμοί IntAct βοηθούν να καταστεί η βάση γνώσεων του GO ένας χρήσιμος πόρος για δεδομένα δικτύου αλληλεπίδρασης πρωτεϊνών υψηλής εμπιστοσύνης.
Οι σχολιασμοί δέσμευσης πρωτεϊνών είναι χρήσιμοι μόνο αν περιλαμβάνουν τον συγκεκριμένο δεσμευτή πρωτεϊνών. Με την προσθήκη της βάσης δεδομένων IntAct <ref>{{Cite journal|title=The complex portal - an encyclopaedia of macromolecular complexes|url=http://dx.doi.org/10.1093/nar/gku975|journal=Nucleic Acids Research|date=2014-10-13|issn=1362-4962|pages=D479–D484|volume=43|issue=D1|doi=10.1093/nar/gku975|first=Birgit H.M.|last=Meldal|first2=Oscar|last2=Forner-Martinez|first3=Maria C.|last3=Costanzo|first4=Jose|last4=Dana|first5=Janos|last5=Demeter|first6=Marine|last6=Dumousseau|first7=Selina S.|last7=Dwight|first8=Anna|last8=Gaulton|first9=Luana|last9=Licata}}</ref> ως φορέα σχολιασμού GO, ο αριθμός των συγκεκριμένων σχολιασμών δέσμευσης πρωτεϊνών έχει αυξηθεί δραματικά. Μόνο οι σχολιασμοί υψηλής πιστότητας ενσωματώνονται στο GO από το IntAct. Σε συνδυασμό με σχολιασμούς από πειράματα μικρής κλίμακας που έχουν συμβάλει στην GO από πολλούς διαφορετικούς παρόχους σχολιασμού, οι σχολιασμοί IntAct βοηθούν να καταστεί η βάση γνώσεων του GO ένας χρήσιμος πόρος για δεδομένα δικτύου αλληλεπίδρασης πρωτεϊνών υψηλής εμπιστοσύνης.


Επιπροσθέτως για τη δημιουργία δικτύων αλληλεπίδρασης πρωτεϊνών, οι χρήστες πρέπει να χρησιμοποιήσουν το πεδίο 'with' των Αρχείων Σύνδεσης GO (GAF), το οποίο περιέχει το αναγνωριστικό του δεσμευτή αλληλεπίδρασης. Ζητούμε από τους χρήστες να γνωρίζουν τους σχολιασμούς που δηλώνουν ότι μια συγκεκριμένη γκάμα έχει αποκτήσει τη λειτουργία Η απαρίθμηση NOT γενικά δημιουργείται όταν ένα γονιδιακό προϊόν με συγκεκριμένη περιοχή ή ένωση γονιδιακής οικογένειας αναμένεται ότι έχει κάποια δραστηριότητα, αλλά όπου υπάρχουν ρητά πειραματικά δεδομένα δείχνει ότι το γονιδιακό προϊόν ΔΕΝ έχει αυτή τη δραστηριότητα .Οι σχολιασμοί είναι σχετικά σπάνιοι βάση των γνώσεων (επί του παρόντος υπάρχουν περίπου 3300 από αυτές, βασισμένες σε πειραματικά δεδομένα ). Ωστόσο, πιστεύεται ότι μπορεί να είναι ιδιαίτερα χρήσιμες σε ορισμένες εφαρμογές, όπως η αξιολόγηση της λειτουργικότητας της ακρίβειας της διαδικασίας. Οι σχολιασμοί αυτοί έχουν τον χαρακτηρισμό «ΟΧΙ» στο πεδίο προσδιορισμού GAF.
Επιπροσθέτως για τη δημιουργία δικτύων αλληλεπίδρασης πρωτεϊνών, οι χρήστες πρέπει να χρησιμοποιήσουν το πεδίο 'with' των Αρχείων Σύνδεσης GO (GAF), το οποίο περιέχει το αναγνωριστικό του δεσμευτή αλληλεπίδρασης. Ζητούμε από τους χρήστες να γνωρίζουν τους σχολιασμούς που δηλώνουν ότι μια συγκεκριμένη γκάμα έχει αποκτήσει τη λειτουργία Η απαρίθμηση NOT γενικά δημιουργείται όταν ένα γονιδιακό προϊόν με συγκεκριμένη περιοχή ή ένωση γονιδιακής οικογένειας αναμένεται ότι έχει κάποια δραστηριότητα, αλλά όπου υπάρχουν ρητά πειραματικά δεδομένα δείχνει ότι το γονιδιακό προϊόν ΔΕΝ έχει αυτή τη δραστηριότητα .Οι σχολιασμοί είναι σχετικά σπάνιοι βάση των γνώσεων (επί του παρόντος υπάρχουν περίπου 3300 από αυτές, βασισμένες σε πειραματικά δεδομένα ). Ωστόσο, πιστεύεται ότι μπορεί να είναι ιδιαίτερα χρήσιμες σε ορισμένες εφαρμογές, όπως η αξιολόγηση της λειτουργικότητας της ακρίβειας της διαδικασίας. Οι σχολιασμοί αυτοί έχουν τον χαρακτηρισμό «ΟΧΙ» στο πεδίο προσδιορισμού GAF.
Γραμμή 94: Γραμμή 94:
'''Φυλογενετικοί υποστηριζόμενοι σχολιασμοί:'''
'''Φυλογενετικοί υποστηριζόμενοι σχολιασμοί:'''


Οι Φυλογενετικές αρχές, αναδημιουργώντας εξελικτικά γεγονότα για να συναγάγουν σχέσεις μεταξύ των γονιδίων, παρέχουν έναν ισχυρό τρόπο απόκτηση γνώσεων σχετικά με τη γονιδιακή λειτουργία. Εν συντομία, αναπτύχθηκε λογισμικό (PAINT, Φυλογενετικό Εργαλείο Σχολιασμού Συμπερασμάτων) με το οποίο ένας προγραμματιστής βιολογικών δεδομένων μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να χρησιμοποιήσει αυτές τις πληροφορίες για να συναγάγει σχολιασμούς για μη χαρακτηρισμένα μέλη της οικογένειας.Ο προγραμματιστής βιολόγος έπειτα δημιουργεί ένα σαφές μοντέλο κέρδους και απώλειας γονιδιακής λειτουργίας σε συγκεκριμένους κλάδους σε ένα φυλογενετικό δέντρο της οικογένειας. Αυτό το πρότυπο χρησιμοποιείται για να συναχθούν νέοι σχολιασμοί (δεν υπάρχει αλληλεπικάλυψη με πειραματικούς σχολιασμούς) για γονίδια στην οικογένεια.
Οι Φυλογενετικές αρχές, αναδημιουργώντας εξελικτικά γεγονότα για να συναγάγουν σχέσεις μεταξύ των γονιδίων<ref>{{Cite journal|title=The Gene Ontology's Reference Genome Project: A Unified Framework for Functional Annotation across Species|url=http://dx.doi.org/10.1371/journal.pcbi.1000431|journal=PLoS Computational Biology|date=2009-07-03|issn=1553-7358|pages=e1000431|volume=5|issue=7|doi=10.1371/journal.pcbi.1000431}}</ref>, παρέχουν έναν ισχυρό τρόπο απόκτηση γνώσεων σχετικά με τη γονιδιακή λειτουργία. Εν συντομία, αναπτύχθηκε λογισμικό (PAINT, Φυλογενετικό Εργαλείο Σχολιασμού Συμπερασμάτων) με το οποίο ένας προγραμματιστής βιολογικών δεδομένων μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να χρησιμοποιήσει αυτές τις πληροφορίες για να συναγάγει σχολιασμούς για μη χαρακτηρισμένα μέλη της οικογένειας<ref>{{Cite journal|title=Phylogenetic-based propagation of functional annotations within the Gene Ontology consortium|url=http://dx.doi.org/10.1093/bib/bbr042|journal=Briefings in Bioinformatics|date=2011-08-27|issn=1467-5463|pages=449–462|volume=12|issue=5|doi=10.1093/bib/bbr042|first=P.|last=Gaudet|first2=M. S.|last2=Livstone|first3=S. E.|last3=Lewis|first4=P. D.|last4=Thomas}}</ref>.Ο προγραμματιστής βιολόγος έπειτα δημιουργεί ένα σαφές μοντέλο κέρδους και απώλειας γονιδιακής λειτουργίας σε συγκεκριμένους κλάδους σε ένα φυλογενετικό δέντρο της οικογένειας. Αυτό το πρότυπο χρησιμοποιείται για να συναχθούν νέοι σχολιασμοί (δεν υπάρχει αλληλεπικάλυψη με πειραματικούς σχολιασμούς) για γονίδια στην οικογένεια.


Φυλογενετικοί σχολιασμοί σημειώνονται από τους κώδικες αποδεικτικών στοιχείων IBA (Inferred from Biological Ancestry). Κάθε συνήθης σχολιασμός μπορεί να εντοπιστεί στους άμεσους πειραματικούς σχολιασμούς που χρησιμοποιήθηκαν ως βάση για αυτόν τον ισχυρισμό. Το πρόγραμμα Phylogenetic Commenting GO είναι πλέον η μεγαλύτερη πηγή χειρωνακτικά σχολιασμένων παρατηρήσεων στη βάση δεδομένων GO και έχει αυξήσει σημαντικά τον αριθμό σχολιασμών ακόμη και σε οργανισμούς που έχουν μελετηθεί καλά πειραματικά .
Φυλογενετικοί σχολιασμοί σημειώνονται από τους κώδικες αποδεικτικών στοιχείων IBA (Inferred from Biological Ancestry). Κάθε συνήθης σχολιασμός μπορεί να εντοπιστεί στους άμεσους πειραματικούς σχολιασμούς που χρησιμοποιήθηκαν ως βάση για αυτόν τον ισχυρισμό. Το πρόγραμμα Phylogenetic Commenting GO είναι πλέον η μεγαλύτερη πηγή χειρωνακτικά σχολιασμένων παρατηρήσεων στη βάση δεδομένων GO και έχει αυξήσει σημαντικά τον αριθμό σχολιασμών ακόμη και σε οργανισμούς που έχουν μελετηθεί καλά πειραματικά .
Γραμμή 100: Γραμμή 100:
'''Υπολογιστικοί υποστηριζόμενοι σχολιασμοί:'''
'''Υπολογιστικοί υποστηριζόμενοι σχολιασμοί:'''


Τέλος, αυτά που απομακρύνονται από τα άμεσα πειραματικά ευρήματα, αποτελούν τους ηλεκτρονικούς κώδικες αποδεικτικών στοιχείων (IEA), οι οποίοι δεν εξετάζονται μεμονωμένα (αν και γενικά υπάρχει εκτεταμένη χειρωνακτική ανασκόπηση ενός δείγματος). Οι σχολιασμοί που υποστηρίζονται από τον IEA βασίζονται τελικά είτε στην ομολογία είτε / και σε άλλες πειραματικές πληροφορίες ή πληροφορίες αλληλουχίας, αλλά γενικά δεν μπορούν να ανιχνευθούν στην πειραματική πηγή. Τρεις μέθοδοι αποτελούν το μεγαλύτερο μέρος αυτών των σχολιασμών. Η πρώτη και πιο ολοκληρωμένη μέθοδος είναι η InterPro2GO , η οποία βασίζεται στην επιμελημένη συσχέτιση ενός όρου GO με ένα γενικευμένο μοντέλο αλληλουχίας («χαρακτηριστική υπογραφή») μιας ομάδας ομόλογων πρωτεϊνών. Οι αλληλουχίες πρωτεϊνών με στατιστικά σημαντική αντιστοιχία με σε μια υπογραφή ανατίθενται οι όροι GO που σχετίζονται με την υπογραφή, μια μορφή ομολογίας. Μια δεύτερη μέθοδος είναι η υπολογιστική μετατροπή των ελεγχόμενων όρων της ''Uni Prot'' (κυρίως οι αριθμοί της ενζυμικής ομάδας που περιγράφουν τις ενζυμικές δραστηριότητες και οι λέξεις-κλειδιά UniProt που περιγράφουν τις υποκυτταρικές θέσεις), στους σχετικούς όρους GO. Τέλος, οι σχολιασμοί γίνονται με βάση τα ορθόλογα 1:1 που συνάγονται από τα γονιδιακά δέντρα, μια προσέγγιση που μεταφέρει αυτόματα τις παρατηρήσεις που βρέθηκαν πειραματικά σε ένα γονίδιο, σε ορθόλογα 1:1 στην ίδια ταξινομική κατηγορία.
Τέλος, αυτά που απομακρύνονται από τα άμεσα πειραματικά ευρήματα, αποτελούν τους ηλεκτρονικούς κώδικες αποδεικτικών στοιχείων (IEA), οι οποίοι δεν εξετάζονται μεμονωμένα (αν και γενικά υπάρχει εκτεταμένη χειρωνακτική ανασκόπηση ενός δείγματος). Οι σχολιασμοί που υποστηρίζονται από τον IEA βασίζονται τελικά είτε στην ομολογία είτε / και σε άλλες πειραματικές πληροφορίες ή πληροφορίες αλληλουχίας, αλλά γενικά δεν μπορούν να ανιχνευθούν στην πειραματική πηγή. Τρεις μέθοδοι αποτελούν το μεγαλύτερο μέρος αυτών των σχολιασμών. Η πρώτη και πιο ολοκληρωμένη μέθοδος είναι η InterPro2GO<ref>{{Cite journal|title=The InterPro protein families database: the classification resource after 15 years|url=http://dx.doi.org/10.1093/nar/gku1243|journal=Nucleic Acids Research|date=2014-11-26|issn=1362-4962|pages=D213–D221|volume=43|issue=D1|doi=10.1093/nar/gku1243|first=Alex|last=Mitchell|first2=Hsin-Yu|last2=Chang|first3=Louise|last3=Daugherty|first4=Matthew|last4=Fraser|first5=Sarah|last5=Hunter|first6=Rodrigo|last6=Lopez|first7=Craig|last7=McAnulla|first8=Conor|last8=McMenamin|first9=Gift|last9=Nuka}}</ref> , η οποία βασίζεται στην επιμελημένη συσχέτιση ενός όρου GO με ένα γενικευμένο μοντέλο αλληλουχίας («χαρακτηριστική υπογραφή») μιας ομάδας ομόλογων πρωτεϊνών. Οι αλληλουχίες πρωτεϊνών με στατιστικά σημαντική αντιστοιχία με σε μια υπογραφή ανατίθενται οι όροι GO που σχετίζονται με την υπογραφή, μια μορφή ομολογίας. Μια δεύτερη μέθοδος είναι η υπολογιστική μετατροπή των ελεγχόμενων όρων της ''Uni Prot'' (κυρίως οι αριθμοί της ενζυμικής ομάδας που περιγράφουν τις ενζυμικές δραστηριότητες και οι λέξεις-κλειδιά UniProt που περιγράφουν τις υποκυτταρικές θέσεις), στους σχετικούς όρους GO. Τέλος, οι σχολιασμοί γίνονται με βάση τα ορθόλογα 1:1 που συνάγονται από τα γονιδιακά δέντρα, μια προσέγγιση που μεταφέρει αυτόματα τις παρατηρήσεις που βρέθηκαν πειραματικά σε ένα γονίδιο, σε ορθόλογα 1:1 στην ίδια ταξινομική κατηγορία.


'''Από σχολιασμούς (annotations) στα Βιολογικά Μοντέλα (LEGO):'''
'''Από σχολιασμούς (annotations) στα Βιολογικά Μοντέλα (LEGO):'''
Γραμμή 106: Γραμμή 106:
Η δομή των σχολιασμών GO είναι  αρκετά απλή, μια κατάσταση  που αποτελείται από ένα γονίδιο και έναν όρο GO (με τα αποδεικτικά στοιχεία αυτής της σύνδεσης, όπως περιγράφεται παραπάνω).
Η δομή των σχολιασμών GO είναι  αρκετά απλή, μια κατάσταση  που αποτελείται από ένα γονίδιο και έναν όρο GO (με τα αποδεικτικά στοιχεία αυτής της σύνδεσης, όπως περιγράφεται παραπάνω).


Επειδή η γονιδιακή λειτουργία είναι περίπλοκη και σχετίζεται με μεγαλύτερα συστήματα και βιολογικά «προγράμματα» που εκτελούνται από πολλαπλά γονίδια, ένας τυπικός σχολιασμός GO αντιπροσωπεύει δικαίως μια απλή πτυχή αυτής της λειτουργίας. Προηγουμένως αναφέραμε μια απλή επέκταση στο μοντέλο σχολιασμού GO, που ονομάζεται «επέκταση σχολιασμού»  η οποία επιτρέπει στους βιολογικούς προγραμματιστές να καταγράψουν πρόσθετες πληροφορίες χρησιμοποιώντας καθορισμένες σχέσεις και οντότητες ώστε να τροποποιήσουν τον επιλεγμένο όρο GO.Ωστόσο, προκειμένου να καταστεί δυνατή μια πιο ολοκληρωμένη και ακριβής αναφορά σχετικά με τη λειτουργία των γονιδίων και τον τρόπο με τον οποίο τα πολλαπλά γονίδια μπορεί να λειτουργήσουν μαζί, έχουμε αναπτύξει μια «γραμματικό κώδικα» για να συνδυαστούν παραδοσιακοί σχολιασμοί GO σε μια ακόμα πλήρως ολοκληρωμένη αναπαράσταση της σχέσης γονιδιακών λειτουργιών μεταξύ τους και σε μεγαλύτερες βιολογικές διεργασίες. Το ονομάζουμε αυτό νέες μορφοποιημένες εκφράσεις χρησιμοποιώντας τη γονιδιακή οντολογία ή το LEGO. Μια αρχική ανακοίνωση μπορεί να βρεθεί στην ηλεκτρονική διεύθυνση ''http://geneontology.org/article/gaf-gpad-and-lego''
Επειδή η γονιδιακή λειτουργία είναι περίπλοκη και σχετίζεται με μεγαλύτερα συστήματα και βιολογικά «προγράμματα» που εκτελούνται από πολλαπλά γονίδια, ένας τυπικός σχολιασμός GO αντιπροσωπεύει δικαίως μια απλή πτυχή αυτής της λειτουργίας. Προηγουμένως αναφέραμε μια απλή επέκταση<ref>{{Cite journal|title=Control of Mitotic Exit in Budding Yeast|url=http://dx.doi.org/10.1074/jbc.m202540200|journal=Journal of Biological Chemistry|date=2002-06-04|issn=0021-9258|pages=28439–28445|volume=277|issue=32|doi=10.1074/jbc.m202540200|first=Marco|last=Geymonat|first2=Ad|last2=Spanos|first3=Susan J. M.|last3=Smith|first4=Edward|last4=Wheatley|first5=Katrin|last5=Rittinger|first6=Leland H.|last6=Johnston|first7=Steven G.|last7=Sedgwick}}</ref> στο μοντέλο σχολιασμού GO, που ονομάζεται «επέκταση σχολιασμού»  η οποία επιτρέπει στους βιολογικούς προγραμματιστές να καταγράψουν πρόσθετες πληροφορίες χρησιμοποιώντας καθορισμένες σχέσεις και οντότητες ώστε να τροποποιήσουν τον επιλεγμένο όρο GO.Ωστόσο, προκειμένου να καταστεί δυνατή μια πιο ολοκληρωμένη και ακριβής αναφορά σχετικά με τη λειτουργία των γονιδίων και τον τρόπο με τον οποίο τα πολλαπλά γονίδια μπορεί να λειτουργήσουν μαζί, έχουμε αναπτύξει μια «γραμματικό κώδικα» για να συνδυαστούν παραδοσιακοί σχολιασμοί GO σε μια ακόμα πλήρως ολοκληρωμένη αναπαράσταση της σχέσης γονιδιακών λειτουργιών μεταξύ τους και σε μεγαλύτερες βιολογικές διεργασίες. Το ονομάζουμε αυτό νέες μορφοποιημένες εκφράσεις χρησιμοποιώντας τη γονιδιακή οντολογία ή το LEGO. Μια αρχική ανακοίνωση μπορεί να βρεθεί στην ηλεκτρονική διεύθυνση ''http://geneontology.org/article/gaf-gpad-and-lego''


Ο τυποποιημένος όρος LEGO , εν συντομία, ορίζει πόσο διαφορετικοί είναι οι σχολιασμοί GO και τον τρόπο που μπορούν να συνδυαστούν σε ένα μεγαλύτερο 'μοντέλο' γονιδίου και συστήματος. Ένα απλό παράδειγμα εμφανίζεται στο “Σχήμα 2”. Είναι σημαντικό ότι το μοντέλο μπορεί και  αποσυντίθενται υπολογιστικά σε σχολιασμούς(annotations) GO, έτσι ώστε όλες οι τρέχουσες εφαρμογές σχολιασμών GO, όπως η ανάλυση εμπλουτισμού,να εξακολουθήσουν να υποστηρίζονται. Εντούτοις, ενθαρρύνουμε τους προγραμματιστές των εργαλείων ανάλυσης με βάση το δίκτυο να κατεβάσουν τη γνήσιο πρόγραμμα του OWL (Ontology Language Web) για κάθε μοντέλο LEGO το οποίο καθορίζει πώς συνδέονται οι λειτουργίες των διαφόρων γονιδιακών προϊόντων δικτύων. Οι χρήστες ενδέχεται επίσης να ενδιαφέρονται για την περιήγηση και την προβολή δημοσιευμένων μοντέλων, τα οποία διατίθενται στην ηλεκτρονική διεύθυνση: ''http://noctua.berkeleybop.org''
Ο τυποποιημένος όρος LEGO , εν συντομία, ορίζει πόσο διαφορετικοί είναι οι σχολιασμοί GO και τον τρόπο που μπορούν να συνδυαστούν σε ένα μεγαλύτερο 'μοντέλο' γονιδίου και συστήματος. Ένα απλό παράδειγμα εμφανίζεται στο “Σχήμα 2”. Είναι σημαντικό ότι το μοντέλο μπορεί και  αποσυντίθενται υπολογιστικά σε σχολιασμούς(annotations) GO, έτσι ώστε όλες οι τρέχουσες εφαρμογές σχολιασμών GO, όπως η ανάλυση εμπλουτισμού,να εξακολουθήσουν να υποστηρίζονται. Εντούτοις, ενθαρρύνουμε τους προγραμματιστές των εργαλείων ανάλυσης με βάση το δίκτυο να κατεβάσουν τη γνήσιο πρόγραμμα του OWL (Ontology Language Web) για κάθε μοντέλο LEGO το οποίο καθορίζει πώς συνδέονται οι λειτουργίες των διαφόρων γονιδιακών προϊόντων δικτύων. Οι χρήστες ενδέχεται επίσης να ενδιαφέρονται για την περιήγηση και την προβολή δημοσιευμένων μοντέλων, τα οποία διατίθενται στην ηλεκτρονική διεύθυνση: ''http://noctua.berkeleybop.org''
Γραμμή 117: Γραμμή 117:


== References ==
== References ==
<references />

Έκδοση από την 16:40, 22 Ιουλίου 2019


Οντολογία Γονιδίων (Gene Ontology-GO)

Εισαγωγικά Στοιχεία:

Ιστορικά Στοιχεία:

Gene Ontology

Η Οντολογία Γονιδίων (Gene Ontology) περιλαμβάνει τους όρους (GO terms/GO concept/GO classes) που χρησιμοποιούνται για τον ορισμό των λειτουργιών των γονιδίων (“gene function”) και την περιγραφή του τρόπου με τον οποίο συσχετίζονται οι λειτουργίες αυτές (“relations”).[1] Πρόκειται για ένα κωδικοποιημένο λεξιλόγιο που δημιουργείται για να αποδώσει τη βιολογική πληροφορία με ένα δομημένο τρόπο.[1][2]

Όροι (Terms)

Κάθε όρος έχει ένα όνομα και μια GO ταυτότητα (ένας 7ψηφιος κωδικός από αριθμούς που ξεκινά πάντα με “GO:”). Δίνονται πληροφορίες για την οντολογία στην οποία ανήκουν και ένα μικρό κείμενο που περιγράφει τι αφορά ο όρος με τη σχετική βιβλιογραφία και σχέσεις με άλλους όρους. Επίσης, μπορεί να δίνονται προαιρετικά, στοιχεία για εναλλακτικέςταυτότητες όταν προκύπτουν ταυτόσημοι όροι, συνόνυμα και αν αυτά είναι ακριβή, σχετικά, περιέχουν ή περιέχονται στον αρχικό όρο, αναφορές από άλλες βάσεις για παρόμοια στοιχεία, σχόλια, την οντολογία της GO στην οποία ανήκουν και να πρόκειται για όρο που έχει αφαιρεθεί (“Obsolete” tag).[3][4]

Όροι που συσχετίζονται μπορούν να αναπαρασταθούν ως ένας γράφος[2],όπου όροι είναι οι κόμβοι και οι σχέσεις μεταξύ τους αναπαρίστανται με κατευθυνόμενες ακμές. Κάθε κόμβος μπορεί να συνδέεται με πολλούς υψηλότερους σε ιεραρχία («γονικούς») κόμβους και αντίστοιχα με πολλούς χαμηλότερης ιεραρχίας και προκύπτει τελικά μια ιδιαίτερα πολύπλοκη και όχι μια απλή ιεραρχική δομή. (Εικόνα 1).[5]

** ΕΙΚΟΝΑ 1 **

Αξιώματα (Axioms)

Τα αξιώματα χρησιμοποιούνται για τον ορισμό των σχέσεων μεταξύ των κατηγοριών μιας οντολογίας. Βοηθούν στην διατήρηση μιας πολύπλοκης λογικής δομής και συνέπειας στην GO καθώς χρησιμοποιούνται για τον ορισμό νέων όρων και τον έλεγχο για τις σχέσεις τους με άλλους όρους της Οντολογίας. Υπάρχουν επίσης αξιώματα για να συνδέουν την GO με άλλες εξωτερικές οντολογίες ΟΒΟ (Open Biomedical Ontologies).

Κάποιες απο αυτές είναι: η ΟΒΟ (Open Biomedical Ontology), CHEBI (χημικά), CL (κυτταρικοί τύποι), PO (ανατομία φυτών), PR (πρωτεΐνες), UBERON (ανατομία ζώων), FAO (Οντολογία Ανατομίας Μυκήτων) κλπ.[1]

Αναπαράσταση Σχέσεων μεταξύ των Όρων

Οι βασικές συμβάσεις που χρησιμοποιούνται για την περιγραφή των σχέσεων είναi:

  1. Οι κόμβοι αναπαριστούν όρους.
  2. Οι «γονικοί κόμβοι» είναι κόμβοι πιο κοντά στη βάση του γράφου και οι πιο εξειδικευμένοι κόμβοι που υπάρχουν τοποθετούνται προς την κορυφή του  γράφου.
  3.  Η κορυφή του βέλους δείχνει την κατεύθυνση της σχέσης
  4.  Διακεκομμένες γραμμές δείχνουν πως η σχέση προέκυψε από τα δεδομένα αλλά δεν έχει καταχωρηθεί στην οντολογία.


Οι βασικές σχέσεις ανάμεσα σε δύο τυχαίους όρους Α, Β είναι:

  1. «είναι» (“is a”): Αν ο όρος A είναι Β (“A is B”) σημαίνει πως ο όρος Α είναι ένας υπότυπος του Β, πχ η δράση οξειδάσης είναι μια καταλυτική δράση.
  2. «ανήκει» (“part of”): Αν ο όρος Α ανήκει στο Β (“Α part of Β”) σημαίνει πως ο Α όρος υπάρχει, είναι μέρος του Β και εφόσον υπάρχει ο Α θα υπάρχει και ο Β. Ενώ αν υπάρχει ο Β δεν θα υπάρχει απαραίτητα και ο Α.
  3. «περιέχει» (“has part”): Αν ο όρος Α περιέχει τον όρο Β (“A has part B”) σημαίνει πως ο Α περιέχει το Β και αν ο Α υπάρχει θα υπάρχει απαραίτητα και ο Β ενώ δεν ισχύει το αντίστροφο με βεβαιότητα.
  4. «ρυθμίζει» (“regulates”): Η σχέση αυτή αναφέρεται σε διαδικασίες Α, Β όπου αν η Α ρυθμίζει την Β (“A regulates B”) τότε σημαίνει πως αν συμβαίνουν και οι 2 διαδικασίες η Α πάντα θα ρυθμίζει την Β αλλά η Β δεν θα ρυθμίζεται πάντα αποκλειστικά από την Α. Η διαδιακασία –στόχος μπορεί να είναι ένα μονοπάτι, μια τιμή pH ή και ένα μέγεθος.


Λειτουργία Γονιδίων (Gene Function)

Η Οντολογία Γονιδίων αναφέρεται στη «λειτουργία γονιδίων» δεδομένου ότι τα γονίδια είναι η μοναδική πηγή πληροφορίας για τις διαδικασίες που λαμβάνουν χώρα σε μοριακό και κυτταρικό επίπεδο, αλλά με τη φράση αυτή εννοείται η λειτουργία που εκτελούν τα προϊόντα που κωδικοποιούνται από τα αναφερόμενα γονιδία (πρωτεϊνες ή μη κωδικά RNA) και όχι τα γονίδια αυτά καθ’ αυτά.[5]

Για την περιγραφή της ακολουθεί το πρότυπο της μοριακής βιολογίας («molecular biology paradigm»), σύμφωνα με το οποίο, το γονίδιο κωδικοποιεί ένα γονιδιακό προϊόν που εκτελεί μια λειτουργία σε μοριακό επίπεδο (μοριακή λειτουργία), σε μια συγκεκριμένη θέση του κυττάρου (cellular component), συνεισφέροντας τελικά σε ένα γενικότερο βιολογικό σκοπό (biological process) που περιλαμβάνει πολλές διαδικασίες μοριακού επιπέδου (Εικόνα 2).[3]

** ΕΙΚΟΝΑ 2 **

Γι αυτό, η λειτουργία των γονιδίων προσεγγίζεται σε 3 επίπεδα:

α. Μοριακή λειτουργία (Molecular Function)

β. Συστατικό του Κυττάρου (Cellular Component)

γ. Βιολογική διαδικασία (Biological Process)


Μοριακή λειτουργία (Molecular Function):

Η διαδικασία που εκτελεί ένα μακρομόριο μέσω φυσικών αλληλεπιδράσεων με άλλες μοριακές οντότητες. Σχετίζεται με τη βιοχημεία (πρόσδεση ή κατάλυση μιας αντίδρασης) ή αναφέρεται στο γενικό ρόλο του μορίου ως μέρος ενός ευρύτερου συστήματος ή διαδικασίας. (πχ. Πρωτεΐνες-υποδοχείς).5

Συστατικό του Κυττάρου (Cellular Component):

Η θέση στο κύτταρο όπου εντοπίζεται  ένα μακρομόριο που εκτελεί μια συγκεκριμένη μοριακή λειτουργία. Πιθανές θέσεις είναι είτε κοντά σε κυτταρικές δομές (πχ. Πλασματική μεμβράνη) ή κυτταρικά διαμερίσματα (πχ. μιτοχόνδρια), είτε τα σταθερά μακρομοριακά σύμπλοκα στα οποία συμμετέχουν (πχ. ριβοσώματα). 5

Βιολογική διαδικασία (Biological Process):

Είναι οι σημαντικές, γενετικά προγραμματισμένες λειτουργίες του οργανισμού που τις καθορίζει το αποτέλεσμα που επιφέρουν (πχ, κυτταρική διαίρεση). Η διεξαγωγή καθεμιάς από αυτές απαιτεί την πραγματοποίηση πολλών μοριακών διαδικασιών που υπόκεινται σε αυστηρό έλεγχο και χρονική διευθέτηση. Τα γονιδιακά προϊόντα μπορεί να συμμετέχουν άμεσα στη διαδικασία ή να την επηρεάζουν έμμεσα μέσω ελέγχου ή συμμετοχής σε άλλη προαπαιτούμενη διαδικασία. [5]

Κάθε μια από αυτές τις κατηγορίες αποτελεί μια διαφορετική οντολογία. [5] Οι οντολογίες αυτές είναι απαραίτητες, μοιράζονται τα ίδια αναγνωριστικά και μία καλώς ορισμένη σύνταξη.2

Ανανέωση Περιεχομένου

Υπάρχει συνεχής ανανέωση της βάσης με διορθώσεις, διαγραφές ή/και εισαγωγή όρων και σχέσεων ώστε να συμβαδίζει πάντα με τα νέα πειραματικά δεδομένα. Οι όροι δεν διαγράφονται από την οντολογία αλλά αλλάζει η κατάστασή τους σε «κρυφή» (“obsolete”) και οι ακμές (σχέσεις) αφαιρούνται. [6]

GO Annotations

Σχολιασμοί (Annotations) GO:

Οι σχολιασμοί(annotations) GO συνιστούν μια σχέση μεταξύ γονιδίου και ενός όρου GO, με στοιχεία υπο τη μορφή ενός «αποδεικτικού κώδικα GO» από δημοσιευμένα άρθρα ή μιας δημοσιευμένης αναφοράς ή μιας περιγραφής της μεθοδολογίας που χρησιμοποιήθηκε για τη δημιουργία του σχολιασμού .Ωστόσο, όλες οι σημειώσεις-σχολιασμοί GO εν τέλει υποστηρίζονται από την επιστημονική βιβλιογραφία άμεσα η έμμεσα.Οι αποδεικτικοί κώδικες του GO περιγράφουν τη διαφορά ενός ισχυρισμού-σχολιασμού με την πραγματική πειραματική απόδειξη, τα οποία εξετάζονται από εμπειρογνώμονα βιολόγο.

Πειραματικά υποστηριζόμενοι σχολιασμοί:

Οι αποδεικτικοί κώδικες EXPerimental (EXP) δείχνουν ότι υπάρχουν στοιχεία από ένα πείραμα που υποστηρίζουν άμεσα τον σχολιασμό(annotations) του γονιδίου. Για παράδειγμα, μια συσχέτιση μεταξύ ενός γονιδιακού προϊόντος και του υποκυτταρικού εντοπισμού του, όπως προσδιορίζεται από τον ανοσο-φθορισμό, θα υποστηρίζεται από τον αποδεικτικό κώδικα Inferred from Direct Assay (IDA) και από έναν υπότυπο των στοιχείων EXP. Οι σχολιασμοί με άμεσες πειραματικές αποδείξεις δημιουργούνται από τους βιολόγους και τους διδακτορικούς υποψηφίους εξειδικευμένους σε προγράμματα υπολογιστών, οι οποίοι διαβάζουν βιβλία που έχουν αξιολογηθεί από ομότιμους και δημιουργούν σχολιασμούς GO όπως δικαιολογούνται από τα στοιχεία που παρουσιάζονται σε αυτά τα άρθρα.

Για την εξασφάλιση και τη συνοχή και την ποιότητα στις πρακτικές εξειδίκευσης των εμπειρογνωμόνων, οι προγραμματιστές βιολογίας της GOC συναντιούνται τακτικά για να συζητήσουν τα ζητήματα επιμέλειας και να συμμετάσχουν σε ασκήσεις που αφορούν το σχολιασμό γονιδίων. Κατά τη διάρκεια αυτών των ασκήσεων, πολλαπλές ομάδες επιμελητών σχολιάζουν ένα ενιαίο έγγραφο, το οποίο οδηγεί σε διευκρινίσεις σχετικά με τη χρήση όρων οντολογίας και κώδικες αποδεικτικών στοιχείων GO και αναπτύσσει βέλτιστες πρακτικές μεταξύ των κατανεμημένων ομάδων σχολιασμού GO. Για παράδειγμα, η διευκρίνιση του τρόπου με τον οποίο τα αποτελέσματα του πειράματος μόλυνσης και λειτουργικής συμπλήρωσης θα μπορούσαν να σημειωθούν, εξασφαλίζουν ότι η πληροφορία βασίζεται σε λειτουργικές γενετικές αλληλεπιδράσεις έναντι του φαινοτύπου, καταγράφεται σαφώς στη βάση δεδομένων GO.

Μέχρι πρόσφατα τα microRNAs σχολιάστηκαν[7] στο GO επειδή η ρύθμιση των μικροοργανισμών των αναπτυξιακών και κυτταρικών διεργασιών ήταν ένα νέο πεδίο μελέτης. Συνεπώς, οι ερευνητές έπρεπε να βασίζονται στους λειτουργικούς σχολιασμούς των microRNA-στόχων ως υποκατάστατο, διότι δεν υπήρχε άμεσος σχολιασμός των ίδιων των microRNAs. Σε διαβούλευση με τους εμπειρογνώμονες στον τομέα της έρευνας microRNA, δόθηκε σημαντική προσπάθεια για την αποκατάσταση αυτής της κατάστασης. Δημιουργήσαμε οδηγίες σχολιασμού για σχολιασμό microRNA και ακολουθώντας αυτές τις οδηγίες, δημιουργήσαμε σχολιασμούς για πάνω από 300 ανθρώπινα microRNAs, 70 στο Drosophila melanogaster, και σχεδόν 200 στο Arabidopsis thaliana.

Οι σχολιασμοί δέσμευσης πρωτεϊνών είναι χρήσιμοι μόνο αν περιλαμβάνουν τον συγκεκριμένο δεσμευτή πρωτεϊνών. Με την προσθήκη της βάσης δεδομένων IntAct [8] ως φορέα σχολιασμού GO, ο αριθμός των συγκεκριμένων σχολιασμών δέσμευσης πρωτεϊνών έχει αυξηθεί δραματικά. Μόνο οι σχολιασμοί υψηλής πιστότητας ενσωματώνονται στο GO από το IntAct. Σε συνδυασμό με σχολιασμούς από πειράματα μικρής κλίμακας που έχουν συμβάλει στην GO από πολλούς διαφορετικούς παρόχους σχολιασμού, οι σχολιασμοί IntAct βοηθούν να καταστεί η βάση γνώσεων του GO ένας χρήσιμος πόρος για δεδομένα δικτύου αλληλεπίδρασης πρωτεϊνών υψηλής εμπιστοσύνης.

Επιπροσθέτως για τη δημιουργία δικτύων αλληλεπίδρασης πρωτεϊνών, οι χρήστες πρέπει να χρησιμοποιήσουν το πεδίο 'with' των Αρχείων Σύνδεσης GO (GAF), το οποίο περιέχει το αναγνωριστικό του δεσμευτή αλληλεπίδρασης. Ζητούμε από τους χρήστες να γνωρίζουν τους σχολιασμούς που δηλώνουν ότι μια συγκεκριμένη γκάμα έχει αποκτήσει τη λειτουργία Η απαρίθμηση NOT γενικά δημιουργείται όταν ένα γονιδιακό προϊόν με συγκεκριμένη περιοχή ή ένωση γονιδιακής οικογένειας αναμένεται ότι έχει κάποια δραστηριότητα, αλλά όπου υπάρχουν ρητά πειραματικά δεδομένα δείχνει ότι το γονιδιακό προϊόν ΔΕΝ έχει αυτή τη δραστηριότητα .Οι σχολιασμοί είναι σχετικά σπάνιοι βάση των γνώσεων (επί του παρόντος υπάρχουν περίπου 3300 από αυτές, βασισμένες σε πειραματικά δεδομένα ). Ωστόσο, πιστεύεται ότι μπορεί να είναι ιδιαίτερα χρήσιμες σε ορισμένες εφαρμογές, όπως η αξιολόγηση της λειτουργικότητας της ακρίβειας της διαδικασίας. Οι σχολιασμοί αυτοί έχουν τον χαρακτηρισμό «ΟΧΙ» στο πεδίο προσδιορισμού GAF.

Φυλογενετικοί υποστηριζόμενοι σχολιασμοί:

Οι Φυλογενετικές αρχές, αναδημιουργώντας εξελικτικά γεγονότα για να συναγάγουν σχέσεις μεταξύ των γονιδίων[9], παρέχουν έναν ισχυρό τρόπο απόκτηση γνώσεων σχετικά με τη γονιδιακή λειτουργία. Εν συντομία, αναπτύχθηκε λογισμικό (PAINT, Φυλογενετικό Εργαλείο Σχολιασμού Συμπερασμάτων) με το οποίο ένας προγραμματιστής βιολογικών δεδομένων μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να μπορεί να δει όλους τους πειραματικούς σχολιασμούς για γονίδια σε μια οικογένεια γονιδίων και να χρησιμοποιήσει αυτές τις πληροφορίες για να συναγάγει σχολιασμούς για μη χαρακτηρισμένα μέλη της οικογένειας[10].Ο προγραμματιστής βιολόγος έπειτα δημιουργεί ένα σαφές μοντέλο κέρδους και απώλειας γονιδιακής λειτουργίας σε συγκεκριμένους κλάδους σε ένα φυλογενετικό δέντρο της οικογένειας. Αυτό το πρότυπο χρησιμοποιείται για να συναχθούν νέοι σχολιασμοί (δεν υπάρχει αλληλεπικάλυψη με πειραματικούς σχολιασμούς) για γονίδια στην οικογένεια.

Φυλογενετικοί σχολιασμοί σημειώνονται από τους κώδικες αποδεικτικών στοιχείων IBA (Inferred from Biological Ancestry). Κάθε συνήθης σχολιασμός μπορεί να εντοπιστεί στους άμεσους πειραματικούς σχολιασμούς που χρησιμοποιήθηκαν ως βάση για αυτόν τον ισχυρισμό. Το πρόγραμμα Phylogenetic Commenting GO είναι πλέον η μεγαλύτερη πηγή χειρωνακτικά σχολιασμένων παρατηρήσεων στη βάση δεδομένων GO και έχει αυξήσει σημαντικά τον αριθμό σχολιασμών ακόμη και σε οργανισμούς που έχουν μελετηθεί καλά πειραματικά .

Υπολογιστικοί υποστηριζόμενοι σχολιασμοί:

Τέλος, αυτά που απομακρύνονται από τα άμεσα πειραματικά ευρήματα, αποτελούν τους ηλεκτρονικούς κώδικες αποδεικτικών στοιχείων (IEA), οι οποίοι δεν εξετάζονται μεμονωμένα (αν και γενικά υπάρχει εκτεταμένη χειρωνακτική ανασκόπηση ενός δείγματος). Οι σχολιασμοί που υποστηρίζονται από τον IEA βασίζονται τελικά είτε στην ομολογία είτε / και σε άλλες πειραματικές πληροφορίες ή πληροφορίες αλληλουχίας, αλλά γενικά δεν μπορούν να ανιχνευθούν στην πειραματική πηγή. Τρεις μέθοδοι αποτελούν το μεγαλύτερο μέρος αυτών των σχολιασμών. Η πρώτη και πιο ολοκληρωμένη μέθοδος είναι η InterPro2GO[11] , η οποία βασίζεται στην επιμελημένη συσχέτιση ενός όρου GO με ένα γενικευμένο μοντέλο αλληλουχίας («χαρακτηριστική υπογραφή») μιας ομάδας ομόλογων πρωτεϊνών. Οι αλληλουχίες πρωτεϊνών με στατιστικά σημαντική αντιστοιχία με σε μια υπογραφή ανατίθενται οι όροι GO που σχετίζονται με την υπογραφή, μια μορφή ομολογίας. Μια δεύτερη μέθοδος είναι η υπολογιστική μετατροπή των ελεγχόμενων όρων της Uni Prot (κυρίως οι αριθμοί της ενζυμικής ομάδας που περιγράφουν τις ενζυμικές δραστηριότητες και οι λέξεις-κλειδιά UniProt που περιγράφουν τις υποκυτταρικές θέσεις), στους σχετικούς όρους GO. Τέλος, οι σχολιασμοί γίνονται με βάση τα ορθόλογα 1:1 που συνάγονται από τα γονιδιακά δέντρα, μια προσέγγιση που μεταφέρει αυτόματα τις παρατηρήσεις που βρέθηκαν πειραματικά σε ένα γονίδιο, σε ορθόλογα 1:1 στην ίδια ταξινομική κατηγορία.

Από σχολιασμούς (annotations) στα Βιολογικά Μοντέλα (LEGO):

Η δομή των σχολιασμών GO είναι  αρκετά απλή, μια κατάσταση  που αποτελείται από ένα γονίδιο και έναν όρο GO (με τα αποδεικτικά στοιχεία αυτής της σύνδεσης, όπως περιγράφεται παραπάνω).

Επειδή η γονιδιακή λειτουργία είναι περίπλοκη και σχετίζεται με μεγαλύτερα συστήματα και βιολογικά «προγράμματα» που εκτελούνται από πολλαπλά γονίδια, ένας τυπικός σχολιασμός GO αντιπροσωπεύει δικαίως μια απλή πτυχή αυτής της λειτουργίας. Προηγουμένως αναφέραμε μια απλή επέκταση[12] στο μοντέλο σχολιασμού GO, που ονομάζεται «επέκταση σχολιασμού»  η οποία επιτρέπει στους βιολογικούς προγραμματιστές να καταγράψουν πρόσθετες πληροφορίες χρησιμοποιώντας καθορισμένες σχέσεις και οντότητες ώστε να τροποποιήσουν τον επιλεγμένο όρο GO.Ωστόσο, προκειμένου να καταστεί δυνατή μια πιο ολοκληρωμένη και ακριβής αναφορά σχετικά με τη λειτουργία των γονιδίων και τον τρόπο με τον οποίο τα πολλαπλά γονίδια μπορεί να λειτουργήσουν μαζί, έχουμε αναπτύξει μια «γραμματικό κώδικα» για να συνδυαστούν παραδοσιακοί σχολιασμοί GO σε μια ακόμα πλήρως ολοκληρωμένη αναπαράσταση της σχέσης γονιδιακών λειτουργιών μεταξύ τους και σε μεγαλύτερες βιολογικές διεργασίες. Το ονομάζουμε αυτό νέες μορφοποιημένες εκφράσεις χρησιμοποιώντας τη γονιδιακή οντολογία ή το LEGO. Μια αρχική ανακοίνωση μπορεί να βρεθεί στην ηλεκτρονική διεύθυνση http://geneontology.org/article/gaf-gpad-and-lego

Ο τυποποιημένος όρος LEGO , εν συντομία, ορίζει πόσο διαφορετικοί είναι οι σχολιασμοί GO και τον τρόπο που μπορούν να συνδυαστούν σε ένα μεγαλύτερο 'μοντέλο' γονιδίου και συστήματος. Ένα απλό παράδειγμα εμφανίζεται στο “Σχήμα 2”. Είναι σημαντικό ότι το μοντέλο μπορεί και  αποσυντίθενται υπολογιστικά σε σχολιασμούς(annotations) GO, έτσι ώστε όλες οι τρέχουσες εφαρμογές σχολιασμών GO, όπως η ανάλυση εμπλουτισμού,να εξακολουθήσουν να υποστηρίζονται. Εντούτοις, ενθαρρύνουμε τους προγραμματιστές των εργαλείων ανάλυσης με βάση το δίκτυο να κατεβάσουν τη γνήσιο πρόγραμμα του OWL (Ontology Language Web) για κάθε μοντέλο LEGO το οποίο καθορίζει πώς συνδέονται οι λειτουργίες των διαφόρων γονιδιακών προϊόντων δικτύων. Οι χρήστες ενδέχεται επίσης να ενδιαφέρονται για την περιήγηση και την προβολή δημοσιευμένων μοντέλων, τα οποία διατίθενται στην ηλεκτρονική διεύθυνση: http://noctua.berkeleybop.org

Επομένως αναπτύχθηκε μια πλατφόρμα λογισμικού για τη δημιουργία και επεξεργασία μοντέλων LEGO, τα οποία ονομάζονται Noctua. Τα Noctua επιτρέπουν το συνεργατικό σχολιασμό των μοντέλων LEGO μέσω διαδικτύου. Επί του παρόντος, η κινεζική κυβέρνηση βρίσκεται στη διαδικασία μετάβασης Noctua (http://noctua.berkeleybop.org) ως κύριο εργαλείο GO.

Αρκετοί πάροχοι σχολιασμού GO χρησιμοποιούν ήδη το λογισμικό Noctua για να δημιουργήσουν μοντέλα LEGO και οι ειδικοί της GOC αναμένουν ότι ο αριθμός και η χρησιμότητα τέτοιων μοντέλων θα αυξηθούν ραγδαία κατά την προσεχή περίοδο. Έχουν πραγματοποιηθεί 5 εργαστήρια σχολιασμού κατά το παρελθόν για την εισαγωγή βιοπρογραμματιστών στο εργαλείο σχολιασμού Noctua και τις αρχές του OWL-based LEGO curation.

Tools

References

  1. 1,0 1,1 1,2 The Gene Ontology Consortium (2017-01-04). «Expansion of the Gene Ontology knowledgebase and resources» (στα αγγλικά). Nucleic Acids Research 45 (D1): D331–D338. doi:10.1093/nar/gkw1108. ISSN 0305-1048. PMID 27899567. PMC PMC5210579. https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkw1108. 
  2. 2,0 2,1 Hastings, Janna (2017). Dessimoz, Christophe, επιμ. The Gene Ontology Handbook. 1446. New York, NY: Springer New York. σελίδες 3–13. ISBN 9781493937417. 
  3. 3,0 3,1 Ashburner, Michael; Ball, Catherine A.; Blake, Judith A.; Botstein, David; Butler, Heather; Cherry, J. Michael; Davis, Allan P.; Dolinski, Kara και άλλοι. (2000-5). «Gene Ontology: tool for the unification of biology» (στα αγγλικά). Nature Genetics 25 (1): 25–29. doi:10.1038/75556. ISSN 1061-4036. PMID 10802651. PMC PMC3037419. http://www.nature.com/articles/ng0500_25. 
  4. «The Gene Ontology Resource: 20 years and still GOing strong» (στα αγγλικά). Nucleic Acids Research 47 (D1): D330–D338. 2019-01-08. doi:10.1093/nar/gky1055. ISSN 0305-1048. PMID 30395331. PMC PMC6323945. https://academic.oup.com/nar/article/47/D1/D330/5160994. 
  5. 5,0 5,1 5,2 5,3 Dessimoz, Christophe, επιμ. (2017). The Gene Ontology Handbook. Methods in Molecular Biology. 1446. New York, NY: Springer New York. ISBN 9781493937417. 
  6. Yon Rhee, Seung; Wood, Valerie; Dolinski, Kara; Draghici, Sorin (2008-7). «Use and misuse of the gene ontology annotations» (στα αγγλικά). Nature Reviews Genetics 9 (7): 509–515. doi:10.1038/nrg2363. ISSN 1471-0056. http://www.nature.com/articles/nrg2363. 
  7. Huntley, Rachael P.; Sitnikov, Dmitry; Orlic-Milacic, Marija; Balakrishnan, Rama; D'Eustachio, Peter; Gillespie, Marc E.; Howe, Doug; Kalea, Anastasia Z. και άλλοι. (2016-02-25). «Guidelines for the functional annotation of microRNAs using the Gene Ontology». RNA 22 (5): 667–676. doi:10.1261/rna.055301.115. ISSN 1355-8382. http://dx.doi.org/10.1261/rna.055301.115. 
  8. Meldal, Birgit H.M.; Forner-Martinez, Oscar; Costanzo, Maria C.; Dana, Jose; Demeter, Janos; Dumousseau, Marine; Dwight, Selina S.; Gaulton, Anna και άλλοι. (2014-10-13). «The complex portal - an encyclopaedia of macromolecular complexes». Nucleic Acids Research 43 (D1): D479–D484. doi:10.1093/nar/gku975. ISSN 1362-4962. http://dx.doi.org/10.1093/nar/gku975. 
  9. «The Gene Ontology's Reference Genome Project: A Unified Framework for Functional Annotation across Species». PLoS Computational Biology 5 (7): e1000431. 2009-07-03. doi:10.1371/journal.pcbi.1000431. ISSN 1553-7358. http://dx.doi.org/10.1371/journal.pcbi.1000431. 
  10. Gaudet, P.; Livstone, M. S.; Lewis, S. E.; Thomas, P. D. (2011-08-27). «Phylogenetic-based propagation of functional annotations within the Gene Ontology consortium». Briefings in Bioinformatics 12 (5): 449–462. doi:10.1093/bib/bbr042. ISSN 1467-5463. http://dx.doi.org/10.1093/bib/bbr042. 
  11. Mitchell, Alex; Chang, Hsin-Yu; Daugherty, Louise; Fraser, Matthew; Hunter, Sarah; Lopez, Rodrigo; McAnulla, Craig; McMenamin, Conor και άλλοι. (2014-11-26). «The InterPro protein families database: the classification resource after 15 years». Nucleic Acids Research 43 (D1): D213–D221. doi:10.1093/nar/gku1243. ISSN 1362-4962. http://dx.doi.org/10.1093/nar/gku1243. 
  12. Geymonat, Marco; Spanos, Ad; Smith, Susan J. M.; Wheatley, Edward; Rittinger, Katrin; Johnston, Leland H.; Sedgwick, Steven G. (2002-06-04). «Control of Mitotic Exit in Budding Yeast». Journal of Biological Chemistry 277 (32): 28439–28445. doi:10.1074/jbc.m202540200. ISSN 0021-9258. http://dx.doi.org/10.1074/jbc.m202540200.