Βιοπληροφορική

Η βιοπληροφορική (bioinformatics) είναι ένα διεπιστημονικό πεδίο που αναπτύσσει μεθόδους και εργαλεία λογισμικού για την κατανόηση βιολογικών δεδομένων. Ως ένα διεπιστημονικό πεδίο της επιστήμης, η βιοπληροφορική συνδυάζει την υπολογιστική επιστήμη, τη στατιστική, τα μαθηματικά και τη μηχανική για να αναλύσει και να ερμηνεύσει βιολογικά δεδομένα. Η βιοπληροφορική έχει χρησιμοποιηθεί για in silico (υπολογιστικές) αναλύσεις βιολογικών ερωτημάτων χρησιμοποιώντας μαθηματικές και στατιστικές τεχνικές.

Ο όρος βιοπληροφορική περικλείει το μέρος των βιολογικών ερευνών όπου ο προγραμματισμός είναι μέρος της μεθοδολογίας, και αναφέρεται σε ειδικές διοχετεύσεις (pipelines) ανάλυσης που χρησιμοποιούνται συχνά, ειδικά στο πεδίο της γενομικής. Συχνές χρήσεις της βιοπληροφορικής περιλαμβάνουν την αναγνώριση υποψήφιων γονιδίων και μονονουκλεοτιδικών πολυμορφισμών (SNPs). Συχνά αυτή η αναγνώριση γίνεται με σκοπό την κατανόηση της γενετικής βάσης μιας ασθένειας, μοναδικών προσαρμογών, επιθυμητών ιδιοτήτων (ειδικά στα γεωργικά είδη) ή τις διαφορές μεταξύ πληθυσμών.

Θεωρώντας τα βιολογικά δεδομένα (DNA, RNA, πρωτεΐνες) ως ψηφιακή πληροφορία, εφαρμόζει αλγορίθμους για την επεξεργασία τους και την παραγωγή χρήσιμων συμπερασμάτων με αποδοτικό τρόπο. Συνήθως χρησιμοποιούνται μέθοδοι κλάδων της τεχνητής νοημοσύνης, όπως η εξόρυξη δεδομένων (π.χ. νευρωνικά δίκτυα, μπεϋζιανά δίκτυα κλπ) και ο εξελικτικός υπολογισμός (π.χ. γενετικοί αλγόριθμοι).

Εισαγωγή

Η βιοπληροφορική έχει γίνει ένα σημαντικό τμήμα πολλών πεδίων της βιολογίας. Στην πειραματική μοριακά βιολογία, βιοπληροφορικές τεχνικές όπως είναι η ανάλυση εικόνας και σήματος, επιτρέπουν την εξόρυξη χρήσιμων αποτελεσμάτων από τεράστιο αριθμό ακατέργαστων δεδομένων. Στο πεδίο της γενετικής και της γενωμική, βοηθάει στην αλληλούχιση και το σχολιασμό γονιδιωμάτων και των παρατηρηθεισών μεταλλαγών τους. Παίζει σημαντικό ρόλο στην εξόρυξη κειμένου (text mining) από τη βιολογική βιβλιογραφία και στην ανάπτυξη βιολογικών και γονιδιακών οντολογιών για να οργανωθούν και διερωτηθούν τα βιολογικά δεδομένα. Έχει ρόλο και στην ανάλυση της γονιδιακή και πρωτεϊνικής έκφρασης και ρύθμισης. Βιοπληροφορικά εργαλεία βοηθούν στη σύγκριση γενετικών και γονιδιωματικών δεδομένων και πιο γενικά στην κατανόηση των εξελικτικών πτυχών της μοριακής βιολογίας. Σε ένα άλλο επίπεδο ενσωμάτωσης, βοηθάει στην ανάλυση και την καταγραφή των βιολογικών μονοπατιών και δικτύων που αποτελούν σημαντικό μέρος της βιολογίας συστημάτων. Στη δομική βιολογία, βοηθάει στην προσομοίωση και μοντελοποίηση του DNA^[1], RNA^[1]^[2], πρωτεϊνών^[3] καθώς και βιομοριακών αλληλεπιδράσεων.^[4]^[5]^[6]

Ακολουθίες

Οι υπολογιστές έγιναν απαραίτητοι στη μοριακή βιολογία όταν πρωτεϊνικές ακολουθίες έγινε διαθέσιμες, αφότου ο Frederick Sanger προσδιόρισε την ακολουθία της ινσουλίνης στις αρχές της δεκαετίας του 1950. Η σύγκριση πολλαπλών ακολουθιών με το χέρι αποδείχθηκε μη πρακτική. Πρωτοπόρος στο πεδίο ήταν η Margaret Oakley Dayhoff, την οποία αποκάλεσε «μητέρα και πατέρα της βιοπληροφορικής», ο David Lipman, διευθυντής του National Center for Biotechnology Information (NCBI).^[7] Η Dayhoff συγκρότησε την πρώτη βάση δεδομένων με πρωτεϊνικές ακολουθίες, την οποία αρχικά δημοσίευσε ως βιβλίο^[8], και πρωτοπόρησε σε μεθόδους στοίχισης ακολουθιών και μοριακής εξέλιξης.^[9]

Τα σύμβολα

Τα βιολογικά μακρομόρια, όπως το DNA, το RNA και οι πρωτεΐνες, μπορούν να θεωρηθούν ως ακολουθίες συμβόλων, δηλαδή συμβολοσειρές. Για παράδειγμα το DNA μπορεί να θεωρηθεί ως μια ακολουθία χιλιάδων νουκλεοτιδίων ή βάσεων. Υπάρχουν τέσσερα είδη βάσεων και αντίστοιχα τέσσερα είδη νουκλεοτιδίων: η αδενίνη, η θυμίνη, η γουανίνη και η κυτοσίνη. Αντιστοιχίζοντας σε καθεμία απ' αυτές ένα σύμβολο, π.χ. «A» για την αδενίνη, «T» για τη θυμίνη, «G» για τη γουανίνη και «C» για την κυτοσίνη, μπορούμε να κατασκευάσουμε τέτοιες συμβολοσειρές (π.χ. «...AAGATCGGTAC...»). Κατά παρόμοιο τρόπο, οι πρωτεΐνες μπορούν να περιγραφούν ως ακολουθίες αμινοξέων. Αυτού του είδους η αναπαράσταση είναι ιδιαίτερα πρόσφορη για επεξεργασία σε ηλεκτρονικό υπολογιστή που μπορεί να μας δώσει χρήσιμα αποτελέσματα.

Βιοπληροφορικές σπουδές στην Ελλάδα

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής, MSc in Data Science & Information Technologies, Specialization: Bioinformatics – Biomedical Data Science [1]
Εθνικό και Καποδιστριακό Πανεπιστήμιο, Τμήμα Βιολογίας, Πρόγραμμα Μεταπτυχιακών Σπουδών (ΠΜΣ) "Βιοπληροφορική - Υπολογιστική Βιολογία"
Πρόγραμμα Μεταπτυχιακών Σπουδών Πανεπιστημίου Πατρών: «Πληροφορική Επιστημών Ζωής»
Τμήμα Ιατρικής του Πανεπιστημίου Θεσσαλίας, Πρόγραμμα Μεταπτυχιακών Σπουδών (ΠΜΣ) «Μεθοδολογία Βιοϊατρικής Έρευνας, Βιοστατιστική και Κλινική Βιοπληροφορική»
Τμήμα Ιατρικής του Πανεπιστημίου Κρήτης, Πρόγραμμα Μεταπτυχιακών Σπουδών (ΠΜΣ) «Βιοπληροφορική»
Τμήμα Πληροφορικής του Ιονίου Πανεπιστημίου, Πρόγραμμα Μεταπτυχιακών Σπουδών (ΠΜΣ) "Βιοπληροφορική και Νευροπληροφορική"
Τμήμα Πληροφορικής με εφαρμογές στη Βιοϊατρική του Πανεπιστημίου Θεσσαλίας (Λαμία)

Παραπομπές

↑ ^1,0 ^1,1 Sim, Adelene YL; Minary, Peter; Levitt, Michael (2012-06-01). «Modeling nucleic acids». Current Opinion in Structural Biology. Nucleic acids/Sequences and topology 22 (3): 273–278. doi:10.1016/j.sbi.2012.03.012. PMID 22538125. PMC PMC4028509. http://www.sciencedirect.com/science/article/pii/S0959440X12000632.
↑ Dawson, Wayne K.; Maciejczyk, Maciej; Jankowska, Elzbieta J.; Bujnicki, Janusz M. (2016-07-01). «Coarse-grained modeling of RNA 3D structure». Methods. Advances in RNA Structure Determination 103: 138–156. doi:10.1016/j.ymeth.2016.04.026. http://www.sciencedirect.com/science/article/pii/S1046202316301050.
↑ Kmiecik, Sebastian; Gront, Dominik; Kolinski, Michal; Wieteska, Lukasz; Dawid, Aleksandra Elzbieta; Kolinski, Andrzej (2016-07-27). «Coarse-Grained Protein Models and Their Applications». Chemical Reviews 116 (14): 7898–7936. doi:10.1021/acs.chemrev.6b00163. ISSN 0009-2665. http://dx.doi.org/10.1021/acs.chemrev.6b00163.
↑ Ka-Chun,, Wong,. Computational biology and bioinformatics : gene regulation. Boca Raton, FL. ISBN 9781498724975. 948286124.
↑ Joyce, Adam P.; Zhang, Chi; Bradley, Philip; Havranek, James J. (2015-01-01). «Structure-based modeling of protein: DNA specificity». Briefings in Functional Genomics 14 (1): 39–49. doi:10.1093/bfgp/elu044. ISSN 2041-2649. PMID 25414269. PMC PMC4366589. https://academic.oup.com/bfg/article/14/1/39/197895/Structure-based-modeling-of-protein-DNA.
↑ Spiga, Enrico; Degiacomi, Matteo Thomas; Dal Peraro, Matteo (2014-01-01). «New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly». Advances in Protein Chemistry and Structural Biology. Biomolecular Modelling and Simulations 96: 77–111. doi:10.1016/bs.apcsb.2014.06.008. http://www.sciencedirect.com/science/article/pii/S1876162314000091.
↑ Glyn., Moody, (2004). Digital code of life : how bioinformatics is revolutionizing science, medicine, and business. Hoboken, N.J.: Wiley. ISBN 9780471327882. 53284897.
↑ Dayhoff, Margaret Oakley (1966). Atlas of protein sequence and structure. National Biomedical Research Foundation. σελ. 215.
↑ Eck, Richard V.; Dayhoff, Margaret O. (1966-04-15). «Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences» (στα αγγλικά). Science 152 (3720): 363–366. doi:10.1126/science.152.3720.363. ISSN 0036-8075. PMID 17775169. http://science.sciencemag.org/content/152/3720/363.

Εξωτερικοί σύνδεσμοι

wiktionary logo

Το Βικιλεξικό έχει σχετικό λήμμα:
βιοπληροφορική

Commons logo

Τα Wikimedia Commons έχουν πολυμέσα σχετικά με το θέμα
Βιοπληροφορική

[:0-1] 1,0 ^1,1 Sim, Adelene YL; Minary, Peter; Levitt, Michael (2012-06-01). «Modeling nucleic acids». Current Opinion in Structural Biology. Nucleic acids/Sequences and topology 22 (3): 273–278. doi:10.1016/j.sbi.2012.03.012. PMID 22538125. PMC PMC4028509. http://www.sciencedirect.com/science/article/pii/S0959440X12000632.

[2] Dawson, Wayne K.; Maciejczyk, Maciej; Jankowska, Elzbieta J.; Bujnicki, Janusz M. (2016-07-01). «Coarse-grained modeling of RNA 3D structure». Methods. Advances in RNA Structure Determination 103: 138–156. doi:10.1016/j.ymeth.2016.04.026. http://www.sciencedirect.com/science/article/pii/S1046202316301050.

[3] Kmiecik, Sebastian; Gront, Dominik; Kolinski, Michal; Wieteska, Lukasz; Dawid, Aleksandra Elzbieta; Kolinski, Andrzej (2016-07-27). «Coarse-Grained Protein Models and Their Applications». Chemical Reviews 116 (14): 7898–7936. doi:10.1021/acs.chemrev.6b00163. ISSN 0009-2665. http://dx.doi.org/10.1021/acs.chemrev.6b00163.

[4] Ka-Chun,, Wong,. Computational biology and bioinformatics : gene regulation. Boca Raton, FL. ISBN 9781498724975. 948286124.

[5] Joyce, Adam P.; Zhang, Chi; Bradley, Philip; Havranek, James J. (2015-01-01). «Structure-based modeling of protein: DNA specificity». Briefings in Functional Genomics 14 (1): 39–49. doi:10.1093/bfgp/elu044. ISSN 2041-2649. PMID 25414269. PMC PMC4366589. https://academic.oup.com/bfg/article/14/1/39/197895/Structure-based-modeling-of-protein-DNA.

[6] Spiga, Enrico; Degiacomi, Matteo Thomas; Dal Peraro, Matteo (2014-01-01). «New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly». Advances in Protein Chemistry and Structural Biology. Biomolecular Modelling and Simulations 96: 77–111. doi:10.1016/bs.apcsb.2014.06.008. http://www.sciencedirect.com/science/article/pii/S1876162314000091.

[7] Glyn., Moody, (2004). Digital code of life : how bioinformatics is revolutionizing science, medicine, and business. Hoboken, N.J.: Wiley. ISBN 9780471327882. 53284897.

[8] Dayhoff, Margaret Oakley (1966). Atlas of protein sequence and structure. National Biomedical Research Foundation. σελ. 215.

[9] Eck, Richard V.; Dayhoff, Margaret O. (1966-04-15). «Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences» (στα αγγλικά). Science 152 (3720): 363–366. doi:10.1126/science.152.3720.363. ISSN 0036-8075. PMID 17775169. http://science.sciencemag.org/content/152/3720/363.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]