Βιοπληροφορική

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση

Η Βιοπληροφορική (bioinformatics) είναι ένα διεπιστημονικό πεδίο που αναπτύσει μεθόδους και εργαλεία λογισμικού για τη κατανόηση βιολογικών δεδομένων. Ως ένα διεπιστημονικό πεδίο της επιστήμης, η βιοπληροφορική συνδυάζει την υπολογιστική επιστήμη, τη στατιστική, τα μαθηματικά και τη μηχανική για να αναλύσει και να ερμηνεύσει βιολογικά δεδομένα. Η βιοπληροφορική έχει χρησιμοποιηθεί για in silico (υπολογιστικές) αναλύσεις βιολογικών ερωτημάτων χρησιμοποιώντας μαθηματικές και στατιστικές τεχνικές.

Ο όρος βιοπληροφορική περικλείει το μέρος των βιολογικών ερευνών όπου ο προγραμματισμός είναι μέρος της μεθοδολογίας, αλλά και είναι αναφορά σε ειδικές διοχετεύσεις (pipelines) ανάλυσης που χρησιμοποιούνται συχνά, ειδικά στο πεδίο τη γενωμικής. Συχνές χρήσεις της βιοπληροφορικής περιλαμβάνουν την αναγνώριση υποψήφιων γονιδίων και μονονουκλεοτιδικών πολυμορφισμών (SNPs). Συχνά αυτή η αναγνώριση γίνεται με σκοπό τη κατανόηση της γενετικής βάσης μιας ασθένειας, μοναδικών προσαρμογών, επιθυμητών ιδιοτήτων (ειδικά στα γεωργικά είδη) ή τις διαφορές μεταξύ πληθυσμών.

Θεωρώντας τα βιολογικά δεδομένα (DNA, RNA, πρωτεΐνες) ως ψηφιακή πληροφορία, εφαρμόζει αλγορίθμους για την επεξεργασία τους και την παραγωγή χρήσιμων συμπερασμάτων με αποδοτικό τρόπο. Συνήθως χρησιμοποιούνται μέθοδοι κλάδων της τεχνητής νοημοσύνης, όπως η εξόρυξη δεδομένων (π.χ. νευρωνικά δίκτυα, μπεϋζιανά δίκτυα κλπ) και ο εξελικτικός υπολογισμός (π.χ. γενετικοί αλγόριθμοι).

Εισαγωγή[Επεξεργασία | επεξεργασία κώδικα]

Η βιοπληροφορική έχει γίνει ένα σημαντικό τμήμα πολλών πεδίων της βιολογίας. Στη πειραματική μοριακά βιολογία, βιοπληροφορικές τεχνικές όπως είναι η ανάλυση εικόνας και σήματος, επιτρέπουν την εξόρυξη χρήσιμων αποτελεσμάτων από τεράστιο αριθμό ακατέργαστων δεδομένων. Στο πεδίο της γενετικής και της γενωμική, βοηθάει στην αλληλούχιση και το σχολιασμό γονιδιωμάτων και των παρατηρηθεισών μεταλλαγών τους. Παίζει σημαντικό ρόλο στην εξόρυξη κειμένου (text mining) από τη βιολογική βιβλιογραφία και στην ανάπτυξη βιολογικών και γονιδιακών οντολογιών για να οργανωθούν και διερωτηθούν τα βιολογικά δεδομένα. Έχει ρόλο και στην ανάλυση της γονιδιακή και πρωτεϊνικής έκφρασης και ρύθμισης. Βιοπληροφορικά εργαλεία βοηθούν στη σύγκριση γενετικών και γονιδιωματικών δεδομένων και πιο γενικά στη κατανόηση των εξελικτικών πτυχών της μοριακής βιολογίας. Σε ένα άλλο επίπεδο ενσωμάτωσης, βοηθάει στην ανάλυση και τη καταγραφή των βιολογικών μονοπατιών και δικτύων που αποτελούν σημαντικό μέρος της βιολογίας συστημάτων. Στη δομική βιολογία, βοηθάει στη προσομοίωση και μοντελοποίηση του DNA[1], RNA[1][2], πρωτεϊνών[3] καθώς και βιομοριακών αλληλεπιδράσεων.[4][5][6]

Ακολουθίες[Επεξεργασία | επεξεργασία κώδικα]

Οι υπολογιστές έγιναν απαραίτητοι στη μοριακή βιολογία όταν πρωτεϊνικές ακολουθίες έγινε διαθέσιμε, αφότου ο Frederick Sanger προσδιόρισε την ακολουθία της ινσουλίνης στις αρχές της δεκαετίας του 1950. Η σύγκριση πολλαπλών ακολουθιών με το χέρι αποδείχθηκε μη πρακτική. Πρωτοπόρος στο πεδίο ήταν η Margaret Oakley Dayhoff, την οποία αποκάλεσε "μητέρα και πατέρα της βιοπληροφορικής", ο David Lipman, διευθυντής του National Center for Biotechnology Information (NCBI).[7] Η Dayhoff συγκρότησε τη πρώτη βάση δεδομένων με πρωτεϊνικές ακολουθίες, την οποία αρχικά δημοσίευσε ως βιβλίο[8], και πρωτοπόρησε σε μεθόδους στοίχισης ακολουθιών και μοριακής εξέλιξης.[9]

Τα σύμβολα[Επεξεργασία | επεξεργασία κώδικα]

Τα βιολογικά μακρομόρια, όπως το DNA, το RNA και οι πρωτεΐνες, μπορούν να θεωρηθούν ως ακολουθίες συμβόλων, δηλαδή συμβολοσειρές. Για παράδειγμα το DNA μπορεί να θεωρηθεί ως μια ακολουθία χιλιάδων νουκλεοτιδίων ή βάσεων. Υπάρχουν τέσσερα είδη βάσεων και αντίστοιχα τέσσερα είδη νουκλεοτιδίων: η αδενίνη, η θυμίνη, η γουανίνη και η κυτοσίνη. Αντιστοιχίζοντας σε καθεμία απ' αυτές ένα σύμβολο, π.χ. «A» για την αδενίνη, «T» για τη θυμίνη, «G» για τη γουανίνη και «C» για την κυτοσίνη, μπορούμε να κατασκευάσουμε τέτοιες συμβολοσειρές (π.χ. «...AAGATCGGTAC...»). Κατά παρόμοιο τρόπο, οι πρωτεΐνες μπορούν να περιγραφούν ως ακολουθίες αμινοξέων. Αυτού του είδους η αναπαράσταση είναι ιδιαίτερα πρόσφορη για επεξεργασία σε ηλεκτρονικό υπολογιστή που μπορεί να μας δώσει χρήσιμα αποτελέσματα.

Βιοπληροφορικές σπουδές στην Ελλάδα[Επεξεργασία | επεξεργασία κώδικα]

Εξωτερικοί σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]

Commons logo
Τα Wikimedia Commons έχουν πολυμέσα σχετικά με το θέμα
  1. 1,0 1,1 Sim, Adelene YL; Minary, Peter; Levitt, Michael (2012-06-01). «Modeling nucleic acids». Current Opinion in Structural Biology. Nucleic acids/Sequences and topology 22 (3): 273–278. doi:10.1016/j.sbi.2012.03.012. PMID 22538125. PMC PMC4028509. http://www.sciencedirect.com/science/article/pii/S0959440X12000632. 
  2. Dawson, Wayne K.; Maciejczyk, Maciej; Jankowska, Elzbieta J.; Bujnicki, Janusz M. (2016-07-01). «Coarse-grained modeling of RNA 3D structure». Methods. Advances in RNA Structure Determination 103: 138–156. doi:10.1016/j.ymeth.2016.04.026. http://www.sciencedirect.com/science/article/pii/S1046202316301050. 
  3. Kmiecik, Sebastian; Gront, Dominik; Kolinski, Michal; Wieteska, Lukasz; Dawid, Aleksandra Elzbieta; Kolinski, Andrzej (2016-07-27). «Coarse-Grained Protein Models and Their Applications». Chemical Reviews 116 (14): 7898–7936. doi:10.1021/acs.chemrev.6b00163. ISSN 0009-2665. http://dx.doi.org/10.1021/acs.chemrev.6b00163. 
  4. Ka-Chun,, Wong,. Computational biology and bioinformatics : gene regulation. Boca Raton, FL. 948286124. ISBN 9781498724975. https://www.worldcat.org/oclc/948286124. 
  5. Joyce, Adam P.; Zhang, Chi; Bradley, Philip; Havranek, James J. (2015-01-01). «Structure-based modeling of protein: DNA specificity». Briefings in Functional Genomics 14 (1): 39–49. doi:10.1093/bfgp/elu044. ISSN 2041-2649. PMID 25414269. PMC PMC4366589. https://academic.oup.com/bfg/article/14/1/39/197895/Structure-based-modeling-of-protein-DNA. 
  6. Spiga, Enrico; Degiacomi, Matteo Thomas; Dal Peraro, Matteo (2014-01-01). «New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly». Advances in Protein Chemistry and Structural Biology. Biomolecular Modelling and Simulations 96: 77–111. doi:10.1016/bs.apcsb.2014.06.008. http://www.sciencedirect.com/science/article/pii/S1876162314000091. 
  7. Glyn., Moody, (2004). Digital code of life : how bioinformatics is revolutionizing science, medicine, and business. Hoboken, N.J.: Wiley. 53284897. ISBN 9780471327882. https://www.worldcat.org/oclc/53284897. 
  8. Dayhoff, Margaret Oakley (1966). Atlas of protein sequence and structure. National Biomedical Research Foundation, σελ. 215. 
  9. Eck, Richard V.; Dayhoff, Margaret O. (1966-04-15). «Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences» (στα αγγλικά). Science 152 (3720): 363–366. doi:10.1126/science.152.3720.363. ISSN 0036-8075. PMID 17775169. http://science.sciencemag.org/content/152/3720/363.