Μετάβαση στο περιεχόμενο

Μικροσυστοιχίες DNA

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Πώς να χρησιμοποιήσετε μια μικροσυστοιχία για τον προσδιορισμό της γονοτύπησης. Το βίντεο δείχνει τη διαδικασία εξαγωγής γονοτύπων από δείγμα ανθρώπινου πτύελου χρησιμοποιώντας μικροσυστοιχίες. Η γονοτύπηση είναι μια σημαντική χρήση των μικροσυστοιχιών DNA, αλλά με ορισμένες τροποποιήσεις μπορούν επίσης να χρησιμοποιηθούν για άλλους σκοπούς, όπως η μέτρηση της γονιδιακής έκφρασης και οι επιγενετικοί δείκτες.

Μια μικροσυστοιχία (ή μικροπαράταξη, ή μικροπίνακας) DNA, τσιπ DNA, βιοτσίπ (DNA microarray, biochip) είναι μια συλλογή μικροσκοπικών κηλίδων DNA που συνδέονται σε μια στερεή επιφάνεια. Οι επιστήμονες χρησιμοποιούν μικροσυστοιχίες DNA για να μετρήσουν τα επίπεδα έκφρασης μεγάλου αριθμού γονιδίων ταυτόχρονα, ή σε γονότυπους πολλαπλών περιοχών ενός γονιδιώματος. Κάθε κηλίδα DNA περιέχει picomol (10−12 mol) μιας συγκεκριμένης αλληλουχίας DNA, γνωστής ως ανιχνευτές (probes) (ή ανταποκριτές (reporters). Αυτά μπορεί να είναι ένα σύντομο τμήμα ενός γονιδίου ή άλλου στοιχείου DNA που χρησιμοποιείται για υβριδισμό ενός cDNA ή cRNA (ονομάζεται επίσης αντινοηματικό RNA) δείγματος (που ονομάζεται στόχος) υπό συνθήκες υψηλής αυστηρότητας. Ο υβριδισμός ανιχνευτή-στόχου ανιχνεύεται συνήθως και ποσοτικοποιείται με την ανίχνευση στόχων σημασμένων με φθοροφόρο, άργυρο ή χημειοφωταύγεια για τον προσδιορισμό της σχετικής αφθονίας αλληλουχιών νουκλεϊκών οξέων στον στόχο. Οι αρχικές συστοιχίες νουκλεϊκών οξέων ήταν μακροσυστοιχίες περίπου 9 cm × 12 cm και η πρώτη ανάλυση εικόνας βασισμένη σε ηλεκτρονικό υπολογιστή δημοσιεύτηκε το 1981.[1] Ένα παράδειγμα εφαρμογής του είναι σε συστοιχίες πολυμορφισμών μονών (απλών) νουκλεοτιδίων (SNPs), για πολυμορφισμούς σε καρδιαγγειακά νοσήματα, καρκίνο, παθογόνα και ανάλυση μελέτης συσχέτισης ολόκληρου του γονιδιώματος (GWAS). Χρησιμοποιείται επίσης για την αναγνώριση δομικών παραλλαγών και τη μέτρηση της γονιδιακής έκφρασης.

Υβριδοποίηση του στόχου στον ανιχνευτή

Η βασική αρχή πίσω από τις μικροσυστοιχίες είναι ο υβριδισμός μεταξύ δύο κλώνων DNA, με την ιδιότητα συμπληρωματικών αλληλουχιών νουκλεϊκών οξέων να ζευγαρώνουν ειδικά μεταξύ τους σχηματίζοντας δεσμούς υδρογόνου μεταξύ συμπληρωματικών ζευγών βάσεων νουκλεοτιδίων. Ένας μεγάλος αριθμός συμπληρωματικών ζευγών βάσεων σε μια νουκλεοτιδική αλληλουχία σημαίνει στενότερο μη ομοιοπολικό δεσμό μεταξύ των δύο κλώνων. Μετά την απομάκρυνση των μη ειδικών αλληλουχιών σύνδεσης, μόνο οι ισχυρά ζευγαρωμένοι κλώνοι θα παραμείνουν υβριδισμένοι. Οι σημασμένες με φθορισμό αλληλουχίες στόχου που συνδέονται με μια αλληλουχία ανιχνευτή δημιουργούν ένα σήμα που εξαρτάται από τις συνθήκες υβριδισμού (όπως η θερμοκρασία) και την πλύση μετά τον υβριδισμό. Η συνολική ισχύς του σήματος, από ένα σημείο (χαρακτηριστικό), εξαρτάται από την ποσότητα του δείγματος στόχου που συνδέεται με τους ανιχνευτές που υπάρχουν σε αυτό το σημείο. Οι μικροσυστοιχίες χρησιμοποιούν σχετική ποσοτικοποίηση στην οποία η ένταση ενός χαρακτηριστικού συγκρίνεται με την ένταση του ίδιου χαρακτηριστικού υπό διαφορετικές συνθήκες και η ταυτότητα του χαρακτηριστικού είναι γνωστή από τη θέση του.

Τα βήματα που απαιτούνται σε ένα πείραμα μικροσυστοιχίας
Δύο τσιπ Affymetrix. Ένα ταίριασμα εμφανίζεται κάτω αριστερά για σύγκριση μεγεθών.

Υπάρχουν πολλοί τύποι συστοιχιών και η ευρύτερη διάκριση είναι εάν είναι χωρικά διατεταγμένα σε μια επιφάνεια ή σε κωδικοποιημένα σφαιρίδια:

  • Η παραδοσιακή συστοιχία στερεάς φάσης είναι μια συλλογή τακτοποιημένων μικροσκοπικών "σημείων", που ονομάζονται χαρακτηριστικά, το καθένα με χιλιάδες ταυτόσημους και συγκεκριμένους ανιχνευτές προσαρτημένους σε μια στερεή επιφάνεια, όπως γυαλί, πλαστικό ή βιοτσίπ πυριτίου (κοινώς γνωστό ως τσιπ γονιδιώματος, τσιπ ή συστοιχία γονιδίων). Χιλιάδες από αυτά τα χαρακτηριστικά μπορούν να τοποθετηθούν σε γνωστές θέσεις σε μια ενιαία μικροσυστοιχία DNA.
  • Η εναλλακτική σειρά σφαιριδίων είναι μια συλλογή μικροσκοπικών σφαιριδίων πολυστυρενίου, που η καθεμιά έχει έναν ειδικό ανιχνευτή και μια αναλογία δύο ή περισσότερων χρωστικών, που δεν παρεμβαίνουν στις φθορίζουσες βαφές που χρησιμοποιούνται στην αλληλουχία στόχο.

Οι μικροσυστοιχίες DNA μπορούν να χρησιμοποιηθούν για την ανίχνευση DNA (όπως στο συγκριτικός υβριδισμό γονιδιώματος (comparative genomic hybridization)), ή για την ανίχνευση RNA (συνηθέστερα ως cDNA μετά από αντίστροφη μεταγραφή) που μπορεί ή όχι να μεταφραστεί σε πρωτεΐνες. Η διαδικασία μέτρησης της γονιδιακής έκφρασης μέσω cDNA ονομάζεται ανάλυση έκφρασης ή κατατομή (προφίλ) έκφρασης (expression profiling). Οι εφαρμογές περιλαμβάνουν:

Εφαρμογή ή τεχνολογία Σύνοψη
Κατατομή (προφίλ) έκφρασης γονιδίου Σε ένα πείραμα mRNA, ή κατατομής γονιδιακής έκφρασης τα επίπεδα έκφρασης χιλιάδων γονιδίων παρακολουθούνται ταυτόχρονα για να μελετηθούν τα αποτελέσματα ορισμένων θεραπειών, ασθενειών και αναπτυξιακών σταδίων στη γονιδιακή έκφραση. Για παράδειγμα, η κατατομή έκφρασης γονιδίων που βασίζεται σε μικροσυστοιχίες μπορεί να χρησιμοποιηθεί για τον εντοπισμό γονιδίων των οποίων η έκφραση αλλάζει ως απόκριση σε παθογόνα ή άλλους οργανισμούς, συγκρίνοντας την έκφραση γονιδίου σε μολυσμένα με αυτήν σε μη μολυσμένα κύτταρα ή ιστούς.[2]
Συγκριτικός γονιδιωματικός υβριδισμός Αξιολόγηση του περιεχομένου του γονιδιώματος σε διαφορετικά κύτταρα ή στενά συγγενείς οργανισμούς, όπως περιγράφηκε αρχικά από τους Patrick Brown, Jonathan Pollack, Ash Alizadeh και συνεργάτες στο Στάνφορντ.[3][4]
Αναγνωριστικό γονιδίου Μικρές μικροσυστοιχίες για έλεγχο αναγνωριστικών οργανισμών σε τρόφιμα και ζωοτροφές (όπως γενετικά τροποποιημένους οργανισμούς [1]), μυκοπλάσματα σε κυτταρική καλλιέργεια ή παθογόνα για ανίχνευση ασθενειών, που συνδυάζουν κυρίως PCR και τεχνολογία μικροσυστοιχιών.
Ανοσοκαθίζηση χρωματίνης σε τσιπ Οι αλληλουχίες DNA που συνδέονται με μια συγκεκριμένη πρωτεΐνη μπορούν να απομονωθούν με ανοσοκαθίζηση αυτής της πρωτεΐνης (Chromatin immunoprecipitation, ChIP), αυτά τα θραύσματα μπορούν στη συνέχεια να υβριδοποιηθούν σε μια μικροσυστοιχία (όπως μια συστοιχία παράθεσης (tiling array)) επιτρέποντας τον προσδιορισμό της κατάληψης της θέσης σύνδεσης της πρωτεΐνης σε όλο το γονιδίωμα. Παράδειγμα πρωτεΐνης σε ανοσοκαθίζημα είναι οι τροποποιήσεις ιστονών (H3K27me3, H3K4me2, H3K9me3, κ.λπ.), πολυκομβικών ομάδων πρωτεϊνών (Polycomb-group protein) (PRC2:Suz12, PRC1:YY1) πρωτεϊνών τριθωρακικής ομάδας (trithorax-group protein) (Ash1) για μελέτη του επιγενετικού τοπίου, ή η RNA πολυμεράση II για τη μελέτη του τοπίου μεταγραφής.
Ταυτοποίηση μεθυλομεταφοράσης αδενίνης DNA, DamID Ανάλογα με την ανοσοκαθίζηση της χρωματίνης (ChIP), οι γονιδιωματικές περιοχές που συνδέονται με μια πρωτεΐνη ενδιαφέροντος μπορούν να απομονωθούν και να χρησιμοποιηθούν για την ανίχνευση μιας μικροσυστοιχίας για τον προσδιορισμό της κατάληψης της θέσης δέσμευσης. Σε αντίθεση με το ChIP, το DamID δεν απαιτεί αντισώματα, αλλά χρησιμοποιεί μεθυλίωση αδενίνης κοντά στις θέσεις δέσμευσης της πρωτεΐνης για να ενισχύσει επιλεκτικά αυτές τις περιοχές, που εισάγονται εκφράζοντας μικρές ποσότητες της πρωτεΐνης ενδιαφέροντος συγχωνευμένης με βακτηριακή μεθυλομεταφοράση αδενίνης DNA (DNA adenine methyltransferase).
Ανίχνευση πολυμορφισμού απλού νουκλεοτιδίου Εντοπισμός πολυμορφισμού απλού νουκλεοτιδίου μεταξύ αλληλόμορφων εντός ή μεταξύ πληθυσμών.[5] Αρκετές εφαρμογές μικροσυστοιχιών χρησιμοποιούν την ανίχνευση SNP, συμπεριλαμβανομένης της γονοτύπησης, της ιατροδικαστικής ανάλυσης, της μέτρησης προδιάθεσης για ασθένεια, ταυτοποίηση υποψήφιων φαρμάκων, αξιολόγηση μεταλλάξεων βλαστικής γραμμής σε άτομα, ή σωματικές μεταλλάξεις σε καρκίνους, αξιολόγηση απώλειας ετεροζυγωτίας ή ανάλυση γενετικής σύνδεσης.
Ανίχνευση εναλλακτικού ματίσματος Ένας σχεδιασμός συστοιχίας συνδέσμου εξονίων (exon junction array) χρησιμοποιεί ανιχνευτές ειδικούς για τις αναμενόμενες ή πιθανές θέσεις ματίσματος των προβλεπόμενων εξονίων για ένα γονίδιο. Είναι ενδιάμεσης πυκνότητας ή κάλυψης σε μια τυπική συστοιχία γονιδιακής έκφρασης (με 1-3 ανιχνευτές ανά γονίδιο) και σε μια γονιδιωματική συστοιχία παράθεσης (με εκατοντάδες ή χιλιάδες ανιχνευτές ανά γονίδιο). Χρησιμοποιείται για τον προσδιορισμό της έκφρασης εναλλακτικών μορφών ματίσματος ενός γονιδίου. Οι συστοιχίες εξονίων έχουν διαφορετικό σχεδιασμό, χρησιμοποιώντας ανιχνευτές σχεδιασμένους να ανιχνεύουν κάθε μεμονωμένο εξόνιο για γνωστά ή προβλεπόμενα γονίδια και μπορούν να χρησιμοποιηθούν για την ανίχνευση διαφορετικών ισομορφών ματίσματος.
Μικροσυστοιχία συγχωνευμένων γονιδίων Μια μικροσυστοιχία συγχωνευμένων γονιδίων μπορεί να ανιχνεύσει μεταγραφές σύντηξης, π.χ. από δείγματα καρκίνου. Η αρχή πίσω από αυτό βασίζεται στις μικροσυστοιχίες εναλλακτικού ματίσματος. Η στρατηγική σχεδίασης ολιγονουκλεοτιδίων επιτρέπει συνδυασμένες μετρήσεις χιμαιρικών συνδέσεων μεταγραφημάτων με μετρήσεις εξονίου μεμονωμένων συνεργατών σύντηξης.
Συστοιχία παράθεσης (Tiling array) Οι συστοιχίες παράθεσης γονιδιώματος αποτελούνται από επικαλυπτόμενους ανιχνευτές σχεδιασμένους να αναπαριστούν πυκνά μια γονιδιωματική περιοχή ενδιαφέροντος, μερικές φορές τόσο μεγάλη όσο ένα ολόκληρο ανθρώπινο χρωμόσωμα. Ο σκοπός είναι να ανιχνευθεί εμπειρικά η έκφραση των μεταγραφημάτων ή εναλλακτικά ματισμένων μορφών που μπορεί να μην ήταν προηγουμένως γνωστές ή προβλεπόμενες.
Δικλωνικές μικροσυστοιχίες B-DNA This approach can be used to inhibit gene expression. Οι δεξιόχειρες δίκλωνες μικροσυστοιχίες B-DNA μπορούν να χρησιμοποιηθούν για τον χαρακτηρισμό νέων φαρμάκων και βιολογικών προϊόντων που μπορούν να χρησιμοποιηθούν για τη σύνδεση συγκεκριμένων περιοχών ακινητοποιημένου, ανέπαφου, δίκλωνου DNA. Αυτή η προσέγγιση μπορεί να χρησιμοποιηθεί για την αναστολή της γονιδιακής έκφρασης.[6][7] Επιτρέπουν επίσης τον χαρακτηρισμό της δομής τους κάτω από διαφορετικές περιβαλλοντικές συνθήκες.
Δικλωνικές μικροσυστοιχίες Z-DNA Οι αριστερόστροφες δίκλωνες μικροσυστοιχίες Z-DNA μπορούν να χρησιμοποιηθούν για τον εντοπισμό σύντομων αλληλουχιών της εναλλακτικής δομής Z-DNA που βρίσκονται σε μεγαλύτερα τμήματα δεξιόχειρων γονιδίων B-DNA (π.χ. μεταγραφική ενίσχυση, ανασυνδυασμός, επεξεργασία RNA).[6][7] Οι μικροσυστοιχίες επιτρέπουν επίσης τον χαρακτηρισμό της δομής τους κάτω από διαφορετικές περιβαλλοντικές συνθήκες.
Πολυκλωνικές μικροσυστοιχίες DNA (μικροσυστοιχίες τριπλού DNA και μικροσυστοιχίες τετραπλών DNA) Οι πολυκλωνικές μικροσυστοιχίες DNA και RNA μπορούν να χρησιμοποιηθούν για την αναγνώριση νέων φαρμάκων που συνδέονται με αυτές τις πολυκλωνικές αλληλουχίες νουκλεϊκών οξέων. Αυτή η προσέγγιση μπορεί να χρησιμοποιηθεί για την ανακάλυψη νέων φαρμάκων και βιολογικών προϊόντων που έχουν την ικανότητα να αναστέλλουν την έκφραση των γονιδίων.[6][7][8][9] Αυτές οι μικροσυστοιχίες επιτρέπουν επίσης τον χαρακτηρισμό της δομής τους κάτω από διαφορετικές περιβαλλοντικές συνθήκες.

Εξειδικευμένες συστοιχίες προσαρμοσμένες σε συγκεκριμένες καλλιέργειες γίνονται όλο και πιο δημοφιλείς σε εφαρμογές μοριακής βελτίωσης. Στο μέλλον θα μπορούσαν να χρησιμοποιηθούν για τον έλεγχο νεαρών φυτών σε πρώιμα στάδια για να μειωθεί ο αριθμός των περιττών δενδρυλλίων που δοκιμάστηκαν σε εργασίες βελτίωσης.[10]

Οι μικροσυστοιχίες μπορούν να κατασκευαστούν με διαφορετικούς τρόπους, ανάλογα με τον αριθμό των υπό εξέταση ανιχνευτών, το κόστος, τις απαιτήσεις προσαρμογής και τον τύπο της επιστημονικής ερώτησης που τίθεται. Οι συστοιχίες από εμπορικούς πωλητές μπορεί να έχουν μόλις 10 ανιχνευτές ή έως και 5 εκατομμύρια ή περισσότερους ανιχνευτές κλίμακας μικρομέτρων.

Κηλιδωμένες ως προς επιτόπια συντιθέμενες συστοιχίες

[Επεξεργασία | επεξεργασία κώδικα]
Μια μικροσυστοιχία DNA που εκτυπώνεται από ένα ρομπότ στο Πανεπιστήμιο του Ντέλαγουερ

Οι μικροσυστοιχίες μπορούν να κατασκευαστούν χρησιμοποιώντας μια ποικιλία τεχνολογιών, όπως εκτύπωση με λεπτές ακίδες σε γυάλινες διαφάνειες, φωτολιθογραφία χρησιμοποιώντας προκατασκευασμένες μάσκες, φωτολιθογραφία με χρήση δυναμικών συσκευών μικροκαθρεφτών, εκτύπωση με έγχυση μελάνης,[11][12] ή ηλεκτροχημικά σε συστοιχίες μικροηλεκτροδίων. Στις κηλιδωμένες μικροσυστοιχίες, οι ανιχνευτές είναι ολιγονουκλεοτίδια, cDNA ή μικρά θραύσματα προϊόντων PCR που αντιστοιχούν σε mRNA. Οι ανιχνευτές συντίθενται πριν από την εναπόθεση στην επιφάνεια της συστοιχίας και στη συνέχεια «κηλιδώνονται» σε γυαλί. Μια κοινή προσέγγιση χρησιμοποιεί μια συστοιχία από λεπτές καρφίτσες ή βελόνες που ελέγχονται από έναν ρομποτικό βραχίονα που βυθίζεται σε φρεάτια που περιέχουν ανιχνευτές DNA και στη συνέχεια εναποτίθεται κάθε ανιχνευτής σε καθορισμένες θέσεις στην επιφάνεια της συστοιχίας. Το προκύπτον "πλέγμα" ανιχνευτών αντιπροσωπεύει τα προφίλ των νουκλεϊκών οξέων των παρασκευασμένων ανιχνευτών και είναι έτοιμο να λάβει συμπληρωματικούς "στόχους" cDNA ή cRNA που προέρχονται από πειραματικά ή κλινικά δείγματα. Αυτή η τεχνική χρησιμοποιείται από ερευνητές σε όλο τον κόσμο για την παραγωγή εσωτερικών εκτυπωμένων μικροσυστοιχιών στα δικά τους εργαστήρια. Αυτές οι συστοιχίες μπορούν εύκολα να προσαρμοστούν για κάθε πείραμα, επειδή οι ερευνητές μπορούν να επιλέξουν τους ανιχνευτές και τις θέσεις εκτύπωσης στις συστοιχίες, να συνθέσουν τους ανιχνευτές στο δικό τους εργαστήριο (ή σε συνεργαζόμενη εγκατάσταση) και να εντοπίσουν τις συστοιχίες. Στη συνέχεια, μπορούν να δημιουργήσουν τα δικά τους επισημασμένα δείγματα για υβριδισμό, να υβριδοποιήσουν τα δείγματα με τη συστοιχία και, τέλος, να σαρώσουν τις συστοιχίες με τον δικό τους εξοπλισμό. Αυτό παρέχει μια σχετικά χαμηλού κόστους μικροσυστοιχία που μπορεί να προσαρμοστεί για κάθε μελέτη και αποφεύγει συχνά το κόστος αγοράς πιο ακριβών εμπορικών συστοιχιών που μπορεί να αντιπροσωπεύουν τεράστιο αριθμό γονιδίων που δεν ενδιαφέρουν τον ερευνητή. Υπάρχουν δημοσιεύσεις που υποδεικνύουν ότι οι εσωτερικές μικροσυστοιχίες ενδέχεται να μην παρέχουν το ίδιο επίπεδο ευαισθησίας σε σύγκριση με τις εμπορικές συστοιχίες ολιγονουκλεοτιδίων,[13] πιθανώς λόγω των μικρών μεγεθών παρτίδας και της μειωμένης απόδοσης εκτύπωσης σε σύγκριση με τις βιομηχανικές κατασκευές συστοιχιών ολιγονουκλεοτιδίων. Στις μικροσυστοιχίες ολιγονουκλεοτιδίων, οι ανιχνευτές είναι σύντομες αλληλουχίες που έχουν σχεδιαστεί για να ταιριάζουν με μέρη της αλληλουχίας γνωστών ή προβλεπόμενων ανοιχτών πλαισίων ανάγνωσης. Αν και οι ολιγονουκλεοτιδικοί ανιχνευτές χρησιμοποιούνται συχνά σε κηλιδωμένες μικροσυστοιχίες, ο όρος συστοιχία ολιγονουκλεοτιδίων αναφέρεται συχνότερα σε μια συγκεκριμένη τεχνική κατασκευής. Οι συστοιχίες ολιγονουκλεοτιδίων παράγονται εκτυπώνοντας σύντομες ολιγονουκλεοτιδικές αλληλουχίες σχεδιασμένες να αντιπροσωπεύουν ένα μεμονωμένο γονίδιο ή οικογένεια παραλλαγών ματίσματος γονιδίων με σύνθεση αυτής της αλληλουχίας απευθείας στην επιφάνεια της συστοιχίας αντί να εναποθέτουν ανέπαφες αλληλουχίες. Οι αλληλουχίες μπορεί να είναι μακρύτερες (ανιχνευτές 60 μερών όπως το σχέδιο Agilent) ή μικρότερες (ανιχνευτές 25 μερών που παράγονται από την Affymetrix) ανάλογα με τον επιθυμητό σκοπό. Οι μακρύτεροι ανιχνευτές είναι πιο συγκεκριμένοι για μεμονωμένα γονίδια-στόχους, οι μικρότεροι ανιχνευτές μπορούν να εντοπιστούν σε υψηλότερη πυκνότητα κατά μήκος της συστοιχίας και είναι φθηνότεροι στην κατασκευή. Μία τεχνική που χρησιμοποιείται για την παραγωγή ολιγονουκλεοτιδικών συστοιχιών περιλαμβάνει φωτολιθογραφική σύνθεση (Affymetrix) σε υπόστρωμα διοξειδίου του πυριτίου, όπου χρησιμοποιούνται φωτοευαίσθητοι παράγοντες κάλυψης για να χτίσουν μια αλληλουχία ενός νουκλεοτιδίου τη φορά σε ολόκληρη τη συστοιχία.[14] Κάθε εφαρμόσιμος ανιχνευτής "αποκαλύπτεται" επιλεκτικά πριν από την εμβάπτιση της συστοιχίας σε ένα διάλυμα ενός μόνο νουκλεοτιδίου, στη συνέχεια λαμβάνει χώρα μια αντίδραση κάλυψης και το επόμενο σύνολο ανιχνευτών αποκαλύπτεται ως προετοιμασία για διαφορετική έκθεση νουκλεοτιδίου. Μετά από πολλές επαναλήψεις, οι ακολουθίες κάθε ανιχνευτή κατασκευάζονται πλήρως. Πιο πρόσφατα, η σύνθεση συστοιχίας χωρίς κάλυψη (Maskless Array Synthesis) της NimbleGen Systems συνδύασε την ευελιξία με μεγάλο αριθμό ανιχνευτών.[15]

Ανίχνευση δύο καναλιών έναντι ενός καναλιού

[Επεξεργασία | επεξεργασία κώδικα]
Διάγραμμα τυπικού διπλού χρώματος πειράματος μικροσυστοιχίας

Οι "μικροσυστοιχίες δύο καναλιών" (ή και μικροσυστοιχίες δύο χρωμάτων) είναι τυπικά υβριδοποιημένες με cDNA που παρασκευάζεται από δύο δείγματα που πρόκειται να συγκριθούν (π.χ. άρρωστος ιστός έναντι υγιούς ιστού) και που επισημαίνονται με δύο διαφορετικά φθοροφόρα.[16] Οι φθορίζουσες χρωστικές που χρησιμοποιούνται συνήθως για την επισήμανση cDNA περιλαμβάνουν την κυανίνη 3 (Cy3), η οποία έχει μήκος κύματος εκπομπής φθορισμού 570 nm (που αντιστοιχεί στο πράσινο τμήμα του φάσματος του φωτός) και Cy5 με μήκος κύματος εκπομπής φθορισμού 670 nm (που αντιστοιχεί στο κόκκινο τμήμα του φάσματος του φωτός). Τα δύο δείγματα cDNA με σήμανση Cy αναμειγνύονται και υβριδοποιούνται σε μια μοναδική μικροσυστοιχία που στη συνέχεια σαρώνεται σε σαρωτή μικροσυστοιχίας για να οπτικοποιηθεί ο φθορισμός των δύο φθοροφόρων μετά από διέγερση με μια δέσμη λέιζερ καθορισμένου μήκους κύματος. Οι σχετικές εντάσεις κάθε φθοροφόρου μπορούν στη συνέχεια να χρησιμοποιηθούν σε ανάλυση με βάση την αναλογία για τον εντοπισμό γονιδίων που ρυθμίζονται προς τα πάνω και προς τα κάτω.[17] Οι μικροσυστοιχίες ολιγονουκλεοτιδίων φέρουν συχνά ανιχνευτές ελέγχου σχεδιασμένους να υβριδοποιούνται με RNA spike-ins. Ο βαθμός υβριδισμού μεταξύ των ακίδων και των ανιχνευτών ελέγχου χρησιμοποιείται για την κανονικοποίηση των μετρήσεων υβριδισμού για τους ανιχνευτές-στόχους. Αν και τα απόλυτα επίπεδα γονιδιακής έκφρασης μπορούν να προσδιοριστούν στη συστοιχία δύο καναλιών σε σπάνιες περιπτώσεις, οι σχετικές διαφορές στην έκφραση μεταξύ διαφορετικών σημείων μέσα σε ένα δείγμα και μεταξύ δειγμάτων είναι η προτιμώμενη μέθοδος ανάλυσης δεδομένων για το σύστημα δύο καναλιών. Παραδείγματα παρόχων τέτοιων μικροσυστοιχιών περιλαμβάνουν τον Agilent με την πλατφόρμα Dual-Mode, την Eppendorf με την πλατφόρμα DualChip για χρωματομετρική σήμανση Silverquant και την TeleChem International με Arrayit. Σε μονοκαναλικές μικροσυστοιχίες ή μονόχρωμες μικροσυστοιχίες, οι συστοιχίες παρέχουν δεδομένα έντασης για κάθε ανιχνευτή ή σύνολο ανιχνευτή υποδεικνύοντας ένα σχετικό επίπεδο υβριδισμού με τον επισημασμένο στόχο. Ωστόσο, δεν υποδεικνύουν πραγματικά επίπεδα αφθονίας ενός γονιδίου αλλά μάλλον σχετική αφθονία σε σύγκριση με άλλα δείγματα ή συνθήκες όταν υποβάλλονται σε επεξεργασία στο ίδιο πείραμα. Κάθε μόριο RNA αντιμετωπίζει απόκλιση παρτίδας και ειδικού πρωτοκόλλου κατά τη διάρκεια των φάσεων ενίσχυσης, επισήμανσης και υβριδισμού του πειράματος καθιστώντας τις συγκρίσεις μεταξύ γονιδίων για την ίδια μικροσυστοιχία μη ενημερωτικές. Η σύγκριση δύο συνθηκών για το ίδιο γονίδιο απαιτεί δύο ξεχωριστούς υβριδισμούς μιας βαφής. Αρκετά δημοφιλή συστήματα μονού καναλιού είναι τα Affymetrix "Gene Chip", Illumina "Bead Chip", Agilent συστοιχίες μονού καναλιού, οι Applied Microarrays "CodeLink" και οι Eppendorf "DualChip & Silverquant". Ένα πλεονέκτημα του συστήματος απλής βαφής έγκειται στο γεγονός ότι ένα παρεκκλίνον δείγμα δεν μπορεί να επηρεάσει τα ακατέργαστα δεδομένα που προέρχονται από άλλα δείγματα, επειδή κάθε τσιπ συστοιχίας εκτίθεται μόνο σε ένα δείγμα (σε αντίθεση με ένα σύστημα δύο καναλιών στο οποίο ένα μεμονωμένο δείγμα χαμηλής ποιότητας μπορεί να επηρεάσει δραστικά τη συνολική ακρίβεια δεδομένων, ακόμη κι αν το άλλο δείγμα ήταν υψηλής ποιότητας). Ένα άλλο πλεονέκτημα είναι ότι τα δεδομένα συγκρίνονται πιο εύκολα με συστοιχίες από διαφορετικά πειράματα, εφόσον έχουν υπολογιστεί τα αποτελέσματα παρτίδας. Η μικροσυστοιχία ενός καναλιού μπορεί να είναι η μόνη επιλογή σε ορισμένες περιπτώσεις. Ας υποθέσουμε ότι τα δείγματα πρέπει να συγκριθούν: τότε ο αριθμός των πειραμάτων που απαιτούνται με τη χρήση των δύο συστοιχιών καναλιών γίνεται γρήγορα ανέφικτος, εκτός εάν χρησιμοποιείται ένα δείγμα ως αναφορά.

αριθμός δειγμάτων μονοκάναλη μικροσυστοιχία δικάναλη μικροσυστοιχία

δικάναλη μικροσυστοιχία (με παραπομπή)

1 1 1 1
2 2 1 1
3 3 3 2
4 4 6 3

Ένα τυπικό πρωτόκολλο

[Επεξεργασία | επεξεργασία κώδικα]
Παραδείγματα επιπέδων εφαρμογής μικροσυστοιχιών. Μέσα στους οργανισμούς, τα γονίδια μεταγράφονται και ματίζονται για να παραχθούν ώριμα μεταγραφήματα mRNA (κόκκινο). Το mRNA εξάγεται από τον οργανισμό και η αντίστροφη μεταγραφάση χρησιμοποιείται για την αντιγραφή του mRNA σε σταθερό ds-cDNA (γαλάζιο). Σε μικροσυστοιχίες, το ds-cDNA είναι κατακερματισμένο και επισημασμένο με φθορισμό (πορτοκαλί). Τα επισημασμένα θραύσματα δεσμεύονται σε μια διατεταγμένη συστοιχία συμπληρωματικών ολιγονουκλεοτιδίων και η μέτρηση της έντασης φθορισμού κατά μήκος της συστοιχίας υποδεικνύει την αφθονία ενός προκαθορισμένου συνόλου αλληλουχιών. Αυτές οι αλληλουχίες επιλέγονται τυπικά ειδικά για να αναφέρουν γονίδια ενδιαφέροντος εντός του γονιδιώματος του οργανισμού.[18]

Αυτό είναι ένα παράδειγμα ενός πειράματος μικροσυστοιχίας DNA που περιλαμβάνει λεπτομέρειες για μια συγκεκριμένη περίπτωση για να εξηγηθούν καλύτερα τα πειράματα μικροσυστοιχιών DNA, ενώ παρατίθενται τροποποιήσεις για RNA ή άλλα εναλλακτικά πειράματα.

  1. Τα δύο προς σύγκριση δείγματα (σύγκριση κατά ζεύγη) αναπτύσσονται/αποκτώνται. Σε αυτό το παράδειγμα επεξεργασμένο δείγμα (ασθενείς και μη επεξεργασμένο δείγμα (μάρτυρες).
  2. Το νουκλεϊκό οξύ που ενδιαφέρει καθαρίζεται: αυτό μπορεί να είναι RNA για προφίλ έκφρασης, DNA για συγκριτικό υβριδισμό, ή δεσμευμένο DNA/RNA σε μια συγκεκριμένη πρωτεΐνη που είναι ανοσοκαταβυθισμένη χρωματίνη σε μικροσυστοιχία DNA (ChIP-on-chip) για επιγενετικές ή ρυθμιστικές μελέτες. Σε αυτό το παράδειγμα το ολικό RNA απομονώνεται (τόσο το πυρηνικό όσο και το κυτταροπλασματικό) με εκχύλιση θειοκυανικού γουανιδινίου-φαινόλης-χλωροφόρμιου (π.χ. Trizol) που απομονώνει το μεγαλύτερο μέρος του RNA (ενώ οι μέθοδοι στήλης έχουν αποκοπή 200 νουκλεοτιδίων) και εάν γίνει σωστά, η έχει καλύτερη καθαρότητα.
  3. Το καθαρισμένο RNA αναλύεται ως προς την ποιότητα (με τριχοειδική ηλεκτροφόρηση) και την ποσότητα (για παράδειγμα, χρησιμοποιώντας ένα φασματόμετρο νανοσταγόνας ή νανοφωτόμετρο). Εάν το υλικό είναι αποδεκτής ποιότητας και υπάρχει επαρκής ποσότητα (π.χ. >1μg, αν και η απαιτούμενη ποσότητα ποικίλλει ανά πλατφόρμα μικροσυστοιχίας), το πείραμα μπορεί να προχωρήσει.
  4. Το επισημασμένο προϊόν δημιουργείται μέσω αντίστροφης μεταγραφής και ακολουθείται από μια προαιρετική ενίσχυση PCR. Το RNA μεταγράφεται αντίστροφα είτε με εκκινητές polyT (που ενισχύουν μόνο mRNA), είτε με τυχαίους εκκινητές (που ενισχύουν όλο το RNA, το μεγαλύτερο μέρος των οποίων είναι rRNA). Οι μικροσυστοιχίες miRNA απολινώνουν ένα ολιγονουκλεοτίδιο στο καθαρισμένο μικρό RNA (απομονωμένο με κλασματοποιητή), το οποίο στη συνέχεια μεταγράφεται αντίστροφα και ενισχύεται.
    • Η ετικέτα προστίθεται είτε κατά τη διάρκεια του σταδίου της αντίστροφης μεταγραφής, είτε μετά την ενίσχυση εάν εκτελεστεί. Η επισήμανση κατεύθυνσης εξαρτάται από τη μικροσυστοιχία. π.χ. εάν η ετικέτα προστεθεί με το μίγμα RT, το cDNA είναι αντινοηματικό και ο ανιχνευτής μικροσυστοιχίας είναι νοηματικός, εκτός από την περίπτωση αρνητικών μαρτύρων.
    • Η ετικέτα είναι τυπικά φθορισμού. Μόνο ένα μηχάνημα χρησιμοποιεί ραδιοετικέτες.
    • Η επισήμανση μπορεί να είναι άμεση (δεν χρησιμοποιείται) ή έμμεση (απαιτείται στάδιο σύζευξης). Για συστοιχίες δύο καναλιών, το στάδιο σύζευξης λαμβάνει χώρα πριν από τον υβριδισμό, χρησιμοποιώντας τριφωσφορική αμινοαλλυλουριδίνη (αμινοαλυλ-UTP, ή aaUTP) και αμινο-δραστικές χρωστικές Ν-υδροξυηλεκτριμιδίου (N-hydroxysuccinimide, NHS) (όπως χρωστικές κυανίνης). Για συστοιχίες μονού καναλιού, το στάδιο σύζευξης λαμβάνει χώρα μετά τον υβριδισμό, χρησιμοποιώντας βιοτίνη και επισημασμένη ως στρεπταβιδίνη (streptavidin). Τα τροποποιημένα νουκλεοτίδια (συνήθως σε αναλογία 1 aaUTP: 4 TTP (τριφωσφορική θυμιδίνη) προστίθενται ενζυματικά σε χαμηλή αναλογία προς τα κανονικά νουκλεοτίδια, με αποτέλεσμα τυπικά 1 κάθε 60 βάσεις. Το aaDNA στη συνέχεια καθαρίζεται με στήλη (χρησιμοποιώντας ένα ρυθμιστικό διάλυμα φωσφορικών, καθώς το Tris περιέχει ομάδες αμίνης). Η αμινοαλυλική ομάδα είναι μια ομάδα αμίνης σε έναν μακρύ συνδέτη συνδεδεμένο με τη νουκλεοβάση, η οποία αντιδρά με μια δραστική χρωστική.
      • Μια μορφή αντιγραφής γνωστή ως αναστροφή χρωστικής μπορεί να εκτελεστεί για τον έλεγχο της τεχνικών σφαλμάτων της βαφής σε πειράματα δύο καναλιών. Για μια αναστροφή χρωστικής, χρησιμοποιείται μια δεύτερη πλάκα, με τις ετικέτες εναλλάξιμες (το δείγμα που επισημάνθηκε με Cy3 στην πρώτη πλάκα φέρει ετικέτα Cy5 και αντίστροφα). Σε αυτό το παράδειγμα, το αμινοαλυλ-UTP υπάρχει στο ανάστροφα μεταγραφόμενο μίγμα.
  5. Τα επισημασμένα δείγματα στη συνέχεια αναμειγνύονται με ένα αποκλειστικό διάλυμα υβριδισμού το οποίο μπορεί να αποτελείται από δωδεκυλοθειικό νάτριο (Sodium dodecyl sulfate, SDS), SSC, θειική δεξτράνη, έναν παράγοντα αποκλεισμού (όπως Cot-1 DNA, DNA σπέρματος σολομού, DNA θύμου μόσχου, PolyA ή PolyT), διάλυμα Denhardt, ή Μεθυλαμίνη.

^# Το μείγμα μετουσιώνεται και προστίθεται στις μικροσκοπικές οπές της μικροσυστοιχίας. Οι οπές σφραγίζονται και η μικροσυστοιχία υβριδοποιείται, είτε σε έναν κλίβανο υβριδοποίησης, όπου η μικροσυστοιχία αναμειγνύεται με περιστροφή, είτε σε ένα μείκτη, όπου η μικροσυστοιχία αναμειγνύεται με εναλλασσόμενη πίεση στις μικροσκοπικές οπές.

  1. Μετά από μια ολονύκτια υβριδοποίηση, όλη η μη ειδική δέσμευση ξεπλένεται (SDS και SSC).
  2. Η μικροσυστοιχία στεγνώνει και σαρώνεται από ένα μηχάνημα που χρησιμοποιεί λέιζερ για να διεγείρει τη βαφή και μετρά τα επίπεδα εκπομπής με έναν ανιχνευτή.
  3. Η εικόνα καλύπτεται με ένα πρότυπο και οι εντάσεις κάθε χαρακτηριστικού (που αποτελείται από πολλά εικονοστοιχεία) ποσοτικοποιούνται.
  4. Τα ανεπεξέργαστα δεδομένα κανονικοποιούνται. Η απλούστερη μέθοδος κανονικοποίησης είναι η αφαίρεση της έντασης και της κλίμακας υποβάθρου, έτσι ώστε οι συνολικές εντάσεις των χαρακτηριστικών των δύο καναλιών να είναι ίσες ή να χρησιμοποιηθεί η ένταση ενός γονιδίου αναφοράς για τον υπολογισμό της τιμής t για όλες τις εντάσεις. Οι πιο εξελιγμένες μέθοδοι περιλαμβάνουν τον λόγο z, την παλινδρόμηση loess και lowess καθώς και και RMA (robust multichip analysis, ισχυρή ανάλυση πολλαπλών τσιπ) για τσιπ Affymetrix (μονοκάναλο, τσιπ πυριτίου, σύντομα ολιγονουκλεοτίδια που συντίθενται επιτόπου).

Μικροσυστοιχίες και βιοπληροφορική

[Επεξεργασία | επεξεργασία κώδικα]
Οι τιμές γονιδιακής έκφρασης από πειράματα μικροσυστοιχιών μπορούν να αναπαρασταθούν ως χάρτες θερμότητας για την οπτικοποίηση του αποτελέσματος της ανάλυσης δεδομένων.

Η εμφάνιση φθηνών πειραμάτων μικροσυστοιχιών δημιούργησε πολλές συγκεκριμένες προκλήσεις στη βιοπληροφορική:[19] τα πολλαπλά επίπεδα αντιγραφής στον πειραματικό σχεδιασμό. Ο αριθμός των πλατφορμών και των ανεξάρτητων ομάδων και η μορφή δεδομένων προτυποποίησης. Η στατιστική επεξεργασία των δεδομένων. Η αντιστοίχιση κάθε ανιχνευτή στο μεταγράφημα mRNA που μετρά. Ο τεράστιος όγκος των δεδομένων και η δυνατότητα κοινής χρήσης τους.

Πειραματικός σχεδιασμός

[Επεξεργασία | επεξεργασία κώδικα]

Λόγω της βιολογικής πολυπλοκότητας της γονιδιακής έκφρασης, οι εκτιμήσεις του πειραματικού σχεδιασμού που συζητούνται στο άρθρο προφίλ έκφρασης είναι κρίσιμης σημασίας εάν πρόκειται να εξαχθούν στατιστικά και βιολογικά έγκυρα συμπεράσματα από τα δεδομένα. Υπάρχουν τρία κύρια στοιχεία που πρέπει να ληφθούν υπόψη κατά το σχεδιασμό ενός πειράματος μικροσυστοιχίας. Πρώτον, η αναπαραγωγή των βιολογικών δειγμάτων είναι απαραίτητη για την εξαγωγή συμπερασμάτων από το πείραμα. Δεύτερον, τα τεχνικά αντίγραφα (π.χ. δύο δείγματα RNA που λαμβάνονται από κάθε πειραματική μονάδα) μπορεί να βοηθήσουν στον ποσοτική ακρίβεια. Τα βιολογικά αντίγραφα περιλαμβάνουν ανεξάρτητες εκχυλίσεις RNA. Τα τεχνικά αντίγραφα μπορεί να είναι δύο στοιχεία της ίδιας εξαγωγής. Τρίτον, κηλίδες κάθε κλώνου cDNA ή ολιγονουκλεοτιδίου υπάρχουν ως αντίγραφα (τουλάχιστον διπλά) στην αντικειμενοφόρο πλάκα μικροσυστοιχίας, για να παρέχουν ένα μέτρο τεχνικής ακρίβειας σε κάθε υβριδισμό. Είναι κρίσιμο να συζητούνται πληροφορίες σχετικά με την προετοιμασία και το χειρισμό του δείγματος, προκειμένου να βοηθηθεί ο εντοπισμός των ανεξάρτητων μονάδων στο πείραμα και να αποφευχθούν διογκωμένες εκτιμήσεις της στατιστικής σημαντικότητας.[20]

Τα δεδομένα μικροσυστοιχιών είναι δύσκολο να ανταλλάσσονται λόγω της έλλειψης τυποποίησης στην κατασκευή πλατφόρμας, στα πρωτόκολλα ανάλυσης και στις μεθόδους ανάλυσης. Αυτό παρουσιάζει ένα πρόβλημα διαλειτουργικότητας στη βιοπληροφορική. Διάφορα λαϊκά έργα ανοικτού κώδικα προσπαθούν να διευκολύνουν την ανταλλαγή και την ανάλυση δεδομένων που παράγονται με μη ιδιόκτητα τσιπ: Για παράδειγμα, η λίστα ελέγχου "Ελάχιστες πληροφορίες σχετικά με ένα πείραμα μικροσυστοιχίας" (MIAME) βοηθά στον καθορισμό του επιπέδου λεπτομέρειας που πρέπει να υπάρχει και υιοθετείται από πολλά περιοδικά ως προϋπόθεση για την υποβολή εργασιών που ενσωματώνουν αποτελέσματα μικροσυστοιχιών. Ωστόσο, το MIAME δεν περιγράφει τη μορφή για τις πληροφορίες, επομένως, ενώ πολλές μορφές μπορούν να υποστηρίξουν τις απαιτήσεις του MIAME, καμία μορφή δεν επιτρέπει την επαλήθευση της πλήρους σημασιολογικής συμμόρφωσης. Το έργο "MicroArray Quality Control (MAQC) Project" διεξάγεται από τη Food and Drug Administration (FDA) των ΗΠΑ για την ανάπτυξη προτύπων και μετρήσεων ποιοτικού ελέγχου που θα επιτρέψουν τελικά τη χρήση δεδομένων μικροσυστοιχιών στην ανακάλυψη φαρμάκων, την κλινική πρακτική και τη λήψη ρυθμιστικών αποφάσεων.[21] Η MGED Society έχει αναπτύξει πρότυπα για την αναπαράσταση των αποτελεσμάτων πειραμάτων γονιδιακής έκφρασης και σχετικούς σχολιασμούς.

Ανάλυση δεδομένων

[Επεξεργασία | επεξεργασία κώδικα]
Εθνικό Κέντρο Τοξικολογικής Έρευνας των ΗΠΑ. Επιστήμονας εξετάζει δεδομένα μικροσυστοιχιών.

Τα σύνολα δεδομένων μικροσυστοιχιών είναι συνήθως πολύ μεγάλα και η αναλυτική ακρίβεια επηρεάζεται από έναν αριθμό μεταβλητών. Οι στατιστικές προκλήσεις περιλαμβάνουν τη συνεκτίμηση των επιπτώσεων του θορύβου υποβάθρου και την κατάλληλη κανονικοποίηση των δεδομένων. Οι μέθοδοι κανονικοποίησης μπορεί να είναι κατάλληλες για συγκεκριμένες πλατφόρμες και, στην περίπτωση εμπορικών πλατφορμών, η ανάλυση μπορεί να είναι αποκλειστική.[22] Οι αλγόριθμοι που επηρεάζουν τη στατιστική ανάλυση περιλαμβάνουν:

  • Ανάλυση εικόνας: τοποθέτηση στο πλέγμα, αναγνώριση σημείου της σαρωμένης εικόνας (αλγόριθμος τμηματοποίησης), αφαίρεση ή σήμανση χαρακτηριστικών κακής ποιότητας και χαμηλής έντασης (flagging).
  • Επεξεργασία δεδομένων: αφαίρεση παρασκηνίου (με βάση το καθολικό ή τοπικό παρασκήνιο), προσδιορισμός εντάσεων και αναλογιών έντασης κηλίδων, οπτικοποίηση δεδομένων και λογαριθμικός μετασχηματισμός αναλογιών, καθολική ή τοπική κανονικοποίηση των αναλογιών έντασης και τμηματοποίηση σε διαφορετικές περιοχές αριθμού αντιγράφων χρησιμοποιώντας αλγόριθμους βηματικής ανίχνευσης [23]
  • Ανάλυση ανακάλυψης τάξης: Αυτή η αναλυτική προσέγγιση, που μερικές φορές ονομάζεται ταξινόμηση χωρίς επίβλεψη ή ανακάλυψη γνώσης, προσπαθεί να προσδιορίσει εάν μικροσυστοιχίες (αντικειμένων, ασθενών, ποντικιών, κ.λπ.) ή γονιδίων συγκεντρώνονται σε ομάδες. Ο εντοπισμός φυσικώς υπαρχουσών ομάδων αντικειμένων (μικροσυστοιχίες ή γονίδια) που συγκεντρώνονται μαζί μπορεί να επιτρέψει την ανακάλυψη νέων ομάδων που διαφορετικά δεν ήταν γνωστό ότι υπήρχαν. Κατά τη διάρκεια της ανάλυσης ανακάλυψης γνώσης, διάφορες μη εποπτευόμενες τεχνικές ταξινόμησης μπορούν να χρησιμοποιηθούν με δεδομένα μικροσυστοιχιών DNA για την αναγνώριση νέων συστάδων (τάξεων) συστοιχιών.[24] Αυτός ο τύπος προσέγγισης δεν βασίζεται σε υποθέσεις, αλλά βασίζεται μάλλον σε επαναληπτική αναγνώριση προτύπων ή στατιστικών μεθόδων μάθησης για την εύρεση ενός βέλτιστου αριθμού συστάδων στα δεδομένα. Παραδείγματα μεθόδων αναλύσεων χωρίς επίβλεψη περιλαμβάνουν χάρτες αυτοοργάνωσης, νευρικό αέριο, αναλύσεις συστάδων k-μέσων,[25] ιεραρχική ανάλυση συστάδων, ομαδοποίηση βάσει γονιδιωματικής επεξεργασίας σήματος και ανάλυση συστάδων βάσει μοντέλου. Για ορισμένες από αυτές τις μεθόδους, ο χρήστης πρέπει επίσης να ορίσει ένα μέτρο απόστασης μεταξύ ζευγών αντικειμένων. Αν και συνήθως χρησιμοποιείται ο συντελεστής συσχέτισης Pearson, αρκετά άλλα μέτρα έχουν προταθεί και αξιολογηθεί στη βιβλιογραφία.[26] Τα δεδομένα εισόδου που χρησιμοποιούνται στις αναλύσεις ανακάλυψης τάξεων βασίζονται συνήθως σε λίστες γονιδίων με υψηλή πληροφόρηση (χαμηλό θόρυβο) με βάση τις χαμηλές τιμές του συντελεστή διακύμανσης, ή τις υψηλές τιμές της εντροπίας Shannon, κ.λπ. Ο προσδιορισμός του πιο πιθανού ή βέλτιστου αριθμού συστάδων που λαμβάνεται από μια ανάλυση χωρίς επίβλεψη ονομάζεται εγκυρότητα συστάδων. Ορισμένες μετρήσεις που χρησιμοποιούνται συνήθως για την εγκυρότητα συμπλέγματος είναι ο δείκτης σιλουέτας, ο δείκτης Davies-Bouldin,[27] ο δείκτης Dunn ή το στατιστικό στοιχείο του Hubert.
  • Ανάλυση πρόβλεψης τάξης: Αυτή η προσέγγιση, που ονομάζεται εποπτευόμενη ταξινόμηση, δημιουργεί τη βάση για την ανάπτυξη ενός προγνωστικού μοντέλου στο οποίο μπορούν να εισαχθούν μελλοντικά άγνωστα αντικείμενα δοκιμής προκειμένου να προβλεφθεί η πιο πιθανή συμμετοχή στην κατηγορία των αντικειμένων της δοκιμής. Η εποπτευόμενη ανάλυση[24] για την πρόβλεψη τάξεων περιλαμβάνει τη χρήση τεχνικών όπως γραμμική παλινδρόμηση, k-πλησιέστερος γείτονας, κβαντοποίηση διανυσμάτων μάθησης, ανάλυση δέντρων αποφάσεων, τυχαία δάση, αφελής Bayes, λογιστική παλινδρόμηση, παλινδρόμηση πυρήνα, τεχνητά νευρωνικά δίκτυα, μηχανές υποστήριξης διανυσμάτων, μίγμα ειδικών και εποπτευόμενο νευρικό αέριο. Επιπλέον, χρησιμοποιούνται διάφορες μεταευρετικές μέθοδοι, όπως γενετικοί αλγόριθμοι, αυτοπροσαρμογή πίνακα συνδιακύμανσης, βελτιστοποίηση σμήνους σωματιδίων και βελτιστοποίηση αποικίας μυρμηγκιών. Τα δεδομένα εισόδου για την πρόβλεψη τάξης βασίζονται συνήθως σε φιλτραρισμένες λίστες γονιδίων που είναι προγνωστικά της κατηγορίας, που προσδιορίζονται χρησιμοποιώντας κλασικά τεστ υποθέσεων (επόμενη ενότητα), δείκτη ποικιλομορφίας Gini ή κέρδος πληροφοριών (εντροπία).
  • Στατιστική ανάλυση βάσει υποθέσεων: Η αναγνώριση στατιστικά σημαντικών αλλαγών στη γονιδιακή έκφραση προσδιορίζεται συνήθως χρησιμοποιώντας τα t-test, ANOVA, τη μέθοδο Bayesian. [28] Οι μέθοδοι δοκιμής Mann–Whitney προσαρμοσμένες σε σύνολα δεδομένων μικροσυστοιχιών, οι οποίες λαμβάνουν υπόψη πολλαπλές συγκρίσεις[29] ή ανάλυση συστάδας.[30] Αυτές οι μέθοδοι αξιολογούν τη στατιστική ισχύ με βάση τη διακύμανση που υπάρχει στα δεδομένα και τον αριθμό των πειραματικών επαναλήψεων και μπορούν να βοηθήσουν στην ελαχιστοποίηση των λαθών τύπου I και τύπου II στις αναλύσεις.[31] όπως και σε πολλές άλλες περιπτώσεις όπου οι αρχές διαφωνούν, μια υγιής συντηρητική προσέγγιση είναι η απευθείας σύγκριση διαφορετικών μεθόδων κανονικοποίησης για τον προσδιορισμό των επιπτώσεων αυτών των διαφορετικών μεθόδων στα αποτελέσματα που λαμβάνονται. Αυτό μπορεί να γίνει, για παράδειγμα, με τη διερεύνηση της απόδοσης διαφόρων μεθόδων σε δεδομένα από πειράματα "spike-in".
  • Μείωση διαστάσεων: Οι αναλυτές μειώνουν συχνά τον αριθμό των διαστάσεων (γονιδίων) πριν από την ανάλυση δεδομένων.[24] Αυτό μπορεί να περιλαμβάνει γραμμικές προσεγγίσεις όπως ανάλυση κύριων συστατικών (principal components analysis, PCA) ή μη γραμμική πολλαπλή μάθηση (μετρική εκμάθηση εξ αποστάσεως) χρησιμοποιώντας πυρήνα PCA, χάρτες διάχυσης, λαπλασιανούς ιδιοχάρτες, τοπική γραμμική ενσωμάτωση, τοπική διατήρηση προβολών και χαρτογράφηση του Sammon.
  • Μέθοδοι που βασίζονται σε δίκτυο: Στατιστικές μέθοδοι που λαμβάνουν υπόψη την υποκείμενη δομή των γονιδιακών δικτύων, αντιπροσωπεύοντας είτε συσχετιστικές, είτε αιτιολογικές αλληλεπιδράσεις, ή εξαρτήσεις μεταξύ γονιδιακών προϊόντων.[32] Η ανάλυση δικτύου σταθμισμένης συνέκφρασης γονιδίων χρησιμοποιείται ευρέως για τον εντοπισμό μονάδων συνέκφρασης και γονιδίων ενδομοριακού κόμβου. Οι μονάδες μπορεί να αντιστοιχούν σε τύπους κυττάρων ή οδούς. Οι ενδομυϊκοί κόμβοι υψηλής σύνδεσης αντιπροσωπεύουν καλύτερα τις αντίστοιχες μονάδες τους.

Τα δεδομένα μικροσυστοιχιών ενδέχεται να απαιτούν περαιτέρω επεξεργασία με στόχο τη μείωση της διάστασης των δεδομένων για να διευκολύνεται η κατανόηση και η πιο εστιασμένη ανάλυση.[33] Άλλες μέθοδοι επιτρέπουν την ανάλυση δεδομένων που αποτελούνται από μικρό αριθμό βιολογικών ή τεχνικών αντιγραφών. Παραδείγματος χάρη, η δοκιμή τοπικού συγκεντρωτικού σφάλματος (Local Pooled Error, LPE) συγκεντρώνει τυπικές αποκλίσεις γονιδίων με παρόμοια επίπεδα έκφρασης σε μια προσπάθεια να αντισταθμίσει την ανεπαρκή αντιγραφή.[34]

Η σχέση μεταξύ ενός ανιχνευτή και του mRNA που αναμένεται να ανιχνεύσει δεν είναι ασήμαντη.[35] Ορισμένα mRNA μπορεί να διασταυρώσουν υβριδικά ανιχνευτές στη συστοιχία που υποτίθεται ότι ανιχνεύουν ένα άλλο mRNA. Επιπλέον, τα mRNA μπορεί να εμφανίσουν προκατάληψη ενίσχυσης που είναι ειδική για την αλληλουχία ή το μόριο. Τρίτον, οι ανιχνευτές που έχουν σχεδιαστεί για να ανιχνεύουν το mRNA ενός συγκεκριμένου γονιδίου μπορεί να βασίζονται σε γονιδιωματικές πληροφορίες εκφρασμένης ετικέτας αλληλουχίας (Expressed sequence tag, EST) που σχετίζονται εσφαλμένα με αυτό το γονίδιο.

Αποθήκευση δεδομένων

[Επεξεργασία | επεξεργασία κώδικα]

Τα δεδομένα μικροσυστοιχιών βρέθηκαν πιο χρήσιμα σε σύγκριση με άλλα παρόμοια σύνολα δεδομένων. Ο τεράστιος όγκος δεδομένων, οι εξειδικευμένες μορφές (όπως MIAME) και οι προσπάθειες επιμέλειας που σχετίζονται με τα σύνολα δεδομένων απαιτούν εξειδικευμένες βάσεις δεδομένων για την αποθήκευση των δεδομένων. Ένας αριθμός λύσεων αποθήκευσης δεδομένων ανοιχτού κώδικα, όπως το InterMine και το BioMart, έχουν δημιουργηθεί με συγκεκριμένο σκοπό την ενσωμάτωση διαφορετικών βιολογικών συνόλων δεδομένων, καθώς και την υποστήριξη της ανάλυσης.

Εναλλακτικές τεχνολογίες

[Επεξεργασία | επεξεργασία κώδικα]

Η πρόοδος στη μαζικά παράλληλη αλληλούχιση οδήγησε στην ανάπτυξη της τεχνολογίας RNA-Seq, η οποία επιτρέπει σε μια ολοκληρωμένη προσέγγιση του μεταγραφώματος για τον χαρακτηρισμό και τον ποσοτικό προσδιορισμό της γονιδιακής έκφρασης.[36][37] Σε αντίθεση με τις μικροσυστοιχίες, οι οποίες χρειάζονται ένα γονιδίωμα αναφοράς και ένα μεταγράφωμα για να είναι διαθέσιμο πριν σχεδιαστεί η ίδια η μικροσυστοιχία, το RNA-Seq μπορεί επίσης να χρησιμοποιηθεί για νέους οργανισμούς προτύπων των οποίων το γονιδίωμα δεν έχει ακόμη προσδιοριστεί η αλληλουχία.[37]

  1. Taub, Floyd (1983). «Laboratory methods: Sequential comparative hybridizations analyzed by computerized image processing can identify and quantitate regulated RNAs». DNA 2 (4): 309–327. doi:10.1089/dna.1983.2.309. PMID 6198132. 
  2. Adomas A; Heller G; Olson A; Osborne J; Karlsson M; Nahalkova J; Van Zyl L; Sederoff R και άλλοι. (2008). «Comparative analysis of transcript abundance in Pinus sylvestris after challenge with a saprotrophic, pathogenic or mutualistic fungus». Tree Physiol. 28 (6): 885–897. doi:10.1093/treephys/28.6.885. PMID 18381269. 
  3. Pollack JR; Perou CM; Alizadeh AA; Eisen MB; Pergamenschikov A; Williams CF; Jeffrey SS; Botstein D και άλλοι. (1999). «Genome-wide analysis of DNA copy-number changes using cDNA microarrays». Nat Genet 23 (1): 41–46. doi:10.1038/12640. PMID 10471496. https://cdr.lib.unc.edu/downloads/sj139421j. 
  4. Moran G; Stokes C; Thewes S; Hube B; Coleman DC; Sullivan D (2004). «Comparative genomics using Candida albicans DNA microarrays reveals absence and divergence of virulence-associated genes in Candida dubliniensis». Microbiology 150 (Pt 10): 3363–3382. doi:10.1099/mic.0.27221-0. PMID 15470115. 
  5. Hacia JG; Fan JB; Ryder O; Jin L; Edgemon K; Ghandour G; Mayer RA; Sun B και άλλοι. (1999). «Determination of ancestral alleles for human single-nucleotide polymorphisms using high-density oligonucleotide arrays». Nat Genet 22 (2): 164–167. doi:10.1038/9674. PMID 10369258. 
  6. 6,0 6,1 6,2 Gagna, Claude E.; Lambert, W. Clark (2009-05-01). «Novel multistranded, alternative, plasmid and helical transitional DNA and RNA microarrays: implications for therapeutics». Pharmacogenomics 10 (5): 895–914. doi:10.2217/pgs.09.27. ISSN 1744-8042. PMID 19450135. 
  7. 7,0 7,1 7,2 Gagna, Claude E.; Clark Lambert, W. (2007-03-01). «Cell biology, chemogenomics and chemoproteomics – application to drug discovery». Expert Opinion on Drug Discovery 2 (3): 381–401. doi:10.1517/17460441.2.3.381. ISSN 1746-0441. PMID 23484648. 
  8. Mukherjee, Anirban; Vasquez, Karen M. (2011-08-01). «Triplex technology in studies of DNA damage, DNA repair, and mutagenesis». Biochimie 93 (8): 1197–1208. doi:10.1016/j.biochi.2011.04.001. ISSN 1638-6183. PMID 21501652. 
  9. Rhodes, Daniela; Lipps, Hans J. (2015-10-15). «G-quadruplexes and their regulatory roles in biology». Nucleic Acids Research 43 (18): 8627–8637. doi:10.1093/nar/gkv862. ISSN 1362-4962. PMID 26350216. 
  10. Rasheed, Awais; Hao, Yuanfeng; Xia, Xianchun; Khan, Awais; Xu, Yunbi; Varshney, Rajeev K.; He, Zhonghu (2017). «Crop Breeding Chips and Genotyping Platforms: Progress, Challenges, and Perspectives». Molecular Plant (Chin Acad Sci+Chin Soc Plant Bio+Shanghai Inst Bio Sci (Elsevier)) 10 (8): 1047–1064. doi:10.1016/j.molp.2017.06.008. ISSN 1674-2052. PMID 28669791. http://oar.icrisat.org/10133/1/S1674-2052%2817%2930174-0.pdf. 
  11. J Biochem Biophys Methods. 2000 Mar 16;42(3):105–10. DNA-printing: utilization of a standard inkjet printer for the transfer of nucleic acids to solid supports. Goldmann T, Gonzalez JS.
  12. Lausted C (2004). «POSaM: a fast, flexible, open-source, inkjet oligonucleotide synthesizer and microarrayer». Genome Biology 5 (8): R58. doi:10.1186/gb-2004-5-8-r58. PMID 15287980. 
  13. Bammler T, Beyer RP; Consortium, Members of the Toxicogenomics Research; Kerr, X; Jing, LX; Lapidus, S; Lasarev, DA; Paules, RS; Li, JL και άλλοι. (2005). «Standardizing global gene expression analysis between laboratories and across platforms». Nat Methods 2 (5): 351–356. doi:10.1038/nmeth754. PMID 15846362. 
  14. Pease AC; Solas D; Sullivan EJ; Cronin MT; Holmes CP; Fodor SP (1994). «Light-generated oligonucleotide arrays for rapid DNA sequence analysis». PNAS 91 (11): 5022–5026. doi:10.1073/pnas.91.11.5022. PMID 8197176. Bibcode1994PNAS...91.5022P. 
  15. Nuwaysir EF; Huang W; Albert TJ; Singh J; Nuwaysir K; Pitas A; Richmond T; Gorski T και άλλοι. (2002). «Gene Expression Analysis Using Oligonucleotide Arrays Produced by Maskless Photolithography». Genome Res 12 (11): 1749–1755. doi:10.1101/gr.362402. PMID 12421762. 
  16. Shalon D; Smith SJ; Brown PO (1996). «A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization». Genome Res 6 (7): 639–645. doi:10.1101/gr.6.7.639. PMID 8796352. 
  17. Tang T; François N; Glatigny A; Agier N; Mucchielli MH; Aggerbeck L; Delacroix H (2007). «Expression ratio evaluation in two-colour microarray experiments is significantly improved by correcting image misalignment». Bioinformatics 23 (20): 2686–2691. doi:10.1093/bioinformatics/btm399. PMID 17698492. 
  18. Shafee, Thomas; Lowe, Rohan (2017). «Eukaryotic and prokaryotic gene structure» (στα αγγλικά). WikiJournal of Medicine 4 (1). doi:10.15347/wjm/2017.002. ISSN 2002-4436. 
  19. Tinker, Anna V.; Boussioutas, Alex; Bowtell, David D.L. (2006). «The challenges of gene expression microarrays for the study of human cancer». Cancer Cell 9 (5): 333–339. doi:10.1016/j.ccr.2006.05.001. ISSN 1535-6108. PMID 16697954. 
  20. Churchill, GA (2002). «Fundamentals of experimental design for cDNA microarrays». Nature Genetics. supplement 32: 490–5. doi:10.1038/ng1031. PMID 12454643. Αρχειοθετήθηκε από το πρωτότυπο στις 2005-05-08. https://web.archive.org/web/20050508225647/http://www.vmrf.org/research-websites/gcf/Forms/Churchill.pdf. Ανακτήθηκε στις 12 December 2013. 
  21. NCTR Center for Toxicoinformatics – MAQC Project
  22. «Prosigna | Prosigna algorithm». prosigna.com. Αρχειοθετήθηκε από το πρωτότυπο στις 9 Νοεμβρίου 2017. Ανακτήθηκε στις 22 Ιουνίου 2017. 
  23. Little, M.A.; Jones, N.S. (2011). «Generalized Methods and Solvers for Piecewise Constant Signals: Part I». Proceedings of the Royal Society A 467 (2135): 3088–3114. doi:10.1098/rspa.2010.0671. PMID 22003312. PMC 3191861. Αρχειοθετήθηκε από το πρωτότυπο στις 2019-08-19. https://web.archive.org/web/20190819140345/http://www.maxlittle.net/publications/pwc_filtering_arxiv.pdf. Ανακτήθηκε στις 2025-02-14. 
  24. 24,0 24,1 24,2 Peterson, Leif E. (2013). Classification Analysis of DNA Microarrays. John Wiley and Sons. ISBN 978-0-470-17081-6. 
  25. De Souto M et al. (2008) Clustering cancer gene expression data: a comparative study, BMC Bioinformatics, 9(497).
  26. Jaskowiak, Pablo A; Campello, Ricardo JGB; Costa, Ivan G (2014). «On the selection of appropriate distances for gene expression data clustering». BMC Bioinformatics 15 (Suppl 2): S2. doi:10.1186/1471-2105-15-S2-S2. PMID 24564555. 
  27. Bolshakova N, Azuaje F (2003) Cluster validation techniques for genome expression data, Signal Processing, Vol. 83, pp. 825–833.
  28. Ben Gal, I.; Shani, A.; Gohr, A.; Grau, J.; Arviv, S.; Shmilovici, A.; Posch, S.; Grosse, I. (2005). «Identification of transcription factor binding sites with variable-order Bayesian networks». Bioinformatics 21 (11): 2657–2666. doi:10.1093/bioinformatics/bti410. ISSN 1367-4803. PMID 15797905. 
  29. Yuk Fai Leung and Duccio Cavalieri, Fundamentals of cDNA microarray data analysis. Trends in Genetics Vol.19 No.11 November 2003.
  30. Priness I.; Maimon O.; Ben-Gal I. (2007). «Evaluation of gene-expression clustering via mutual information distance measure». BMC Bioinformatics 8 (1): 111. doi:10.1186/1471-2105-8-111. PMID 17397530. 
  31. Wei C; Li J; Bumgarner RE (2004). «Sample size for detecting differentially expressed genes in microarray experiments». BMC Genomics 5: 87. doi:10.1186/1471-2164-5-87. PMID 15533245. 
  32. Emmert-Streib, F.· Dehmer, M. (2008). Analysis of Microarray Data A Network-Based Approach. Wiley-VCH. ISBN 978-3-527-31822-3.  Unknown parameter |name-list-style= ignored (βοήθεια)
  33. Wouters L; Gõhlmann HW; Bijnens L; Kass SU; Molenberghs G; Lewi PJ (2003). «Graphical exploration of gene expression data: a comparative study of three multivariate methods». Biometrics 59 (4): 1131–1139. doi:10.1111/j.0006-341X.2003.00130.x. PMID 14969494. 
  34. Jain N; Thatte J; Braciale T; Ley K; O'Connell M; Lee JK (2003). «Local-pooled-error test for identifying differentially expressed genes with a small number of replicated microarrays». Bioinformatics 19 (15): 1945–1951. doi:10.1093/bioinformatics/btg264. PMID 14555628. https://archive.org/details/sim_bioinformatics_2003-10-12_19_15/page/n84. 
  35. Barbosa-Morais, N. L.; Dunning, M. J.; Samarajiwa, S. A.; Darot, J. F. J.; Ritchie, M. E.; Lynch, A. G.; Tavare, S. (18 November 2009). «A re-annotation pipeline for Illumina BeadArrays: improving the interpretation of gene expression data». Nucleic Acids Research 38 (3): e17. doi:10.1093/nar/gkp942. PMID 19923232. 
  36. Mortazavi, Ali; Brian A Williams; Kenneth McCue; Lorian Schaeffer; Barbara Wold (July 2008). «Mapping and quantifying mammalian transcriptomes by RNA-Seq». Nat Methods 5 (7): 621–628. doi:10.1038/nmeth.1226. ISSN 1548-7091. PMID 18516045. 
  37. 37,0 37,1 Wang, Zhong; Mark Gerstein; Michael Snyder (January 2009). «RNA-Seq: a revolutionary tool for transcriptomics». Nat Rev Genet 10 (1): 57–63. doi:10.1038/nrg2484. ISSN 1471-0056. PMID 19015660. 

Εξωτερικοί σύνδεσμοι

[Επεξεργασία | επεξεργασία κώδικα]