Ανάλυση διαφορικής γονιδιακής έκφρασης: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
Χωρίς σύνοψη επεξεργασίας
μ Προσθήκη παραγράφων
Γραμμή 1: Γραμμή 1:


'''Η Ανάλυση διαφορικής γονιδιακής έκφρασης''' (ΔΓΕ) (Differential gene expression (DEG)) είναι τμήμα της ανάλυσης βιολογικών δεδομένων. Αφορά στη λήψη των κανονικοποιημένων δεδομένων μέτρησης αναγνωσμένων και διεξαγωγή στατιστικής ανάλυσης για την ανακάλυψη ποσοτικών αλλαγών στα επίπεδα έκφρασης μεταξύ των πειραματικών ομάδων. Για παράδειγμα, χρησιμοποιούνται στατιστικές δοκιμές για να αποφασιστεί αν, για ένα δεδομένο γονίδιο, μια παρατηρούμενη διαφορά στους αριθμούς ανάγνωσης είναι σημαντική, δηλαδή εάν είναι μεγαλύτερη από ό,τι θα περίμενε κανείς λόγω της φυσικής τυχαίας διακύμανσης.'''<ref>{{Cite journal|title=Differential expression analysis for sequence count data|url=http://dx.doi.org/10.1038/npre.2010.4282.2|journal=Nature Precedings|date=2010-04-30|issn=1756-0357|doi=10.1038/npre.2010.4282.2|first=Simon|last=Anders|first2=Wolfgang|last2=Huber}}</ref>
'''Η Ανάλυση Διαφορικής Γονιδιακής Έκφρασης''' (ΔΓΕ) (Differential gene expression (DEG)) είναι τμήμα της ανάλυσης βιολογικών δεδομένων. Αφορά στη λήψη των κανονικοποιημένων δεδομένων μέτρησης αναγνωσμένων και διεξαγωγή στατιστικής ανάλυσης για την ανακάλυψη ποσοτικών αλλαγών στα επίπεδα έκφρασης μεταξύ των πειραματικών ομάδων. Για παράδειγμα, χρησιμοποιούνται στατιστικές δοκιμές για να αποφασιστεί αν, για ένα δεδομένο γονίδιο, μια παρατηρούμενη διαφορά στους αριθμούς ανάγνωσης είναι σημαντική, δηλαδή εάν είναι μεγαλύτερη από ό,τι θα περίμενε κανείς λόγω της φυσικής τυχαίας διακύμανσης.'''<ref>{{Cite journal|title=Differential expression analysis for sequence count data|url=http://dx.doi.org/10.1038/npre.2010.4282.2|journal=Nature Precedings|date=2010-04-30|issn=1756-0357|doi=10.1038/npre.2010.4282.2|first=Simon|last=Anders|first2=Wolfgang|last2=Huber}}</ref>


Η ανάλυση διαφορικής έκφρασης είναι μια από τις πιο κοινές εφαρμογές ανάλυσης δεδομένων RNA-seq. Προσδιορίζει τις γονοτυπικές διαφορές μεταξύ δύο ή περισσότερων κυττάρων. Η ενσωμάτωση και η οπτικοποίηση των αποτελεσμάτων ΔΓΕ μπορεί να διευκολύνει μεταγενέστερες μελέτες, ειδικά για ερευνητές που έχουν περιορισμένο υπολογιστικό υπόβαθρο.'''<ref>{{Cite journal|title=Differential expression analysis for sequence count data|url=http://dx.doi.org/10.1038/npre.2010.4282.2|journal=Nature Precedings|date=2010-04-30|issn=1756-0357|doi=10.1038/npre.2010.4282.2|first=Simon|last=Anders|first2=Wolfgang|last2=Huber}}</ref>
Η ανάλυση διαφορικής έκφρασης είναι μια από τις πιο κοινές εφαρμογές ανάλυσης δεδομένων RNA-seq. Προσδιορίζει τις γονοτυπικές διαφορές μεταξύ δύο ή περισσότερων κυττάρων. Η ενσωμάτωση και η οπτικοποίηση των αποτελεσμάτων ΔΓΕ μπορεί να διευκολύνει μεταγενέστερες μελέτες, ειδικά για ερευνητές που έχουν περιορισμένο υπολογιστικό υπόβαθρο.'''<ref>{{Cite journal|title=Differential expression analysis for sequence count data|url=http://dx.doi.org/10.1038/npre.2010.4282.2|journal=Nature Precedings|date=2010-04-30|issn=1756-0357|doi=10.1038/npre.2010.4282.2|first=Simon|last=Anders|first2=Wolfgang|last2=Huber}}</ref>


=== Εργαλεία Ανάλυσης Διαφορικής Έκφρασης ===
Τα εργαλεία διαφορικής έκφρασης γονιδίων (DGE)<ref>{{Cite journal|title=Data visualization tools drive interactivity and reproducibility in online publishing|url=http://dx.doi.org/10.1038/d41586-018-01322-9|journal=Nature|date=2018-01-30|issn=0028-0836|pages=133–134|volume=554|issue=7690|doi=10.1038/d41586-018-01322-9|first=Jeffrey M.|last=Perkel}}</ref> εκτελούν στατιστικές δοκιμές βασισμένες σε ποσοτικοποιήσεις εκφρασμένων γονιδίων που προέρχονται από υπολογιστικές αναλύσεις μη επεξεργασμένων RNA-seq αποτελεσμάτων με σκοπό να προσδιοριστούν τα γονίδια που έχουν στατιστικά σημαντική διαφορά, ενώ παρέχουν επίσης πληροφορίες σχετικά με το επίπεδο έκφρασης και το μέγεθος της διαφοράς ανά ζεύγη για κάθε γονίδιο. Οι αναλύσεις DGE μπορούν να παρέχουν σημαντική εικόνα για τους γενετικούς μηχανισμούς σε οργανισμούς που συμβάλλουν σε φαινοτυπικές διαφορές, συμπεριλαμβανομένων των προτύπων ανάπτυξης των φυτών, της ανίχνευσης προέλευσης όγκου και της μελέτης μικροβιωμάτων.

Τα εργαλεία που συνήθως χρησιμοποιούνται ειναι:

* edgeR <ref>{{Cite journal|title=edgeR: a Bioconductor package for differential expression analysis of digital gene expression data|url=http://dx.doi.org/10.1093/bioinformatics/btp616|journal=Bioinformatics|date=2009-11-11|issn=1367-4803|pages=139–140|volume=26|issue=1|doi=10.1093/bioinformatics/btp616|first=M. D.|last=Robinson|first2=D. J.|last2=McCarthy|first3=G. K.|last3=Smyth}}</ref>
* Cuffdiff/Cuffdiff2 2<ref>{{Cite journal|title=Differential analysis of gene regulation at transcript resolution with RNA-seq|url=http://dx.doi.org/10.1038/nbt.2450|journal=Nature Biotechnology|date=2012-12-09|issn=1087-0156|pages=46–53|volume=31|issue=1|doi=10.1038/nbt.2450|first=Cole|last=Trapnell|first2=David G|last2=Hendrickson|first3=Martin|last3=Sauvageau|first4=Loyal|last4=Goff|first5=John L|last5=Rinn|first6=Lior|last6=Pachter}}</ref>
* DESeq/DESeq2<ref>{{Cite journal|title=Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2|url=http://dx.doi.org/10.1186/s13059-014-0550-8|journal=Genome Biology|date=2014-12|issn=1474-760X|volume=15|issue=12|doi=10.1186/s13059-014-0550-8|first=Michael I|last=Love|first2=Wolfgang|last2=Huber|first3=Simon|last3=Anders}}</ref>
* NOISeq<ref>{{Cite journal|title=NOIseq: a RNA-seq differential expression method robust for sequencing depth biases|url=http://dx.doi.org/10.14806/ej.17.b.265|journal=EMBnet.journal|date=2012-02-28|issn=2226-6089|pages=18|volume=17|issue=B|doi=10.14806/ej.17.b.265|first=Sonia|last=Tarazona|first2=Fernando|last2=García|first3=Alberto|last3=Ferrer|first4=Joaquín|last4=Dopazo|first5=Ana|last5=Conesa}}</ref>
* SAMSeq<ref>{{Cite journal|title=Finding consistent patterns: A nonparametric approach for identifying differential expression in RNA-Seq data|url=http://dx.doi.org/10.1177/0962280211428386|journal=Statistical Methods in Medical Research|date=2011-11-28|issn=0962-2802|pages=519–536|volume=22|issue=5|doi=10.1177/0962280211428386|first=Jun|last=Li|first2=Robert|last2=Tibshirani}}</ref>
* sleuth<ref>{{Cite journal|title=Differential analysis of RNA-seq incorporating quantification uncertainty|url=http://dx.doi.org/10.1038/nmeth.4324|journal=Nature Methods|date=2017-06-05|issn=1548-7091|pages=687–690|volume=14|issue=7|doi=10.1038/nmeth.4324|first=Harold|last=Pimentel|first2=Nicolas L|last2=Bray|first3=Suzette|last3=Puente|first4=Páll|last4=Melsted|first5=Lior|last5=Pachter}}</ref>
* Limma<ref>{{Cite journal|title=limma powers differential expression analyses for RNA-sequencing and microarray studies|url=http://dx.doi.org/10.1093/nar/gkv007|journal=Nucleic Acids Research|date=2015-01-20|issn=1362-4962|pages=e47–e47|volume=43|issue=7|doi=10.1093/nar/gkv007|first=Matthew E.|last=Ritchie|first2=Belinda|last2=Phipson|first3=Di|last3=Wu|first4=Yifang|last4=Hu|first5=Charity W.|last5=Law|first6=Wei|last6=Shi|first7=Gordon K.|last7=Smyth}}</ref>

=== Μέθοδοι ανάλυσης διαφορικής έκφρασης ===
Υπάρχουν διαφορετικές μέθοδοι για ανάλυση διαφορικής έκφρασης, όπως το edgeR και το DESeq που βασίζονται σε αρνητικές διωνυμικές κατανομές (NB) ή baySeq και EBSeq που είναι προσεγγίσεις Bayes βασισμένες σε αρνητικό διωνυμικό μοντέλο. Είναι σημαντικό να λαμβάνεται υπόψη ο πειραματικός σχεδιασμός κατά την επιλογή μιας μεθόδου ανάλυσης. Ενώ ορισμένα από τα εργαλεία διαφορικής έκφρασης μπορούν να πραγματοποιήσουν σύγκριση μόνο κατά ζεύγη, άλλα όπως το edgeR, το limma-voom, το DESeq και το maSigPro μπορούν να εκτελέσουν πολλαπλές συγκρίσεις.<ref name=":0">{{Cite web|url=https://www.ebi.ac.uk/training/online/courses/functional-genomics-ii-common-technologies-and-data-analysis-methods/rna-sequencing/performing-a-rna-seq-experiment/data-analysis/differential-gene-expression-analysis/|title=Differential gene expression analysis {{!}} Functional genomics II|last=EMBL-EBI|language=en|accessdate=2022-07-04}}</ref>
Η γραμμή επεξεργασίας RNA-seq που χρησιμοποιείται για τη δημιουργία δεδομένων για τον Άτλαντα έκφρασης είναι ένας "αγωγός". Σε αυτόν τον “αγωγό” οι ακατέργαστες αναγνώσεις (αρχεία FASTQ) υποβάλλονται σε αξιολόγηση ποιότητας και φιλτράρισμα. Οι ποιοτικά φιλτραρισμένες αναγνώσεις ευθυγραμμίζονται με το γονιδίωμα αναφοράς μέσω του HISAT2. Οι χαρτογραφημένες αναγνώσεις συνοψίζονται και συγκεντρώνονται σε γονίδια μέσω HTSeq. Για τη βασική έκφραση, τα FPKM υπολογίζονται από τις πρωτογενείς μετρήσεις από το iRAP. Αυτές υπολογίζονται κατά μέσο όρο για κάθε σύνολο τεχνικών αντιγράφων και, στη συνέχεια, κανονικοποιούνται τα ποσοστά εντός κάθε συνόλου βιολογικών αντιγράφων χρησιμοποιώντας λίμα.

Τέλος, υπολογίζεται ο μέσος όρος για όλα τα βιολογικά αντίγραφα (εάν υπάρχουν). Για τη διαφορική έκφραση, τα γονίδια που εκφράζονται διαφορετικά μεταξύ του τεστ και των ομάδων αναφοράς κάθε ζεύγους αντίθεσης ταυτοποιούνται χρησιμοποιώντας το DESeq2.<ref name=":0" />


== Παραπομπές ==
== Παραπομπές ==

Έκδοση από την 11:10, 4 Ιουλίου 2022

Η Ανάλυση Διαφορικής Γονιδιακής Έκφρασης (ΔΓΕ) (Differential gene expression (DEG)) είναι τμήμα της ανάλυσης βιολογικών δεδομένων. Αφορά στη λήψη των κανονικοποιημένων δεδομένων μέτρησης αναγνωσμένων και διεξαγωγή στατιστικής ανάλυσης για την ανακάλυψη ποσοτικών αλλαγών στα επίπεδα έκφρασης μεταξύ των πειραματικών ομάδων. Για παράδειγμα, χρησιμοποιούνται στατιστικές δοκιμές για να αποφασιστεί αν, για ένα δεδομένο γονίδιο, μια παρατηρούμενη διαφορά στους αριθμούς ανάγνωσης είναι σημαντική, δηλαδή εάν είναι μεγαλύτερη από ό,τι θα περίμενε κανείς λόγω της φυσικής τυχαίας διακύμανσης.[1]

Η ανάλυση διαφορικής έκφρασης είναι μια από τις πιο κοινές εφαρμογές ανάλυσης δεδομένων RNA-seq. Προσδιορίζει τις γονοτυπικές διαφορές μεταξύ δύο ή περισσότερων κυττάρων. Η ενσωμάτωση και η οπτικοποίηση των αποτελεσμάτων ΔΓΕ μπορεί να διευκολύνει μεταγενέστερες μελέτες, ειδικά για ερευνητές που έχουν περιορισμένο υπολογιστικό υπόβαθρο.[2]

Εργαλεία Ανάλυσης Διαφορικής Έκφρασης

Τα εργαλεία διαφορικής έκφρασης γονιδίων (DGE)[3] εκτελούν στατιστικές δοκιμές βασισμένες σε ποσοτικοποιήσεις εκφρασμένων γονιδίων που προέρχονται από υπολογιστικές αναλύσεις μη επεξεργασμένων RNA-seq αποτελεσμάτων με σκοπό να προσδιοριστούν τα γονίδια που έχουν στατιστικά σημαντική διαφορά, ενώ παρέχουν επίσης πληροφορίες σχετικά με το επίπεδο έκφρασης και το μέγεθος της διαφοράς ανά ζεύγη για κάθε γονίδιο. Οι αναλύσεις DGE μπορούν να παρέχουν σημαντική εικόνα για τους γενετικούς μηχανισμούς σε οργανισμούς που συμβάλλουν σε φαινοτυπικές διαφορές, συμπεριλαμβανομένων των προτύπων ανάπτυξης των φυτών, της ανίχνευσης προέλευσης όγκου και της μελέτης μικροβιωμάτων.

Τα εργαλεία που συνήθως χρησιμοποιούνται ειναι:

Μέθοδοι ανάλυσης διαφορικής έκφρασης

Υπάρχουν διαφορετικές μέθοδοι για ανάλυση διαφορικής έκφρασης, όπως το edgeR και το DESeq που βασίζονται σε αρνητικές διωνυμικές κατανομές (NB) ή baySeq και EBSeq που είναι προσεγγίσεις Bayes βασισμένες σε αρνητικό διωνυμικό μοντέλο. Είναι σημαντικό να λαμβάνεται υπόψη ο πειραματικός σχεδιασμός κατά την επιλογή μιας μεθόδου ανάλυσης. Ενώ ορισμένα από τα εργαλεία διαφορικής έκφρασης μπορούν να πραγματοποιήσουν σύγκριση μόνο κατά ζεύγη, άλλα όπως το edgeR, το limma-voom, το DESeq και το maSigPro μπορούν να εκτελέσουν πολλαπλές συγκρίσεις.[11] Η γραμμή επεξεργασίας RNA-seq που χρησιμοποιείται για τη δημιουργία δεδομένων για τον Άτλαντα έκφρασης είναι ένας "αγωγός". Σε αυτόν τον “αγωγό” οι ακατέργαστες αναγνώσεις (αρχεία FASTQ) υποβάλλονται σε αξιολόγηση ποιότητας και φιλτράρισμα. Οι ποιοτικά φιλτραρισμένες αναγνώσεις ευθυγραμμίζονται με το γονιδίωμα αναφοράς μέσω του HISAT2. Οι χαρτογραφημένες αναγνώσεις συνοψίζονται και συγκεντρώνονται σε γονίδια μέσω HTSeq. Για τη βασική έκφραση, τα FPKM υπολογίζονται από τις πρωτογενείς μετρήσεις από το iRAP. Αυτές υπολογίζονται κατά μέσο όρο για κάθε σύνολο τεχνικών αντιγράφων και, στη συνέχεια, κανονικοποιούνται τα ποσοστά εντός κάθε συνόλου βιολογικών αντιγράφων χρησιμοποιώντας λίμα.

Τέλος, υπολογίζεται ο μέσος όρος για όλα τα βιολογικά αντίγραφα (εάν υπάρχουν). Για τη διαφορική έκφραση, τα γονίδια που εκφράζονται διαφορετικά μεταξύ του τεστ και των ομάδων αναφοράς κάθε ζεύγους αντίθεσης ταυτοποιούνται χρησιμοποιώντας το DESeq2.[11]

Παραπομπές

  1. Anders, Simon; Huber, Wolfgang (2010-04-30). «Differential expression analysis for sequence count data». Nature Precedings. doi:10.1038/npre.2010.4282.2. ISSN 1756-0357. http://dx.doi.org/10.1038/npre.2010.4282.2. 
  2. Anders, Simon; Huber, Wolfgang (2010-04-30). «Differential expression analysis for sequence count data». Nature Precedings. doi:10.1038/npre.2010.4282.2. ISSN 1756-0357. http://dx.doi.org/10.1038/npre.2010.4282.2. 
  3. Perkel, Jeffrey M. (2018-01-30). «Data visualization tools drive interactivity and reproducibility in online publishing». Nature 554 (7690): 133–134. doi:10.1038/d41586-018-01322-9. ISSN 0028-0836. http://dx.doi.org/10.1038/d41586-018-01322-9. 
  4. Robinson, M. D.; McCarthy, D. J.; Smyth, G. K. (2009-11-11). «edgeR: a Bioconductor package for differential expression analysis of digital gene expression data». Bioinformatics 26 (1): 139–140. doi:10.1093/bioinformatics/btp616. ISSN 1367-4803. http://dx.doi.org/10.1093/bioinformatics/btp616. 
  5. Trapnell, Cole; Hendrickson, David G; Sauvageau, Martin; Goff, Loyal; Rinn, John L; Pachter, Lior (2012-12-09). «Differential analysis of gene regulation at transcript resolution with RNA-seq». Nature Biotechnology 31 (1): 46–53. doi:10.1038/nbt.2450. ISSN 1087-0156. http://dx.doi.org/10.1038/nbt.2450. 
  6. Love, Michael I; Huber, Wolfgang; Anders, Simon (2014-12). «Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2». Genome Biology 15 (12). doi:10.1186/s13059-014-0550-8. ISSN 1474-760X. http://dx.doi.org/10.1186/s13059-014-0550-8. 
  7. Tarazona, Sonia; García, Fernando; Ferrer, Alberto; Dopazo, Joaquín; Conesa, Ana (2012-02-28). «NOIseq: a RNA-seq differential expression method robust for sequencing depth biases». EMBnet.journal 17 (B): 18. doi:10.14806/ej.17.b.265. ISSN 2226-6089. http://dx.doi.org/10.14806/ej.17.b.265. 
  8. Li, Jun; Tibshirani, Robert (2011-11-28). «Finding consistent patterns: A nonparametric approach for identifying differential expression in RNA-Seq data». Statistical Methods in Medical Research 22 (5): 519–536. doi:10.1177/0962280211428386. ISSN 0962-2802. http://dx.doi.org/10.1177/0962280211428386. 
  9. Pimentel, Harold; Bray, Nicolas L; Puente, Suzette; Melsted, Páll; Pachter, Lior (2017-06-05). «Differential analysis of RNA-seq incorporating quantification uncertainty». Nature Methods 14 (7): 687–690. doi:10.1038/nmeth.4324. ISSN 1548-7091. http://dx.doi.org/10.1038/nmeth.4324. 
  10. Ritchie, Matthew E.; Phipson, Belinda; Wu, Di; Hu, Yifang; Law, Charity W.; Shi, Wei; Smyth, Gordon K. (2015-01-20). «limma powers differential expression analyses for RNA-sequencing and microarray studies». Nucleic Acids Research 43 (7): e47–e47. doi:10.1093/nar/gkv007. ISSN 1362-4962. http://dx.doi.org/10.1093/nar/gkv007. 
  11. 11,0 11,1 EMBL-EBI. «Differential gene expression analysis | Functional genomics II» (στα Αγγλικά). Ανακτήθηκε στις 4 Ιουλίου 2022.