Δίκτυα πρωτεϊνικών αλληλεπιδράσεων: Διαφορά μεταξύ των αναθεωρήσεων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Περιεχόμενο που διαγράφηκε Περιεχόμενο που προστέθηκε
μ Αλλαγή γραμματοσειρας στην επικεφαλίδα
Eirini94 (συζήτηση | συνεισφορές)
Προσθήκη 2 νέων παραγράφων (μέθοδοι και βάσεις δεδομένων)
Γραμμή 17: Γραμμή 17:
=== Σύμπλοκα δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου ===
=== Σύμπλοκα δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου ===
Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης μπορούν επίσης να ταξινομηθούν με βάση τη δομή τους ως αλληλεπιδράσεις δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου {{r|Aloy}}. Τα σύμπλοκα που ανήκουν στην τελευταία ομάδα έχουν ως επί το πλείστον παροδική φύση καθώς σχηματίζονται από την αναγνώριση μιας σφαιρικής δομικής περιοχής, ενός σύντομου γραμμικού μοτίβου (LM) και της μικρής επιφάνειας διεπαφής στην οποία λαμβάνει χώρα η αλληλεπίδραση (π.χ. περιοχή SH3 κινάσης τυροσίνης Fyn -πεπτίδια πλούσια σε προλίνη). Η αλληλεπίδραση αυτή δομικής περιοχής-πεπτιδίου ονομάζεται επίσης διαμεσολαβούμενη από πεπτίδιο παροδική αλληλεπίδραση. Πράγματι, ειδικές δομικές περιοχές αλληλεπίδρασης (όπως PDZ, SH2 , SH3, WW, κ.λπ.) παρέχουν ένα μηχανισμό σηματοδότησης χρησιμοποιώντας παροδικές αλληλεπιδράσεις. Αυτές οι μορφολογικές δομικές περιοχές αλληλεπίδρασης αναγνωρίζουν και δεσμεύουν συγκεκριμένα μοτίβα των πεπτιδίων (είτε στα άκρα είτε στις μη δομημένες περιοχές των πρωτεϊνών εταίρων). Αυτές οι ειδικές περιοχές δεν υφίστανται μεγάλες δομικές αλλαγές στη σύνδεση και για αυτό χρησιμοποιούνται συχνά στο κύτταρο. Για παράδειγμα, στον ''Ηomo sapiens'', υπάρχουν 223 SH3, 234 PDZ και 91 δομικές περιοχές WW {{r|Bhattacharyya}}. Αυτές οι δομικές περιοχές μπορεί να χρησιμοποιηθούν για τη συναρμολόγηση συστατικών πρωτεϊνών σε μεγάλα σύμπλοκα, φέρνοντας σε επαφή διάφορους συνδυασμούς καταλυτικών ρυθμιστικών περιοχών. Κάθε σύμπλοκο με έναν διαφορετικό συνδυασμό δομικών περιοχών έχει στη συνέχεια μια διαφορετική λειτουργία, που οδηγεί σε διαφορετική διαδικασία σηματοδότησης στο κύτταρο.
Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης μπορούν επίσης να ταξινομηθούν με βάση τη δομή τους ως αλληλεπιδράσεις δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου {{r|Aloy}}. Τα σύμπλοκα που ανήκουν στην τελευταία ομάδα έχουν ως επί το πλείστον παροδική φύση καθώς σχηματίζονται από την αναγνώριση μιας σφαιρικής δομικής περιοχής, ενός σύντομου γραμμικού μοτίβου (LM) και της μικρής επιφάνειας διεπαφής στην οποία λαμβάνει χώρα η αλληλεπίδραση (π.χ. περιοχή SH3 κινάσης τυροσίνης Fyn -πεπτίδια πλούσια σε προλίνη). Η αλληλεπίδραση αυτή δομικής περιοχής-πεπτιδίου ονομάζεται επίσης διαμεσολαβούμενη από πεπτίδιο παροδική αλληλεπίδραση. Πράγματι, ειδικές δομικές περιοχές αλληλεπίδρασης (όπως PDZ, SH2 , SH3, WW, κ.λπ.) παρέχουν ένα μηχανισμό σηματοδότησης χρησιμοποιώντας παροδικές αλληλεπιδράσεις. Αυτές οι μορφολογικές δομικές περιοχές αλληλεπίδρασης αναγνωρίζουν και δεσμεύουν συγκεκριμένα μοτίβα των πεπτιδίων (είτε στα άκρα είτε στις μη δομημένες περιοχές των πρωτεϊνών εταίρων). Αυτές οι ειδικές περιοχές δεν υφίστανται μεγάλες δομικές αλλαγές στη σύνδεση και για αυτό χρησιμοποιούνται συχνά στο κύτταρο. Για παράδειγμα, στον ''Ηomo sapiens'', υπάρχουν 223 SH3, 234 PDZ και 91 δομικές περιοχές WW {{r|Bhattacharyya}}. Αυτές οι δομικές περιοχές μπορεί να χρησιμοποιηθούν για τη συναρμολόγηση συστατικών πρωτεϊνών σε μεγάλα σύμπλοκα, φέρνοντας σε επαφή διάφορους συνδυασμούς καταλυτικών ρυθμιστικών περιοχών. Κάθε σύμπλοκο με έναν διαφορετικό συνδυασμό δομικών περιοχών έχει στη συνέχεια μια διαφορετική λειτουργία, που οδηγεί σε διαφορετική διαδικασία σηματοδότησης στο κύτταρο.

== '''Μέθοδοι εύρεσης και ανάλυσης''' ==
Οι αλληλεπιδράσεις μεταξύ πρωτεϊνών είναι εκτενείς στα κύτταρα και ο βαθμός της ρύθμισης που παρέχουν είναι μεγάλος. Για την βέλτιστη κατανόηση της σημαντικότητάς τους πρέπει να ταυτοποιηθούν τα διαφορετικά είδη αλληλεπιδράσεων και η έκταση που έχουν στο κύτταρο ώστε να βρεθούν οι επιπτώσεις της κάθε αλληλεπίδρασης. Πολλές μέθοδοι υψηλής απόδοσης έχουν αναπτυχθεί για την πρόβλεψη αλληλεπιδράσεων μεταξύ πρωτεϊνών, όπως δύο υβριδικά συστήματα , φασματομετρία μάζας, απεικόνιση φάγου και τεχνολογία πρωτεϊνικών συστοιχιών<ref>{{Cite web|url=http://www.cambridge.org/gr/academic/subjects/computer-science/computational-biology-and-bioinformatics/protein-interaction-networks-computational-analysis?format=HB&isbn=9780521888950|title=Protein interaction networks computational analysis {{!}} Computational biology and bioinformatics|website=Cambridge University Press|language=en|accessdate=2018-05-27}}</ref>.Κάθε μέθοδος έχει διαφορετική ένταση ευαισθησίας και ακρίβειας και χωρίζονται σε in vivo, in vitro και in silico. <ref name=":0">{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/24693427|title=Protein-protein interaction detection: methods and analysis|last=Rao|first=V. Srinivasa|last2=Srinivas|first2=K.|date=2014|journal=International Journal of Proteomics|doi=10.1155/2014/147648|volume=2014|pages=147648|issn=2090-2166|pmc=PMC3947875|pmid=24693427|last3=Sujini|first3=G. N.|last4=Kumar|first4=G. N. Sunand}}</ref>

=== ''In vitro'' τεχνικές <ref name=":0" /> ===
Αυτές οι τεχνικές γίνονται υπό ελεγχόμενες συνθήκες σε μη ζωντανούς οργανισμούς. Μερικές από αυτές είναι ο διαδοχικός καθαρισμός συγγένειας (tandem affinity purification ή TAP), η χρωματογραφία συγγένειας, η συν-ανοσοκατακρήμνιση, οι συστοιχίες πρωτεϊνών, η συμπληρωματικότητα θραυσμάτων πρωτεΐνης, η απεικόνιση φάγου, η μεταφορά ενέργειας συντονισμού Φέρστερ (Förster resonance energy transfer ή FRET),  η κρυσταλλογραφία ακτίνων Χ και ο πυρηνικός μαγνητικός συντονισμός (NMR).

==== Συν-ανοσοκατακρήμνιση ====
Με τη μέθοδο επιβεβαιώνονται αλληλεπιδράσεις μεταξύ πρωτεϊνών χρησιμοποιώντας εκχύλισμα με παρούσες τις πρωτεΐνες στη φυσική τους μορφή σε ένα πολύπλοκο μίγμα με συστατικά του κυττάρου που μπορεί να απαιτούνται για τις αλληλεπιδράσεις. Γίνεται η χρήση αντισώματος που δεσμεύει την πρωτεΐνη στόχο ώστε να απομονωθεί και μαζί με αυτή απομονώνονται και οι πρωτεΐνες με τις οποίες είναι συνδεδεμένη. Αυτά τα σύμπλοκα αναλύονται και γίνεται η ταυτοποίηση των αλληλεπιδράσεων. Συνίσταται η χρήση ευκαρυωτικών κυττάρων ώστε να είναι δυνατές οι μετα-μεταφραστικές τροποποιήσεις, που μπορεί να είναι κρίσιμες για κάποια αλληλεπίδραση εν αντιθέσει με τα προκαρυωτικά συστήματα έκφρασης που δεν έχουν μετα-μεταφραστικές τροποποιήσεις.

=== ''In vivo'' τεχνικές ===
Αυτές οι τεχνικές ακολουθούν συγκεκριμένες διαδικασίες που εφαρμόζονται σε ολόκληρο το ζωντανό οργανισμό. Οι κύριες τεχνικές είναι το σύστημα δύο υβριδίων του σακχαρομύκητα (yeast two hybrid ή Y2H), η βιοφωταύγεια συντονισμού με μεταφορά ενέργειας (bioluminescence resonance energy transfer ή BRET), η συμπληρωματικότητα διμοριακού φθορισμού (bimolecular fluorescence complementation ή BiFC) και η συνθετική θνησιμότητα. <ref name=":0" />

==== Σύστημα δύο υβριδίων ζύμης ====
Για τη μέθοδο απαιτούνται οι δύο πρωτεϊνικές περιοχές ενός μεταγραφικού παράγοντα για τη μεταγραφή ενός γονιδίου αναφοράς που έχουν δύο συγκεκριμένες λειτουργίες (α) μία περιοχή που βοηθά την πρόσδεση στο DNA (DNA binding domain ή DBD) και (β) μία περιοχή ενεργοποίησης για την έναρξη της μεταγραφής τους DNA(activation domain ή AD). Τα δύο τμήματα είναι ανεξάρτητα αλλά απαιτούνται και τα δύο για την έκφραση του γονιδίου αναφοράς. Για τη διάκριση της αλληλεπίδρασης δύο πρωτεϊνών, εκφράζεται η μία πρωτεΐνη στην περιοχή DBD και η άλλη στην περιοχή AD διαφορετικών στελεχών ζύμης. Έπειτα από σύντηξη των δύο στελεχών, υπάρχει μεταγραφή του γονιδίου αναφοράς που επάγεται από τον συγκεκριμένο παράγοντα αν οι δύο πρωτεΐνες έχουν φυσική αλληλεπίδραση. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/11283351|title=A comprehensive two-hybrid analysis to explore the yeast protein interactome|last=Ito|first=T.|last2=Chiba|first2=T.|date=2001-04-10|journal=Proceedings of the National Academy of Sciences of the United States of America|issue=8|doi=10.1073/pnas.061034498|volume=98|pages=4569–4574|issn=0027-8424|pmid=11283351|last3=Ozawa|first3=R.|last4=Yoshida|first4=M.|last5=Hattori|first5=M.|last6=Sakaki|first6=Y.}}</ref>

=== ''In silico'' τεχνικές <ref name=":1">{{Cite book|title=Protein-protein interaction|first=Werther,|last=Meike.|first2=Seitz,|last2=Harald.|publisher=Springer|isbn=9783540688204|date=2008|location=Berlin|url=https://www.worldcat.org/oclc/288440334|id=288440334}}</ref> ===
Οι τεχνικές γίνονται σε υπολογιστή ή μέσω προσομοιώσεων υπολογιστή. Δεδομένα από διαφορετικές ''in vivo'' και ''in vitro'' μεθόδους συχνά έχουν ασυμφωνία και εμφανίζεται μεγάλο ποσοστό θετικών σφαλμάτων δείχνοντας αλληλεπίδραση πρωτεϊνών που δεν είναι απαραιτήτως συνδεδεμένες. Συνεπώς δημιουργείται η ανάγκη ανάπτυξης νέων μεθόδων για επιβεβαίωση των αλληλεπιδράσεων μέσω υπολογιστικών εργαλείων που βασίζονται σε δεδομένα αλληλούχισης βάσεων ή δομών, σε δεδομένα από ''in silico'' σύστημα δύο υβριδίων, σε φυλογενετικά δένδρα ή προσεγγίσεις βασισμένες στη γονιδιακή έκφραση. <ref name=":2">{{Cite journal|url=https://link.springer.com/article/10.1023/B:JSFG.0000016143.91973.1c|title=Computational approaches to protein-protein interaction|last=Franzot|first=Giacomo|last2=Carugo|first2=Oliviero|date=2003-12-01|journal=Journal of Structural and Functional Genomics|issue=4|doi=10.1023/B:JSFG.0000016143.91973.1c|volume=4|pages=245–255|language=en|issn=1345-711X}}</ref><ref name=":3">{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/15193311|title=A structural perspective on protein-protein interactions|last=Russell|first=Robert B.|last2=Alber|first2=Frank|date=2004-6|journal=Current Opinion in Structural Biology|issue=3|doi=10.1016/j.sbi.2004.04.006|volume=14|pages=313–324|issn=0959-440X|pmid=15193311|last3=Aloy|first3=Patrick|last4=Davis|first4=Fred P.|last5=Korkin|first5=Dmitry|last6=Pichaud|first6=Matthieu|last7=Topf|first7=Maya|last8=Sali|first8=Andrej}}</ref>

Οι υπολογιστικές μέθοδοι αρχικά αναπτύχθηκαν κατασκευάζοντας βάσεις δεδομένων για αλληλεπιδράσεις που προσδιορίστηκαν πειραματικά. Έπειτα εφαρμόστηκαν τεχνικές εξόρυξης δεδομένων από αυτές τις βάσεις ώστε να ληφθούν πληροφορίες από το μεγάλο όγκο δεδομένων πρωτεϊνικών αλληλεπιδράσεων για δημιουργία δικτύων πρωτεϊνικών αλληλεπιδράσεων. Δεδομένου ότι οι πρωτεΐνες που αλληλεπιδρούν έχουν αυξημένη πιθανότητα να είναι λειτουργικά συνδεδεμένες, αναπτύχθηκαν υπολογιστικά εργαλεία για τη διερεύνηση δικτύων πρωτεϊνικών αλληλεπιδράσεων ώστε να προβλεφτούν λειτουργικά χαρακτηριστικά των πρωτεϊνών και νέες αλληλεπιδράσεις από τις ήδη γνωστές. <ref name=":2" /><ref name=":3" />

==== Υπολογιστικές μέθοδοι πρόβλεψης ====
Παρέχουν μία συμπληρωματική προσέγγιση για την ανίχνευση πρωτεϊνικών αλληλεπιδράσεων και προσπαθούν να κατευθύνουν τη γνώση ήδη ταυτοποιημένων αλληλεπιδράσεων προς πρόβλεψη νέων. Συχνά δίνουν μία κατεύθυνση για το σχεδιασμό πειραμάτων ώστε να επιβεβαιωθούν αυτές οι προβλέψεις. Αυτές οι προσεγγίσεις μπορούν να ταξινομηθούν σε 5 κατηγορίες βασισμένες σε πληροφορίες από μελέτες γονιδιωματικής, εξελικτικές σχέσεις, πρωτεϊνικές δομές τριών διαστάσεων, περιοχές πρωτεϊνών και πρωτοταγείς πρωτεϊνικές δομές (Εικόνες Α, Β, Γ, Δ, Ε <ref name=":1" />).

Τα γονιδιώματα που έχουν αλληλουχηθεί πλήρως παρέχουν πληροφορίες για τη διάταξη των γονιδίων και την εξελικτική συντήρηση αυτής της διάταξης ανάμεσα στα είδη υποδεικνύοντας ποια μπορεί να σχετίζονται λειτουργικά. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/9787636|title=Conservation of gene order: a fingerprint of proteins that physically interact|last=Dandekar|first=T.|last2=Snel|first2=B.|date=1998-9|journal=Trends in Biochemical Sciences|issue=9|volume=23|pages=324–328|issn=0968-0004|pmid=9787636|last3=Huynen|first3=M.|last4=Bork|first4=P.}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/10427000|title=Detecting protein function and protein-protein interactions from genome sequences|last=Marcotte|first=E. M.|last2=Pellegrini|first2=M.|date=1999-07-30|journal=Science (New York, N.Y.)|issue=5428|volume=285|pages=751–753|issn=0036-8075|pmid=10427000|last3=Ng|first3=H. L.|last4=Rice|first4=D. W.|last5=Yeates|first5=T. O.|last6=Eisenberg|first6=D.}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/10573422|title=Protein interaction maps for complete genomes based on gene fusion events|last=Enright|first=A. J.|last2=Iliopoulos|first2=I.|date=1999-11-04|journal=Nature|issue=6757|doi=10.1038/47056|volume=402|pages=86–90|issn=0028-0836|pmid=10573422|last3=Kyrpides|first3=N. C.|last4=Ouzounis|first4=C. A.}}</ref>

Οι εξελικτικές σχέσεις μεταξύ δύο πρωτεϊνών μπορούν να χρησιμοποιηθούν για την κατανόηση της φυσικής και λειτουργικής σχέσης τους. Το φυλογενετικό προφίλ μιας πρωτεΐνης περιγράφει την παρουσία ομολόγων μεταξύ οργανισμών και παρόμοια προφίλ μεταξύ πρωτεϊνών μπορεί να υποδεικνύουν και λειτουργική συσχέτιση. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/10200254|title=Assigning protein functions by comparative genome analysis: protein phylogenetic profiles|last=Pellegrini|first=M.|last2=Marcotte|first2=E. M.|date=1999-04-13|journal=Proceedings of the National Academy of Sciences of the United States of America|issue=8|volume=96|pages=4285–4288|issn=0027-8424|pmid=10200254|last3=Thompson|first3=M. J.|last4=Eisenberg|first4=D.|last5=Yeates|first5=T. O.}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/11707606|title=Similarity of phylogenetic trees as indicator of protein-protein interaction|last=Pazos|first=F.|last2=Valencia|first2=A.|date=2001-9|journal=Protein Engineering|issue=9|volume=14|pages=609–614|issn=0269-2139|pmid=11707606}}</ref>

Η πειραματικά αυξανόμενη ταυτοποίηση πρωτεϊνικών δομών έχει οδηγήσει στη χρησιμοποίηση της τρισδιάστατης δομής των πρωτεϊνών για την πρόβλεψη της φυσικής πρόσδεσής τους. Έχει επίσης δειχθεί ότι πρωτεΐνες με μεγάλη ομολογία αλληλεπιδρούν με τον ίδιο ή παρόμοιο τρόπο. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/12730379|title=Protein-protein interactions: structurally conserved residues distinguish between binding sites and exposed protein surfaces|last=Ma|first=Buyong|last2=Elkayam|first2=Tal|date=2003-05-13|journal=Proceedings of the National Academy of Sciences of the United States of America|issue=10|doi=10.1073/pnas.1030237100|volume=100|pages=5772–5777|issn=0027-8424|pmid=12730379|last3=Wolfson|first3=Haim|last4=Nussinov|first4=Ruth}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/12499311|title=InterPreTS: protein interaction prediction through tertiary structure|last=Aloy|first=Patrick|last2=Russell|first2=Robert B.|date=2003-1|journal=Bioinformatics (Oxford, England)|issue=1|volume=19|pages=161–162|issn=1367-4803|pmid=12499311}}</ref>

Πολλές υπολογιστικές τεχνικές βασίζονται μόνο στη συντήρηση πρωτεϊνικών περιοχών. Με τη χρησιμοποίηση εξελικτικά συντηρημένων πρωτεϊνικών περιοχών μπορούν να εκτιμηθούν οι πιθανότητες αλληλεπίδρασης κάθε ζεύγους περιοχών. Δημιουργείται οπότε ένα δίκτυο πιθανών αλληλεπιδράσεων μεταξύ περιοχών των πρωτεϊνών, το οποίο μπορεί να χρησιμοποιηθεί για την πρόβλεψη αλληλεπιδράσεων μεταξύ των πρωτεϊνών.<ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/15961445|title=Prediction of protein-protein interactions using distant conservation of sequence patterns and structure relationships|last=Espadaler|first=Jordi|last2=Romero-Isart|first2=Oriol|date=2005-08-15|journal=Bioinformatics (Oxford, England)|issue=16|doi=10.1093/bioinformatics/bti522|volume=21|pages=3360–3368|issn=1367-4803|pmid=15961445|last3=Jackson|first3=Richard M.|last4=Oliva|first4=Baldo}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/12368246|title=Inferring domain-domain interactions from protein-protein interactions|last=Deng|first=Minghua|last2=Mehta|first2=Shipra|date=2002-10|journal=Genome Research|issue=10|doi=10.1101/gr.153002|volume=12|pages=1540–1548|issn=1088-9051|pmid=12368246|last3=Sun|first3=Fengzhu|last4=Chen|first4=Ting}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/15576357|title=PreSPI: a domain combination based prediction system for protein-protein interaction|last=Han|first=Dong-Soo|last2=Kim|first2=Hong-Soog|date=2004|journal=Nucleic Acids Research|issue=21|doi=10.1093/nar/gkh972|volume=32|pages=6312–6320|issn=1362-4962|pmid=15576357|last3=Jang|first3=Woo-Hyuk|last4=Lee|first4=Sung-Doke|last5=Suh|first5=Jung-Keun}}</ref>

Προσεγγίσεις που βασίζονται στην πρωτοταγή δομή των πρωτεϊνών στηρίζονται στην υπόθεση ότι οι πρωτεϊνικές αλληλεπιδράσεις μπορεί να διαμεσολαβούνται μέσω συγκεκριμένου αριθμού μικρών επαναλαμβανόμενων πολυπεπτιδικών αλληλουχιών. Η εφαρμογή μηχανών διανυσματικής υποστήριξης (support vector machines ή SVM) έχει δείξει ότι η πρωτοταγής αλληλουχία μιας αμινοξικής ακολουθίας μπορεί να ταυτοποιήσει αλληλεπιδράσεις. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/11331240|title=Predicting protein--protein interactions from primary structure|last=Bock|first=J. R.|last2=Gough|first2=D. A.|date=2001-5|journal=Bioinformatics (Oxford, England)|issue=5|volume=17|pages=455–460|issn=1367-4803|pmid=11331240}}</ref><ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/15319262|title=Predicting protein-protein interactions using signature products|last=Martin|first=Shawn|last2=Roe|first2=Diana|date=2005-01-15|journal=Bioinformatics (Oxford, England)|issue=2|doi=10.1093/bioinformatics/bth483|volume=21|pages=218–226|issn=1367-4803|pmid=15319262|last3=Faulon|first3=Jean-Loup}}</ref>

==== Επαλήθευση πειραματικά καθορισμένων αλληλεπιδράσεων ====
Έχει βρεθεί ότι μεταξύ πειραματικών και βιοπληροφορικών μεθόδων υπάρχει χαμηλό επίπεδο επικαλύψεων. Ένας τρόπος επαλήθευσης των υπολογιστικών μεθόδων είναι το μέτρο «σχετικότητας αλληλεπίδρασης» (interaction generality ή IG1). Αυτό είναι ο αριθμός πρωτεϊνών που εμπλέκονται σε μία αλληλεπίδραση ή ο αριθμός των πρωτεϊνών που αλληλεπιδρούν άμεσα με το ζεύγος πρωτεϊνών στόχο. Αυτό το μέτρο βασίζεται στην υπόθεση πως πρωτεΐνες που αλληλεπιδρούν και εμφανίζονται να συμμετέχουν σε αλληλεπιδράσεις με άλλες πρωτεΐνες που δε συμμετέχουν σε κάποιο άλλο δίκτυο αλληλεπιδράσεων, είναι πιο πιθανό να είναι ψευδώς θετικές. Λαμβάνοντας υπόψη και τις τοπολογικές ιδιότητες του πρωτεϊνικού δικτύου αλληλεπιδράσεων δημιουργήθηκε ένα νέο μέτρο, το IG2 με μεγαλύτερη ακρίβεια πρόβλεψης. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC101243/|title=Interaction generality, a measurement to assess the reliability of a protein–protein interaction|last=Saito|first=Rintaro|last2=Suzuki|first2=Harukazu|date=2002-03-01|journal=Nucleic Acids Research|issue=5|volume=30|pages=1163–1168|issn=0305-1048|pmid=11861907|last3=Hayashizaki|first3=Yoshihide}}</ref>

Ένα άλλο μέτρο για τον καθορισμό της αξιοπιστίας μιας αλληλεπίδρασης μεταξύ δύο πρωτεϊνών είναι η συσχέτιση των επιπέδων έκφρασης των mRNA τους. Αυτό χρησιμοποιείται για να δημιουργηθεί ένα προφίλ έκφρασης της αξιοπιστίας (expression profile reliability ή EPR). Μία μέθοδος παράλογης επαλήθευσης (paralogous verification method ή PVM) έχει αναπτυχθεί στην οποία ανιχνεύονται παράλογες αλληλεπιδράσεις πρωτεϊνών από βάσεις δεδομένων αλληλεπίδρασης και βάση του αριθμού τους αποφασίζεται η αξιοπιστία τους. <ref>{{Cite journal|url=https://www.ncbi.nlm.nih.gov/pubmed/12118076|title=Protein interactions: two methods for assessment of the reliability of high throughput observations|last=Deane|first=Charlotte M.|last2=Salwiński|first2=Łukasz|date=2002-5|journal=Molecular & cellular proteomics: MCP|issue=5|volume=1|pages=349–356|issn=1535-9476|pmid=12118076|last3=Xenarios|first3=Ioannis|last4=Eisenberg|first4=David}}</ref>

== Βάσεις δεδομένων <ref>{{Cite journal|url=http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1000807|title=Protein–Protein Interactions Essentials: Key Concepts to Building and Analyzing Interactome Networks|date=2010-06-24|journal=PLOS Computational Biology|issue=6|doi=10.1371/journal.pcbi.1000807|volume=6|pages=e1000807|language=en|issn=1553-7358}}</ref> ==
Ο μεγάλος αριθμός πειραματικών δεδομένων για πρωτεϊνικές αλληλεπιδράσεις έχει δημιουργήσει την ανάγκη κατασκευής βιολογικών βάσεων δεδομένων για την καλύτερη οργάνωση και διάδοση αυτών των δεδομένων μέσω υπολογιστών.

Υπάρχουν οι πρωταρχικές βάσεις δεδομένων που έχουν προκύψει από πειραματικά δεδομένα δημοσιευμένων μελετών μεγάλης ή μικρής κλίμακας: BIND (Biomolecular Interaction Network Database, <nowiki>http://bond.unleashedinformatics.com/</nowiki>), BioGRID (Biological General Repository for Interaction Datasets, <nowiki>http://www.thebiogrid.org/</nowiki>), DIP (Database of Interacting Proteins, <nowiki>http://dip.doe-mbi.ucla.edu/dip/</nowiki>), HPRD (Human Protein Reference Database, <nowiki>http://www.hprd.org/</nowiki>), IntAct (IntAct Molecular Interaction Database, <nowiki>http://www.ebi.ac.uk/intact/</nowiki>), MINT (Molecular INTeraction database, <nowiki>http://mint.bio.uniroma2.it/mint/</nowiki>), MIPS-MPact (MIPS protein interaction resource on yeast, <nowiki>http://mips.gsf.de/genre/proj/mpact/</nowiki>), MIPS-MPPI (MIPS Mammalian Protein-Protein Interaction Database, <nowiki>http://mips.gsf.de/proj/ppi</nowiki>).

Έπειτα δημιουργήθηκαν βάσεις δεδομένων που προέκυψαν από ενσωμάτωση και ενοποίηση των δεδομένων από πρωταρχικές βάσεις που αναφέρθηκαν. Μερικές από αυτές είναι: APID (Agile Protein Interaction DataAnalyzer, <nowiki>http://bioinfow.dep.usal.es/apid/</nowiki>), MPIDB (The Microbial Protein Interaction Database, <nowiki>http://www.jcvi.org/mpidb/</nowiki>), PINA (Protein Interaction Network Analysis platform, <nowiki>http://csbi.ltdk.helsinki.fi/pina/</nowiki>)

Τέλος, δημιουργήθηκαν βάσεις από πειραματικά δεδομένα σε συνδυασμό με προβλεπόμενες αλληλεπιδράσεις που έχουν προκύψει από ετερογενή βιολογικά δεδομένα όπως: MiMI (Michigan Molecular Interactions, <nowiki>http://mimi.ncibi.org/MimiWeb/</nowiki>), PIPs (Human PPI Prediction database, <nowiki>http://www.compbio.dundee.ac.uk/www-pips/</nowiki>), OPHID (Online Predicted Human Interaction Database, <nowiki>http://ophid.utoronto.ca/</nowiki>), STRING (Known and Predicted Protein-Protein Interactions, <nowiki>http://string.embl.de/</nowiki>), UniHI Unified Human Interactome, <nowiki>http://www.mdc-berlin.de/unihi/</nowiki>).


== Παράμετροι δικτύων πρωτεϊνικών αλληλεπιδράσεων ==
== Παράμετροι δικτύων πρωτεϊνικών αλληλεπιδράσεων ==

Έκδοση από την 14:10, 27 Μαΐου 2018

Οι πρωτεΐνες είναι τα πιο σημαντικά μακρομόρια τα οποία εμπλέκονται σε όλες τις κυτταρικές διεργασίες. Χάρη στις νέες τεχνολογίες που αναπτύσσονται, η γνώση μας για αυτές αναπτύσσεται μέρα με τη μέρα. Παρόλα αυτά, η γνώση μόνο της κάθε πρωτεΐνης ξεχωριστά δεν επαρκεί, αφού συνήθως οι πρωτεΐνες δεν δρουν αυτόνομα, αλλά συνεργατικά. Άρα, σημαντικό βήμα για την κατανόηση τους είναι η χαρτογράφηση των μεταξύ τους αλληλεπιδράσεων, το οποίο επιτυγχάνουμε με τη χρήση και δημιουργία των δικτύων πρωτεϊνικών αλληλεπιδράσεων.

Τύποι αλληλεπιδράσεων

Οι πρωτεΐνες είναι κομβικά μακρομόρια για σχεδόν όλες τις βιολογικές λειτουργίες, αλλά σπάνια δρουν μόνες  τους. Οι περισσότερες από τις μοριακές διεργασίες βασίζονται σε μοριακές μηχανές, οι οποίες αποτελούνται από μεγάλο αριθμό πρωτεϊνών που συνδέονται μεταξύ τους μέσω απευθείας φυσικής αλληλεπίδρασης πρωτεΐνης-πρωτεΐνης. Τα δίκτυα μεταβολισμού και ρύθμισης καθοδηγούνται από αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης. Ωστόσο, παρατηρούνται διαφορετικοί τύποι συμπλοκών με συγκεκριμένες λειτουργίες: μεγάλα μακρομοριακά σύμπλοκα, όπως το ριβόσωμα, είναι ιδιαίτερα σταθερά και μόνιμα, ενώ βασικά συστατικά των σηματοδοτικών και ρυθμιστικών δικτύων είναι οι δυναμικές και παροδικές αλληλεπιδράσεις [1] [2] [3] . Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης μπορούν να ταξινομηθούν με βάση τη σύνθεσή τους, τη συνάφεια και το χρόνο ζωής τους [4] [5] ως: (i) ομο- και ετερο-ολιγομερή σύμπλοκα, (ii) υποχρεωτικά και μη υποχρεωτικά  σύμπλοκα, (iii) παροδικά και μόνιμα σύμπλοκα και (iv) σύμπλοκα δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου.

Ομο-ολιγομερή και ετερο-ολιγομερή σύμπλοκα

Ένα σύμπλοκο πρωτεϊνών θεωρείται ότι είναι ένα όμο-ολιγομερές όταν το σύμπλεγμα αποτελείται μόνο από ταυτόσημες μονάδες αλληλεπίδρασης, διαφορετικά ταξινομείται ως ετερο-ολιγομερές και αποτελείται από μη ταυτόσημες πρωτεΐνες. Τα ομο-ολιγομερή σύμπλοκα πρωτεϊνών τείνουν να σχηματίζουν πολύ σταθερές και μόνιμες πρωτεϊνικές δομές. Αυτό ισχύει ιδιαίτερα στις περιπτώσεις των ομο-διμερών (σύμπλοκα δύο πρωτεϊνών)  [6], όπως το ομο-διμερές του κυτοχρώματος C [7]. Λόγω της συμμετρικής τους φύσης, τα ομο-ολιγομερή εξυπηρετούν ως πρωτεΐνες ικριώματα για τη δέσμευση μακρομορίων. Βασικό παράδειγμα είναι η βακτηριακή τσαπερόνη GroEL, η οποία σχηματίζει ένα GroEL ομο-επταμερές σχηματίζοντας έναν κύλινδρο, το ένα άκρο του οποίου  καλύπτεται από επτά πρωτείνες GroES [8] [9]. Η κυλινδρική περιοχή είναι ένα παράδειγμα ενός ομο-ολιγομερούς, ενώ το σύμπλεγμα GroEL/GroES είναι ένα υπερ-μόριο ετερο-ολιγομερών. Η σταθερότητα των ετερο-ολιγομερών μπορεί να ποικίλει, γεγονός που επιτρέπει τη συνεργασία  διαφορετικών πρωτεϊνών σε ένα μόνο μακρομόριο. Παραδείγματος χάριν, οι α/β τουμπουλίνες σχηματίζουν ένα σταθερό διμερές και αυτά τα διμερή σχηματίζουν μακρά νηµατοειδή µικροσυµπλέγµατα, τα οποία είναι συστατικά των μικροσωληνίσκων [10].

Υποχρεωτικά και μη υποχρεωτικά σύμπλοκα

Το βασικό σημείο για τη διαφοροποίηση μεταξύ αυτών των δύο ομάδων είναι η συγγένεια. Τα  συστατικά (πρωτόμερή, μονομερή) μιας υποχρεωτική αλληλεπίδρασης είναι ασταθή in vivo ενώ τα συστατικά των μη υποχρεωτικών αλληλεπιδράσεων μπορούν να υπάρχουν ανεξάρτητα [4] [11]. Οι επιφάνειες διεπαφής των μη υποχρεωτικών αλληλεπιδράσεων τείνουν να είναι μικρότερες, λιγότερο πακεταρισμένες, πιο πολικές, λιγότερο συντηρημένες και συνολικά πιο όμοιες με τις κανονικές επιφάνειες πρωτεϊνών όσον αφορά τη σύνθεση των αμινοξέων σε σχέση με τις υποχρεωτικές αλληλεπιδράσεις [12]. Ένα παράδειγμα υποχρεωτικού συμπλόκου είναι οι πρωτεΐνες Ku, οι οποίες εμπλέκονται στην επιδιόρθωση του DNA και φαίνεται να δεσμεύουν το DNA ως υποχρεωτικά ομοδιμερή [13]. Από την άλλη πλευρά, τα σύμπλοκα σηματοδοτικών πρωτεϊνών είναι καλά παραδείγματα μη υποχρεωτικής αλληλεπίδρασης λόγω του παροδικού χαρακτήρα τους, καθώς αφού συμβάλλουν στη διάδοση ενός σήματος, στη συνέχεια διαχωρίζονται στις σταθερές συστατικές πρωτεΐνες. Για παράδειγμα, η πρωτεΐνη H-Ras, η οποία είναι μια G πρωτεΐνη, έχει βασικό ρόλο στον έλεγχο των σηματοδοτικών οδών, της κυτταρικής ανάπτυξης και της διαφοροποίησης. Η H-Ras σχηματίζει μη υποχρεωτικά σύμπλοκα με πρωτεΐνες που ενεργοποιούνται μέσω της τριφωσφατάση της γουανοσίνης (GTPase) (GAPs), όταν το κύτταρο βρίσκεται σε κατάσταση ηρεμίας ή σχηματίζει σύμπλοκα με παράγοντες ανταλλαγής νουκλεοτιδίων γουανίνης ως απόκριση σε ερεθίσματα [14].

Μόνιμες και παροδικές αλληλεπιδράσεις

Τα πρωτεινικά σύμπλοκα μπορούν επίσης να υποδιαιρεθούν σε δύο κατηγορίες με βάση τη συγγένεια δέσμευσης και τη διάρκεια ζωής τους. Συστατικά μόνιμων αλληλεπιδράσεων, όπως αναστολείς ενζύμων ή σύμπλοκα αντισώματος-αντιγόνου, βρίσκονται μόνο σε δεσμευμένη κατάσταση ενώ παροδικές αλληλεπιδράσεις, που συνήθως εμπλέκονται στην ενδοκυτταρική σηματοδότηση, είναι βραχύβιες και εύκολα συντίθενται ή αποσυντίθενται [15]. Το διμερές της a/b τουμπουλίνης είναι ένα παράδειγμα υποχρεωτικής και μόνιμης αλληλεπίδρασης, ενώ η αλληλεπίδραση των a/b διμερών τουμπουλίνης είναι παροδική και μη υποχρεωτική, παρέχοντας δυναμική φύση στους μικροσωληνίσκους κατά τη κυτταρική διαίρεση. Οι υποχρεωτικές αλληλεπιδράσεις είναι συνήθως μόνιμες [15] ενώ οι μη υποχρεωτικές αλληλεπιδράσεις είναι ως επί το πλείστον παροδικές [16]. Η δομή των παροδικών επιφανειών διεπαφής έχει μικρότερο μήκος σε σχέση με αυτή των μόνιμων επιφανειών διεπαφής και η σύνθεση των αμινοξέων της έχει ελαφρώς πλουσιότερη σύσταση σε ουδέτερες πολικές ομάδες [17] [18] [4] [19] [20] [21]. Η δεσμευτική ικανότητα των θέσεων αλληλεπίδρασης των παροδικών πρωτεϊνικών συμπλόκων καθορίζεται συχνά από σύντομα γραμμικά αμινοξικά μοτίβα (ELM) [11] [22].

Τα παροδικά σύμπλοκα, ανάλογα με τους λειτουργικούς τους ρόλους στο κύτταρο, παρουσιάζουν ευρύ φάσμα συγγενειών δέσμευσης και διάρκειας χρόνου ζωής και επομένως μπορούν να ταξινομηθούν ως ισχυρά και αδύναμα [4] [23] με βάση τη σταθερότητα του ολιγομερούς. Οι αδύναμες παροδικές αλληλεπιδράσεις χαρακτηρίζονται από χαμηλή συγγένεια δέσμευσης και πολύ μικρή διάρκεια ζωής (δηλ. κάποια δευτερόλεπτα), ενώ οι ισχυρές παροδικές αλληλεπιδράσεις μπορούν να οδηγήσουν σε αλλαγή της τριτοταγούς δομής (π.χ. με δέσμευση συνδέτη). Επιπλέον, οι ισχυρές παροδικές αλληλεπιδράσεις (π.χ. G πρωτεΐνες) μεταβάλλουν την ισορροπία σύνδεσης/διάστασης υπό ορισμένες προϋποθέσεις [15], ενώ οι αδύναμες παροδικές αλληλεπιδράσεις (όπως τα διμερή λυσίνης dimers of abalone sperm lysin) διασπώνται και σχηματίζονται συνεχώς [4]. Οι παροδικές επιφάνειες διεπαφής συνίστανται κυρίως από έναν κεντρικό πυρήνα ο οποίος είναι πλήρως απομονωμένος και οι παροδικές αλληλεπίδρασης πραγματοποιούνται στο νερό . Επιπλέον, οι ισχυρές παροδικές αλληλεπιδράσεις σε σύγκριση με τις αδύναμες έχουν μικρότερες, επίπεδες και πιο υδρόφοβες επιφάνειες διεπαφής. Τα αμινοξικά κατάλοιπα των αδύναμων παροδικών επιφανειών διεπαφής τείνουν να είναι λιγότερο σταθερά, αλλά περισσότερο συντηρημένα [15].

Σύμπλοκα δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου

Οι αλληλεπιδράσεις πρωτεΐνης-πρωτεΐνης μπορούν επίσης να ταξινομηθούν με βάση τη δομή τους ως αλληλεπιδράσεις δομικής περιοχής-δομικής περιοχής και δομικής περιοχής-πεπτιδίου [24]. Τα σύμπλοκα που ανήκουν στην τελευταία ομάδα έχουν ως επί το πλείστον παροδική φύση καθώς σχηματίζονται από την αναγνώριση μιας σφαιρικής δομικής περιοχής, ενός σύντομου γραμμικού μοτίβου (LM) και της μικρής επιφάνειας διεπαφής στην οποία λαμβάνει χώρα η αλληλεπίδραση (π.χ. περιοχή SH3 κινάσης τυροσίνης Fyn -πεπτίδια πλούσια σε προλίνη). Η αλληλεπίδραση αυτή δομικής περιοχής-πεπτιδίου ονομάζεται επίσης διαμεσολαβούμενη από πεπτίδιο παροδική αλληλεπίδραση. Πράγματι, ειδικές δομικές περιοχές αλληλεπίδρασης (όπως PDZ, SH2 , SH3, WW, κ.λπ.) παρέχουν ένα μηχανισμό σηματοδότησης χρησιμοποιώντας παροδικές αλληλεπιδράσεις. Αυτές οι μορφολογικές δομικές περιοχές αλληλεπίδρασης αναγνωρίζουν και δεσμεύουν συγκεκριμένα μοτίβα των πεπτιδίων (είτε στα άκρα είτε στις μη δομημένες περιοχές των πρωτεϊνών εταίρων). Αυτές οι ειδικές περιοχές δεν υφίστανται μεγάλες δομικές αλλαγές στη σύνδεση και για αυτό χρησιμοποιούνται συχνά στο κύτταρο. Για παράδειγμα, στον Ηomo sapiens, υπάρχουν 223 SH3, 234 PDZ και 91 δομικές περιοχές WW [1]. Αυτές οι δομικές περιοχές μπορεί να χρησιμοποιηθούν για τη συναρμολόγηση συστατικών πρωτεϊνών σε μεγάλα σύμπλοκα, φέρνοντας σε επαφή διάφορους συνδυασμούς καταλυτικών ρυθμιστικών περιοχών. Κάθε σύμπλοκο με έναν διαφορετικό συνδυασμό δομικών περιοχών έχει στη συνέχεια μια διαφορετική λειτουργία, που οδηγεί σε διαφορετική διαδικασία σηματοδότησης στο κύτταρο.

Μέθοδοι εύρεσης και ανάλυσης

Οι αλληλεπιδράσεις μεταξύ πρωτεϊνών είναι εκτενείς στα κύτταρα και ο βαθμός της ρύθμισης που παρέχουν είναι μεγάλος. Για την βέλτιστη κατανόηση της σημαντικότητάς τους πρέπει να ταυτοποιηθούν τα διαφορετικά είδη αλληλεπιδράσεων και η έκταση που έχουν στο κύτταρο ώστε να βρεθούν οι επιπτώσεις της κάθε αλληλεπίδρασης. Πολλές μέθοδοι υψηλής απόδοσης έχουν αναπτυχθεί για την πρόβλεψη αλληλεπιδράσεων μεταξύ πρωτεϊνών, όπως δύο υβριδικά συστήματα , φασματομετρία μάζας, απεικόνιση φάγου και τεχνολογία πρωτεϊνικών συστοιχιών[25].Κάθε μέθοδος έχει διαφορετική ένταση ευαισθησίας και ακρίβειας και χωρίζονται σε in vivo, in vitro και in silico. [26]

In vitro τεχνικές [26]

Αυτές οι τεχνικές γίνονται υπό ελεγχόμενες συνθήκες σε μη ζωντανούς οργανισμούς. Μερικές από αυτές είναι ο διαδοχικός καθαρισμός συγγένειας (tandem affinity purification ή TAP), η χρωματογραφία συγγένειας, η συν-ανοσοκατακρήμνιση, οι συστοιχίες πρωτεϊνών, η συμπληρωματικότητα θραυσμάτων πρωτεΐνης, η απεικόνιση φάγου, η μεταφορά ενέργειας συντονισμού Φέρστερ (Förster resonance energy transfer ή FRET),  η κρυσταλλογραφία ακτίνων Χ και ο πυρηνικός μαγνητικός συντονισμός (NMR).

Συν-ανοσοκατακρήμνιση

Με τη μέθοδο επιβεβαιώνονται αλληλεπιδράσεις μεταξύ πρωτεϊνών χρησιμοποιώντας εκχύλισμα με παρούσες τις πρωτεΐνες στη φυσική τους μορφή σε ένα πολύπλοκο μίγμα με συστατικά του κυττάρου που μπορεί να απαιτούνται για τις αλληλεπιδράσεις. Γίνεται η χρήση αντισώματος που δεσμεύει την πρωτεΐνη στόχο ώστε να απομονωθεί και μαζί με αυτή απομονώνονται και οι πρωτεΐνες με τις οποίες είναι συνδεδεμένη. Αυτά τα σύμπλοκα αναλύονται και γίνεται η ταυτοποίηση των αλληλεπιδράσεων. Συνίσταται η χρήση ευκαρυωτικών κυττάρων ώστε να είναι δυνατές οι μετα-μεταφραστικές τροποποιήσεις, που μπορεί να είναι κρίσιμες για κάποια αλληλεπίδραση εν αντιθέσει με τα προκαρυωτικά συστήματα έκφρασης που δεν έχουν μετα-μεταφραστικές τροποποιήσεις.

In vivo τεχνικές

Αυτές οι τεχνικές ακολουθούν συγκεκριμένες διαδικασίες που εφαρμόζονται σε ολόκληρο το ζωντανό οργανισμό. Οι κύριες τεχνικές είναι το σύστημα δύο υβριδίων του σακχαρομύκητα (yeast two hybrid ή Y2H), η βιοφωταύγεια συντονισμού με μεταφορά ενέργειας (bioluminescence resonance energy transfer ή BRET), η συμπληρωματικότητα διμοριακού φθορισμού (bimolecular fluorescence complementation ή BiFC) και η συνθετική θνησιμότητα. [26]

Σύστημα δύο υβριδίων ζύμης

Για τη μέθοδο απαιτούνται οι δύο πρωτεϊνικές περιοχές ενός μεταγραφικού παράγοντα για τη μεταγραφή ενός γονιδίου αναφοράς που έχουν δύο συγκεκριμένες λειτουργίες (α) μία περιοχή που βοηθά την πρόσδεση στο DNA (DNA binding domain ή DBD) και (β) μία περιοχή ενεργοποίησης για την έναρξη της μεταγραφής τους DNA(activation domain ή AD). Τα δύο τμήματα είναι ανεξάρτητα αλλά απαιτούνται και τα δύο για την έκφραση του γονιδίου αναφοράς. Για τη διάκριση της αλληλεπίδρασης δύο πρωτεϊνών, εκφράζεται η μία πρωτεΐνη στην περιοχή DBD και η άλλη στην περιοχή AD διαφορετικών στελεχών ζύμης. Έπειτα από σύντηξη των δύο στελεχών, υπάρχει μεταγραφή του γονιδίου αναφοράς που επάγεται από τον συγκεκριμένο παράγοντα αν οι δύο πρωτεΐνες έχουν φυσική αλληλεπίδραση. [27]

In silico τεχνικές [28]

Οι τεχνικές γίνονται σε υπολογιστή ή μέσω προσομοιώσεων υπολογιστή. Δεδομένα από διαφορετικές in vivo και in vitro μεθόδους συχνά έχουν ασυμφωνία και εμφανίζεται μεγάλο ποσοστό θετικών σφαλμάτων δείχνοντας αλληλεπίδραση πρωτεϊνών που δεν είναι απαραιτήτως συνδεδεμένες. Συνεπώς δημιουργείται η ανάγκη ανάπτυξης νέων μεθόδων για επιβεβαίωση των αλληλεπιδράσεων μέσω υπολογιστικών εργαλείων που βασίζονται σε δεδομένα αλληλούχισης βάσεων ή δομών, σε δεδομένα από in silico σύστημα δύο υβριδίων, σε φυλογενετικά δένδρα ή προσεγγίσεις βασισμένες στη γονιδιακή έκφραση. [29][30]

Οι υπολογιστικές μέθοδοι αρχικά αναπτύχθηκαν κατασκευάζοντας βάσεις δεδομένων για αλληλεπιδράσεις που προσδιορίστηκαν πειραματικά. Έπειτα εφαρμόστηκαν τεχνικές εξόρυξης δεδομένων από αυτές τις βάσεις ώστε να ληφθούν πληροφορίες από το μεγάλο όγκο δεδομένων πρωτεϊνικών αλληλεπιδράσεων για δημιουργία δικτύων πρωτεϊνικών αλληλεπιδράσεων. Δεδομένου ότι οι πρωτεΐνες που αλληλεπιδρούν έχουν αυξημένη πιθανότητα να είναι λειτουργικά συνδεδεμένες, αναπτύχθηκαν υπολογιστικά εργαλεία για τη διερεύνηση δικτύων πρωτεϊνικών αλληλεπιδράσεων ώστε να προβλεφτούν λειτουργικά χαρακτηριστικά των πρωτεϊνών και νέες αλληλεπιδράσεις από τις ήδη γνωστές. [29][30]

Υπολογιστικές μέθοδοι πρόβλεψης

Παρέχουν μία συμπληρωματική προσέγγιση για την ανίχνευση πρωτεϊνικών αλληλεπιδράσεων και προσπαθούν να κατευθύνουν τη γνώση ήδη ταυτοποιημένων αλληλεπιδράσεων προς πρόβλεψη νέων. Συχνά δίνουν μία κατεύθυνση για το σχεδιασμό πειραμάτων ώστε να επιβεβαιωθούν αυτές οι προβλέψεις. Αυτές οι προσεγγίσεις μπορούν να ταξινομηθούν σε 5 κατηγορίες βασισμένες σε πληροφορίες από μελέτες γονιδιωματικής, εξελικτικές σχέσεις, πρωτεϊνικές δομές τριών διαστάσεων, περιοχές πρωτεϊνών και πρωτοταγείς πρωτεϊνικές δομές (Εικόνες Α, Β, Γ, Δ, Ε [28]).

Τα γονιδιώματα που έχουν αλληλουχηθεί πλήρως παρέχουν πληροφορίες για τη διάταξη των γονιδίων και την εξελικτική συντήρηση αυτής της διάταξης ανάμεσα στα είδη υποδεικνύοντας ποια μπορεί να σχετίζονται λειτουργικά. [31][32][33]

Οι εξελικτικές σχέσεις μεταξύ δύο πρωτεϊνών μπορούν να χρησιμοποιηθούν για την κατανόηση της φυσικής και λειτουργικής σχέσης τους. Το φυλογενετικό προφίλ μιας πρωτεΐνης περιγράφει την παρουσία ομολόγων μεταξύ οργανισμών και παρόμοια προφίλ μεταξύ πρωτεϊνών μπορεί να υποδεικνύουν και λειτουργική συσχέτιση. [34][35]

Η πειραματικά αυξανόμενη ταυτοποίηση πρωτεϊνικών δομών έχει οδηγήσει στη χρησιμοποίηση της τρισδιάστατης δομής των πρωτεϊνών για την πρόβλεψη της φυσικής πρόσδεσής τους. Έχει επίσης δειχθεί ότι πρωτεΐνες με μεγάλη ομολογία αλληλεπιδρούν με τον ίδιο ή παρόμοιο τρόπο. [36][37]

Πολλές υπολογιστικές τεχνικές βασίζονται μόνο στη συντήρηση πρωτεϊνικών περιοχών. Με τη χρησιμοποίηση εξελικτικά συντηρημένων πρωτεϊνικών περιοχών μπορούν να εκτιμηθούν οι πιθανότητες αλληλεπίδρασης κάθε ζεύγους περιοχών. Δημιουργείται οπότε ένα δίκτυο πιθανών αλληλεπιδράσεων μεταξύ περιοχών των πρωτεϊνών, το οποίο μπορεί να χρησιμοποιηθεί για την πρόβλεψη αλληλεπιδράσεων μεταξύ των πρωτεϊνών.[38][39][40]

Προσεγγίσεις που βασίζονται στην πρωτοταγή δομή των πρωτεϊνών στηρίζονται στην υπόθεση ότι οι πρωτεϊνικές αλληλεπιδράσεις μπορεί να διαμεσολαβούνται μέσω συγκεκριμένου αριθμού μικρών επαναλαμβανόμενων πολυπεπτιδικών αλληλουχιών. Η εφαρμογή μηχανών διανυσματικής υποστήριξης (support vector machines ή SVM) έχει δείξει ότι η πρωτοταγής αλληλουχία μιας αμινοξικής ακολουθίας μπορεί να ταυτοποιήσει αλληλεπιδράσεις. [41][42]

Επαλήθευση πειραματικά καθορισμένων αλληλεπιδράσεων

Έχει βρεθεί ότι μεταξύ πειραματικών και βιοπληροφορικών μεθόδων υπάρχει χαμηλό επίπεδο επικαλύψεων. Ένας τρόπος επαλήθευσης των υπολογιστικών μεθόδων είναι το μέτρο «σχετικότητας αλληλεπίδρασης» (interaction generality ή IG1). Αυτό είναι ο αριθμός πρωτεϊνών που εμπλέκονται σε μία αλληλεπίδραση ή ο αριθμός των πρωτεϊνών που αλληλεπιδρούν άμεσα με το ζεύγος πρωτεϊνών στόχο. Αυτό το μέτρο βασίζεται στην υπόθεση πως πρωτεΐνες που αλληλεπιδρούν και εμφανίζονται να συμμετέχουν σε αλληλεπιδράσεις με άλλες πρωτεΐνες που δε συμμετέχουν σε κάποιο άλλο δίκτυο αλληλεπιδράσεων, είναι πιο πιθανό να είναι ψευδώς θετικές. Λαμβάνοντας υπόψη και τις τοπολογικές ιδιότητες του πρωτεϊνικού δικτύου αλληλεπιδράσεων δημιουργήθηκε ένα νέο μέτρο, το IG2 με μεγαλύτερη ακρίβεια πρόβλεψης. [43]

Ένα άλλο μέτρο για τον καθορισμό της αξιοπιστίας μιας αλληλεπίδρασης μεταξύ δύο πρωτεϊνών είναι η συσχέτιση των επιπέδων έκφρασης των mRNA τους. Αυτό χρησιμοποιείται για να δημιουργηθεί ένα προφίλ έκφρασης της αξιοπιστίας (expression profile reliability ή EPR). Μία μέθοδος παράλογης επαλήθευσης (paralogous verification method ή PVM) έχει αναπτυχθεί στην οποία ανιχνεύονται παράλογες αλληλεπιδράσεις πρωτεϊνών από βάσεις δεδομένων αλληλεπίδρασης και βάση του αριθμού τους αποφασίζεται η αξιοπιστία τους. [44]

Βάσεις δεδομένων [45]

Ο μεγάλος αριθμός πειραματικών δεδομένων για πρωτεϊνικές αλληλεπιδράσεις έχει δημιουργήσει την ανάγκη κατασκευής βιολογικών βάσεων δεδομένων για την καλύτερη οργάνωση και διάδοση αυτών των δεδομένων μέσω υπολογιστών.

Υπάρχουν οι πρωταρχικές βάσεις δεδομένων που έχουν προκύψει από πειραματικά δεδομένα δημοσιευμένων μελετών μεγάλης ή μικρής κλίμακας: BIND (Biomolecular Interaction Network Database, http://bond.unleashedinformatics.com/), BioGRID (Biological General Repository for Interaction Datasets, http://www.thebiogrid.org/), DIP (Database of Interacting Proteins, http://dip.doe-mbi.ucla.edu/dip/), HPRD (Human Protein Reference Database, http://www.hprd.org/), IntAct (IntAct Molecular Interaction Database, http://www.ebi.ac.uk/intact/), MINT (Molecular INTeraction database, http://mint.bio.uniroma2.it/mint/), MIPS-MPact (MIPS protein interaction resource on yeast, http://mips.gsf.de/genre/proj/mpact/), MIPS-MPPI (MIPS Mammalian Protein-Protein Interaction Database, http://mips.gsf.de/proj/ppi).

Έπειτα δημιουργήθηκαν βάσεις δεδομένων που προέκυψαν από ενσωμάτωση και ενοποίηση των δεδομένων από πρωταρχικές βάσεις που αναφέρθηκαν. Μερικές από αυτές είναι: APID (Agile Protein Interaction DataAnalyzer, http://bioinfow.dep.usal.es/apid/), MPIDB (The Microbial Protein Interaction Database, http://www.jcvi.org/mpidb/), PINA (Protein Interaction Network Analysis platform, http://csbi.ltdk.helsinki.fi/pina/)

Τέλος, δημιουργήθηκαν βάσεις από πειραματικά δεδομένα σε συνδυασμό με προβλεπόμενες αλληλεπιδράσεις που έχουν προκύψει από ετερογενή βιολογικά δεδομένα όπως: MiMI (Michigan Molecular Interactions, http://mimi.ncibi.org/MimiWeb/), PIPs (Human PPI Prediction database, http://www.compbio.dundee.ac.uk/www-pips/), OPHID (Online Predicted Human Interaction Database, http://ophid.utoronto.ca/), STRING (Known and Predicted Protein-Protein Interactions, http://string.embl.de/), UniHI Unified Human Interactome, http://www.mdc-berlin.de/unihi/).

Παράμετροι δικτύων πρωτεϊνικών αλληλεπιδράσεων

Η θεωρία δικτύων παρέχει μέτρα ποσοτικοποίησης των παραμέτρων ενός δικτύου, τα οποία χρησιμοποιούνται και για την περιγραφή του. Χρησιμοποιώντας αυτά τα μέτρα μπορούμε να χαρακτηρίσουμε αλλά και να συγκρίνουμε μεταξύ τους περίπλοκα δίκτυα.

Συνδεσιμότητα ή βαθμός

Κάθε πρωτεΐνη σε ένα δίκτυο αποτελεί έναν κόμβο. Το πιο βασικό χαρακτηριστικό ενός κόμβου ενός δικτύου είναι ο βαθμός του, k, ο οποίος αναπαριστά τον αριθμό των άμεσων συνδέσεων ή ακμών που έχει ο κόμβος με άλλους κόμβους του δικτύου.

Κατανομή βαθμού

Η κατανομή βαθμού, P(k), δίνει την πιθανότητα που έχει ένας συγκεκριμένος κόμβος του δικτύου να έχει ακριβώς k ακμές ή αλλιώς συνδέσεις. Η πιθανότητα αυτή υπολογίζεται μετρώντας τον αριθμό των κόμβων N(k) με k=1,2,… ακμές και διαιρώντας τον αριθμό αυτό με τον αριθμώ των συνολικών κόμβων Ν. Η κατανομή του βαθμού ενός δικτύου είναι ένα βασικό χαρακτηριστικό το οποίο μας επιτρέπει να ξεχωρίζουμε μεταξύ των διαφορετικών τοπολογιών ενός δικτύου, οι οποίες θα αναλυθούν και παρακάτω [46].

Συντελεστής ομαδοποίησης

Ο συντελεστής ομαδοποίησης C, ο οποίος πρώτη φορά ορίστηκε από τους Watts και Strogatz [47], περιγράφει πόσο συνδεδεμένοι είναι οι γείτονες ενός επιλεγμένου κόμβου με τους δικούς τους γειτονικούς κόμβους. Ο μέσος συντελεστής ομαδοποίησης για όλους τους κόμβους ενός δικτύου θεωρείται ως ο συντελεστής ομαδοποίησης του δικτύου συνολικά. Σε έναν μη κατευθυνόμενο δίκτυο, ή αν χρησιμοποιήσουμε την ορολογία της επιστήμης των δικτύων ένα μη κατευθυνόμενο γράφο, αν ένας κόμβος vi έχει ki γείτονες, μπορούν να υπάρχουν ki(k-1)/2 ακμές μεταξύ των κόμβων μεταξύ των γειτόνων της γειτονιάς Νi. Ο συντελεστής ομαδοποίησης για έναν μη κατευθυνόμενο γράφο χαρακτηρίζει λοιπόν την τάση που έχουν οι κόμβοι ενός δικτύου να κάνουν «συστάδες» ή ομάδες. O C(k) ορίζεται ως ο μέσος συντελεστής ομαδοποίησης ενός δικτύου για όλους τους κόμβους του με k συνδέσεις.

Χαρακτηριστικό μήκος μονοπατιού

Το χαρακτηριστικό μήκος μονοπατιού L ορίζεται ως ο αριθμός των ακμών στο κοντινότερο μονοπάτι μεταξύ δύο κόμβων, υπολογίζοντας τον μέσο όρο για όλα τα ζευγάρια κόμβων. Μετράει το πόσο απομακρυσμένοι είναι τυπικά δυο κόμβοι μέσα στο δίκτυο [47]. Επεκτείνοντας τον ορισμό αυτό, μπορούμε να πούμε ότι αναπαριστά το πόσο εύκολα και σύντομα μπορούμε να μετακινηθούμε από έναν κόμβο στον επόμενο μέσα στο δίκτυο [46].

Διάμετρος δικτύου

Η διάμετρος του δικτύου d είναι η μεγαλύτερη απόσταση μεταξύ δύο οποιωνδήποτε κόμβων σε ένα δίκτυο[48]. Μπορούμε επίσης να τη χαρακτηρίσουμε ως το «μακρύτερο» κοντινότερο μονοπάτι μεταξύ δύο κόμβων ενός δικτύου. Αρκετοί συγγραφείς χρησιμοποιούν τη διάμετρο δικτύου για να περιγράψουν τη μέση τοπογραφική απόσταση μέσα σ ένα δίκτυο, δηλαδή το χαρακτηριστικό μήκος μονοπατιού, παρόλο που σε απόλυτους όρους, αυτά τα δύο μέτρα διαφέρουν.

Ενδιαμεσότητα

Η ενδιαμεσότητα (CB) είναι ένα μέσο μέτρησης της κεντρικότητας ενός κόμβου μέσα σε έναν γράφο, δηλαδή ποιοι κόμβοι είναι ανάμεσα στο μονοπάτι μεταξύ δύο γειτονικών κόμβων. Αν δεν υπήρχαν αυτοί οι ενδιάμεσοι κόμβοι, οι δύο γείτονες δεν θα μπορούσαν να επικοινωνήσουν, άρα η ενδιαμεσότητα χαρακτηρίζει σημαντικούς κόμβους οι οποίοι βρίσκονται σε μεγάλο ποσοστό των μονοπατιών μεταξύ άλλων κόμβων του δικτύου [48]. Ένας παρόμοιος ορισμός δίνεται και από τους Girvan και Newman [49].

Τοπολογίες δικτύων

Η τοπολογία ενός δικτύου πολύ συχνά μας αποκαλύπτει πληροφορίες σχετικά με το πόσο σημαντικό είναι ένα βιολογικό δίκτυο. Πολύ συχνά τα βιολογικά δίκτυα ακολουθούν συγκεκριμένους κανόνες και πρότυπα, τα οποία μπορούν και να χρησιμοποιήσουν οι επιστήμονες για να τα εντοπίσουν, χαρακτηρίσουν και εξάγουν σημαντική βιολογική γνώση.

Τυχαία δίκτυα

Ένα τυχαίο δίκτυο, ή αλλιώς ένα δίκτυο Erdős–Rényi ξεκινά με έναν Ν αριθμό κόμβων και συνδέει κάθε ζεύγος κόμβων με μία πιθανότητα p, η οποία λοιπόν δημιουργεί έναν γράφο με περίπου pN(N-1)/2 τυχαία τοποθετημένες συνδέσεις. Οι βαθμοί των κόμβων ακολουθούν την κατανομή Πουασσόν, καταδεικνύοντας ότι η πλειοψηφία των κόμβων θα έχει και παρόμοιο αριθμό ακμών [46]. Για αρκετά μικρή πιθανότητα p, το δίκτυο θα είναι αρκετά αποσυνδεδεμένο και θα αποτελείται από απομονωμένα «νησιά», ενώ αν p>log(N)/N σχεδόν όλοι οι κόμβοι θα είναι πλήρως συνδεδεμένοι [48].

Δίκτυα μικρού κόσμου

Τα δίκτυα μικρού κόσμου πρώτη φορά εισήχθησαν από τους Watts και Strogatz ώστε να περιγράψουν δίκτυα με πολύ συγκεκριμένη τοπολογία: ο κάθε κόμβος έχει πολύ λίγους γείτονες, αλλά μπορούμε να φτάσουμε από έναν κόμβο σε έναν άλλον με σχετικά μικρό μέσο αριθμό βημάτων, κάτι που συχνά περιγράφεται και ως «έξι βαθμοί διαχωρισμού» [50]. Δίκτυα μικρού κόσμου μπορούν να κατασκευαστούν «ανασυνδέοντας» δίκτυα που μοιάζουν με διασυνδεδεμένο δακτύλιο [47]. Ένα τυπικό πλέγμα δακτυλίου μοιάζει με κομπολόι, όπου οι χάντρες είναι οι κόμβοι, οι οποίοι είναι συνδεδεμένοι μόνο με τους δύο άλλους κόμβους-χάντρες δεξιά και αριστερά του, με μόνη διαφορά ότι είναι και συνδεδεμένο εκτός από αυτούς και με τους αμέσως επόμενους γείτονες από τις διπλανές του χάντρες. Άρα, κάθε κόμβος είναι συνδεδεμένος με 4 κοντινούς γείτονες στο κυκλικό αυτό πλέγμα. Αν αρχίσουμε να αντικαθιστούμε αυτές τις συνδέσεις με τυχαίες, με μια πιθανότητα φ=[0,1] αυξάνοντας δηλαδή συνεχόμενα την τυχαιότητα των συνδέσεων, ξεκινάμε από την απόλυτη τάξη και μπορούμε να καταλήξουμε στην απόλυτη αταξία. Αυτή ακριβώς η διαδικασία είναι που δημιουργεί τα δίκτυα μικρού κόσμου. Το «ιδανικό» δίκτυο μικρού κόσμου παρουσιάζει μεγάλο συντελεστή ομαδοποίησης και παράλληλα μικρό χαρακτηριστικό μήκος μονοπατιού μεταξύ των κόμβων του. Αυτός ο τύπος δικτύου αντιπροσωπεύει αρκετά βιολογικά δίκτυα, όπως τα μεταβολικά δίκτυα κ.ά., επιτρέποντας λοιπόν την άμεση επικοινωνία των μερών αυτών των δικτύων, άρα πιθανές αλλαγές σε τμήματα τους εξαπλώνονται άμεσα [46]. Η κατανομή των κόμβων ανάλογα με το πόσες συνδέσεις φέρουν σε ένα δίκτυο μικρού κόσμου ακολουθεί τον «νόμο δύναμης», δηλαδή η πλειοψηφία των κόμβων φέρουν ελάχιστες ακμές, ενώ μια πολύ μικρή μειοψηφία είναι άκρως διασυνδεδεμένη [51].

Δίκτυα Χωρίς Κλίμακα

Τα δίκτυα χωρίς κλίμακα χαρακτηρίζονται από κατανομή βαθμού που ακολουθεί το νόμο δύναμης. Η πιθανότητα ένας κόμβος να έχει k συνδέσεις δίνεται από το P(k) ~k-γ, όπου γ είναι o βαθμός του εκθέτη. Η εισαγωγή του δικτύου αυτού έγινε από τους Barabasi και Albert. Η τιμή του γ καθορίζει αρκετές από τις ιδιότητες του δικτύου [52]. Για μικρές τιμές του γ, οι κεντρικοί, πολύ συνδεδεμένοι, κόμβοι του δικτύου γίνονται πολύ σημαντικοί. Για γ>3 αυτοί οι άκρως συνδεδεμένοι κόμβοι δεν είναι αρκετά σημαντικοί, ενώ για τιμές 2<γ<3 υπάρχει μια ιεραρχία τέτοιων «κεντρικών» κόμβων, με τους πιο συνδεδεμένους από αυτούς να είναι σε σύνδεση με ένα μικρό τμήμα του δικτύου. Σημαντικό χαρακτηριστικό των δικτύων χωρίς κλίμακα είναι ότι είναι άκρως ανθεκτικά σε τυχαίες αφαιρέσεις κόμβων, καθώς και ευαίσθητα σε αφαίρεση «κεντρικών» κόμβων. Αυτά τα χαρακτηριστικά παρατηρούνται και στην πλειοψηφία των βιολογικών δικτύων, άρα το μοντέλο των δικτύων χωρίς κλίμακα τα περιγράφει με τον καλύτερο δυνατό τρόπο, αφού η λογική πίσω από αυτό μας αποκαλύπτει πληροφορίες σχετικά με τη δυναμική του δικτύου, ιδίως από την οπτική της εξέλιξης. Φαινόμενα όπως ο διπλασιασμός γονιδίων, τα δίκτυα των οποίων επεκτείνονται συνεχώς, αφού προστίθενται συνεχώς νέοι κόμβοι, οι οποίοι συνδέονται κυρίως σε άλλους υπάρχοντες κόμβους με πολλαπλές συνδέσεις [48].


Παραπομπές

  1. 1,0 1,1 Bhattacharyya, R. P., et al. (2006). "Domains, motifs, and scaffolds: the role of modular interactions in the evolution and wiring of cell signaling circuits." Annu Rev Biochem 75: 655-680.
  2. Stein, A., et al. (2009). "Dynamic interactions of proteins in complex networks: a more structured view." FEBS J 276(19): 5390-5405.
  3. Bashor, C. J., et al. (2010). "Rewiring cells: synthetic biology as a tool to interrogate the organizational principles of living systems." Annu Rev Biophys 39: 515-537.
  4. 4,0 4,1 4,2 4,3 4,4 Nooren, I. M. and J. M. Thornton (2003). "Diversity of protein-protein interactions." EMBO J 22(14): 3486-3492.
  5. Park, S. H., et al. (2009). "Prediction of protein-protein interaction types using association rule based classification." BMC Bioinformatics 10: 36.
  6. Jeong, H., et al. (2001). "Lethality and centrality in protein networks." Nature 411(6833): 41-42.
  7. Finzel, B. C., et al. (1985). "Structure of ferricytochrome c' from Rhodospirillum molischianum at 1.67 A resolution." J Mol Biol 186(3): 627-643.
  8. Braig, K., et al. (1994). "The crystal structure of the bacterial chaperonin GroEL at 2.8 A." Nature 371(6498): 578-586
  9. Boisvert, D. C., et al. (1996). "The 2.4 A crystal structure of the bacterial chaperonin GroEL complexed with ATP gamma S." Nat Struct Biol 3(2): 170-177.
  10. Lowe, J., et al. (2001). "Refined structure of alpha beta-tubulin at 3.5 A resolution." J Mol Biol 313(5): 1045-1057.
  11. 11,0 11,1 Perkins, J. R., et al. (2010). "Transient protein-protein interactions: structural, functional, and network properties." Structure 18(10): 1233-1243.
  12. Zhu, H., et al. (2006). "NOXclass: prediction of protein-protein interaction types." BMC Bioinformatics 7: 27.
  13. Krishna, S. S. and L. Aravind (2010). "The bridge-region of the Ku superfamily is an atypical zinc ribbon domain." J Struct Biol 172(3): 294-299.
  14. Vetter, I. R. and A. Wittinghofer (2001). "The guanine nucleotide-binding switch in three dimensions." Science 294(5545): 1299-1304.
  15. 15,0 15,1 15,2 15,3 Nooren, I. M. and J. M. Thornton (2003). "Structural characterisation and functional significance of transient protein-protein interactions." J Mol Biol 325(5): 991-1018.
  16. Janin, J., et al. (2008). "Protein-protein interaction and quaternary structure." Q Rev Biophys 41(2): 133-180.
  17. Jones, S. and J. M. Thornton (1997). "Analysis of protein-protein interaction sites using surface patches." J Mol Biol 272(1): 121-132.
  18. Lo Conte, L., et al. (1999). "The atomic structure of protein-protein recognition sites." J Mol Biol 285(5): 2177-2198.
  19. Ansari, S. and V. Helms (2005). "Statistical analysis of predominantly transient protein-protein interfaces." Proteins 61(2): 344-355.
  20. Mintseris, J. and Z. Weng (2005). "Structure, function, and evolution of transient and obligate protein-protein interactions." Proc Natl Acad Sci U S A 102(31): 10930-10935.
  21. Dey, S., et al. (2010). "The subunit interfaces of weakly associated homodimeric proteins." J Mol Biol 398(1): 146-160.
  22. Dinkel, H., et al. (2014). "The eukaryotic linear motif resource ELM: 10 years and counting." Nucleic Acids Res 42(Database issue): D259-266.
  23. Nyfeler, B., et al. (2005). "Capturing protein interactions in the secretory pathway of living cells." Proc Natl Acad Sci U S A 102(18): 6350-6355.
  24. Aloy, P. and R. B. Russell (2006). "Structural systems biology: modelling protein interactions." Nat Rev Mol Cell Biol 7(3): 188-197.
  25. «Protein interaction networks computational analysis | Computational biology and bioinformatics». Cambridge University Press (στα Αγγλικά). Ανακτήθηκε στις 27 Μαΐου 2018. 
  26. 26,0 26,1 26,2 Rao, V. Srinivasa; Srinivas, K.; Sujini, G. N.; Kumar, G. N. Sunand (2014). «Protein-protein interaction detection: methods and analysis». International Journal of Proteomics 2014: 147648. doi:10.1155/2014/147648. ISSN 2090-2166. PMID 24693427. PMC PMC3947875. https://www.ncbi.nlm.nih.gov/pubmed/24693427. 
  27. Ito, T.; Chiba, T.; Ozawa, R.; Yoshida, M.; Hattori, M.; Sakaki, Y. (2001-04-10). «A comprehensive two-hybrid analysis to explore the yeast protein interactome». Proceedings of the National Academy of Sciences of the United States of America 98 (8): 4569–4574. doi:10.1073/pnas.061034498. ISSN 0027-8424. PMID 11283351. https://www.ncbi.nlm.nih.gov/pubmed/11283351. 
  28. 28,0 28,1 Meike., Werther,· Harald., Seitz, (2008). Protein-protein interaction. Berlin: Springer. ISBN 9783540688204. 288440334. 
  29. 29,0 29,1 Franzot, Giacomo; Carugo, Oliviero (2003-12-01). «Computational approaches to protein-protein interaction» (στα αγγλικά). Journal of Structural and Functional Genomics 4 (4): 245–255. doi:10.1023/B:JSFG.0000016143.91973.1c. ISSN 1345-711X. https://link.springer.com/article/10.1023/B:JSFG.0000016143.91973.1c. 
  30. 30,0 30,1 Russell, Robert B.; Alber, Frank; Aloy, Patrick; Davis, Fred P.; Korkin, Dmitry; Pichaud, Matthieu; Topf, Maya; Sali, Andrej (2004-6). «A structural perspective on protein-protein interactions». Current Opinion in Structural Biology 14 (3): 313–324. doi:10.1016/j.sbi.2004.04.006. ISSN 0959-440X. PMID 15193311. https://www.ncbi.nlm.nih.gov/pubmed/15193311. 
  31. Dandekar, T.; Snel, B.; Huynen, M.; Bork, P. (1998-9). «Conservation of gene order: a fingerprint of proteins that physically interact». Trends in Biochemical Sciences 23 (9): 324–328. ISSN 0968-0004. PMID 9787636. https://www.ncbi.nlm.nih.gov/pubmed/9787636. 
  32. Marcotte, E. M.; Pellegrini, M.; Ng, H. L.; Rice, D. W.; Yeates, T. O.; Eisenberg, D. (1999-07-30). «Detecting protein function and protein-protein interactions from genome sequences». Science (New York, N.Y.) 285 (5428): 751–753. ISSN 0036-8075. PMID 10427000. https://www.ncbi.nlm.nih.gov/pubmed/10427000. 
  33. Enright, A. J.; Iliopoulos, I.; Kyrpides, N. C.; Ouzounis, C. A. (1999-11-04). «Protein interaction maps for complete genomes based on gene fusion events». Nature 402 (6757): 86–90. doi:10.1038/47056. ISSN 0028-0836. PMID 10573422. https://www.ncbi.nlm.nih.gov/pubmed/10573422. 
  34. Pellegrini, M.; Marcotte, E. M.; Thompson, M. J.; Eisenberg, D.; Yeates, T. O. (1999-04-13). «Assigning protein functions by comparative genome analysis: protein phylogenetic profiles». Proceedings of the National Academy of Sciences of the United States of America 96 (8): 4285–4288. ISSN 0027-8424. PMID 10200254. https://www.ncbi.nlm.nih.gov/pubmed/10200254. 
  35. Pazos, F.; Valencia, A. (2001-9). «Similarity of phylogenetic trees as indicator of protein-protein interaction». Protein Engineering 14 (9): 609–614. ISSN 0269-2139. PMID 11707606. https://www.ncbi.nlm.nih.gov/pubmed/11707606. 
  36. Ma, Buyong; Elkayam, Tal; Wolfson, Haim; Nussinov, Ruth (2003-05-13). «Protein-protein interactions: structurally conserved residues distinguish between binding sites and exposed protein surfaces». Proceedings of the National Academy of Sciences of the United States of America 100 (10): 5772–5777. doi:10.1073/pnas.1030237100. ISSN 0027-8424. PMID 12730379. https://www.ncbi.nlm.nih.gov/pubmed/12730379. 
  37. Aloy, Patrick; Russell, Robert B. (2003-1). «InterPreTS: protein interaction prediction through tertiary structure». Bioinformatics (Oxford, England) 19 (1): 161–162. ISSN 1367-4803. PMID 12499311. https://www.ncbi.nlm.nih.gov/pubmed/12499311. 
  38. Espadaler, Jordi; Romero-Isart, Oriol; Jackson, Richard M.; Oliva, Baldo (2005-08-15). «Prediction of protein-protein interactions using distant conservation of sequence patterns and structure relationships». Bioinformatics (Oxford, England) 21 (16): 3360–3368. doi:10.1093/bioinformatics/bti522. ISSN 1367-4803. PMID 15961445. https://www.ncbi.nlm.nih.gov/pubmed/15961445. 
  39. Deng, Minghua; Mehta, Shipra; Sun, Fengzhu; Chen, Ting (2002-10). «Inferring domain-domain interactions from protein-protein interactions». Genome Research 12 (10): 1540–1548. doi:10.1101/gr.153002. ISSN 1088-9051. PMID 12368246. https://www.ncbi.nlm.nih.gov/pubmed/12368246. 
  40. Han, Dong-Soo; Kim, Hong-Soog; Jang, Woo-Hyuk; Lee, Sung-Doke; Suh, Jung-Keun (2004). «PreSPI: a domain combination based prediction system for protein-protein interaction». Nucleic Acids Research 32 (21): 6312–6320. doi:10.1093/nar/gkh972. ISSN 1362-4962. PMID 15576357. https://www.ncbi.nlm.nih.gov/pubmed/15576357. 
  41. Bock, J. R.; Gough, D. A. (2001-5). «Predicting protein--protein interactions from primary structure». Bioinformatics (Oxford, England) 17 (5): 455–460. ISSN 1367-4803. PMID 11331240. https://www.ncbi.nlm.nih.gov/pubmed/11331240. 
  42. Martin, Shawn; Roe, Diana; Faulon, Jean-Loup (2005-01-15). «Predicting protein-protein interactions using signature products». Bioinformatics (Oxford, England) 21 (2): 218–226. doi:10.1093/bioinformatics/bth483. ISSN 1367-4803. PMID 15319262. https://www.ncbi.nlm.nih.gov/pubmed/15319262. 
  43. Saito, Rintaro; Suzuki, Harukazu; Hayashizaki, Yoshihide (2002-03-01). «Interaction generality, a measurement to assess the reliability of a protein–protein interaction». Nucleic Acids Research 30 (5): 1163–1168. ISSN 0305-1048. PMID 11861907. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC101243/. 
  44. Deane, Charlotte M.; Salwiński, Łukasz; Xenarios, Ioannis; Eisenberg, David (2002-5). «Protein interactions: two methods for assessment of the reliability of high throughput observations». Molecular & cellular proteomics: MCP 1 (5): 349–356. ISSN 1535-9476. PMID 12118076. https://www.ncbi.nlm.nih.gov/pubmed/12118076. 
  45. «Protein–Protein Interactions Essentials: Key Concepts to Building and Analyzing Interactome Networks» (στα αγγλικά). PLOS Computational Biology 6 (6): e1000807. 2010-06-24. doi:10.1371/journal.pcbi.1000807. ISSN 1553-7358. http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1000807. 
  46. 46,0 46,1 46,2 46,3 Barabasi, A.L. and Z.N. Oltvai, Network biology: understanding the cell's functional organization. Nat Rev Genet, 2004. 5(2): p. 101-13.
  47. 47,0 47,1 47,2 Watts, D.J. and S.H. Strogatz, Collective dynamics of 'small-world' networks. Nature, 1998. 393(6684): p. 440-2.
  48. 48,0 48,1 48,2 48,3 Pavlopoulos, G.A., et al., Using graph theory to analyze biological networks. BioData Min, 2011. 4: p. 10.
  49. Girvan, M. and M.E. Newman, Community structure in social and biological networks. Proc Natl Acad Sci U S A, 2002. 99(12): p. 7821-6.
  50. Manna, S.S., Diffusion-limited friendship network: a model for six degrees of separation. Phys Rev E Stat Nonlin Soft Matter Phys, 2003. 68(2 Pt 2): p. 027104.
  51. Jarrett, T.C., et al., Interplay between function and structure in complex networks. Phys Rev E Stat Nonlin Soft Matter Phys, 2006. 74(2 Pt 2): p. 026116.
  52. Barabasi, A.L. and R. Albert, Emergence of scaling in random networks. Science, 1999. 286(5439): p. 509-12.