SMILES

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια
Μετάβαση σε: πλοήγηση, αναζήτηση
SMILES
Επέκταση αρχείου .smi
Τύπος διαδικτυακού μέσου chemical/x-daylight-smiles
Τύπος φορμά μορφή χημικού αρχείου
Δημιουργία του SMILES: Άνοιγμα των κύκλων, έπειτα γράψιμο ως διακλαδώσεων εκτός του κύριου σκελετού. (Σιπροφλοξασίνη)

Το σύστημα απλοποιημένης μοριακής γραμμικής γραφής (simplified molecular-input line-entry system ή SMILES) είναι μια προδιαγραφή με τη μορφή μιας γραμμικής σημειογραφίας για την περιγραφή της δομής των χημικών ειδών χρησιμοποιώντας σύντομες συμβολοσειρές ASCII. Οι συμβολοσειρές SMILES μπορούν να εισαχθούν από τους περισσότερους μοριακούς επεξεργαστές για μετατροπή πάλι σε δισδιάστατα σχέδια ή τρισδιάστατα πρότυπα των μορίων.

Η αρχική προδιαγραφή SMILES ξεκίνησε από τον συγγραφέα Ντέιβιντ Γουάινιγκερ (David Weininger) σε εργαστήριο του USEPA στη Μινεσότα τη δεκαετία του 1980.[1][2][3] Έχει αναγνωριστεί η συμμετοχή των Gilman Veith και Rose Russo (USEPA), Albert Leo και Corwin Hansch στο Κολέγιο Pomona για υποστήριξη της εργασίας στα αρχικά στάδια, καθώς και των Arthur Weininger (Pomona, Daylight CIS) και Jeremy Scofield (Cedar River Software, Renton, WA) για τη βοήθειά τους στον προγραμματισμό του συστήματος.[4] Η υπηρεσία προστασίας του περιβάλλοντος (Environmental Protection Agency) χρηματοδότησε το αρχικό σχέδιο ανάπτυξης του SMILES.[5][6]

Από τότε έχει τροποποιηθεί και επεκταθεί από άλλους και κυρίως από το Daylight Chemical Information Systems. Το 2007, ένα ανοικτό πρότυπο που λέγεται "OpenSMILES" αναπτύχθηκε από την κοινότητα ανοικτού λογισμικού χημείας Blue Obelisk. Άλλες 'γραμμικές' σημειογραφίες περιλαμβάνουν τα Wiswesser Line Notation (WLN), ROSDAL και SYBYL Line Notation (SLN) (Tripos Inc).

Τον Ιούλιο του 2006, η IUPAC εισήγαγε το International Chemical Identifier (InChI) ως ένα πρότυπο για αναπαράσταση τύπων. Το SMILES θεωρείται γενικά ότι έχει το πλεονέκτημα να είναι ελαφρώς πιο εύκολο στην ανάγνωση από τους ανθρώπους από το InChI. Έχει, επίσης, μια πλατιά βάση υποστήριξης λογισμικού με εκτεταμένη θεωρητική υποστήριξη (π.χ. Θεωρία γράφων).

Ορολογία[Επεξεργασία | επεξεργασία κώδικα]

Ο όρος SMILES αναφέρεται σε μια γραμμική σημειογραφία για κωδικοποίηση μοριακών δομών και συγκεκριμένων στιγμιοτύπων που πρέπει να αποκαλούνται αυστηρά συμβολοσειρές SMILES. Όμως, ο όρος SMILES χρησιμοποιείται επίσης, συνήθως, για να αναφέρεται και σε μια μοναδική συμβολοσειρά SMILES και σε έναν αριθμό συμβολοσειρών SMILES. Το ακριβές νόημα είναι συνήθως φανερό από το περιεχόμενο. Οι όροι "κανονικός" και "ισομερής" μπορεί να οδηγήσουν σε κάποια σύγχυση όταν εφαρμόζονται στο SMILES. Οι όροι περιγράφουν διαφορετικά χαρακτηριστικά των συμβολοσειρών SMILES και δεν αποκλείονται αμοιβαία.

Ένας αριθμός από εξίσου έγκυρες συμβολοσειρές SMILES, συνήθως, μπορεί να γραφτεί για ένα μόριο. Παραδείγματος χάρη, CCO, OCC και C(O)C καθορίζουν όλα τη δομή της αιθανόλης. Έχουν αναπτυχθεί αλγόριθμοι για να δημιουργήσουν την ίδια συμβολοσειρά SMILES για ένα δεδομένο μόριο· από τις πολλές δυνατές συμβολοσειρές, αυτοί οι αλγόριθμοι επιλέγουν μόνο μία. Αυτό το SMILES είναι μοναδικό για κάθε δομή, αν και εξαρτάται από τον χρησιμοποιούμενο αλγόριθμο κανονικοποίησης που το δημιουργεί και ορίζεται ως κανονικό SMILES. Αυτοί οι αλγόριθμοι μετατρέπουν πρώτα το SMILES σε μια εσωτερική αναπαράσταση της μοριακής δομής· έπειτα, ένας αλγόριθμος εξετάζει αυτήν τη δομή και παράγει μια μοναδική συμβολοσειρά SMILES. Έχουν αναπτυχθεί διάφοροι αλγόριθμοι για τη δημιουργία κανονικών SMILES και περιλαμβάνουν τους αλγόριθμους από το Daylight Chemical Information Systems, το OpenEye Scientific Software, το MEDIT, το Chemical Computing Group, το MolSoft LLC και το Chemistry Development Kit. Μια συνηθισμένη εφαρμογή του κανονικού SMILES είναι η δεικτοδότηση και η εξασφάλιση της μοναδικότητας των μορίων σε μια χημική βάση δεδομένων.

Το αρχικό άρθρο που περιέγραφε τον αλγόριθμο CANGEN[2] ισχυριζόταν ότι παρήγαγε μοναδικές συμβολοσειρές SMILES για γραφικές αναπαραστάσεις μορίων, αλλά ο αλγόριθμος αποτύγχανε για κάποιες απλές περιπτώσεις (π.χ. 1,2-δικυκλοπροπυλαιθάνιο) και δεν μπορεί να θεωρηθεί ως μια σωστή μέθοδος για κανονική αναπαράσταση ενός γραφήματος.[7] Δεν υπάρχει καμιά συστηματική σύγκριση μεταξύ των εμπορικών λογισμικών για να ελεγχθούν αν τέτοια ελαττώματα υπάρχουν σε αυτά τα πακέτα.

Η σημειογραφία SMILES επιτρέπει τον ορισμό της διαμόρφωσης σε κέντρα τετράεδρων και γεωμετρία διπλού δεσμού. Αυτά είναι δομικά χαρακτηριστικά που δεν μπορούν να οριστούν μόνο από τη σύνδεση και το SMILES που κωδικοποιεί αυτήν την πληροφορία ορίζεται ως ισομερές SMILES. Ένα σημαντικό χαρακτηριστικό αυτών των κανόνων είναι ότι επιτρέπουν αυστηρό μερικό ορισμό της εναντιομέρειας. Ο όρος ισομερές SMILES εφαρμόζεται επίσης στο SMILES στο οποίο καθορίζονται ισότοπα.

Ορισμός με βάση το γράφημα[Επεξεργασία | επεξεργασία κώδικα]

Με όρους μιας υπολογιστικής διαδικασίας με βάση ένα γράφημα, το SMILES είναι μια συμβολοσειρά που παίρνεται εκτυπώνοντας τους εμφανιζόμενους κόμβους συμβόλων σε μια διέλευση δένδρου με αναζήτηση κατά βάθος ενός χημικού γραφήματος. Το χημικό γράφημα περικόπτεται αρχικά για να αφαιρεθούν τα άτομα του υδρογόνου και οι κύκλοι ανοίγουν για να το μετατρέψουν σε ένα επικαλύπτον δένδρο. Όπου έχουν σπάσει κύκλοι, συμπεριλαμβάνονται αριθμητικές ετικέτες επιθημάτων για να δείξουν τους συνδεδεμένους κόμβους. Οι παρενθέσεις χρησιμοποιούνται για να δείξουν σημεία διακλάδωσης στο δένδρο.

Παραδείγματα[Επεξεργασία | επεξεργασία κώδικα]

Άτομα[Επεξεργασία | επεξεργασία κώδικα]

Τα άτομα αναπαριστώνται με την τυπική συντόμευση των χημικών στοιχείων, σε αγκύλες, όπως [Au] για τον χρυσό. Οι αγκύλες μπορούν να παραληφθούν για το "οργανικό υποσύνολο" των B, C, N, O, P, S, F, Cl, Br και I. Όλα τα άλλα στοιχεία πρέπει να περικλείονται σε αγκύλες. Αν παραλείπονται οι αγκύλες, υποτίθεται ότι είναι ο κατάλληλος αριθμός των υπονοούμενων ατόμων υδρογόνου· παραδείγματος χάρη, το SMILES για το νερό είναι απλώς O.

Ένα άτομο που έχει ένα ή περισσότερα ηλεκτρικά φορτία περικλείεται σε αγκύλες, ακολουθούμενο από το σύμβολο H αν είναι συνδεμένο με ένα ή περισσότερα άτομα υδρογόνου, που ακολουθείται από τον αριθμό των ατόμων του υδρογόνου (ως συνήθως το ένα παραλείπεται, π.χ. NH4 για το αμμώνιο), έπειτα το σύμβολο '+' για ένα θετικό φορτίο ή '-' για ένα αρνητικό φορτίο. Ο αριθμός των φορτίων καθορίζεται μετά το σύμβολο (εκτός και είναι μόνο ένα)· όμως, μπορεί να γραφτεί επίσης το σύμβολο τόσες φορές όσες τα φορτία του ιόντος: αντί για "Ti+4", μπορεί να γραφτεί "Ti++++" (τιτάνιο IV, Ti4+). Συνεπώς, το ανιόν υδροξειδίου απεικονίζεται ως [OH-], το κατιόν οξωνίου ως [OH3+] και το κατιόν κοβαλτίου III (Co3+) είναι είτε [Co+3] ή [Co+++].

Δεσμοί[Επεξεργασία | επεξεργασία κώδικα]

Δεσμοί μεταξύ ατόμων αλειφατικών ενώσεων θεωρούνται απλοί εκτός και ορίζονται αλλιώς και συνεπάγονται από τη γειτνίαση με τη συμβολοσειρά SMILES. Παραδείγματος χάρη, το SMILES για την αιθανόλη μπορεί να γραφτεί ως CCO. Ετικέτες τερματισμού δακτυλίου χρησιμοποιούνται για να δείξουν τη σύνδεση μεταξύ μη γειτονικών ατόμων στη συμβολοσειρά SMILES, η οποία για το κυκλοεξάνιο και το διοξάνιο μπορούν να γραφτούν ως C1CCCCC1 και O1CCOCC1 αντίστοιχα. Για έναν δεύτερο δακτύλιο, η ετικέτα θα είναι 2 (ναφθαλίνιο: c1cccc2c1cccc2 (σημειώστε πεζό γράμμα για αρωματικές ενώσεις)) κ.ο.κ. Αφού φτάσει το 9, πρέπει να προηγείται στην ετικέτα ένα '%', για να το διαφοροποιήσει από δύο διαφορετικές ετικέτες συνδεμένες στο ίδιο άτομο (~C12~ σημαίνει ότι το άτομο του άνθρακα έχει τις ετικέτες τερματισμού δακτυλίου 1 και 2, ενώ ~C%12~ δείχνει μόνο μια ετικέτα την 12). Διπλοί, τριπλοί και τετραπλοί χημικοί δεσμοί αναπαριστώνται με τα σύμβολα '=', '#', και '$' αντίστοιχα όπως φαίνεται από τα SMILES O=C=O (διοξείδιο του άνθρακα), C#N (υδροκυάνιο) και [Ga-]$[As+] (αρσενικούχο γάλλιο).

Αρωματικότητα[Επεξεργασία | επεξεργασία κώδικα]

Τα αρωματικά άτομα C, O, S και N εμφανίζονται με πεζά γράμματα 'c', 'o', 's' και 'n' αντίστοιχα. Τα βενζόλιο, πυριδίνη και φουράνιο μπορούν να απεικονιστούν από το SMILES ως c1ccccc1, n1ccccc1 και o1cccc1 αντίστοιχα. Οι δεσμοί μεταξύ των αρωματικών ατόμων είναι, από προεπιλογή, αρωματικοί αν και αυτοί μπορούν να οριστούν σαφώς με το σύμβολο ':'. Τα αρωματικά άτομα μπορούν να ενωθούν μόνο μεταξύ τους και το διφαινύλιο μπορεί να παρασταθεί ως c1ccccc1-c2ccccc2. Το αρωματικά ενωμένο άζωτο με το υδρογόνο, όπως συμβαίνει στο πυρρόλιο πρέπει να παρασταθεί ως [nH] και το ιμιδαζόλιο γράφεται με τη σημειογραφία SMILES ως n1c[nH]cc1.

Οι αλγόριθμοι Daylight και OpenEye για τη δημιουργία κανονικών SMILES διαφέρουν στην συμπεριφορά τους ως προς την αρωματικότητα.

Οπτικοποίηση της 3-κυανοανισόλης ως COc(c1)cccc1C#N.

Διακλάδωση[Επεξεργασία | επεξεργασία κώδικα]

Οι διακλαδώσεις απεικονίζονται με παρενθέσεις, όπως στο CCC(=O)O για το προπανικό οξύ και C(F)(F)F για το τριφθορομεθάνιο. Υποκατεστημένοι δακτύλιοι μπορούν να γραφτούν με το σημείο διακλάδωσης στον δακτύλιο όπως απεικονίζεται από το SMILES COc(c1)cccc1C#N και COc(cc1)ccc1C#N που κωδικοποιεί τα ισομερή της 3 και 4-κυανοανισόλης. Η γραφή του SMILES με αυτόν τον τρόπο για υποκατεστημένους δακτυλίους μπορεί να τους κάνει πιο αναγνώσιμους από τους ανθρώπους.

Στερεοχημεία[Επεξεργασία | επεξεργασία κώδικα]

Η στερεοχημική δομή γύρω από τους διπλούς δεσμούς καθορίζεται χρησιμοποιώντας τους χαρακτήρες "/" και "\". Παραδείγματος χάρη, το F/C=C/F είναι μια απεικόνιση του ισομερούς trans-1,1-διφθοραιθενίου, στο οποίο τα άτομα φθορίου είναι στις απέναντι πλευρές του διπλού δεσμού, όπου F/C=C\F είναι μια από τις δυνατές αναπαραστάσεις του ισομερούς cis-διφθοραιθενίου, στο οποίο τα F είναι στην ίδια πλευρά του διπλού δεσμού, όπως φαίνεται στο σχήμα.

Η στερεοχημική δομή στον τετραεδρικό άνθρακα καθορίζεται από @ ή @@. Η L-αλανίνη, το πιο κοινό εναντιομερές του αμινοξέος αλανίνη μπορεί να γραφτεί ως N[C@@H](C)C(=O)O. Ο προσδιοριστής @@ δείχνει ότι, όταν βλέπετε από το άζωτο μαζί με τον δεσμό στο κέντρο του εναντιομερούς, η σειρά των υποκαταστατών υδρογόνου (H), μεθυλίου (C) και καρβοξυλίου (C(=O)O) εμφανίζονται δεξιόστροφα. Η D-αλανίνη μπορεί να γραφτεί ως N[C@H](C)C(=O)O. Η σειρά των υποκαταστατών στη συμβολοσειρά SMILES είναι πολύ σημαντική και η D-αλανίνη μπορεί επίσης να κωδικοποιηθεί ως N[C@@H](C(=O)O)C.

Ισότοπα[Επεξεργασία | επεξεργασία κώδικα]

Τα ισότοπα χαρακτηρίζονται με έναν αριθμό ίσο με την ακέραιη ισοτοπική μάζα που προηγείται του ατομικού συμβόλου. Το βενζόλιο στο οποίο ένα άτομο άνθρακα-14 γράφεται ως [14c]1ccccc1 και το δευτεριωμένο χλωροφόρμιο είναι [2H]C(Cl)(Cl)Cl.

Εφαρμογή σε μερικά μόρια[Επεξεργασία | επεξεργασία κώδικα]

Μόριο Δομή Τύπος SMILES
Μοριακό άζωτο N≡N N#N
Ισοκυανικό μεθύλιο (MIC) CH3–N=C=O CN=C=O
Θειικός χαλκός (II) Cu2+ SO42− [Cu+2].[O-]S(=O)(=O)[O-]
Οινανθική τοξίνη (Oenanthotoxin) (C17H22O2) Molecular structure of oenanthotoxin CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO
Πυρεθρίνη II (C22H28O5) Molecular structure of pyrethrin II COC(=O)C(\C)=C\C1C(C)(C)[C@H]1C(=O)O[C@@H]2C(C)=C(C(=O)C2)CC=CC=C
Αφλατοξίνη B1 (C17H12O6) Molecular structure of aflatoxin B1 O1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5
Γλυκόζη (γλυκοπυρανόζη) (C6H12O6) Molecular structure of glucopyranose OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O)1
Bergenin (κουσκουτίνη) (μια ρητίνη) (C14H16O9) Molecular structure of cuscutine (bergenin) OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H]2[C@@H]1c3c(O)c(OC)c(O)cc3C(=O)O2
Μια φερομόνη των scale insect της Καλιφόρνιας (3Z,6R)-3-methyl-6-(prop-1-en-2-yl)deca-3,9-dien-1-yl acetate CC(=O)OCCC(/C)=C\C[C@H](C(C)=C)CCC=C
2S,5R-χαλκογράνη: μια φερομόνη του σκαθαριού Pityogenes chalcographus[8] (2S,5R)-2-ethyl-1,6-dioxaspiro[4.4]nonane CC[C@H](O1)CC[C@@]12CCCO2
Βανιλίνη Molecular structure of vanillin O=Cc1ccc(O)c(OC)c1
Μελατονίνη (C13H16N2O2) Molecular structure of melatonin CC(=O)NCCC1=CNc2c1cc(OC)cc2
Φλαβοπερεϊρίνη (Flavopereirin) (C17H15N2) Molecular structure of flavopereirin CCc(c1)ccc2[n+]1ccc3c2Nc4c3cccc4
Νικοτίνη (C10H14N2) Molecular structure of nicotine CN1CCC[C@H]1c2cccnc2
Άλφα- θουιόνη (C10H16O) Molecular structure of thujone CC(C)[C@@]12C[C@@H]1[C@@H](C)C(=O)C2
Θειαμίνη (C12H17N4OS+)
(vitamin B1)
SMolecular structure of thiamin OCCc1c(C)[n+](=cs1)Cc2cnc(C)nc(N)2


Απεικόνιση ενός μορίου με περισσότερους από 9 δακτυλίους, κεφαλοστατίνη-1[9] (μια στεροειδή τριςδεκακυκλική πυραζίνη με τον εμπειρικό τύπο C54H74N2O10:
Μοριακή δομή της καφαλοστατίνης-1

Ξεκινώντας με την πιο αριστερή μεθυλομάδα στο σχήμα:

C[C@@](C)(O1)C[C@@H](O)[C@@]1(O2)[C@@H](C)[C@@H]3CC=C4[C@]3(C2)C(=O)C[C@H]5[C@H]4CC[C@@H](C6)[C@]5(C)Cc(n7)c6nc(C[C@@]89(C))c7C[C@@H]8CC[C@@H]%10[C@@H]9C[C@@H](O)[C@@]%11(C)C%10=C[C@H](O%12)[C@]%11(O)[C@H](C)[C@]%12(O%13)[C@H](O)C[C@@]%13(C)CO

Σημειώστε ότι το '%' εμφανίζεται μπροστά από τον δείκτη των ετικετών τερματισμού δακτυλίου πάνω από 9· δείτε την ενότητα Δεσμοί παραπάνω.

Άλλα παραδείγματα του SMILES[Επεξεργασία | επεξεργασία κώδικα]

Η σημειογραφία SMILES περιγράφεται διεξοδικά στο εγχειρίδιο θεωρίας SMILES που παρέχεται από την Daylight Chemical Information Systems και εμφανίζονται επεξηγηματικά παραδείγματα. Το περιγραφικό βοήθημα της Daylight παρέχει στους χρήστες τα μέσα να ελέγξουν τα δικά τους παραδείγματα στο SMILES και είναι ένα αξιόλογο εκπαιδευτικό εργαλείο.

Επεκτάσεις[Επεξεργασία | επεξεργασία κώδικα]

Το SMARTS (Smiles arbitrary target specification) είναι μια γραμμική σημειογραφία για την προδιαγραφή των υποδομικών προτύπων στα μόρια. Αν και χρησιμοποιεί πολλά από τα ίδια σύμβολα με το SMILES, επιτρέπει επίσης άτομα και δεσμούς με χαρακτήρες υποκατάστασης, που μπορεί να χρησιμοποιηθεί για καθορισμό υποδομικών ερωτημάτων στην αναζήτηση χημικής βάσης δεδομένων. Μια συνηθισμένη παρανόηση είναι ότι η υποδομική αναζήτηση με βάση το SMARTS εμπεριέχει τη συμφωνία των συμβολοσειρών SMILES και SMARTS. Στην πραγματικότητα, και οι δυο συμβολοσειρές SMILES και SMARTS μετατρέπονται πρώτα σε εσωτερικές γραφικές αναπαραστάσεις που αναζητούνται για ισομορφισμό στο γλωσσάρι της θεωρίας των γράφων. Το SMIRKS είναι μια γραμμική σημειογραφία για καθορισμό των μετασχηματισμών των αντιδράσεων.

Μετατροπή[Επεξεργασία | επεξεργασία κώδικα]

Το SMILES μπορεί να μετατραπεί πάλι σε δισδιάστατες αναπαραστάσεις χρησιμοποιώντας αλγορίθμους δημιουργίας διαγραμμάτων δομής (Helson, 1999). Αυτή η μετατροπή δεν είναι πάντα σαφής. Η μετατροπή σε τρισδιάστατη αναπαράσταση πετυχαίνεται με προσεγγίσεις ελαχιστοποίησης της ενέργειας. Υπάρχουν πολλά βοηθήματα που μετατροπής που είναι μεταφορτώσιμα και με βάση το διαδίκτυο.

Δείτε επίσης[Επεξεργασία | επεξεργασία κώδικα]

  • Smiles arbitrary target specification. Η γλώσσα SMARTS για προσδιορισμό υποδομικών ερωτημάτων.
  • SYBYL Line Notation (μια άλλη γραμμική σημειογραφία)
  • Molecular Query Language – Μια γλώσσα ερωτημάτων που επιτρέπει επίσης αριθμητικές ιδιότητες,π.χ. φυσικοχημικές τιμές ή αποστάσεις
  • Chemistry Development Kit (δισδιάστατη διάταξη και μετατροπή)
  • International Chemical Identifier (InChI), η ελεύθερη και εναλλακτική λύση στο SMILES από την IUPAC.
  • OpenBabel, JOELib, OELib (μετατροπή)

Σημειώσεις[Επεξεργασία | επεξεργασία κώδικα]

  1. Weininger 1988
  2. 2,0 2,1 Weininger, Weininger & Weininger 1989
  3. Weininger 1990
  4. Weininger, Dave. «Acknowledgements on Daylight Tutorial smiles-etc page». http://www.daylight.com/meetings/summerschool98/course/dave/smiles-etc.html. Ανακτήθηκε στις 24 June 2013. 
  5. Anderson, Veith & Weininger 1987
  6. «SMILES Tutorial: What is SMILES?». U.S. Environmental Protection Agency. http://www.epa.gov/med/Prods_Pubs/smiles.htm. Ανακτήθηκε στις 2012-09-23. 
  7. Hutchison, David. Takeo Kanade, Josef Kittler, Jon M. Kleinberg, Friedemann Mattern, John C. Mitchell, Moni Naor, Oscar Nierstrasz, C. Pandu Rangan, Bernhard Steffen, Madhu Sudan, Demetri Terzopoulos, Dough Tygar, Moshe Y. Vardi, Gerhard Weikum, Louiqa Raschid, Greeshma Neglur, Robert L. Grossman, Bing Liu (2005). «Assigning Unique Keys to Chemical Compounds for Data Integration: Some Interesting Counter Examples». Στο: Ludäscher, Bertram, επιμ. Data Integration in the Life Sciences. Lecture Notes in Computer Science. 3615. Berlin: Springer, σελ. 145–157. doi:10.1007/11530084_13. ISBN 978-3-540-27967-9. http://www.springerlink.com/index/10.1007/11530084_13. Ανακτήθηκε στις 2013-02-12. 
  8. Byers, J. A.; Birgersson, G.; Löfqvist, J.; Appelgren, M.; Bergström, G. (1990). «Isolation of pheromone synergists of bark beetle, Pityogenes chalcographus, from complex insect-plant odors by fractionation and subtractive-combination bioassay». Journal of Chemical Ecology 16 (3): 861–76. doi:10.1007/BF01016496. PMID 24263601. http://www.chemical-ecology.net/pdf/Byersetal1990a.pdf. Ανακτήθηκε στις May 12, 2012. 
  9. National Center for Biotechnology Information (NCBI). PubChem Compound. (accessed May 12, 2012) PubChem Compound CID=183413 (Cephalostatin-1)

Παραπομπές[Επεξεργασία | επεξεργασία κώδικα]

  • Anderson, E.. Veith, G. D.. Weininger, D. (1987). SMILES: A line notation and computerized interpreter for chemical structures. Duluth, MN: U.S. EPA, Environmental Research Laboratory-Duluth. Report No. EPA/600/M-87/021. 
  • Helson, H. E. (1999). «Structure Diagram Generation». Στο: Lipkowitz, K. B.. Boyd, D. B., επιμ. Rev. Comput. Chem.. 13. New York: Wiley-VCH, σελ. 313–398. doi:10.1002/9780470125908.ch6. 
  • Weininger, David (February 1988). «SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules». Journal of Chemical Information and Modeling 28 (1): 31–6. doi:10.1021/ci00057a005. 
  • Weininger, David; Weininger, Arthur; Weininger, Joseph L. (May 1989). «SMILES. 2. Algorithm for generation of unique SMILES notation». Journal of Chemical Information and Modeling 29 (2): 97–101. doi:10.1021/ci00062a008. 
  • Weininger, David (August 1990). «SMILES. 3. DEPICT. Graphical depiction of chemical structures». Journal of Chemical Information and Modeling 30 (3): 237–43. doi:10.1021/ci00067a005. 

Εξωτερικοί σύνδεσμοι[Επεξεργασία | επεξεργασία κώδικα]

Προδιαγραφές[Επεξεργασία | επεξεργασία κώδικα]

Προγράμματα λογισμικού σχετικά με το SMILES[Επεξεργασία | επεξεργασία κώδικα]

  • NCI/CADD Chemical Identifier Resolver – Επιλύει ή δημιουργεί SMILES από χημικά ονόματα, αριθμούς καταχώρισης CAS, InChI/InChIKey και από πολλές άλλες μορφές αρχείων χημικής δομής
  • NCI/CADD Online SMILES Translator and Structure File Generator – Μια διαδικτυακή μοριακή επεξεργασία με Java
  • PubChem server side structure editor – Διαδικτυακή μοριακή επεξεργασία
  • smi23d[νεκρός σύνδεσμος] – Δημιουργία τρισδιάστατων συντεταγμένων
  • Daylight Depict – Μετάφραση ενός τύπου SMILES σε γραφικά
  • GIF/PNG-Creator for 2D Plots of Chemical Structures
  • JME molecule editor - Χημική επεξεργασία/προβολή και δημιουργία SMILES/SMARTS με Java
  • JSME molecule editor - Ελεύθερη χημική επεξεργασία/προβολή και δημιουργία SMILES/SMARTS με JavaScript
  • ACD/ChemSketch
  • Marvin από την ChemAxon – Διαδικτυακή χημική επεξεργασία/προβολή και δημιουργία/μετατροπή SMILES
  • Instant JChem από την ChemAxon – Εφαρμογή επιφάνειας εργασίας για αποθήκευση/δημιουργία/μετατροπή/οπτικοποίηση/αναζήτηση δομών SMILES, ιδιαίτερα μαζικής αποθήκευσης· ελεύθερη προσωπική χρήση
  • JChem for Excel από την ChemAxon – Πρόσθετο MS Excel για αποθήκευση/δημιουργία/μετατροπή/οπτικοποίηση/αναζήτηση δομών SMILES
  • Smormo-Ed – Ένας μοριακός επεξεργαστής για Λίνουξ που μπορεί να διαβάσει και να γράψει SMILES
  • InChI.info – Μια ανεπίσημη λειτουργία ιστού InChI για διαδικτυακή μετατροπή από InChI και SMILES σε μοριακά σχέδια
  • Balloon – Ένα ελεύθερο πρόγραμμα για δημιουργία τρισδιάστατων συντεταγμένων και ανάλυση διαμορφώσεων.
  • Indigo – Μια διαλειτουργική βιβλιοθήκη ανοιχτού κώδικα χημειοπληροφορικής με ένα πρόσθετο για μόρια με συμβατότητα IUPAC και απόδοση δισδιάστατων αντιδράσεων δομικών τύπων.
  • Open Babel – Μια ανοικτού κώδικα χημική εργαλειοθήκη που επιτρέπει σε οποιονδήποτε να αναζητήσει, να μετατρέψει, να αναλύσει ή να αποθηκεύσει βιοχημικά δεδομένα.
  • Bioclipse – Ένας ελεύθερος και ανοικτού κώδικα πάγκος εργασίας για τις βιοεπιστήμες.
  • MolEngine – Ένα πακέτο εργαλείων χημειοπληροφορικής .NET για ανάγνωση/εγγραφή SMILES, δημιουργία δισδιάστατων συντεταγμένων από SMILES και μετατροπή από SMILES σε μορφές χημικών αρχείων και αντίστροφα.
  • JSDraw – Μια διαλειτουργική επεξεργασία χημικής δομής javascript για δημιουργία SMILES και SMARTS.