Basis data kimia

Basis data kimia adalah suatu basis data yang secara khusus dirancang untuk menyimpan informasi kimia. Informasi ini mencakup struktur kimia dan kristal, spektrum, reaksi dan sintesis, serta data termofisika.

Jenis

Struktur kimia

Struktur kimia secara tradisional diwakili dengan menggunakan garis yang menunjukkan ikatan kimia antara atom dan digambar di atas kertas (rumus struktur 2D). Meskipun ini merupakan representasi visual ideal untuk kimiawan, metode ini tidak sesuai untuk penggunaan komputasi dan terutama untuk pencarian dan penyimpanan. Molekul kecil (juga disebut ligan dalam aplikasi perancangan obat), biasanya diwakili dengan menggunakan daftar atom dan hubungannya. Molekul besar seperti protein diwakili lebih kompak dengan menggunakan rangkaian blok pembangun asam amino.

Basis data kimia besar untuk struktur diharapkan menangani penyimpanan dan pencarian informasi tentang jutaan molekul yang mengambil terabyte memori fisik.

Basis data literatur

Basis data literatur kimia mengkorelasikan struktur atau informasi kimia lainnya ke referensi yang relevan seperti makalah akademis atau paten. Jenis basis data ini termasuk STN, Scifinder, dan Reaxys. Tautan ke literatur juga termasuk dalam banyak basis data yang berfokus pada karakterisasi zat kimia.

Basis data kristalografi

Basis data kristalografi menyimpan data struktur kristal dari hasil kristalografi sinar-X. Contoh umum meliputi Protein Data Bank dan Cambridge Structural Database.

Basis data spektrum NMR

Basis data spektrum NMR menghubungkan struktur kimia dengan data NMR. Basis data ini sering menyertakan data karakterisasi lainnya seperti FTIR dan spektrometri massa.

Basis data reaksi

Sebagian besar basis data kimia menyimpan informasi pada molekul yang stabil namun dalam basis data untuk reaksi juga zat antara dan molekul yang dibuat sementara tidak disimpan. Basis data reaksi berisi informasi tentang produk, eduk, dan mekanisme reaksi.

Basis data termofisika

Data termofisika adalah informasi tentang

Representasi struktur kimia

Terdapat dua teknik utama untuk merepresentasikan struktur kimia dalam basis data digital

  • Sebagai tabel koneksi/adjacency matrices/daftar dengan informasi tambahan mengenai ikatan (tepi) dan atribut atom (node), seperti:
    MDL Molfile, PDB, CML
  • Sebagai notasi string linear berdasarkan kedalaman pertama atau keluasan pencarian pertama, seperti:
    SMILES/SMARTS, SLN, WLN, InChI

Pendekatan ini telah disempurnakan untuk memungkinkan representasi perbedaan stereokimia dan muatan serta jenis ikatan khusus seperti yang terlihat pada senyawa organologam. Keuntungan utama dari representasi komputer adalah kemungkinan untuk meningkatkan penyimpanan dan pencarian cepat serta fleksibel.

Pencarian

Substruktur

Kimiawan dapat mencari basis data dengan menggunakan bagian-bagian struktur, bagian dari nama IUPAC mereka dan juga berdasarkan pada batasan pada sifatnya. Basis data kimia sangat berbeda dengan basis data tujuan umum lainnya dalam dukungan mereka untuk pencarian sub-struktur. Jenis pencarian ini dicapai dengan mencari subgrafik isomorfisme (terkadang juga disebut monomorfisme) dan merupakan aplikasi teori graf yang banyak dipelajari. Algoritme untuk pencarian bersifat komputasi intensif, sering kali O (n3) atau O (n4) kali kompleksitas (di mana n adalah jumlah atom yang terlibat). Komponen pencarian yang intensif disebut atom-by-atom-searching (ABAS), di mana pemetaan pencarian substruktur atom dan ikatan dengan molekul target dicari. Pencarian ABAS biasanya menggunakan algoritme Ullman[1] atau variasinya (mis. SMSD[2]). Percepatan dicapai dengan amortisasi waktu, yaitu beberapa saat pada tugas pencarian disimpan dengan menggunakan informasi prakomputasi. Perhitungan awal ini biasanya melibatkan pembuatan bitstring yang mewakili ada tidaknya fragmen molekul. Dengan melihat fragmen yang ada dalam struktur pencarian, dimungkinkan untuk menghilangkan kebutuhan perbandingan ABAS dengan molekul target yang tidak memiliki fragmen yang ada dalam struktur pencarian. Penghapusan ini disebut skrining/ penyaringan (jangan dikelirukan dengan prosedur penyaringan yang digunakan dalam penemuan obat terlarang). Bit-string yang digunakan untuk aplikasi ini juga disebut kunci struktural. Kinerja tombol seperti itu tergantung pada pilihan fragmen yang digunakan untuk membangun kunci dan probabilitas kehadiran mereka dalam basis data molekul. Jenis kunci lainnya menggunakan hash-code berdasarkan fragmen yang diturunkan secara komputasi. Hal ini disebut 'sidik jari' meski istilahnya kadang-kadang digunakan secara sinonim dengan kunci struktural. Jumlah memori yang dibutuhkan untuk menyimpan kunci struktural dan sidik jari ini dapat dikurangi dengan 'lipat', yang dicapai dengan menggabungkan bagian-bagian kunci dengan menggunakan operasi bitwise dan dengan demikian mengurangi keseluruhan panjangnya.[3]

Konformasi

Pencarian dengan mencocokkan konformasi 3D dari molekul atau dengan menentukan batasan spasial adalah fitur lain yang terutama digunakan dalam desain obat. Penelusuran semacam ini bisa sangat mahal. Banyak metode perkiraan yang telah diajukan, misalnya BCUTS, representasi fungsi khusus, momen inersia, histogram penelusuran sinar, histogram jarak jauh, bentuk multipola untuk beberapa nama.[4][5][6][7][8]

Deskriptor

Semua sifat molekul di luar strukturnya dapat dibagi menjadi atribut fisikokimia atau farmakologi yang juga disebut deskriptor. Selain itu, ada berbagai sistem penamaan buatan dan yang kurang lebih standar untuk molekul yang memasok lebih banyak atau lebih banyak nama dan sinonim yang tidak jelas. Nama IUPAC biasanya merupakan pilihan yang baik untuk mewakili struktur molekul dalam string yang mudah dibaca dan unik meskipun menjadi berat bagi molekul yang lebih besar. Nama trivial di sisi lain semakin banyak dengan homonim dan sinonim dan oleh karena itu merupakan pilihan yang buruk untuk mendefinisikan kunci basis data. Sementara deskriptor fisiko-kimia seperti berat molekul, muatan (parsial), kelarutan, dan lain-lain dapat dihitung secara langsung berdasarkan struktur molekul, deskriptor farmakologis hanya dapat diturunkan. Secara tidak langsung menggunakan statistik multivariat yang terlibat atau hasil eksperimen (pemilihan, bioassay). Semua deskriptor tersebut dapat karena alasan usaha komputasi disimpan bersamaan dengan representasi molekul dan biasanya seperti itu.

Kesamaan

Tidak ada definisi tunggal dari kesamaan molekuler, namun konsepnya dapat didefinisikan sesuai dengan aplikasi dan sering digambarkan sebagai invers dari ukuran jarak dalam ruang deskriptor. Dua molekul mungkin dianggap lebih mirip misalnya jika perbedaannya berat molekul lebih rendah daripada bila dibandingkan dengan yang lain. Berbagai ukuran lain dapat dikombinasikan untuk menghasilkan ukuran jarak beragam. Tindakan jarak sering dikelompokkan ke dalam ukuran Euclidean dan non-Euclidean tergantung pada apakah pertidaksamaan segitiga berlaku. Maximum Common Subgraph (MCS) berdasarkan pencarian substruktur[2](kesamaan atau ukuran jarak) juga sangat umum. MCS juga digunakan untuk penyaringan obat seperti senyawa dengan cara "memukul" molekul, yang memiliki subgraf umum (substruktur).[9]

Bahan kimia dalam basis data mungkin dikelompokkan ke dalam kelompok molekul yang 'serupa' berdasarkan kesamaan. Pendekatan clustering hierarkis dan non-hirarkis dapat diterapkan pada entitas kimia dengan beberapa atribut. Atribut atau sifat molekuler ini dapat ditentukan secara empiris atau komputasi berbasis deskriptor. Salah satu pendekatan clustering yang paling populer adalah algoritme Jarvis-Patrick.[10]

Dalam farmakologi penyimpanan kimia yang berorientasi, kesamaan biasanya didefinisikan dalam kaitannya dengan efek biologis senyawa (ADME/tox) yang pada gilirannya dapat disimpulkan secara semi-otomatis dari kombinasi deskriptor fisiko-kimia yang serupa dengan menggunakan metode QSAR.

Sistem registrasi

Sistem basis data untuk memelihara catatan unik pada senyawa kimia disebut sebagai sistem registrasi. Sistem ini sering digunakan untuk pengindeksan kimia, sistem paten dan basis data industri.

Sistem registrasi biasanya memberlakukan keunikan bahan kimia yang ditunjukkan dalam basis data melalui penggunaan representasi unik. Dengan menerapkan peraturan yang didahulukan untuk menghasilkan notifikasi yang diperkuat, seseorang dapat memperoleh representasi string unik/'kanonikal' seperti 'kanonikal SMILES'. Beberapa sistem registrasi seperti sistem CAS menggunakan algoritme untuk menghasilkan kode hash unik untuk mencapai tujuan yang sama.

Perbedaan utama antara sistem registrasi dan database kimia sederhana adalah kemampuan untuk secara akurat mewakili apa yang diketahui, tidak diketahui, dan sebagian diketahui. Misalnya, database kimia mungkin menyimpan molekul dengan stereokimia tidak ditentukan, sedangkan sistem registrasi kimia mengharuskan petugas pendaftaran untuk menentukan apakah konfigurasi stereo tidak diketahui, campuran tertentu (yang dikenal), atau rasemat. Masing-masing akan dianggap sebagai catatan yang berbeda dalam sistem registrasi kimia.

Sistem registrasi juga molekul preprocess untuk menghindari mempertimbangkan perbedaan sepele seperti perbedaan ion halogen dalam bahan kimia.

Contohnya adalah sistem registrasi Chemical Abstracts Service (CAS). Lihat pula nomor CAS.

Perangkat

Representasi komputasi biasanya dibuat transparan bagi para kimiawan dengan tampilan grafis data. Entri data juga disederhanakan melalui penggunaan editor struktur kimia. Editor ini secara internal mengubah data grafis menjadi representasi komputasi.

Terdapat pula banyak algoritme untuk interkonversi berbagai format representasi. Utilitas sumber terbuka untuk konversi adalah OpenBabel. Algoritme pencarian dan konversi ini diimplementasikan baik dalam sistem basis data itu sendiri atau seperti sekarang tren diimplementasikan sebagai komponen eksternal yang sesuai dengan sistem basis data relasional standar. Baik sistem berbasis Oracle dan PostgreSQL menggunakan teknologi kartrid yang memungkinkan tipe data yang ditentukan pengguna. Ini memungkinkan pengguna membuat kueri SQL dengan kondisi pencarian kimia (Misalnya, kueri untuk mencari catatan yang memiliki cincin fenil dalam strukturnya yang ditunjukkan sebagai string SMILES di kolom SMILESCOL dapat berupa

 SELECT * FROM CHEMTABLE WHERE SMILESCOL.CONTAINS('c1ccccc1')

Algoritme untuk konversi nama IUPAC menjadi representasi struktur dan sebaliknya juga digunakan untuk mengekstrak informasi struktur dari teks. Namun, terdapat kesulitan karena adanya beberapa dialek IUPAC. Pekerjaan tengah dilakukan untuk menetapkan standar IUPAC yang unik (lihat InChI).

Lihat pula

Referensi

  1. ^ Ullmann, Julian R. (1976), "An algorithm for subgraph isomorphism", Journal of the ACM, 23 (1): 31–42, doi:10.1145/321921.321925 
  2. ^ a b Rahman, S. A.; Bashton, M.; Holliday, G. L.; Schrader, R.; Thornton, J. M. (2000). "Small Molecule Subgraph Detector (SMSD) toolkit". Journal of Cheminformatics. 1: 12. doi:10.1186/1758-2946-1-12. 
  3. ^ Cummings, Maxwell D.; Maxwell, Alan C.; DesJarlais, Renee L. (2007). "Processing of Small Molecule Databases for Automated Docking". Medicinal Chemistry. 3 (1): 107–113. doi:10.2174/157340607779317481. 
  4. ^ Pearlman, R.S.; Smith, K.M. (1999). "Metric Validation and the Receptor-Relevant Subspace Concept". J. Chem. Inf. Comput. Sci. 39: 28–35. doi:10.1021/ci980137x. 
  5. ^ Lin, Jr., Hung; Clark, Timothy (2005). "An analytical, variable resolution, complete description of static molecules and their intermolecular binding properties". JCIM. 45 (4): 1010–1016. doi:10.1021/ci050059v. 
  6. ^ Meek, P. J.; Liu, Z.; Tian, L.; Wang, C. J; Welsh, W. J; Zauhar, R. J (2006). "Shape Signatures: speeding up computer aided drug discovery". DDT 2006. 19-20: 895–904. 
  7. ^ Grant, J. A; Gallardo, M. A.; Pickup, B. T. (1996). "A fast method of molecular shape comparison: A simple application of a Gaussian description of molecular shape". JCIC. 17 (14): 1653–1666. doi:10.1002/(sici)1096-987x(19961115)17:14<1653::aid-jcc7>3.0.co;2-k. 
  8. ^ Ballester, P. J.; Richards, W. G. (2007). "Ultrafast shape recognition for similarity search in molecular databases". Proceedings of the Royal Society A. 463: 1307–1321. doi:10.1098/rspa.2007.1823. 
  9. ^ Rahman, S. Asad; Bashton, M.; Holliday, G. L.; Schrader, R.; Thornton, J. M. (2009). "Small Molecule Subgraph Detector (SMSD) Toolkit". Journal of Cheminformatics. 1: 12. doi:10.1186/1758-2946-1-12. Diarsipkan dari versi asli tanggal 2020-01-28. Diakses tanggal 2017-06-21. 
  10. ^ Butina, Darko (1999). "Unsupervised Data Base Clustering Based on Daylight's Fingerprint and Tanimoto Similarity: A Fast and Automated Way To Cluster Small and Large Data Sets". Chem. Inf. Comput. Sci. 39: 747–750. doi:10.1021/ci9803381. 

Read other articles:

Canadian director Denys Arcand won the Academy Award for Best Foreign Language Film for The Barbarian Invasions. This is a list of submissions to the 76th Academy Awards for Best Foreign Language Film. The Academy of Motion Picture Arts and Sciences has invited the film industries of various countries to submit their best film for the Academy Award for Best Foreign Language Film every year since the award was created in 1956. The award is handed out annually by the academy to a feature-lengt...

 

 

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要补充更多来源。 (2018年3月17日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:羅生門 (電影) — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。 �...

 

 

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要补充更多来源。 (2018年3月17日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:羅生門 (電影) — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。 �...

Chiune SugiharaFoto Chiune SugiharaLahir1 Januari 1900Mino, Gifu, JepangMeninggal31 Juli 1986Fujisawa, JepangPekerjaanDiplomat Chiune Sugihara (杉原千畝code: ja is deprecated , Sugihara Chiune, 1 Januari 1900 – 31 Juli 1986) adalah seorang diplomat Jepang yang menyelamatkan ribuan orang Yahudi pada masa Perang Dunia II ketika ia menjabat sebagai konsul Kekaisaran Jepang di Lituania. Ia adalah salah seorang yang tampaknya tidak mempunyai motivasi lain kecuali melakukan apa...

 

 

Questa voce sull'argomento stagioni delle società calcistiche italiane è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Voce principale: Molinella Calcio 1911. Polisportiva MolinellaStagione 1938-1939Sport calcio Squadra Molinella Allenatore Mario Gianni Presidente Luigi Monterumici Serie C1º posto nel girone E, 2º posto nel girone finale B. Promosso in Serie B. Coppa ItaliaTerzo turno eliminato...

 

 

For the Opportunity, Washington radio station that held the call sign KIXZ-FM at 96.1 FM from 2001 to 2013, see KFOO-FM. Radio station in Amarillo, TexasKIXZAmarillo, TexasBroadcast areaAmarillo areaFrequency940 kHzBrandingNews Talk 940 AMProgrammingFormatTalk RadioNetworkFox News RadioAffiliationsCompass Media NetworksPremiere NetworksRadio AmericaTexas State NetworkWestwood OneOwnershipOwnerTownsquare Media(Townsquare License, LLC)Sister stationsKATP, KMXJ-FM, KPRF, KXSS-FMHistoryFirst air ...

Football stadium in Forfar, Scotland Station ParkStation ParkLocation in AngusLocationForfar, ScotlandCoordinates56°39′08″N 2°53′06″W / 56.65222°N 2.88500°W / 56.65222; -2.88500OwnerForfar Athletic F.C.Capacity6,777[1] (739 seated)[2]Surface3G artificial turf[3]Opened1888TenantsForfar Athletic F.C. (1885–present)Forfar Farmington F.C. (2012–present) Station Park is a football ground in Forfar, Angus, Scotland. It is home to Scott...

 

 

Artikel ini bukan mengenai Kabupaten Bantul. Banjul ߓߊ߲߬ߖߎߟ Banjul𞤄𞤢𞤲𞥆𞤶𞤵𞤤𞤵 BannjuluDari atas ke bawah : Masjid Raja Fahad di Banjul, Arch 22 (gerbang masuk ke Banjul), Bandara Internasional Banjul LambangBanjulLokasi Banjul dalam GambiaKoordinat: 13°27′11″N 16°34′39″W / 13.45306°N 16.57750°W / 13.45306; -16.57750Negara GambiaDivisiBanjulLuas • Luas perkotaan36 sq mi (93 km2)Populasi (2...

 

 

Pour l’article ayant un titre homophone, voir Dargo. Pour les articles homonymes, voir Dargaud (homonymie). Repères historiques Création 1936 Dates clés 26 novembre 1954 : immatriculation de la société actuelle Fondée par Georges Dargaud Fiche d’identité Forme juridique SA à conseil d'administration[1] Statut éditeur élément d'un groupe d'édition Siège social Paris (France) Dirigée par Claude de Saint Vincent[2] Spécialités Bande dessinée Collections Poisson Pilote,...

Libre 2D animation software Synfig StudioOriginal author(s)Robert QuattlebaumStable release1.4.4[1] / December 28, 2022; 16 months ago (2022-12-28)Preview release1.5.1[2] / October 30, 2021; 2 years ago (2021-10-30) Repositorygithub.com/synfig/synfig Written inC++ (using gtkmm)Operating systemLinux, Mac OS X, WindowsTypeVector graphics editor, computer animationLicenseGPL-2.0-or-laterWebsitesynfig.org Synfig Studio (also known as Synfig) is ...

 

 

هيو جاكمان (بالإنجليزية: Hugh Jackman)‏    معلومات شخصية اسم الولادة (بالإنجليزية: Hugh Michael Jackman)‏  الميلاد 12 أكتوبر 1968 (56 سنة)  سيدني  الإقامة نيويورك  مواطنة أستراليا المملكة المتحدة[1]  استعمال اليد أعسر  الديانة المسيحية[2]  الزوجة ديبورا لي فيرنس (19...

 

 

 烏克蘭總理Прем'єр-міністр України烏克蘭國徽現任杰尼斯·什米加尔自2020年3月4日任命者烏克蘭總統任期總統任命首任維托爾德·福金设立1991年11月后继职位無网站www.kmu.gov.ua/control/en/(英文) 乌克兰 乌克兰政府与政治系列条目 宪法 政府 总统 弗拉基米尔·泽连斯基 總統辦公室 国家安全与国防事务委员会 总统代表(英语:Representatives of the President of Ukraine) 总...

American baseball player and coach (born 1979) Baseball player Gabe GrossGross with the Tampa Bay Rays.Auburn Tigers Outfielder / CoachBorn: (1979-10-21) October 21, 1979 (age 44)Baltimore, Maryland, U.S.Batted: LeftThrew: RightMLB debutAugust 7, 2004, for the Toronto Blue JaysLast MLB appearanceOctober 3, 2010, for the Oakland AthleticsMLB statisticsBatting average.239Home runs40Runs batted in186 Teams Toronto Blue Jays (2004–2005) Milwaukee Brewers (2006...

 

 

Pour les articles homonymes, voir Dix-Avril. Éphémérides Avril 1er 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30           10 mars 10 mai Chronologies thématiques Croisades Ferroviaires Sports Disney Anarchisme Catholicisme Abréviations / Voir aussi (° 1852) = né en 1852 († 1885) = mort en 1885 a.s. = calendrier julien n.s. = calendrier grégorien Calendrier Calendrier perpétuel Liste de calendriers Naissances du jour modifi...

 

 

جائزة إسبانيا الكبرى 1996 السباق 7 من أصل 16 في بطولة العالم لسباقات الفورمولا واحد موسم 1996 السلسلة بطولة العالم لسباقات فورمولا 1 موسم 1996  البلد إسبانيا  التاريخ 2 يونيو 1996 مكان التنظيم حلبة دي كاتلونيا، برشلونة، إسبانيا طول المسار 4.727 كيلومتر (2.938 ميل) المسافة 307.114 كيل�...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (ديسمبر 2018) العلاقات الكويتية التركية   تركيا   الكويت السفارات السفارة التركية في الكويت السفارة الكويتي...

 

 

Nationality For other uses, see Cuban. Ethnic group CubansCubanosMap of the Cuban Diaspora in the worldTotal populationCubans: ~13.1 million Diaspora: ~2 millionRegions with significant populations Cuba 11,089,511 (2022)[1][2] United States1,312,510 (2022)[3] Spain198,639 (2023)[4] Brazil49,066 (2023)[5] Mexico25,976 (2020) ** Uruguay24,485 (2020)[6] Italy23,531 (2023) ** Canada19,545 (2021)[7][8 ...

 

 

В этом китайском имени фамилия (Хуа) стоит перед личным именем. Для улучшения этой статьи желательно: Найти и оформить в виде сносок ссылки на независимые авторитетные источники, подтверждающие написанное.После исправления проблемы исключите её из списка. Удалите шабло�...

Organization devoted to American clairvoyant Edgar Cayce This article is part of a series onAlternative medicine General information Alternative medicine History Terminology Alternative veterinary medicine Quackery (health fraud) Rise of modern medicine Pseudoscience Antiscience Skepticism Scientific Therapeutic nihilism Fringe medicine and science Acupressure Acupuncture Alkaline diet Anthroposophic medicine Apitherapy Applied kinesiology Aromatherapy Association for Research and Enlightenme...

 

 

City in Nakhchivan Autonomous Republic of Azerbaijan For other places with the same name, see Julfa (disambiguation). City and Municipality in Nakhchivan, AzerbaijanJulfa CulfaՋուղա JughaCity and MunicipalityCulfaJulfaCoordinates: 38°57′21″N 45°37′51″E / 38.95583°N 45.63083°E / 38.95583; 45.63083Country AzerbaijanAutonomous republicNakhchivanDistrictJulfaElevation715 m (2,346 ft)Population (2011) • Total12,500Time zoneUT...