PDB merupakan basis data yang sangat penting dalam bidang biologi struktur, seperti genomika struktur. Sebagian besar jurnal ilmiah utama, dan beberapa agensi pendanaan, saat ini mengharuskan ilmuwan untuk menyerahkan data struktur hasil penelitian mereka pada PDB. Banyak basis data lainnya yang menggunakan struktur protein yang tersimpan di PDB. Misalnya, SCOP dan CATH mengelompokkan struktur protein, sementara PDBsum menyediakan ikhtisar grafis dari entri PDB menggunakan informasi dari sumber lain, seperti ontologi gen.[4][5]
Konten
Basis data PDB diperbaharui setiap minggunya (Rabu UTC+0). Demikian pula, daftar kepemilikan PDB[6] juga diperbaharui setiap minggu. Hingga 17 Oktober 2018[update], rincian kepemilikan saat ini adalah sebagai berikut:
2.531 struktur dalam PDB memiliki berkas pemetaan 3DEM yang tersimpan dalam EM Data Bank
Signifikansi berkas faktor struktur, yang disebutkan di atas, adalah bahwa, untuk struktur PDB yang ditentukan oleh difraksi sinar-X yang memiliki berkas struktur, pemetaan kerapatan elektron dapat dilihat. Data struktur tersebut disimpan di "server kerapatan elektron".[7][8]
Di masa lalu, jumlah struktur dalam PDB telah tumbuh pada tingkat yang kira-kira eksponensial, melewati 100 struktur yang terdaftar pada tahun 1982, 1.000 pada tahun 1993, 10.000 pada tahun 1999, dan 100.000 pada tahun 2014.[9][10] Namun, sejak 2007, tingkat akumulasi struktur protein baru tampaknya tidak menunjukkan peningkatan yang signifikan.
Format berkas
Format berkas yang digunakan oleh PDB pada mulanya adalah format berkas PDB. Format berkas awal ini dibatasi oleh lebar dibatasi oleh lebar kartu punch komputer hingga 80 karakter per baris. Sekitar tahun 1996, format "Berkas Informasi Kristalografi makromolekul", mmCIF, (bahasa Inggris: "macromolecular Crystallographic Information File") yang merupakan perpanjangan dari format CIF mulai digunakan secara bertahap. Format berkas mmCIF saat ini digunakan sebagai format utama untuk arsip PDB.[11] Versi XML dari format ini, yang dikenal sebagai PDBML, diperkenalkan pada tahun 2005.[12]
Berkas struktur ini dapat diunduh dalam satu diantara ketiga format tadi. Lebih lanjut, berkas individualnya dapat secara mudah diunduh dalam paket grafis melalui situs web:
Untuk format berkas PDB, dapat diakses dari http://www.pdb.org/pdb/files/4hhb.pdb.gz atau http://pdbe.org/download/4hhb
Untuk berkas PDBML (XML), dapat diakses dari http://www.pdb.org/pdb/files/4hhb.xml.gz atau http://pdbe.org/pdbml/4hhb
"4hhb" merupakan kode pengenal PDB. Setiap struktur yang diterbitkan oleh PDB mendapatkan kode pengenal alfanumerik empat-karakter, disebut sebagai PDB ID. (Pengenal ini tidak dapat digunakan sebagai pengenal biomolekul, karena terkadang beberapa struktur dengan molekul yang sama—dalam lingkungan atau konformasi yang berbeda—dimasukkan dalam PDB dengan PDB ID yang berbeda.)
^Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (Desember 1997). "PDBsum: a Web-based database of summaries and analyses of all PDB structures". Trends Biochem. Sci. (dalam bahasa Inggris). 22 (12): 488–90. doi:10.1016/S0968-0004(97)01140-7. PMID9433130.
^Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA (Desember 2004). "The Uppsala Electron-Density Server". Acta Crystallogr. D (dalam bahasa Inggris). 60 (Pt 12 Pt 1): 2240–2249. doi:10.1107/S0907444904013253. PMID15572777.
^Anon (2014). "Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures". Nature (dalam bahasa Inggris). 509 (7500): 260. doi:10.1038/509260a. PMID24834514.