Proteinska banka podataka

Proteinska banka podataka, (engl. Protein Data Bank, PDB), je kolekcija 3D strukturnih podataka velikih bioloških molekula, kao što su proteini i nukleinske kiseline. Podaci su tipično dobijeni rendgenskom strukturnom analizom ili NMR spektroskopijom. Biolozi i biohemičari iz celog sveta doprinose stvaranju ove kolekcije. PDB je slobodno dostupan na Internetu. PDB nadzire organizacija pod nazivom Svetska proteinska banka podataka (engl. Worldwide Protein Data Bank, wwPDB).

PDB je ključni resurs u strukturno biološkim oblastima, poput strukturne genomike. Većina vodećih naučnih časopisa, i pojedine agencije za finansiranje, kao što je NIH u SAD, zahtevaju od istraživača da unesu njihove strukturne podatke u PDB. PDB sadržaj se smatra primarnim podacima, i postoje stotine izvedenih baza podataka koje kategorizuju podatke na razne načine. Na primer, SCOP i CATH kategorizuju strukture na osnovu strukturno tipa i pretpostavljenih evolucionih odnosa; a GO kategorizuje strukture na osnovu gena.[1]

Istorija

PDB je formiran 1971. godine[1]. Njen osnivač je Valter Hamilton sa Brukhaven nacionalne laboratorije. Nakon Hamiltonove smrti 1973, Tom Koeztle je preuzeo nadzor nad PDB-om. Januara 1994, Joel Susman je bio imenovan za PDB rukovodioca. Oktobra 1998,[2] PDB je transformisan u RCSB (engl. Research Collaboratory for Structural Bioinformatics) [3]. Transfer je završen juna 1999. Novi direktor je bila Helen M. Berman sa Rutgers univerziteta (jednog od RCSB institucija članica).[4] 2003 sa wwPDB formiranjem, PDB je postao internacionalna organizacija. Svaki od četiri wwPDB člana dejstvuje kao centar za depoziciju, obradu i distribuciju PDB podataka. Obrada podataka se odnosi na činjenicu da wwPDB osoblje pregleda i anotira svaki podneti upis. Nakon toka se verodostojnost podataka se proverava. Izvorni kod tog softvera za validaciju je javno dostupan.[5]

Sadržaj

PDB baza podataka se ažurira sedmično (utorkom). U septembru 2010 PDB je imao sledeći sadržaj[6]:

Eksperimentalni
metod
Proteini Nukleinske kiseline Protein/Nukleinska kiselina
kompleksi
Drugo Total
difrakcija X-zraka 55480 1231 2605 17 59333
NMR 7512 925 162 7 8606
Elektronska mikroskopija 214 17 77 0 308
Hybrid 24 1 1 1 27
Other 126 4 4 13 147
Total: 63356 2178 2849 38 68421
48,715 struktura u PDB imaju strukturni faktor fajl.
5,901 struktura imaju NMR podatke.

Ovi podaci pokazuju da je većina struktura određena difrakcijom X-zraka, dok je oko 15% struktura određeno putem protein NMR. Kad se koristi difrakcija X-zraka dobijaju se aproksimativne koordinate atoma proteina. NMR eksperimenti daju procene rastojanja između parova atoma proteina, a konformacija proteina se dobija rešavanjem problema geometrije rastojanja. Nekoliko proteinskih struktura je određeno krio-elektronskom mikroskopijom.

U prošlosti[7] PDB je rastao približno eksponencijalnom brzinom. Međutim, od 2007 brzina akumulacije novih proteina izgleda da je dostigla plato, sa 7263 proteina dodatih u 2007, 7073 u 2008, i 7448 u 2009.

Fajl format

Fajl format koji je PDB inicijalno koristio se zove PDB fajl format. Taj originalni format je bio ograničen širinom računarskih bušenih karti na 80 slova po liniji. "Makromolekularni kristalografski informacioni fajl" format, mmCIF, je počeo da se primenjuje 1996. godine,. XML verzija ovog formata, zvana PDBML, se pojavila 2005. godine.[8]

Proteinske strukture se mogu preuzeti u bilo kom od tih formata. Grafički paketi mogu direktno da pristupe strukturama na PDB sajtu:

  • Za PDB fajlove, npr., http://www.pdb.org/pdb/files/4hhb.pdb.gz
  • Za PDBML (XML) fajlove, npr., http://www.pdb.org/pdb/files/4hhb.xml.gz

Povezano

Literatura

  1. 1,0 1,1 Berman, H. M. (January 2008). „The Protein Data Bank: a historical perspective”. Acta Crystallographica Section A: Foundations of Crystallography A64 (1): 88–95. DOI:10.1107/S0108767307035623. PMID 18156675. 
  2. Berman, H. M.; et al. (January 2000). „The Protein Data Bank”. Nucleic Acids Res. 28 (1): 235–242. DOI:10.1093/nar/28.1.235. PMC 102472. PMID 10592235. 
  3. „Research Collaboratory for Structural Bioinformatics (RCSB)”. Arhivirano iz originala na datum 2007-02-05. Pristupljeno 2013-12-25. 
  4. „RCSB PDB Newsletter Archive”. RCSB Protein Data Bank. 
  5. „PDB Validation Suite”. Arhivirano iz originala na datum 2016-03-03. 
  6. „RCSB Protein Data Bank - Holdings Report”. Arhivirano iz originala na datum 2007-07-04. 
  7. „Number of structures”. Arhivirano iz originala na datum 2007-04-28. Pristupljeno 2013-12-25. 
  8. Westbrook, J.; et al. (2005). „PDBML: the representation of archival macromolecular structure data in XML”. Bioinformatics 21 (7): 988–992. DOI:10.1093/bioinformatics/bti082. PMID 15509603. 

Vanjske veze