단백질 정보 은행(蛋白質情報銀行, 영어: Protein Data Bank)은 브루크하벤 국립 연구소에 의해 1971년 세워졌으며, 단백질 정보 은행의 관리는 1998년 구조적 생물정보학을 위한 공동연구소 (RCSB)로 옮겨졌다. 단백질 자료 은행(蛋白質資料銀行)이라고도 한다. 전 세계 단백질 정보 은행(wwPDB)는 PDB 정보를 처리하고, 분배, 폐기하는 기관으로 작동하고 있다. wwPDB의 목적은 거대분자의 구조에 대한 각각 PDB의 기록을 보존하고, 전지구적 공동체에게 자유롭게 이용할 수 있도록 하는 것이다.
단백질정보은행은 구조생물학의 핵심 출처이며, 구조유전학의 최근 작업에 결정적인 기여를 해 왔다.
무수한 파생 데이터베이스와 프로젝트들이 PDB를 단백질의 구조, 단백질의 역할, 단백질의 진화의 표현으로 통합하고, 분류하기 위해 발전되어 왔다.
구성원
2006년 wwPDB의 구성원으로는 미국의 RCSB PDB, 유럽의 MSD-EBI, 일본의 PDBj, 미국의 BMRB가 있다.
PDBj
PDBj(Protein Data Bank Japan)는 미국의 구조 생물 정보학 연구 공동체(RCSB), BMRB및 유럽 생물 정보학 연구소(PDBe)와 협력하여 고분자 입체구조와 구조 해석 툴을 제공하고 있다. PDBj는 독립 행정법의 과학기술 진흥기구 바이오사이언스데이터베이스센터(JST-NBDC)와 오사카대학의 후원을 받고 있다.
성장
PDB가 처음 설립될 때에는 오직 7개의 단백질 구조만을 보유하고 있었다. 그때부터 지금까지 단백질 구조의 숫자에서 대략 지수적인 증가를 겪고 있으며, 그 추세는 떨어지려는 기미를 보이지 않고 있다. 이곳에서 PDB 정보량의 증가추세를 볼 수 있다.
개요
2007년7월 26일 현재, 단백질정보은행은 44476 개의 단백질, 핵산, 단백질-핵산 복합체, 그리고 약간의 기타 분자들의 구조가 등재되어있다. 연간 약 5000 개의 단백질 구조가 추가등재되고 있다, 단백질의 구조는 효율을 위해 특별히 개발된 mmCIF의 형식으로 저장된다.
정보은행은 거대 생체분자의 모든 원자들의 정밀한 위치를 저장하고 있다는 점에 유의해야 한다. (다만 때때로 수소원자는 포함되지 않는다.)
만약 단백질의 서열정보, 즉 단백질을 구성하는 아미노산의 순서나, 핵산을 구성하는 뉴클레오사이드의 순서에 관심이 있다면, Swiss-Prot과 INSDC 가 사용될 수 있다.
만약 생물학자들이 단백질이나 핵산의 구조를 제출하면, wwPDB의 직원들은 그구조에 비평과 주석작업을 한다. 자료는 자동적으로 타당성 확인을 받는다. 타당성을 확인하는 프로그램의 소스코드는 공개되어있다. 주요 데이터베이스는 오직 실험에서 찾아낸 정보만을 수록하며, 이론적으로 예측한 구조는 수록하지 않는다.
몇몇의 자금 대행업체와 과학저널들은 과학자들에게 그들이 발견한 구조를 PDB로 제출할 것을 요구하고 있다.
데이터 보기
VMD, RasMol, PyMol, Jmol 등의 프로그램을 통해 생체분자를 시각화하는데 활용될 수 있다. 그밖에도 STING와 같은 웹 기반의 소프트웨어들이 단백질의 구조를 시각화하고 분석하기 위해 설계되고 있다. 최근의 데스크톱 기반의 소프트웨어인 시리우스가 추가되었다. RCSB PDB 또한 교육, 구조적유전학, 관련 소프트웨어를 위한 자원을 포함하고 있다.