PubChem

PubChem é unha base de datos de moléculas. É un sistema operado e mantido polo National Center for Biotechnology Information (NCBI), parte da National Library of Medicine, dependente á súa vez dos National Institutes of Health estadounidenses. Pódese consultar gratuitamente a través de Internet, ademais de poder descargar os datos de millóns de estruturas vía FTP. A maioría das moléculas listadas en PubChem teñen un peso molecular inferior a 2000 uma. A American Chemical Society tentou restrinxir as súas actividades, alegando que competían co seu Chemical Abstracts Service. Máis de 50 provedores de bases de datos contribúen ao crecemento de PubChem.

Bases de datos

PubChem contén tres bases de datos primarias, en continuo crecemento:

  • Compostos: 10,2 M entradas, compostos puros e mesturas.[1]
  • Substancias, 15,5 M entradas, contén mesturas, extractos, complexos e substancias non caracterizadas.[2]
  • BioAssay, resultados de bioactividade de 337 ensaios high throughput screening, con varios millóns de entradas.[3]

Procuras

Pódese buscar na base de datos mediante numerosos parámetros, incluíndo a estrutura química, nome dos fragmentos, fórmula química, peso molecular, XLogP e o número de enlaces de hidróxeno dadores e aceptores.

Ten un sistema propio de edición de moléculas baseado en SMILES/SMARTS e soporte de InChI que permite a importación e exportación dos formatos químicos máis comúns para buscar estruturas e fragmentos.

Cada resultado contén información sobre sinónimos, propiedades químicas (incluíndo as cadeas SMILES e InChI), bioactividade e enlaces a compostos relacionados estruturalmente, ademais de enlaces a outras bases de datos do NCBI, como PubMed.

Pódese buscar a partir de diferentes parámetros incluíndoos dentro de corchetes. Represéntase un rango numérico a partir de dous números separados con dous puntos (:). Os termos de procura non distinguen maiúsculas de minúsculas. Admítense paréntese e operadores lóxicos, como AND, OR e NOT. Se non se especifica ningún, asúmese AND.

Exemplo:

0:500[mw] 0:5[hbdc] 0:10[hbac] -5:5[logp]

Campos da base de datos

Números de identificación
Número de identificación na BBDD [UID]
Número de identificación de substancia [SID]
Número de identificación de composto [CID]
Número de identificación BioAssay [BAID], [AID]
Xeral
Calquera campo da BBDD [ALL]
Comentario [CMT]
Data de alta [DDAT], [DEPDAT]
IDE externo do que deu a alta [SRID], [SRCID]
Nome da fonte [SRC], [SRCNAM], [SRCNAME]
Data de publicación da fonte [SRD], [SRDAT], [RLSDAT]
Termo Medical Subject Heading (MeSH) [MSHT], [MESHT]
Nodo da árbore MeSH [MSHN], [MESHTN]
Accións farmacolóxicas MeSH [PHMA], [PHARMA]
Propiedades da substancia
Sinónimos [SYNO]
Nome IUPAC [UPAC], [IUPAC]
Identificador Químico Internacional (InChI) [INCHI]
Peso molecular [MW], [MWT], [MOLWT]
Elemento [ELMT], [O]
Átomos non de hidróxeno [HAC], [HACNT]
Número de isótopos [IAC], [IACNT]
Carga formal total [TFC], [CHG], [CHRG]
Número de átomos quirais [ACC], [ACCNT]
Número de átomos quirais dun determinado tipo [ACDC], [ACDCNT]
Número de átomos quirais non definidos [ACUC], [ACUCNT]
Número de aceptores de ponte de hidróxeno [HBAC], [HBACNT]
Número de dadores de ponte de hidróxeno [HBDC], [HBDCNT]
Número de tautómeros [TC], [TCNT], [TTMC]
Número de enlaces rotatorios [RBC], [RBCNT]
XLogP [XLGP], [LOGP]
Propiedades do composto
Sinónimos do composto [CSYN], [CSYNO]
Número de compoñentes [CC], [CCNT]
Número de enlaces covalentes [CUC], [CUCNT]
Número de bioactividade [TAC]

Notas

Véxase tamén

Ligazóns externas