Gene Wiki

logo Gene Wiki

Gene Wiki est un projet de Wikipédia en anglais qui vise à décrire les relations et les fonctions de tous les gènes humains. Il a été créé pour transférer des informations à partir de ressources scientifiques vers les articles de Wikipédia[1],[2],[3]. Le projet Gene Wiki a également lancé la publication d'articles de synthèse sur des gènes spécifiques dans la revue Gene, ainsi que l'édition des pages spécifiques au gène dans Wikipedia[4].

Objectifs et portée du projet

Nombre d'articles

Le génome humain contient environ 20 000 à 25 000 gènes codant des protéines[5]. Le but du projet Gene Wiki est de créer des articles pour chaque gène humain notable, c'est-à-dire chaque gène dont la fonction a été assignée dans la littérature scientifique évaluée par des pairs. Environ la moitié des gènes humains ont une fonction assignée. Par conséquent, le nombre total d'articles concernés par le projet Gene Wiki devrait être de l'ordre de 10 000 à 15 000. À ce jour, environ 11 000 articles ont été créés ou enrichis[6]. Une fois que les articles de base ont été établis, l'espoir et l'attente est que ceux-ci seront annotés et verront leur contenu augmenté par des éditeurs allant de l'expérience du public profane, aux étudiants, professionnels et universitaires[1].

Protéines codées par des gènes

La majorité des gènes codent des protéines, par conséquent la compréhension de la fonction d'un gène nécessite généralement la compréhension de la fonction de la protéine correspondante. En plus d'inclure des informations de base sur le gène, le projet comprend donc également des informations sur la protéine codée par le gène. Les informations sont d'abord importées dans Wikidata. En , au total, 59 721 gènes humains et 73 355 gènes de souris ont été importés du National Center for Biotechnology Information, le Centre américain pour les informations biotechnologiques, et 27 306 protéines humaines et 16 728 protéines de souris ont été importées du sous-ensemble Swissprot d'UniProt [7]. À partir de Wikidata, les infobox de Wikipédia sont ensuite éditées. De plus, "un terminal SPARQL et l'exportation de fonctionnalités vers plusieurs formats standard (JSON, XML) permettent aux scientifiques d'utiliser les données".

Sources du projet

Les ébauches d'articles pour le projet Gene Wiki sont créées par un bot informatique et contiennent des liens vers les bases de données de gènes et de protéines suivantes :

Références

  1. a et b J. W. Huss, C. Orozco, J. Goodale, C. Wu, S. Batalov, T. J. Vickers, F. Valafar et A. I. Su, « A Gene Wiki for Community Annotation of Gene Function », PLoS Biol., vol. 6, no 7,‎ , e175 (PMID 18613750, PMCID 2443188, DOI 10.1371/journal.pbio.0060175).
  2. J. W. Huss, C. Orozco, J. Goodale, C. Wu, S. Batalov, T. J. Vickers, F. Valafar et AI. Su, « SciVee Pubcast: A Gene Wiki for Community Annotation of Gene Function » (version du sur Internet Archive).
  3. J. W. Huss, P. Lindenbaum, M. Martone, D. Roberts, A. Pizarro, F. Valafar, J. B. Hogenesch et A. I. Su, « The Gene Wiki: community intelligence applied to human gene annotation », Nucleic Acids Res., vol. 38, no Database issue,‎ , D633–9 (PMID 19755503, PMCID 2808918, DOI 10.1093/nar/gkp760, lire en ligne).
  4. G. Tsueng, B. M. Good, P. Ping, E. Golemis, I. Hanukoglu, W. van, A. J. ijnen et A. I. Su, « Gene Wiki Reviews-Raising the quality and accessibility of information about the human genome. », Gene, vol. 592, no 2,‎ , p. 235–8 (PMID 27150585, DOI 10.1016/j.gene.2016.04.053).
  5. M. Clamp, B. Fry, M. Kamal, X. Xie, J. Cuff, M. F. Lin, M. Kellis, K. Lindblad-Toh et E. S. Lander, « Distinguishing protein-coding and noncoding genes in the human genome », Proc. Natl. Acad. Sci. U.S.A., vol. 104, no 49,‎ , p. 19428–33 (PMID 18040051, PMCID 2148306, DOI 10.1073/pnas.0709013104).
  6. « Gene Wiki Pages », Pages that link to (tl), Wikipedia, the free encyclopedia (consulté le ).
  7. (en) Sebastian Burgstaller-Muehlbacher, Andra Waagmeester, Elvira Mitraka, Julia Turner, Tim Putman, Justin Leong, Chinmay Naik, Paul Pavlidis, Lynn Schriml, Benjamin M. Good et Andrew I. Su, « Wikidata as a semantic framework for the Gene Wiki initiative », Database, vol. 2016,‎ , p. 015 (ISSN 1758-0463, PMID 26989148, PMCID 4795929, DOI 10.1093/database/baw015).
  8. (en) A. I. Su, T. Wiltshire, S. Batalov, H. Lapp, K. A. Ching, D. Block, J. Zhang, R. Soden, M. Hayakawa, G. Kreiman, M. P. Cooke, J. R. Walker et J. B. Hogenesch, « A gene atlas of the mouse and human protein-encoding transcriptomes », Proc. Natl. Acad. Sci. U.S.A., vol. 101, no 16,‎ , p. 6062–7 (PMID 15075390, PMCID 395923, DOI 10.1073/pnas.0400782101).

Voir aussi