Gene Wiki est un projet de Wikipédia en anglais qui vise à décrire les relations et les fonctions de tous les gèneshumains. Il a été créé pour transférer des informations à partir de ressources scientifiques vers les articles de Wikipédia[1],[2],[3]. Le projet Gene Wiki a également lancé la publication d'articles de synthèse sur des gènes spécifiques dans la revue Gene, ainsi que l'édition des pages spécifiques au gène dans Wikipedia[4].
Objectifs et portée du projet
Nombre d'articles
Le génome humain contient environ 20 000 à 25 000 gènes codant des protéines[5]. Le but du projet Gene Wiki est de créer des articles pour chaque gène humain notable, c'est-à-dire chaque gène dont la fonction a été assignée dans la littérature scientifiqueévaluée par des pairs. Environ la moitié des gènes humains ont une fonction assignée. Par conséquent, le nombre total d'articles concernés par le projet Gene Wiki devrait être de l'ordre de 10 000 à 15 000. À ce jour, environ 11 000 articles ont été créés ou enrichis[6]. Une fois que les articles de base ont été établis, l'espoir et l'attente est que ceux-ci seront annotés et verront leur contenu augmenté par des éditeurs allant de l'expérience du public profane, aux étudiants, professionnels et universitaires[1].
Protéines codées par des gènes
La majorité des gènes codent des protéines, par conséquent la compréhension de la fonction d'un gène nécessite généralement la compréhension de la fonction de la protéine correspondante. En plus d'inclure des informations de base sur le gène, le projet comprend donc également des informations sur la protéine codée par le gène. Les informations sont d'abord importées dans Wikidata. En , au total, 59 721 gènes humains et 73 355 gènes de souris ont été importés du National Center for Biotechnology Information, le Centre américain pour les informations biotechnologiques, et 27 306 protéines humaines et 16 728 protéines de souris ont été importées du sous-ensemble Swissprot d'UniProt[7]. À partir de Wikidata, les infobox de Wikipédia sont ensuite éditées. De plus, "un terminal SPARQL et l'exportation de fonctionnalités vers plusieurs formats standard (JSON, XML) permettent aux scientifiques d'utiliser les données".
Sources du projet
Les ébauches d'articles pour le projet Gene Wiki sont créées par un bot informatique et contiennent des liens vers les bases de données de gènes et de protéines suivantes :
UniProt (ressource protéique universelle) - un référentiel central de données sur les protéines
Références
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Gene Wiki » (voir la liste des auteurs).
↑ a et bJ. W. Huss, C. Orozco, J. Goodale, C. Wu, S. Batalov, T. J. Vickers, F. Valafar et A. I. Su, « A Gene Wiki for Community Annotation of Gene Function », PLoS Biol., vol. 6, no 7, , e175 (PMID18613750, PMCID2443188, DOI10.1371/journal.pbio.0060175).
↑J. W. Huss, P. Lindenbaum, M. Martone, D. Roberts, A. Pizarro, F. Valafar, J. B. Hogenesch et A. I. Su, « The Gene Wiki: community intelligence applied to human gene annotation », Nucleic Acids Res., vol. 38, no Database issue, , D633–9 (PMID19755503, PMCID2808918, DOI10.1093/nar/gkp760, lire en ligne).
↑G. Tsueng, B. M. Good, P. Ping, E. Golemis, I. Hanukoglu, W. van, A. J. ijnen et A. I. Su, « Gene Wiki Reviews-Raising the quality and accessibility of information about the human genome. », Gene, vol. 592, no 2, , p. 235–8 (PMID27150585, DOI10.1016/j.gene.2016.04.053).
↑M. Clamp, B. Fry, M. Kamal, X. Xie, J. Cuff, M. F. Lin, M. Kellis, K. Lindblad-Toh et E. S. Lander, « Distinguishing protein-coding and noncoding genes in the human genome », Proc. Natl. Acad. Sci. U.S.A., vol. 104, no 49, , p. 19428–33 (PMID18040051, PMCID2148306, DOI10.1073/pnas.0709013104).
↑« Gene Wiki Pages », Pages that link to (tl), Wikipedia, the free encyclopedia (consulté le ).
↑(en) Sebastian Burgstaller-Muehlbacher, Andra Waagmeester, Elvira Mitraka, Julia Turner, Tim Putman, Justin Leong, Chinmay Naik, Paul Pavlidis, Lynn Schriml, Benjamin M. Good et Andrew I. Su, « Wikidata as a semantic framework for the Gene Wiki initiative », Database, vol. 2016, , p. 015 (ISSN1758-0463, PMID26989148, PMCID4795929, DOI10.1093/database/baw015).
↑(en) A. I. Su, T. Wiltshire, S. Batalov, H. Lapp, K. A. Ching, D. Block, J. Zhang, R. Soden, M. Hayakawa, G. Kreiman, M. P. Cooke, J. R. Walker et J. B. Hogenesch, « A gene atlas of the mouse and human protein-encoding transcriptomes », Proc. Natl. Acad. Sci. U.S.A., vol. 101, no 16, , p. 6062–7 (PMID15075390, PMCID395923, DOI10.1073/pnas.0400782101).