L'homologie de séquences est une notion distincte de leur degré d'identité ou de similitude. Ainsi, on parle parfois de « pourcentage d'homologie » pour signifier « similitude de séquence », en utilisant le pourcentage de résidus identiques (dit pourcentage d'identité) ou le pourcentage de conservation des propriétés physicochimiques des résidus (leucine et isoleucine par exemple, dit pourcentage de similitude) pour quantifier un « degré d'homologie entre séquences », ce qui est une terminologie erronée : si des séquences peuvent être plus ou moins semblables, elles sont en revanche ou bien homologues, ou bien non homologues, mais ne peuvent être partiellement homologues — elles peuvent en revanche être partiellement semblables. Plus précisément, on parlera d'homologie partielle lorsqu'une séquence présente des segments homologues qui ne s'étendent pas sur toute la longueur de la séquence, ce qui peut résulter d'une fusion de gènes(en).
L'homologie de séquences est également distincte de la conservation de certains résidus d'acides aminés jouant un rôle spécifique dans une protéine, qui restent identiques ou sont remplacés par des résidus aux propriétés physicochimiques semblables dans toutes les protéines de même fonction. À l'instar des traits morphologiques et anatomiques, des séquences peuvent en effet présenter des similitudes sous l'effet d'une convergence évolutive, voire simplement par hasard, notamment pour les courts segments, ce qui signifie qu'elles ne sont pas homologues, bien qu'elles soient semblables.
Des séquences homologues sont orthologues si on pense qu'elles ont divergé à partir d'une séquence ancestrale commune à la suite d'une spéciation : lorsqu'une espèce se scinde en deux espèces, les copies du gène d'origine dans chacune des deux nouvelles espèces sont dites orthologues. Ce terme a été introduit en 1970 par le spécialiste en évolution moléculaireWalter M. Fitch(en)[2].
L'orthologie est strictement définie par l'existence d'un ancêtre commun. Dans la mesure où il est difficile d'établir l'ascendance exacte des gènes en raison des duplications et des réarrangements de génomes qui surviennent au cours des générations, la preuve que deux gènes sont orthologues provient généralement d'études phylogénétiques reprenant les lignées de gènes. Les protéines orthologues partagent le plus souvent — mais pas toujours — la même fonction physiologique dans les cellules[3].
Des séquences homologues sont paralogues si on pense qu'elles ont divergé à la suite d'une duplication de gènes. Deux gènes paralogues peuvent être présents dans plusieurs endroits du génome d'une même espèce ou entre plusieurs espèces. Ainsi, l'hémoglobinehumaine et la myoglobine du chimpanzé sont paralogues.
Les gènes paralogues peuvent structurer des génomes entiers et ainsi expliquer largement l'évolution des génomes. C'est par exemple le cas des boîtes homéotiques comme les gènes Hox chez les animaux. Ces gènes n'ont pas seulement connu des duplications sur leur chromosome mais également à travers l'ensemble du génome, raison pour laquelle ils se retrouvent sur de nombreux chromosomes chez les vertébrés, les clusters HoxA-D étant les plus étudiés[4].
On dit souvent que les orthologues présentent davantage de similitudes fonctionnelles que les paralogues à similitude séquentielle comparable, mais plusieurs publications remettent en cause cette conception[5],[6].
↑(en) Walter M. Fitch, « Distinguishing Homologous from Analogous Proteins », Systematic Biology, vol. 19, no 2, , p. 99-113 (PMID5449325, DOI10.2307/2412448, lire en ligne)
↑(en) Gang Fang, Nitin Bhardwaj, Rebecca Robilotto et Mark B. Gerstein, « Getting Started in Gene Orthology and Functional Analysis », PLoS Computational Biology, vol. 6, no 3, , article no e1000703 (PMID20361041, PMCID2845645, DOI10.1371/journal.pcbi.1000703, lire en ligne)
↑(en) Jozsef Zakany et Denis Duboule, « The role of Hox genes during vertebrate limb development », Current Opinion in Genetics & Development, vol. 17, no 4, , p. 359-366 (PMID17644373, DOI10.1016/j.gde.2007.05.011, lire en ligne)
↑(en) Romain A. Studer et Marc Robinson-Rechavi, « How confident can we be that orthologs are similar, but paralogs differ? », Trends in Genetics, vol. 25, no 5, , p. 210-216 (PMID19368988, DOI10.1016/j.tig.2009.03.004, lire en ligne)
↑(en) Nathan L. Nehrt, Wyatt T. Clark, Predrag Radivojac et Matthew W. Hahn, « Testing the Ortholog Conjecture with Comparative Functional Genomic Data from Mammals », PLoS Computational Biology, vol. 7, no 6, , article no e1002073 (PMID21695233, DOI10.1371/journal.pcbi.1002073, Bibcode3111532, lire en ligne)