Les protéines PPR (pour pentatricopeptide repeat) sont des protéines possédant plusieurs motifs dégénérés d’environ 35 acides aminés, appelés motifs PPR[1]. Cette famille de protéines est très présente chez les Eucaryotes, particulièrement chez les Embryophytes. Les protéines PPR se distinguent par la présence de plusieurs motifs PPR (de 2 à 30) répétés en tandem. Les protéines PPR sont capables de lier des ARN de façon séquence spécifique.
Évolution des Protéines PPR
Les protéines PPR sont très proches des protéines TPR (pour tetratricopeptide repeat), une autre famille de protéines présente chez les Eucaryotes et les Procaryotes. Ces protéines interagissent avec d’autres protéines et possèdent un motif dégénéré de ~ 34 acides aminés, similaire à celui des protéines PPR. La distinction entre ces deux familles de protéines a été réalisée en 2000 à la suite des travaux de Small et Peeters[1] en se basant sur la différence de consensus des motifs et a permis de proposer une fonction différente en ce qui concerne leurs ligands.
On trouve des PPR chez tous les organismes eucaryotes. Il est proposé qu’elles seraient apparues chez le premier ancêtre commun des Eucaryotes par évolution à partir des protéines TPR. Néanmoins, des PPR ont été identifiées chez quelques organismes procaryotes comme des bactéries (par exemple Erwinia amylovora). L’hypothèse d’un transfert horizontal serait la plus plausible pour expliquer ces cas particuliers[2].
Même si elles sont présentes et très conservées chez les eucaryotes, on observe une disparité dans leur distribution entre les différentes familles. Ci-dessous est indiqué, le nombre de protéines PPR identifiées dans quelques espèces représentatives.
On observe une expansion du nombre de gènes codants des protéines PPR chez les Embryophytes. L’expansion serait apparue lors de la séparation des Embryophytes et des Algues vertes[9].
Structure et famille
La structure tertiaire des motifs PPR a été caractérisée par cristallographie. Chaque motif PPR est formé de deux hélices α anti-parallèles (hélice-coude-hélice). L’ensemble de ces motifs se replie en une super-hélice[10],[11].
Le motif PPR est un motif dégénéré de 35 acides aminés. Le motif canonique est appelé le motif P (pour pure). Il existe deux motifs variants dérivés du motif P, les motifs S (pour short, de 31 acides aminés) et L (pour long, de 35-36 acides aminés)[12].
L’agencement de ces différents motifs en tandem définit les deux principales sous-familles de protéines PPR, notées P et PLS[13],[2].
Sous-famille P
Les protéines PPR de la sous-famille P ne contiennent que des motifs P[14].
Sous-famille PLS
Les protéines de la sous-famille PLS consistent en un enchaînement régulier de motifs P, L puis S. Les protéines PLS possèdent aussi parfois d'autres domaines que l’on retrouve dans leur région C-terminale : les domaines E1, E2, E+ et DYW (selon la définition de Cheng et al[5]).
La famille PLS est ainsi subdivisée en 4 sous-groupes (selon le domaine C-terminal): PPR-E1, PPR-E2, PPR-E+ et DYW
Rôles des Protéines PPR
L'immense majorité des protéines PPR est codée dans le noyau puis adressée aux organites à génomes des cellules eucaryotes (mitochondries et plastes) où elles assurent leur fonction en se fixant aux ARN simples brins de façon séquence spécifique.
Le Code PPR ou base moléculaire de l’interaction PPR-ARN
Les mécanismes moléculaires impliqués dans la reconnaissance des ARN par les protéines PPR ont beaucoup été étudiés et il a été montré que :
Seuls les motifs PPR seraient impliqués dans la reconnaissance[15],[14].
La reconnaissance se fait avec une orientation parallèle des molécules (la région N-terminale de la protéine lie à la région 5’ du site de liaison de l’ARN tandis que la région C-terminale interagit avec la région 3’)[16].
Chaque motif PPR reconnait l’ARN cible en formant des liaisons hydrogène avec les nucléotides[17],[18],[19].
Les découvertes les plus récentes suggèrent que la fixation protéine PPR/ARN est principalement déterminée par les acides aminés (AA) 5 et 35 du motif PPR[20],[21],[22],[23],[24] (en suivant la nomenclature de Yin et al.[25]) et que chaque motif PPR reconnaîtrait un acide nucléique de l’ARN. Plusieurs équipes ont tenté de déchiffrer ce code (appelé code PPR), aboutissant à des résultats intéressants. Un modèle probabiliste est proposé pour expliquer ce code. Les combinaisons T5N35 et T5D35 vont préférentiellement fixer les purines (Adénine et Guanine) alors que les combinaisons N5D35, N5N35 et N5S35 vont fixer préférentiellement les pyrimidines (Cytosine et Uracile).
Quelques combinaisons d'AA et nucléotides associés
AA position 5
AA position 35
Nucléotide (ordre de préférence)
Thréonine (T)
Asparagine (N)
Adénine >>> Guanine, Cytosine, Uracile
Thréonine (T)
Aspartate (D)
Guanine >>> Adénine, Cytosine, Uracile
Asparagine (N)
Aspartate (D)
Uracile > Cytosine>>> Adénine, Guanine
Asparagine (N)
Asparagine (N)
Cytosine = Uracile >>> Adénine, Guanine
Asparagine (N)
Sérine (S)
Cytosine > Uracile >>> Adénine, Guanine
Si le code est plus ou moins connu aujourd’hui, il demeure, toutefois, particulièrement compliqué de prédire quel ARN va être fixé par une protéine PPR tant le code est dégénéré[26]. En effet, il a été montré que différentes combinaisons d’acides aminés peuvent reconnaître le même nucléotide, alors que la même combinaison d’acides aminés peut reconnaître des nucléotides différents[17].
Fonctions moléculaires des Protéines PPR
La fonction canonique d’une protéine PPR est de fixer une molécule d’ARN. Une fois que la PPR s’est fixée sur son ARN cible, il est souvent suggéré qu’elle recrute d'autres protéines dans la cellule[27]. Selon les acteurs recrutés, l’effet sur l’ARN ne sera pas le même. Les PPR influencent ainsi l'expression des gènes dans les mitochondries et chloroplastes en régulant le devenir des ARN[28].
Les domaines E1 et E2 sont tous les deux composés d’environ 34 acides aminés. Des études suggèrent que ces domaines n’auraient pas d’activité catalytique, mais qu’ils seraient impliqués dans des interactions de type protéine-protéine[14],[29].
Le domaine DYW est composé de 136 acides aminés. Le nom de ce domaine vient de ses trois acides aminés C-terminaux qui sont très conservés (Aspartate-Tyrosine-Tryptophane). Le domaine DYW possède des similarités avec les cytidines désaminases, des enzymes qui catalysent la désamination de cytidines libres en uridines[30]. L’activité cytidine désaminase du domaine DYW, longtemps suggérée sans être prouvée[31],[32] n’a été démontrée que très récemment[33],[34].
On constate que généralement, les PPR de type P sont impliquées dans des processus comme la stabilisation, la traduction et l’épissage des ARN[35],[36] alors que les PPR de type PLS sont impliquées principalement dans l’édition des ARN[37].
Même si les cibles des PPR, ainsi que leur mode d’action, sont peu connus aujourd’hui, l’hypothèse que ce sont des régulateurs nucléaires de l’expression génétique des organites au niveau post-transcriptionnel est largement admise.
Des études ont montré que la mutation de certaines PPR mitochondriales est associée à un défaut de développement embryonnaire ou de stérilité mâle cytoplasmique (CMS) chez les plantes[38]. D’autres études ont pu montrer que la variante canadienne-française du syndrome de Leigh(en), un trouble neurodégénératif chez l’homme, est associée à la mutation dans le gène codant une PPR, LRPPRC (pour leucine rich pentatricopeptide repeat cassette)[39].
Applications en biotechnologies
Les protéines PPR jouent un rôle important dans la régulation post-transcriptionnelle des gènes exprimés dans les organites. L’interaction PPR-ARN, au cœur de cette régulation, fait aujourd’hui l’objet d’un grand intérêt d’un point de vue biotechnologique. Depuis les premières découvertes mettant en évidence les bases moléculaires de cette interaction, des chercheurs ont envisagé la possibilité d’exploiter les propriétés de liaison des PPR aux ARN pour créer des outils biotechnologiques visant à contrôler l’expression de certains gènes. Deux procédés sont utilisés. Le premier consiste à synthétiser de nouvelles PPR comme les cPPR (pour consensus PPR sequences) capable de lier des ARN d’intérêt[40] Le second consiste à modifier des PPR déjà existantes. PPR10, une PPR de maïs, a été modifiée dans le but de guider sa fixation à un ARN d’intérêt[17].
L’interaction entre la PPR et l’ARN peut avoir plusieurs conséquences. Bien maîtrisée elle peut être utilisée pour induire ou réprimer l’expression d’un gène, natif ou transgénique, dans un organite. Dans une étude récente, la séquence de RFP2 (RNA PROCESSING FACTOR 2) a été modifiée pour bloquer l’expression du gène mitochondrial nad6 codant une sous-unité du complexe I de la chaîne respiratoire chez Arabidopsis thaliana[41]. Encore plus récemment, une approche qui consiste à modifier la PPR de maïs PPR10 a permis d'induire l’expression de transgènes dans les chloroplastes de Nicotiana tabacum[42].
↑ a et bI. D. Small et N. Peeters, « The PPR motif - a TPR-related motif prevalent in plant organellar proteins », Trends in Biochemical Sciences, vol. 25, , p. 46–47 (ISSN0968-0004, PMID10664580, lire en ligne, consulté le )
↑Kamil A. Lipinski, Olga Puchta, Vineeth Surendranath et Marek Kudla, « Revisiting the yeast PPR proteins--application of an Iterative Hidden Markov Model algorithm reveals new members of the rapidly evolving family », Molecular Biology and Evolution, vol. 28, no 10, , p. 2935–2948 (ISSN1537-1719, PMID21546354, DOI10.1093/molbev/msr120, lire en ligne, consulté le )
↑ a et b(en) Shifeng Cheng, Bernard Gutmann, Xiao Zhong et Yongtao Ye, « Redefining the structural motifs that determine RNA binding and RNA editing by pentatricopeptide repeat proteins in land plants », The Plant Journal, vol. 85, no 4, , p. 532–547 (ISSN1365-313X, DOI10.1111/tpj.13121, lire en ligne, consulté le )
↑Kamel Hammani, Géraldine Bonnard, Ayoub Bouchoucha et Anthony Gobert, « Helical repeats modular proteins are major players for organelle gene expression », Biochimie, vol. 100, , p. 141–150 (ISSN1638-6183, PMID24021622, DOI10.1016/j.biochi.2013.08.031, lire en ligne, consulté le )
↑(en) Claire Lurin, Charles Andrés, Sébastien Aubourg et Mohammed Bellaoui, « Genome-Wide Analysis of Arabidopsis Pentatricopeptide Repeat Proteins Reveals Their Essential Role in Organelle Biogenesis », The Plant Cell, vol. 16, no 8, , p. 2089–2103 (ISSN1040-4651 et 1532-298X, PMID15269332, PMCIDPMC519200, DOI10.1105/tpc.104.022236, lire en ligne, consulté le )
↑ ab et cKenji Okuda, Fumiyoshi Myouga, Reiko Motohashi et Kazuo Shinozaki, « Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing », Proceedings of the National Academy of Sciences of the United States of America, vol. 104, no 19, , p. 8178–8183 (ISSN0027-8424, PMID17483454, PMCID1876591, DOI10.1073/pnas.0700865104, lire en ligne, consulté le )
↑(en) Maricela Ramos‐Vega, Arturo Guevara‐García, Ernesto Llamas et Nidia Sánchez‐León, « Functional analysis of the Arabidopsis thaliana CHLOROPLAST BIOGENESIS 19 pentatricopeptide repeat editing protein », New Phytologist, vol. 208, no 2, , p. 430–441 (ISSN1469-8137, DOI10.1111/nph.13468, lire en ligne, consulté le )
↑Ping Yin, Quanxiu Li, Chuangye Yan et Ying Liu, « Structural basis for the modular recognition of single-stranded RNA by PPR proteins », Nature, vol. 504, no 7478, , p. 168–171 (ISSN1476-4687, PMID24162847, DOI10.1038/nature12651, lire en ligne, consulté le )
↑(en) Cuicui Shen, Delin Zhang, Zeyuan Guan et Yexing Liu, « Structural basis for specific single-stranded RNA recognition by designer pentatricopeptide repeat proteins », Nature Communications, vol. 7, no 1, , p. 1–8 (ISSN2041-1723, PMID27088764, PMCIDPMC4837458, DOI10.1038/ncomms11285, lire en ligne, consulté le )
↑James J. McDermott, Bryce Civic et Alice Barkan, « Effects of RNA structure and salt concentration on the affinity and kinetics of interactions between pentatricopeptide repeat proteins and their RNA ligands », PloS One, vol. 13, no 12, , e0209713 (ISSN1932-6203, PMID30576379, PMCID6303017, DOI10.1371/journal.pone.0209713, lire en ligne, consulté le )
↑Yusuke Yagi, Shimpei Hayashi, Keiko Kobayashi et Takashi Hirayama, « Elucidation of the RNA recognition code for pentatricopeptide repeat proteins involved in organelle RNA editing in plants », PloS One, vol. 8, , e57286 (ISSN1932-6203, PMID23472078, PMCID3589468, DOI10.1371/journal.pone.0057286, lire en ligne, consulté le )
↑Sandrine Coquille, Aleksandra Filipovska, Tiongsun Chia et Lional Rajappa, « An artificial PPR scaffold for programmable RNA recognition », Nature Communications, vol. 5, , p. 5729 (ISSN2041-1723, PMID25517350, DOI10.1038/ncomms6729, lire en ligne, consulté le )
↑Ping Yin, Quanxiu Li, Chuangye Yan et Ying Liu, « Structural basis for the modular recognition of single-stranded RNA by PPR proteins », Nature, vol. 504, no 7478, , p. 168–171 (DOI10.1038/nature12651, lire en ligne)
↑(en) Margarita Rojas, Qiguo Yu, Rosalind Williams-Carrier et Pal Maliga, « Engineered PPR proteins as inducible switches to activate the expression of chloroplast transgenes », Nature Plants, vol. 5, no 5, , p. 505–511 (ISSN2055-0278, DOI10.1038/s41477-019-0412-1, lire en ligne, consulté le )
↑Eszter Bayer-Császár, Sascha Haag, Anja Jörg et Franziska Glass, « The conserved domain in MORF proteins has distinct affinities to the PPR and E elements in PPR RNA editing factors », Biochimica Et Biophysica Acta. Gene Regulatory Mechanisms, vol. 1860, no 8, , p. 813–828 (ISSN1874-9399, PMID28549935, DOI10.1016/j.bbagrm.2017.05.004, lire en ligne, consulté le )
↑(en) Naveenan Navaratnam et Rizwan Sarwar, « An Overview of Cytidine Deaminases », International Journal of Hematology, vol. 83, no 3, , p. 195–200 (ISSN1865-3774, DOI10.1532/IJH97.06032, lire en ligne, consulté le )
↑(en) Masato Uchida, Shotaro Ohtani, Mizuho Ichinose et Chieko Sugita, « The PPR-DYW proteins are required for RNA editing of rps14 , cox1 and nad5 transcripts in Physcomitrella patens mitochondria », FEBS Letters, vol. 585, no 14, , p. 2367–2371 (DOI10.1016/j.febslet.2011.06.009, lire en ligne, consulté le )
↑(en) Véronique Salone, Mareike Rüdinger, Monika Polsakiewicz et Beate Hoffmann, « A hypothesis on the identification of the editing enzyme in plant organelles », FEBS Letters, vol. 581, no 22, , p. 4132–4138 (DOI10.1016/j.febslet.2007.07.075, lire en ligne, consulté le )
↑(en) Bastian Oldenkott, Yingying Yang, Elena Lesch et Volker Knoop, « Plant-type pentatricopeptide repeat proteins with a DYW domain drive C-to-U RNA editing in Escherichia coli », Communications Biology, vol. 2, no 1, , p. 1–8 (ISSN2399-3642, PMID30854477, PMCIDPMC6397227, DOI10.1038/s42003-019-0328-3, lire en ligne, consulté le )
↑(en) Michael L. Hayes et Paola I. Santibanez, « A plant pentatricopeptide repeat protein with a DYW-deaminase domain is sufficient for catalyzing C-to-U RNA editing in vitro », Journal of Biological Chemistry, vol. 295, no 11, , p. 3497–3505 (ISSN0021-9258 et 1083-351X, PMID31996373, PMCIDPMC7076202, DOI10.1074/jbc.RA119.011790, lire en ligne, consulté le )
↑(en) Charles Andrés, Claire Lurin et Ian D. Small, « The multifarious roles of PPR proteins in plant mitochondrial gene expression », Physiologia Plantarum, vol. 129, , p. 14–22 (ISSN1399-3054, DOI10.1111/j.1399-3054.2006.00766.x, lire en ligne, consulté le )
↑Yusuke Yagi, Makoto Tachikawa, Hisayo Noguchi et Soichirou Satoh, « Pentatricopeptide repeat proteins involved in plant organellar RNA editing », RNA biology, vol. 10, no 9, , p. 1419–1425 (ISSN1555-8584, PMID23669716, PMCID3858424, DOI10.4161/rna.24908, lire en ligne, consulté le )
↑Zhonghua Wang, Yanjiao Zou, Xiaoyu Li et Qunyu Zhang, « Cytoplasmic male sterility of rice with boro II cytoplasm is caused by a cytotoxic peptide and is restored by two related PPR motif genes via distinct modes of mRNA silencing », The Plant Cell, vol. 18, no 3, , p. 676–687 (ISSN1040-4651, PMID16489123, PMCID1383642, DOI10.1105/tpc.105.038240, lire en ligne, consulté le )
↑Vamsi K. Mootha, Pierre Lepage, Kathleen Miller et Jakob Bunkenborg, « Identification of a gene causing human cytochrome c oxidase deficiency by integrative genomics », Proceedings of the National Academy of Sciences of the United States of America, vol. 100, no 2, , p. 605–610 (ISSN0027-8424, PMID12529507, PMCIDPMC141043, DOI10.1073/pnas.242716699, lire en ligne, consulté le )
↑(en) Sandrine Coquille, Aleksandra Filipovska, Tiongsun Chia et Lional Rajappa, « An artificial PPR scaffold for programmable RNA recognition », Nature Communications, vol. 5, no 1, , p. 1–9 (ISSN2041-1723, DOI10.1038/ncomms6729, lire en ligne, consulté le )
↑(en) Catherine Colas des Francs-Small, Lilian Vincis Pereira Sanglard et Ian Small, « Targeted cleavage of nad6 mRNA induced by a modified pentatricopeptide repeat protein in plant mitochondria », Communications Biology, vol. 1, no 1, , p. 1–7 (ISSN2399-3642, PMID30320233, PMCIDPMC6181959, DOI10.1038/s42003-018-0166-8, lire en ligne, consulté le )
↑(en) Margarita Rojas, Qiguo Yu, Rosalind Williams-Carrier et Pal Maliga, « Engineered PPR proteins as inducible switches to activate the expression of chloroplast transgenes », Nature Plants, vol. 5, no 5, , p. 505–511 (ISSN2055-0278, DOI10.1038/s41477-019-0412-1, lire en ligne, consulté le )