Intelligibilité de la parole

L'intelligibilité de la parole est une mesure du taux de transmission de la parole, utilisée pour évaluer les performances de systèmes de télécommunication, de sonorisation, de salles, ou encore de personnes (généralement des locuteurs ou bien des auditeurs présentant des pathologies).

Historique

L’intelligibilité de la parole est une mesure apparue à la fin des années 1920 (Fletcher & Steinberg, 1929[1]), avec le besoin pour les ingénieurs d’évaluer différents systèmes de transmission téléphonique.

Types de mesures

Dans le domaine de l’acoustique, on distingue généralement trois types d’évaluation de l’intelligibilité de la parole (Houtgast & Steeneken, 2002[2]) :

  • les mesures subjectives, faisant appel à des locuteurs et des auditeurs ;
  • les mesures prédictives, se basant sur des paramètres physiques (du canal de transmission, des salles, des interlocuteurs, etc.) ;
  • les mesures objectives, effectuées à l’aide de signaux artificiels.

Les mesures subjectives se basent sur un protocole mettant en jeu un ou plusieurs locuteurs, et un ou plusieurs auditeurs. Les auditeurs sont soumis à différents stimuli verbaux (généralement des listes de mots ou de phrases), directement prononcés par les locuteurs ou bien pré-enregistrés. L’intelligibilité correspond alors au score obtenu par le jury (c'est-à-dire les auditeurs) dans les tâches qui suivent chaque stimulus, à savoir généralement la transcription de sons perçus ou la sélection d’unités – phonétiques ou lexicales – parmi plusieurs choix proposés. Le test aux syllabes de Fletcher & Steinberg[3], le test de time de Fairbanks[4], le test de rime modifiée[5] et le test de rime à visée diagnostique[6] sont des tests subjectifs d'intelligibilité de la parole.

Les mesures objectives et prédictives de l'intelligibilité de la parole permettent d'évaluer l'intelligibilité d'un système de télécommunication ou de sonorisation sans faire appel à des personnes jouant le rôle d'auditeurs. Les principales mesures objectives et prédictives sont l'indice d'articulation[7] (A.I.), l'indice d'intelligibilité de la parole[8] (S.I.I.) l'indice de transmission de la parole[2] (S.T.I.) et le niveau d'interférence avec la parole[9] (S.I.L.). Plus récemment, des mesures objectives de l'intelligibilité de la parole fondées sur l'utilisation de moteurs de reconnaissance automatique de la parole se développent, en particulier pour des applications liées à l'évaluation de performances de locuteurs (apprenants de langue étrangère présentant un accent[10],[11], locuteurs pathologiques[12],[13],[14]) ou d'auditeurs malentendants[15].

Notes et références

  1. Fletcher, H., & Steinberg, J. C. (1929). Articulation Testing Methods. Bell Syst. Tech. J., 8, 806-854.
  2. a et b Houtgast, T., & Steeneken, H. J. M. (2002). The roots of the STI approach. In S.J. van Wijngaarden (Ed.), Past, present and future of the Speech Transmission Index. Soesterberg (NL): TNO Human Factors.
  3. (en) Fletcher, H., & Steinberg, J. C., Articulation Testing Methods, Bell Syst. Tech. J., 8, , p. 806-854
  4. Fairbanks, G. (1958). Test of Phonemic Differentiation: The Rhyme Test. The Journal of the Acoustical Society of America, 30(7), 596-600.
  5. House, Williams, Hecker et Kryter (1965). Articulation Testing Methods : consonantal differentiation with a closed-response set, JASA, Vol. 37, n°1, pp. 158-166.
  6. Voiers (1983). Evaluating processed speech using the Diagnostic Rhyme Test, Speech Technology, janvier-février, pp. 30-39.
  7. French, N. R., & Steinberg, J. C. (1947). Factors Governing the Intelligibility of Speech Sounds. The Journal of the Acoustical Society of America, 19(1), 90-119.
  8. ANSI. (1997). ANSI S3.5-1997. American National Standard Methods for the Calculation of the Speech Intelligibility Index. New York.
  9. AFNOR. (2004). Norme NF EN ISO 9921 - Ergonomie - Evaluation de la communication parlée. Saint-Denis: Association Française de Normalisation.
  10. Sylvain Detey, Lionel Fontan et Thomas Pellegrini, « Traitement de la prononciation en langue étrangère : approches didactiques, méthodes automatiques et enjeux pour l’apprentissage [Diagnosing and correcting pronunciation errors in second language acquisition: from pedagogical approaches to computer-assisted methods] », TAL Traitement Automatique des Langues, vol. 57,‎ , p. 15–39 (lire en ligne, consulté le )
  11. Vincent Laborde, Thomas Pellegrini, Lionel Fontan et Julie Mauclair, Pronunciation Assessment of Japanese Learners of French with GOP Scores and Phonetic Information, (DOI 10.21437/Interspeech.2016-513, lire en ligne)
  12. Lionel Fontan, Thomas Pellegrini, Julia Olcoz et Alberto Abad, Predicting disordered speech comprehensibility from Goodness of Pronunciation scores, (DOI 10.18653/v1/W15-5108, lire en ligne)
  13. Thomas Pellegrini, Lionel Fontan, Julie Mauclair et Jérôme Farinas, « The Goodness of Pronunciation algorithm applied to disordered speech », Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH,‎ (lire en ligne, consulté le )
  14. Imed Laaridh, Christine Meunier et Corinne Fredouille, Dysarthric speech evaluation: automatic and perceptual approaches, (lire en ligne)
  15. (en) Lionel Fontan, Isabelle Ferrané, Jérôme Farinas et Julien Pinquier, « Automatic Speech Recognition Predicts Speech Intelligibility and Comprehension for Listeners With Simulated Age-Related Hearing Loss », Journal of Speech, Language, and Hearing Research, vol. 60, no 9,‎ , p. 2394–2405 (ISSN 1092-4388, DOI 10.1044/2017_JSLHR-S-16-0269, lire en ligne, consulté le )