Reconnaissance de l'écriture manuscrite

La reconnaissance de l’écriture manuscrite (en anglais, handwritten text recognition ou HTR) est un traitement informatique qui a pour but de traduire un texte écrit en un texte codé numériquement.

Il faut distinguer deux reconnaissances distinctes, avec des problématiques et des solutions différentes :

  1. la reconnaissance en-ligne ;
  2. la reconnaissance hors-ligne.
Reconnaissance en-ligne et hors-ligne.

La reconnaissance de l’écriture manuscrite fait appel à la reconnaissance de forme, mais également au traitement automatique du langage naturel. Cela veut dire que le système, tout comme le cerveau humain, reconnaît des mots et des phrases existant dans un langage connu plutôt qu’une succession de caractères. Ceci améliore grandement la robustesse.

Reconnaissance hors-ligne

La reconnaissance hors-ligne travaille sur un instantané d’encre numérique (sur une image). C’est le cas notamment de la reconnaissance optique de caractères. Dans ce contexte, il est impossible de savoir comment ont été tracés les différents motifs. Il est seulement possible d’extraire des formes à partir de l’image, en s’appuyant sur les technologies de reconnaissance de forme.

C’est le type de reconnaissance privilégié pour les traitements asynchrones[Quoi ?], tels que la lecture de chèques bancaires ou le tri postal.

Reconnaissance en-ligne

Dans le cadre de la reconnaissance en-ligne, l’échantillon d’encre est constitué d’un ensemble de coordonnées ordonnées dans le temps. Il est ainsi possible de suivre le tracé, de connaître les posés et levés de stylo et éventuellement l’inclinaison et la vitesse. Il faut évidemment un matériel spécifique pour saisir un tel échantillon, c’est le cas notamment des stylos numériques ou des stylets sur agendas électroniques ou sur les tablettes tactiles.

La reconnaissance en-ligne est généralement beaucoup plus efficace que la reconnaissance hors-ligne car les échantillons sont beaucoup plus informatifs. En revanche, elle nécessite un matériel beaucoup plus coûteux et impose de fortes contraintes au scripteur puisque la capture de l’encre doit se faire au moment de la saisie (capture synchrone) et non a posteriori (capture asynchrone).

Les techniques usitées peuvent avoir un champ applicatif plus vaste permettant la reconnaissance de toute forme abstraite simple (cf. reconnaissance de formes, intelligence artificielle faible). Les systèmes actuels (en 2005) procèdent majoritairement par une comparaison de l’échantillon à reconnaître avec ceux contenus dans une base de données. Cette base de données peut être créée de toutes pièces ou être l’objet d’une phase d’apprentissage.

Les techniques de comparaison reposent généralement sur des méthodes statistiques simples pour gagner en vitesse de traitement. La conséquence est que le nombre de formes reconnaissables doit être limité, sans quoi les résultats risquent d’être souvent erronés. En effet, toute la difficulté de la reconnaissance est d’évaluer la similarité entre une forme étudiée et chaque forme de la base de données (il est presque impossible qu’il y ait une correspondance exacte). Il suffit alors de choisir la forme la plus similaire. La reconnaissance idéale doit avoir la même évaluation de similarité que le cerveau, ce dont on se rapproche avec les réseaux de neurones. Mais les méthodes plus rapides (moins complexes) évalueront une similarité entachée d’erreur. Lorsqu’il y a peu de formes dans la base de données, bien séparées, la forme la plus similaire restera la même, et donc le résultat final sera juste. En augmentant la taille de la base des données, on « rapproche » nécessairement les formes modèles entre elles, et l’erreur sur la similarité peut plus facilement faire pencher la balance vers une mauvaise forme.

Exemple d'une méthode simple

Citons pour exemple la technique qui semblerait demeurer la plus simple, la plus facile et la plus rapide à implémenter en programmation informatique. Il s'agit d'une comparaison de la moyenne de la somme des segments reliant chaque points de la figure à son premier point. Ce mode de reconnaissance d'écriture induit que l'édition des figures soit vectorielle, donc, constituée de segments juxtaposés eux-mêmes constitués/limités par des points. Autrement dit, une figure n'est qu'un ensemble de points reliés entre eux et ayant leurs coordonnées sur un plan en deux dimensions.

  • On considère le premier point tracé comme étant le point de référence ; en quelque sorte, le centre de la figure autour duquel gravitent les autres points formant le nuage.
  • Pour s'abstraire des contraintes de considération de l'orientation et de l'unicité formelle du contour de la figure (la forme physique exacte), on ne prend en considération que la taille des segments/vecteurs reliant le point de référence à chacun des points satellites.
  • Pour ce faire, on utilise tout simplement le théorème de Pythagore.
  • On réduit donc la définition de la figure à la somme de tous ces segments, donc, à une longueur sur une seule dimension.
  • Pour s'abstraire de la contrainte de l'échelle (liée au contexte physique) et d'autres contraintes (liées aux technologies d'acquisition utilisées), on procède à la moyenne de la longueur en la divisant par le nombre de points satellites.
  • On n'obtient ainsi qu'une seule valeur à comparer avec celles mémorisées dans la base de données.
  • La comparaison se devant d'être approximative, une tolérance doit être définie soit par l'utilisateur, soit de manière automatique en fonction du nombre de figures que le système doit pouvoir reconnaître.

Reconnaissance de forme

La reconnaissance de forme joue un rôle très important dans la reconnaissance de l’écriture (manuscrite/imprimée) à deux niveaux :

Extraction de graphème

La reconnaissance de forme s’applique sur un motif. Il faut donc en premier lieu séparer les différents motifs composant les mots (lettres, chiffres, symboles…) avant de les reconnaître.

Sur l’exemple suivant, les différents points de séparation possibles sont annotés.

Segmentation d’un échantillon d’encre numérique en graphème.
Segmentation d’un échantillon d’encre numérique en graphème.

Il est évident que toutes les segmentations ne sont pas correctes et que seules certaines doivent être conservées. Il existe donc une ambiguïté qu’il faut lever pour optimiser la reconnaissance.

Reconnaissance de motifs

À partir des graphèmes extraits précédemment, la reconnaissance de forme permet d’obtenir les différents motifs la composant. La reconnaissance de motifs va également assister l’extraction de graphèmes en écartant une partie des segmentations impossible. Ainsi, plus la reconnaissance de motif est efficace et plus la segmentation l’est. De la même façon, une segmentation efficace conduit nécessairement à une meilleure reconnaissance. Il faut segmenter pour reconnaître, et reconnaître pour segmenter.

Assistance du modèle de langage

Il reste beaucoup d’ambiguïtés après les opérations de segmentation et de reconnaissance. Le traitement du langage intervient à ce niveau en écartant les solutions les moins probables, d’un point de vue linguistique.

Assistance du modèle de langage pour trancher entre plusieurs solutions de la segmentation et de la reconnaissance.
Assistance du modèle de langage pour trancher entre plusieurs solutions de la segmentation et de la reconnaissance.

Dans l’exemple précédent, les étapes de segmentations et de reconnaissance de forme ont conduit aux choix « lrj » ou « by ». Le modèle de langage (parfois un simple dictionnaire) choisira vraisemblablement la solution « by » en fonction de la langue. Le modèle de langage peut-être beaucoup plus complexe et reconnaître par exemple des suites de formes (n-grammes). Ainsi « Il est » sera préféré à « Ils ont » en cas d’ambiguïté.

Collaboration des traitements

Le déroulement de la reconnaissance n’est pas linéaire : les différents traitements apportant à chaque fois un peu plus d’information sur les solutions probables, il peut être intéressant de reprendre une étape à partir des informations fournies par un traitement précédent pour affiner le résultat. Il y a ainsi une collaboration des différents traitements pour augmenter la fiabilité de la reconnaissance.

A priori sur le langage

Quel que soit le type de reconnaissance de l’écriture, l’affinage du modèle de langage est la clé de l’optimisation. En effet, pour garantir de bons résultats il faut plutôt voir le traitement comme faire un choix de solution(s) parmi un ensemble de choix proposé a priori plutôt que de chercher à « deviner », à partir de la forme, ce que le scripteur a voulu écrire. Chercher à reconnaître un texte sans aucune information est à ce jour très difficile, alors que chercher à reconnaître le même texte si l’on connaît la langue employée et le registre (prise de note, texte « correct », SMS) est beaucoup plus efficace.

De cette façon, la technologie est suffisamment avancée pour permettre de reconnaître très rapidement et avec une excellente fiabilité l’adresse sur une enveloppe : le système ne cherche pas à reconnaître au hasard une information, mais à extraire un code postal (par exemple, en France : 5 chiffres) parmi tous ceux qu’il connaît. Un nouveau tri par quartier est alors possible : le système cherchera à extraire la rue parmi celles qu’il connaît pour ce code postal…

À titre d’analogie, il est possible pour un être humain de comprendre l’intégralité d’une phrase même lorsqu’une partie est bruité, par exemple le lecteur parviendra sans aucun doute à comprendre la phrase bruitée suivante : « je suis allé au ci**** voir un film », grâce au contexte posé par le reste de la phrase. Ce contexte donne un a priori sur le mot bruité à reconnaître.

Notes et références

Annexes

Bibliographie

Articles connexes

Read other articles:

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Patrick TumewuLahirPatrick Tumewu27 Februari 1994 (umur 30)Jakarta, IndonesiaKebangsaanIndonesiaPekerjaanPenyanyi Patrick Tumewu (lahir 27 Februari 1994[1]) adalah seorang penyanyi berkebangsaan Indonesia.[2] Ia dikenal setelah me...

 

2013 AAA 400 Race details Race 29 of 36 in the 2013 NASCAR Sprint Cup Series Jimmie Johnson won the raceDate September 29, 2013 (2013-09-29)Location Dover International Speedway in Dover, DelawareCourse Permanent racing facility1 mi (1.6 km)Distance 400 laps, 400 mi (643.737 km)Weather Partly cloudy with a high of 71 °F (22 °C), NE winds up to 12 miles per hour (19 km/h)[1]Pole positionDriver Dale Earnhardt Jr. Hendrick MotorsportsTime 22.243 secondsMos...

 

Sanskrit grammarian ŚākaṭāyanaPersonalBorn814 BCEDied760 BCEReligionHinduism Part of a series onJainism Jains History Timeline Index Philosophy Anekantavada Cosmology Ahimsa Karma Dharma Mokṣa Kevala Jnana Dravya Tattva Brahmacarya Aparigraha Gunasthana Saṃsāra EthicsEthics of Jainism Mahavratas (major vows) Ahiṃsā (non-violence) Satya (truth) Asteya (non-stealing) Brahmacarya (chastity) Aparigraha (non-possession) Anuvratas (further vows) Sāmāyika Sallekhana Jain prayers Bhakt...

2014 Russian crewed spaceflight to the ISS Soyuz TMA-13MSoyuz TMA-13M docked to the ISS, flying above California and Nevada.OperatorRoskosmosCOSPAR ID2014-031A SATCAT no.39775Mission duration165 days, 8 hours, 1 minute Spacecraft propertiesSpacecraftSoyuz 11F732A47 No.713Spacecraft typeSoyuz-TMA 11F747ManufacturerRKK EnergiaLaunch mass305,000 Kilograms CrewCrew size3MembersMaksim SurayevGregory R. WisemanAlexander GerstCallsignCepheus Start of missionLaunch date28 May 2014, 19:57:41 (201...

 

Ice hockey player, coach, general manager Ice hockey player Sheldon Keefe Keefe in 2018Born (1980-09-17) September 17, 1980 (age 43)Brampton, Ontario, CanadaHeight 5 ft 10 in (178 cm)Weight 185 lb (84 kg; 13 st 3 lb)Position Right wingShot RightPlayed for Tampa Bay LightningCurrent NHL coach Toronto Maple LeafsNHL Draft 47th overall, 1999Tampa Bay LightningPlaying career 2000–2004Coaching career 2006–present Sheldon Keefe (born September 17,...

 

Season of television series The X FactorSeason 5Hosted byLuke JacobzJudges Redfoo Dannii Minogue Natalie Bassingthwaighte Ronan Keating WinnerDami ImWinning mentorDannii MinogueRunner-upTaylor Henderson ReleaseOriginal networkSeven NetworkOriginal release29 July (2013-07-29) –28 October 2013 (2013-10-28)Season chronology← PreviousSeason 4Next →Season 6 The X Factor was an Australian television reality music competition, based on the original UK series, to find ...

American college football season 1963 Ohio State Buckeyes footballConferenceBig Ten ConferenceRecord5–3–1 (4–1–1 Big Ten)Head coachWoody Hayes (13th season)MVPMatt SnellCaptains Ormonde Ricketts Matt Snell Home stadiumOhio StadiumSeasons← 19621964 → 1963 Big Ten Conference football standings vte Conf Overall Team W   L   T W   L   T No. 3 Illinois $ 5 – 1 – 1 8 – 1 – 1 No. 9 Michigan State 4 – 1 – ...

 

فيه ما فيهمعلومات عامةالمؤلف جلال الدين الرومي اللغة الفارسية العنوان الأصلي فیهِ ما فیهِ (بالفارسية) تعديل - تعديل مصدري - تعديل ويكي بيانات مخطوطة باسم منتخب فیه ما فیه في مكتبة جامعة براتيسلافا. فیه ما فیه هي أحد آثار جلال الدين الرومي، وهي مجموعة من التعليقات والمناقشات...

 

This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Katsuragisan Ropeway – news · newspapers · books · scholar · JSTOR (July 2015) (Learn how and when to remove this message) Katsuragisan Ropeway葛城山ロープウェイKatsuragisan RopewayOverviewKatsuragi Ropeway Line (葛城索道線)StatusOperationalCharacterRecreationalSys...

Single by Tom Waits For the song about Tom Dooley, see Tom Dooley (song). Hang Down Your HeadSingle by Tom Waitsfrom the album Rain Dogs B-sideTango Till They're SoreReleased1985 (1985)Recorded1985 (1985) at RCA Studios, NYCGenreFolk rock[1]Length2:32LabelIslandSongwriter(s)Kathleen Brennan, Tom WaitsProducer(s)Tom WaitsTom Waits singles chronology Jockey Full of Bourbon (1985) Hang Down Your Head (1985) Downtown Train (1985) Hang Down Your Head is a song by Tom Waits appear...

 

Bilateral relationsJapanese-Liechtensteiner relations Japan Liechtenstein EnvoyAmbassador Botschafter Fujiyama[1]Ambassador Andreas Baum[2]Foreign relations exist between Japan and Liechtenstein. Both countries established diplomatic relations in June 1996.[3] Since then, the relations between the two countries have been stable. Japan does not have an embassy in Liechtenstein, but there is a honorary consulate located in Schaan. The Japanese ambassador to Switzerland, ...

 

Suriname avvolta dalla bandiera arcobaleno Nel paese l'omosessualità non è perseguita ma le persone LGBT godono di poche tutele e le coppie formate da persone dello stesso sesso non hanno nessun riconoscimento legale. Indice 1 Leggi relative all'omosessualità 2 Riconoscimento delle relazioni tra persone dello stesso sesso 3 Protezioni contro la discriminazione 4 Opinione pubblica 5 Tabella riassuntiva 6 Note Leggi relative all'omosessualità L'omosessualità è legale in Suriname dal 1858....

Head of state of Afghanistan Supreme Leader of the Islamic Emirate of Afghanistanد افغانستان د اسلامي امارت مشر (Pashto)Də Afġānistān Islāmī Imārat Damshīrرهبر امارت اسلامی افغانستان (Dari)Rahbar-e Imārat-i Islāmī-yi AfghānistānEmblem of AfghanistanIncumbentHibatullah Akhundzadasince 15 August 2021In exile from 25 May 2016Leadership of the Islamic EmirateStyle Amir al-Mu'minin His Excellency[1] His Highness&#...

 

Archangel in Islam; sometimes identified with Raphael For the angel by this name in the anime Neon Genesis Evangelion, see List of Angels in Neon Genesis Evangelion § Israfel. For the poem by Edgar Allan Poe, see Poems by Edgar Allan Poe § Israfel (1831). Israfel blows a nafir in Zakariya al-Qazwini's The Wonders of Creation (1570s).Part of a series onIslam Beliefs * Oneness of God * Angels * Revealed Books * Prophets * Day of Resurrection * Predestination Practices * Profession o...

 

بادغان إسلامي إمام رضا تقسيم إداري البلد إيران  إحداثيات 37°20′58″N 46°10′23″E / 37.349444444444°N 46.173055555556°E / 37.349444444444; 46.173055555556   تعديل مصدري - تعديل   بادغان إسلامي إمام رضا هي قرية في مقاطعة مراغة، إيران. عدد سكان هذه القرية هو 3,361 في سنة 2006.[1] مراجع ^ تعداد سكان...

Ordine dell'Eroe nazionale di Antigua e BarbudaMost Exalted Order of the National Hero Re di Antigua e BarbudaTipologiaOrdine cavalleresco statale Statusattivo CapoCarlo III del Regno Unito CancelliereLouise Lake-Tack IstituzioneSaint John's, 31 dicembre 1998 Primo capoElisabetta II del Regno Unito PrecedenzaOrdine più altonessuno Ordine più bassoOrdine della Nazione Nastrino dell'Ordine Modifica dati su Wikidata · Manuale L'Ordine dell'Eroe Nazionale è la prima tra le onorificenze d...

 

Position within the White House Office White House National Climate AdvisorIncumbentAli Zaidisince September 16, 2022Executive Branch of the U.S. GovernmentExecutive Office of the PresidentAppointerThe PresidentDeputyMary Repko The White House Office of Domestic Climate Policy (also known as the Climate Policy Office) is an office within the White House Office that is part of the Executive Office of the President of the United States. It is headed by the Assistant to the President and Na...

 

В Википедии есть статьи о других людях с такой фамилией, см. Алпатов; Алпатов, Михаил. Михаил Антонович Алпатов Дата рождения 7 (20) ноября 1903 Место рождения Сибилев, станица Митякинская, Донецкий округ, область Войска Донского Дата смерти 17 декабря 1980(1980-12-17)[1] (77 ...

Disambiguazione – Se stai cercando il significato terapeutico del magnetismo, vedi mesmerismo. Le linee di forza di un campo magnetico generato da una calamita (evidenziate cospargendo della limatura di ferro su un foglio di carta appoggiato alla calamita). In fisica il magnetismo è quel fenomeno per cui alcuni materiali sono in grado di attrarre il ferro nonché trasmettere tale capacità ad altri materiali. Per estensione semantica, il magnetismo è anche la branca della fisica concerne...

 

1814 historical novel by Walter Scott Waverley; or, ’Tis Sixty Years Since First Edinburgh editionAuthorWalter ScottLanguageEnglish, Lowland Scots; some Scottish Gaelic and FrenchSeriesWaverley novelsGenreHistorical novelSet inScotland, 1745–46PublisherArchibald Constable & Co. (Edinburgh); Longman, Hurst, Rees, Orme, and Brown (London)Publication date7 July 1814[1]Publication placeScotlandMedia typePrintPages365 (Edinburgh Edition, 2007)Dewey Decimal823.7LC Cla...