Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos. Así, es posible interactuar con estos mediante un programa de edición de texto o similar.

En los últimos años la digitalización de la información (textos, imágenes, sonido, etcétera) ha devenido un punto de interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicios.

Problemas con el ROC

El proceso básico que se lleva a cabo en el ROC es convertir el texto que aparece en una imagen en un archivo de texto que podrá ser editado y utilizado como tal por cualquier otro programa o aplicación que lo necesite.

Partiendo de una imagen perfecta, es decir, una imagen con sólo dos niveles de gris, el reconocimiento de estos caracteres se realizará básicamente comparándolos con unos patrones o plantillas que contienen todos los posibles caracteres. Ahora bien, las imágenes reales no son perfectas, por lo tanto el ROC se encuentra con varios problemas:

  • El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.
  • La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.
  • La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.
  • La conexión de dos o más caracteres por píxeles comunes también puede producir errores.

Esquema básico de un algoritmo de ROC

Todos los algoritmos de ROC tienen la finalidad de poder diferenciar un texto de una imagen cualquiera. Para hacerlo se basan en cuatro etapas:

  1. Binarización o caracterización.
  2. Fragmentación o segmentación de la imagen.
  3. Adelgazamiento de los componentes.
  4. Comparación con patrones.

Binarización

La mayor parte de algoritmos de ROC parten como base de una imagen binaria (dos colores). Por lo tanto es conveniente convertir una imagen de escala de grises, o una de color, en una imagen en blanco y negro, de tal forma que se preserven las propiedades esenciales de la imagen. Una forma de hacerlo es mediante el histograma de la imagen, donde se muestra el número de píxeles para cada nivel de grises que aparece a la imagen. Para binarizarla tenemos que escoger un umbral adecuado, a partir del cual todos los píxeles que no lo superen se convertirán en negro y el resto en blanco.

Mediante este proceso obtenemos una imagen en blanco y negro donde quedan claramente marcados los contornos de los caracteres y símbolos que contiene la imagen. A partir de aquí podemos aislar las partes de la imagen que contienen texto (más transiciones entre blanco y negro).

Fragmentación o segmentación de la imagen

Este es el proceso más costoso y necesario para el posterior reconocimiento de caracteres. La segmentación de una imagen implica la detección mediante procedimientos de “etiquetado determinista” o estocástico de los contornos o regiones de la imagen, basándose en la información de intensidad o información espacial.

Permite la descomposición de un texto en diferentes entidades lógicas, que han de ser suficientemente invariables, para ser independientes del escritor, y suficientemente significativas para su reconocimiento.

No existe un método genérico para llevar a cabo esta segmentación de la imagen que sea lo suficientemente eficaz para el análisis de un texto. Aunque las técnicas más utilizadas son variaciones de los métodos basados en proyecciones lineales.

Una de las técnicas más clásicas y simples para imágenes de niveles de grises consiste en la determinación de los modos o agrupamientos (clústeres) a partir del histograma, de tal forma que permitan una clasificación o umbralización de los píxeles en regiones homogéneas.

Adelgazamiento de los componentes

Una vez aislados los componentes conexos de la imagen, se les tendrá que aplicar un proceso de adelgazamiento para cada uno de ellos. Este procedimiento consiste en ir borrando sucesivamente los puntos de los contornos de cada componente de forma que se conserve su tipología.

La eliminación de los puntos ha de seguir un esquema de barridos sucesivos para que la imagen continúe teniendo las mismas proporciones que la original y así conseguir que no quede deforme.

Se tiene que hacer un barrido en paralelo, es decir, señalar los píxeles borrables para eliminarlos todos a la vez. Este proceso se lleva a cabo para hacer posible la clasificación y reconocimiento, simplificando la forma de los componentes.

Comparación con patrones

En esta etapa, se comparan los caracteres obtenidos anteriormente con unos teóricos (patrones) almacenados en una base de datos. El buen funcionamiento del ROC se basa en gran medida en una buena definición de esta etapa.

Existen diferentes métodos para llevar a cabo la comparación. Uno de ellos es el método de proyección, en el cual se obtienen proyecciones verticales y horizontales del carácter por reconocer, y se comparan con el alfabeto de caracteres posibles hasta encontrar la máxima coincidencia.

Existen otros métodos, como por ejemplo:

Aplicaciones

Desde la aparición de los algoritmos de ROC, han sido muchos los servicios que han introducido estos procesos para aumentar su rendimiento y otros que se basan completamente en estas tecnologías. A continuación se muestran algunas de las más destacables aplicaciones que utilizan el ROC.

Reconocimiento de texto manuscrito

Las dificultades que podemos encontrar a la hora de reconocer un texto tipografiado, no se pueden comparar con las que aparecen cuando queremos reconocer un texto manuscrito. No todos escribimos de manera uniforme, y no todos escribimos de la misma forma. El reconocimiento de este tipos de textos continúa siendo un desafío. Para abordar este tipo de problemas se han desarrollado técnicas y aplicaciones específicas a las que se les llama Reconocimiento inteligente de caracteres o ICR (del inglés Intelligent Çharacter Recognition).

Aunque el texto se compone básicamente de caracteres individuales, la mayoría de algoritmos ROC no consiguen buenos resultados, ya que la segmentación de texto continuo es un procedimiento complejo.

En el caso de reconocimiento de escritura manuscrita a la hora de corrección de exámenes, existe la posibilidad, añadiendo un listado de léxico (nombres y apellidos) de acercarse al 100% de acierto. A través de las casillas de respuesta ICR se pueden reconocer palabras, como nombres de países, nombres de regiones, marcas comerciales, en resumen, todo aquello que pueda ser integrado en una lista de palabras (léxico), el cual puede ir aumentándose según las necesidades.

En el mundo real, a veces se puede llegar a comprender una frase cuando la hemos terminado de leer. Automatizar este proceso implica una operación de niveles morfológico, léxico y sintáctico que se consigue mediante el reconocimiento del habla continua. Para llevar a cabo esa metodología, se utilizan algoritmos robustos que usan una segmentación previa, debido a que se obtiene automáticamente con la descodificación.

Para facilitar el reconocimiento a veces la tecnología ICR requiere que en el documento se tengan recuadros dentro de los cuales se introducen los caracteres manuscritos, siendo obligatorio un carácter por recuadro. Habitualmente se utiliza para formularios que debemos rellenar a mano y tenemos que poner en letras mayúsculas.[1]

Reconocimiento de matrículas

Coche de policía en Dubái con una cámara instalada para el reconocimiento de matrículas

Una de las aplicaciones son los radares. Estos deben ser capaces de localizar una matrícula de un vehículo con condiciones de iluminación, perspectiva y entorno variables.

En la etapa de segmentación, se buscan texturas similares a la de una matrícula y se aísla el área rectangular que forma la matrícula.

Finalmente, se aplica un proceso de clasificación múltiple sobre el conjunto de píxeles pertenecientes a la matrícula, proporcionando una cadena de caracteres que se tienen que ajustar a un modelo conocido: el formato de una matrícula. Si aparece algún error, es corregido.


Indexación con bases de datos

Con el gran aumento de información publicada que ha tenido lugar en los últimos años, cada vez son más los métodos que se emplean para organizar todo este material almacenado en bases de datos. Uno de estos contenidos son las imágenes. Una de las formas más corrientes de buscar imágenes es a partir de metadatos introducidos manualmente por los usuarios. Actualmente han aparecido buscadores que proporcionan la posibilidad de buscar imágenes mediante el texto que aparecen en ellas, como el buscador DIRS (Document Image Retrieval System) que, mediante un algoritmo de ROC, extrae el texto que aparece en la imagen y lo utiliza como metadato que podrá servir para las búsquedas. Esta tecnología proporciona una posibilidad en la búsqueda de imágenes y demuestra que el ROC aún puede dar mucho de sí.

Reconocimiento de datos estructurados con ROC Zonal

Se usa para digitalizar de forma masiva grandes cantidades de documentos estructurados o semiestructurados (facturas, nóminas, albaranes, pólizas, justificantes bancarios, etcétera), catalogando automáticamente los documentos con los metadatos obtenidos y archivándolos en formato digital de forma indexada para facilitar su posterior búsqueda. Tiene el inconveniente de que es necesario diseñar previamente las plantillas, pero con una buena configuración se ahorra mucho tiempo en el proceso de digitalización.

Véase también

Referencias

Read other articles:

Aeroporto di Adaliaaeroporto Entrata dell'aeroporto Codice IATAAYT Codice ICAOLTAI Nome commercialeAntalya Havalimanı DescrizioneTipocivile GestoreDHMI-Antalya-Turkey-Havalimani Stato Turchia RegioneRegione del Mar Mediterraneo Posizione14 km da Adalia Altitudine54 m s.l.m. Coordinate36°55′00″N 30°48′00″E / 36.916667°N 30.8°E36.916667; 30.8Coordinate: 36°55′00″N 30°48′00″E / 36.916667°N 30.8°E36.916667; 30.8 Mappa di...

 

Templat:Desaslamat Jirapan adalah sebuah desa di kecamatan Masaran, Sragen, Jawa Tengah, Indonesia. Pembagian wilayah Desa Jirapan terdiri dari dukuh: Jirapan Bangunharjo Bulakrejo Celep Dukuh Genjahan Gondang Jatirejo Nglencong Segawok Slamat Tompe lbsKecamatan Masaran, Kabupaten Sragen, Jawa TengahDesa Dawungan Gebang Jati Jirapan Karangmalang Kliwonan Krebet Krikilan Masaran Pilang Pringanom Sepat Sidodadi Artikel bertopik kelurahan atau desa di Indonesia ini adalah sebuah rintisan. Anda d...

 

جنوب شرق أوروبامعلومات عامةجزء من أوروبا تقع في منطقة تضاريس أوروبا الإحداثيات 44°20′00″N 23°49′00″E / 44.3333°N 23.8167°E / 44.3333; 23.8167 لديه جزء أو أجزاء مقدونيا الشماليةاليونان تعديل - تعديل مصدري - تعديل ويكي بيانات المعالم الجغرافية جنوب شرق أوروبا هي منطقة سياسية وجغراف...

Chinese character sorting method The YES stroke alphabetical order, also called YES stroke-order sorting, briefly YES order or YES sorting, is a Chinese character sorting method based on a stroke alphabet and stroke orders.[1][a] It is a simplified stroke-based sorting method free of stroke counting and grouping.[2] YES order has been successfully applied to the indexing of all the characters in Xinhua Character Dictionary and Xiandai Hanyu Word Dictionary. In this joi...

 

Belo HorizonteMunisipalitasMunicípio de Belo HorizonteMunisipalitas Belo Horizonte BenderaLambang kebesaranJulukan: BH (pengucapan beagá),The Garden City,BelôNegara BrazilWilayahTenggaraNegara Bagian Minas GeraisDidirikan pada1701Terbentuk (sebagai kota)12 Desember 1897Pemerintahan • MayorMarcio Lacerda (PSB)(2013-2016)Luas • Munisipalitas330,9 km2 (127,7 sq mi) • Luas perkotaan282,3 km2 (109 sq mi) •&#...

 

Slovenian philosopher (born 1949) Žižek and Zizek redirect here. For the biographical documentary film about Slavoj Žižek, see Zizek! Slavoj ŽižekŽižek in 2015Born (1949-03-21) 21 March 1949 (age 75)Ljubljana, PR Slovenia, FPR YugoslaviaEducation University of Ljubljana (BA, MA, DA) University of Paris VIII (PhD) Spouse Jela Krečič ​(m. 2013)​Children2Era20th-/21st-century philosophyRegionWestern philosophySchoolContinental philosophyLjubljana schoo...

Konflik Serbia-AlbaniaWilayah sengketa KosovoTanggal1914 – SekarangLokasiSerbia, AlbaniaStatus Masih BerlangsungPerubahanwilayah Kosovo Menjadi Bagian Yugoslavia Pada Tahun 1918, Hingga Tahun 1998–1999 Perang antara Kosovo dan Serbia, dan Kosovo mendeklarasikan Kemerdekaan pada Tahun 2008Pihak terlibat Bangsa Albania Bangsa Serbia Konflik Serbia-Albania adalah konflik antara bangsa Serbia dengan Albania yang berlangsung pada abad ke-20. Konflik ini berciri terjadinya peperangan (seperti p...

 

Catharina-AmaliaPutri OranyePotret resmi, 2014Putri OranyePeriode30 April 2013 - sekarang(10 tahun, 352 hari)PendahuluRaja Willem-AlexanderInformasi pribadiKelahiran7 Desember 2003 (umur 20)[1]Rumah Sakit BronovoDen Haag, BelandaWangsaWangsa Oranye-NassauNama lengkapCatharina-Amalia Beatrix Carmen VictoriaAyahWillem-Alexander, Raja BelandaIbuMáxima Zorreguieta CerrutiAgamaProtestan Keluarga Kerajaan Belanda Baginda Sang Raja *Baginda Sang Ratu * Paduka Sang Putri Orany...

 

Alex Greenwood Greenwood bersama Notts County di 2015Informasi pribadiNama lengkap Alex Greenwood[1]Tanggal lahir 7 September 1993 (umur 30)Tempat lahir Liverpool, InggrisTinggi 168 cm (5 ft 6 in)[2]Posisi bermain BekNomor 22Karier junior EvertonKarier senior*Tahun Tim Tampil (Gol)2010–2014 Everton 38 (1)2015 Notts County 14 (1)2016– Liverpool 11 (3)Tim nasional‡2014– Inggris 23 (2) * Penampilan dan gol di klub senior hanya dihitung dari liga domes...

Eithne CoyleIrish: Eithne Ní ChumhaillCumann Na mBan members May Burke (left), Eithne Coyle/Eithne Ní Chumhaill (centre) and Linda Kearns (right) in Duckett’s Grove, Carlow, 1921, standing on the Union JackPresident of Cumann na mBanIn office1926–1941Preceded byConstance MarkieviczSucceeded byMargaret Langsdorf Personal detailsBornAnnie Coyle(1897-01-03)January 3, 1897Killult, County DonegalDied1985 (aged 87–88)SpouseBernard O'DonnellOccupationPolitical ActivistMilitary serv...

 

Diagram that shows events over time This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Digital timing diagram – news · newspapers · books · scholar · JSTOR (February 2024) (Learn how and when to remove this message) A digital timing diagram represents a set of signals in the time domain.[1] A timing dia...

 

Una banda militare argentina si pone in marcia eseguendo il pezzo Avenida de las Camelias di Maranesi (Lomas de Zamora 2010) La marcia (in francese marche; in inglese march; in tedesco Marsch; in spagnolo marcha) è una composizione musicale dal ritmo marcato, nata per accompagnare l'incedere di un'unità militare, e secondariamente di altri cortei (religiosi, civili), regolandone il passo in modo uniforme e cadenzato.[1][2][3][4][5] Ha quindi accenti m...

Apex court of Australia High Court of AustraliaSeal of the High Court of AustraliaThe High Court building, situated on the shore of Lake Burley Griffin, Canberra35°17′56″S 149°08′09″E / 35.29889°S 149.13583°E / -35.29889; 149.13583Established25 August 1903 (1903-08-25)Jurisdiction AustraliaLocationCanberra, Australian Capital TerritoryCoordinates35°17′56″S 149°08′09″E / 35.29889°S 149.13583°E / -35.298...

 

Historical precursor to snooker Setup for pyramid pool Pyramid pool, or simply pyramids, is a form of pool that was played mainly in the 19th century. It was one of several pool games that were popular at this time, and was forerunner to modern games such as eight-ball, blackball, straight pool, and Russian pyramid. Along with black pool, it was one of the progenitor cue sports of snooker. Rules Object balls were racked in a triangle with any remaining balls placed at the back of the triangle...

 

Head of the Catholic Church from 731 to 741 Pope SaintGregory IIIBishop of RomeEffigy of Gregory III in an 8th-century medalChurchCatholic ChurchPapacy began11 February 731Papacy ended28 November 741PredecessorGregory IISuccessorZacharyOrdersCreated cardinal726by Gregory IIPersonal detailsBornBilad al-Sham, Umayyad Caliphate[1]Died(741-11-28)28 November 741Rome, Exarchate of RavennaPrevious post(s)Cardinal-Deacon (726-31)SainthoodFeast day10 DecemberVenerated inRoman Catholic ChurchEa...

この項目では、コルク抜きの道具について説明しています。コルクスクリューおよびコークスクリューのその他の用法については「コークスクリュー (曖昧さ回避)」をご覧ください。 コルク抜き コルクスクリュー(コークスクリュー、英: corkscrew[1])またはコルク抜き[2]は、主に飲料用の瓶の封をしているコルク栓を抜きとるために用いられる道具[2&...

 

Ecoregion of India and Sri Lanka Deccan thorn scrub forestsBlackbucks at Ranibennur Blackbuck SanctuaryEcoregion territory (in purple)EcologyRealmIndomalayanBiomeDeserts and xeric shrublandsBorders List Central Deccan Plateau dry deciduous forestsEast Deccan dry evergreen forestsGodavari-Krishna mangrovesNarmada Valley dry deciduous forestsNorth Western Ghats moist deciduous forestsSouth Deccan Plateau dry deciduous forestsSri Lanka dry-zone dry evergreen forests GeographyArea338,197 km2...

 

No debe confundirse con Siria. No debe confundirse con pueblo asirio o Aššur. Asiria𒀸𒋩 Civilización antigua c. 2500 a. C.-609 a. C. Escudo      Corazón del imperio asirio.      Máxima extensión de Asiria, durante el reinado de Asurbanipal (668-627 aC).Coordenadas 36°00′N 43°18′E / 36, 43.3Capital Aššur (s. XXV-IX)Shubat-Enlil (siglo XVIII)Kalkhu (809-706)Dur Sharrukin (706)Nínive (7...

Conflicto en Sinkiang Fecha 1931[1]​–presenteLugar XinjiangEstado Enfrentamientos violentos, incluidos ataques terroristas entre 1990 y 2006 Segunda ola de enfrentamientos e incidentes violentos en Xinjiang entre 2007 y 2016 Incidencia limitada de violencia relacionada con Xinjiang, incluido el atentado de Bangkok de 2015, fuera de China Reducción de los ataques terroristas a partir de 2016 Establecimiento de campos de internamiento en Xinjiang desde 2017Beligerantes República Popul...

 

1950 sociology book This article is about the book. For the psychological trait of authoritarianism, see Authoritarian personality. For the form of government, see Authoritarianism. The Authoritarian Personality Cover of the first editionAuthorsTheodor W. Adorno, Else Frenkel-Brunswik, Daniel Levinson, Nevitt SanfordPublished1950PublisherHarper & BrothersMedia typePrintISBN978-0-06-030150-7 The Authoritarian Personality is a 1950 sociology book by Theodor W. Adorno, Else Frenkel-Brun...