OCR: ¿Qué es el reconocimiento óptico de caracteres?

Posted by media on 14/11/18 9:00

OCR Qué es el reconocimiento óptico de caracteres

Cuando a finales del siglo XVIII la Revolución Francesa empezó a definir las bases de una nueva concepción del Estado uno de los conceptos que empezaron a desarrollarse fue el del reconocimiento del la individualización de la persona.

De este reconocimiento se pasó a la confección de documentos que acreditasen que el ciudadano estaba debidamente registrado en los archivos nacionales. Aunque tuvieron que pasar dos siglos para que ese documento acabase teniendo el formato actual de nuestros DNI.

En la actualidad, gracias a la tecnología OCR (Optical Character Recognition), que trata de emular la capacidad del ojo humano para reconocer objetos, damos un pasito más en esta historia para la identificación electrónica de personas. Te lo contamos en el siguiente post.

Este post también está disponible en inglés.

  Índice

  Índice

1. OCR, ¿qué es esta tecnología?

2. La identificación electrónica de Signaturit

3. H2020: Reconocimiento óptico de caracteres de documentos europeos de identidad (IDs)

4. Conclusión 

 

1. OCR, ¿qué es esta tecnología?

Nadie es tan guapo como en su foto de perfil de redes sociales y ni tan horrible como en su foto de DNI. Esta afirmación es una verdad absoluta, igual que no eres consciente de la importancia de este documento hasta que lo pierdes.

Ya sea para llevar un control de la población o permitir la rápida identificación de los ciudadanos, los documentos de identidad o pasaporte se han convertido en el método generalizado para identificarnos en cualquier trámite público y privado.

En España el primer modelo de DNI era de color verde, incluía datos como empleo y distinguía entre cuatro categorías dependiendo de la situación económica del titular. De ese primer modelo de 1951 al actual, el documento se ha ido sofisticando con el objetivo de ganar en seguridad e impedir que sea fácilmente falsificable.

Con ese fin y para mejorar la eficiencia de los flujos digitales se suma la tecnología OCR que permite reconocer datos a través del escáner de documentos.  

 

Definición 

El concepto de OCR responde al "Optical Character Recognition", un software que permite el reconocimiento óptico de los caracteres contenidos en una imagen (documento escaneado o fotografía), de forma que estos se vuelven comprensibles o reconocibles para un ordenador.

Así, el sistema OCR es un análisis a través del cual analizamos y escaneamos un fichero para automatizarlo.


Reconocimiento óptico de caracteres

"El reconocimiento óptico de caracteres (ROC), generalmente conocido como reconocimiento de caracteres y expresado con frecuencia con la sigla OCR (del inglés Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos."


¿Cómo funciona el OCR?

Para reconocer los caracteres, el software inspecciona la imagen pixel a pixel, buscando formas que coincidan con los rasgos de los caracteres. En función del nivel de complejidad o grado de desarrollo del software, éste buscará coincidencias con los caracteres y fuentes disponibles en el programa, o tratará de identificar los caracteres a través del análisis de sus características.

El OCR puede analizar los elementos del documento (bloques de texto, imágenes, tablas…), examinando los espacios en blanco y descomponiendo el texto en líneas, palabras y caracteres.

 

¿Para qué se utiliza el OCR?

El OCR es una tecnología transversal, aplicable en distintos ámbitos y sectores para la digitalización de formularios, documentos administrativos, informes, etc., ya que las ventajas que ofrece son comunes para todos ellos.

En el sector de la cultura, por ejemplo en el ámbito de la preservación del patrimonio, el OCR se aplica principalmente en los procesos de digitalización de documentos históricos, en soporte papel o microformas.

En Signaturit en concreto gracias a esta tecnología vereficamos de forma digital los documentos de identidad, pasaportes o carnet de conducir para que nuestros usuarios puedan dar a alta a distancia a sus clientes de forma cómoda y segura.

 firma_electrónica_avanzada

2. La identificación electrónica de Signaturit

El método de autentificación online basado en la tecnología OCR o ROC (reconocimiento óptico de caracteres por sus siglas en castellano), consiste en leer el código MRZ que tienen estos documentos y contrastarlo con el resto de datos que contiene para saber si alguno de ellos ha sido alterado.

Desde Signaturit presentamos dos opciones para su uso:

  1. Que el usuario realice una fotografía al DNI por ambas caras. Al subir a Signaturit la imagen capturamos toda la información del DNI y validamos que no ha sido manipulada.

  2. Que el usuario adjunte una fotografía del DNI que ya tenga guardada en su ordenador o dispositivo móvil. En este caso, también capturamos los datos y validamos que la información no ha sido manipulada.

Técnicamente, nuestra labor es verificar el código MRZ del DNI, que es el código que aparece en el reverso y que es único para cada persona. Este código se genera a través de un algoritmo, y se basa en la información que contiene cada DNI.

Por tanto, si alguien modifica algún dato en su DNI, el código MRZ ya no coincidiría con la información escaneada y nuestro sistema lo detectaría como un DNI inválido. El mismo proceso si el documento de identificación fuese un pasaporte.

Capture

 

Beneficios tecnología OCR de Signaturit 

  • Identificación digital: para prevenir el fraude digital con la identificación online de las personas.

  • Experiencia de usuario: captura óptima de imágenes desde cualquier dispositivo móvil.

  • Fácil Integración: con la opción de integrar la tecnología en cualquier sistema vía API.

 

3. H2020: Reconocimiento óptico de caracteres de documentos europeos de identidad (IDs)

Signaturit recibió el pasado año financiación del programa de investigación e innovación Horizon 2020 de la Unión Europea en virtud del acuerdo de subvención No 778550, gracias al cual estamos desarrollando varios proyectos, entre ellos un software para el reconocimiento automático y extracción de datos más complejo para poder autentificar documentos de identidad europeos.

Esta tecnología nos permitirá extraer y validar toda la información que contiene un documento de identidad europeo a partir de una fotografía del mismo proporcionando más seguridad a las transacciones llevadas a cabo a través de nuestra plataforma.


EU_FLAG

     
 Este proyecto ha recibido financiación del programa de investigación e           innovación Horizon 2020 de la Unión Europea en virtud del acuerdo de           subvención 
Nº 778550.



4. Conclusión

Este tipo de herramienta que realiza la captura de los datos de los documentos de identidad es muy útil ya que permite de manera remota realizar un onboarding digital para la apertura de cuenta bancaria por ejemplo.

Que Signaturit ofrezca este procedimiento de autentificación del documento de una persona junto con nuestra firma electrónica avanzada para la aceptación de cualquier trámite,  nos convierte en la solución perfecta para un onboarding 100% digital, legal y seguro.

Si necesitas información más específica o te gustaría recibir asesoramiento respecto a qué sistemas de autenticación convendría implementar en tu empresa, no dudes en ponerte en contacto con nosotros. Puedes enviarnos un email a info@signaturit.com, llamarnos al +34 93 551 14 80 o rellenar este formulario.

Si lo prefieres, puedes probar directamente nuestros cinco sistemas de autenticación. Tan sólo date de alta en Signaturit y tendrás acceso gratis durante 14 días a éstas y a todas las funcionalidades que ofrecemos.

Este post también está disponible en inglés.


Whitepaper eSignatures 101

Tags: Firma Electrónica

Subscríbete al blog

Últimos posts