Hola comunidad, muchos de seguro conocen lo que es #OCR (Optical Character Recognition) o Reconocimiento Óptico de Caracteres en el más puro español. Pues bien, en el post de hoy vengo a hablarles de una de las herramientas que posee el universo #Linux, para la conversión de imágenes en texto usando OCR. Les hablo de #Lios.

#OCR, #Lios y #Tesseract

Primero lo primero, ¿qué es OCR? #OCR es una técnica que permite mediante un grupo de algoritmos, reconocer las letras que pueden aparecer en una imagen y convertirlas a texto que pueda ser procesado en el ordenador por algún editor de texto. En otras palabras es cuando tenemos texto en una foto, (un documento escaneado por ejemplo) y queremos nuevamente convertir esa imagen en un documento de texto (PDF u otro formato) para poder editarlo o realizar búsquedas sobre él, etc.

#Lios es una herramienta opensource disponible desde los repositorios de la mayoría de las distros conocidas, capaz de convertir imágenes en texto mediante OCR. En realidad  no es más que un frontend para #Tesseract, la herramienta que silenciosamente realiza la función de conversión y devuelve entonces los resultados a #Lios para los que no les gusta el trabajo con la consola.

Es importante decir que existen varios motores de conversión además de Tesseract que son compatibles con #Lios, (#Cuneiform es uno), aunque cada uno de ellos tienen sus propias peculiaridades.

Instalación

Para instalar #Lios en Debian/Ubuntu/Mint y derivadas use el comando de siempre:

sudo apt install lios

En distros con paquetería rpm como CentOS/Fedora use:

yum install -y lios

o instálelo haciendo uso de su gestor de software preferido (Synaptics, Gnome Software, Discover, etc)

¿Cómo hacerlo con #Lios?

Para convertir la imagen puede obtenerse de varias formas. Puede ser una imagen que tengas guardada en el ordenador o proveniente de un Scanner, la WebCam o simplemente una captura de pantalla.

En caso de que la imagen sea un archivo guardado en el PC, seleccione la opción “Abrir” (Open) desde el menú “Archivo” (File). En otro caso puede usar el menú “Escanear” (Scan) para obtener imágenes desde un Scaner, Webcam o captura de pantalla.

Para comenzar la conversión se usan las opciones del menú “Reconocer” (Recognize), el cual permite reconocer los caracteres de la imagen actual, de todas las imágenes cargadas, de un área en específico de la imagen y otras opciones que puedes probar. Una vez concluida la conversión, el resultado será mostrado en el panel inferior en modo de texto, que puedes copiar, o simplemente exportar en otro formato como PDF o texto plano.

Y hasta aquí el post de hoy. Espero que les resulte de utilidad la aplicación y no olviden dejar sus impresiones, o inquietudes en los comentarios. Hasta más ver y a armar #Lios XD. EOF 😉