Empresas Premium
Rosa Giménez Pérez, Senior IA Analyst en Solver IA, nos habla en este artículo de la automatización de los procesos internos para obtener resultados de gran valor a través de la Inteligencia Artificial.
Cada vez, son más las empresas que saben ver y aprovechar la ventaja de recopilar grandes cantidades de datos relativas a sus negocios. La correcta interpretación de estos datos y su transformación en valor añadido es uno de los objetivos que han perseguido numerosos investigadores del campo de la Inteligencia Artificial (IA) y el aprendizaje automático.
Dentro del sector retail, comienza a ser frecuente que las empresas opten por recurrir a profesionales en este campo para implantar este tipo de métodos en tareas como la previsión de demanda, la estimación de costes o el análisis del impacto en redes sociales. No obstante, las técnicas de IA pueden ir mucho más allá y no sólo se centran en transformar los datos en información que ayude a la toma de decisiones, sino que también pueden facilitar el paso previo de captura de datos.
Facturas comerciales, albaranes, certificados, contratos, etc. son otra enorme fuente de información con la que los comercios y superficies tienen que lidiar en su día a día. En el mejor de los casos, los documentos pueden venir en un formato estructurado que permita ser tratado con un proceso automático rápido y sencillo. Por el contrario, en la mayoría de las ocasiones estos archivos suelen recibirse escaneados y la revisión se realiza de forma manual por profesionales especializados que se ven envueltos en tareas tediosas y repetitivas para poder extraer la información. Por este motivo, implantar técnicas que puedan automatizar estos procesos puede proporcionar numerosas ventajas como una reducción del tiempo y coste empleado y, un aumento en la calidad y fiabilidad de los resultados. Además, si se recurre a una solución personalizada, la escalabilidad y compatibilidad de este proceso con los propios internos de la empresa estarán aseguradas.
A modo global las tareas que formarían parte de este proceso y las técnicas empleadas para cada una de ellas dentro del ámbito de la Inteligencia Artificial son:
• Preprocesado de documentos: Esta tarea se aborda principalmente con técnicas de reconocimiento óptico de caracteres (OCR). La finalidad de un método OCR es la transformación de una imagen en la que aparecen palabras o números a texto plano. No obstante, los documentos obtenidos mediante un escáner o fotografía pueden estar torcidos o presentar variaciones de contraste y brillo o ruido que dificultan dicha transformación. Un buen motor OCR combina técnicas de visión artificial para eliminar estas distorsiones como la aplicación de filtros para la eliminación de ruido, corrección de la orientación o detección de contornos, junto a la implementación y entrenamiento de modelos de aprendizaje profundo que permitan clasificar cada entidad detectada como caracteres y palabras que cobren un sentido.
• Segmentación de documentos: También es habitual recibir en un único archivo varias facturas o diferentes tipos de documentos mezclados. En este caso, se opta por la implementación de algoritmos que sean capaces de detectar el inicio y final de un documento para su separación y tratamiento individualizado.
• Clasificación de documentos: Teniendo un archivo por cada documento, ¿cómo diferenciamos lo que es una factura de un albarán en nuestro proceso automático sin ayuda de un supervisor? En este caso, entrenar un modelo basado en redes neuronales podría ser la solución. Esta tarea puede desarrollarse con diferentes metodologías, ya sea por imagen o con técnicas de procesado del lenguaje natural (NLP). Pero, puesto que un modelo sólo entiende el lenguaje numérico, es necesaria una transformación. En el caso de querer entrenar un modelo de clasificación de imágenes, alimentaríamos al mismo con matrices representativas de estas, donde cada valor haría referencia al nivel de color de cada píxel. Para el enfoque basado en NLP, la transformación de la entrada al espacio numérico se puede llevar a cabo con técnicas como la representación en frecuencia de términos o vectores embebidos. Un análisis previo del caso concreto a resolver ayudaría a decidir qué técnica sería la adecuada para obtener los mejores resultados, pudiendo incluso combinar ambos enfoques.
• Extracción de campos relevantes: Aunque el formato y la disposición de los campos suelen variar dependiendo del emisor del documento, muchos de estos incluyen información estándar y de obligatoria inclusión, como pueden ser la fecha, el importe total o los términos de compraventa en una factura comercial. La detección y localización de estos campos vuelve a ser una tarea que puede resolverse con técnicas de aprendizaje automático. En esta fase el objetivo sería, además de la detección de cada campo – valor, la extracción de estos valores para su posterior estructurado y almacenaje. Para este fin, el empleo de expresiones regulares puede ser de ayuda.
• Almacenamiento de información: El último paso de este proceso sería el almacenamiento de toda la información extraída en una base de datos que permita recuperarla y trabajar con ella rápidamente. Aunque en este punto no se utilizan técnicas de IA, es importante que, si se opta por delegar este desarrollo a una empresa externa, el equipo cuente con profesionales de diferentes ámbitos que puedan ayudar en todas las etapas del proceso.
Estas herramientas son un ejemplo más de todo lo que la Inteligencia Artificial puede aportar para facilitar y optimizar el flujo de trabajo dentro de una empresa. Son muchísimas las ventajas de automatizar los procesos internos, pero para poder obtener resultados que realmente aporten valor, es imprescindible contar con un equipo de profesionales que conozca a fondo la materia y esté dispuesto a realizar un estudio que se adapte a las necesidades de cada negocio.