Extraer datos estructurados con imágenes

Hola,

Necesito ayuda con lo siguiente: tengo una tabla en PDF que necesito pasar a Excel. El problema es que en una de las columnas el dato es una imagen.
He intentado extraer los datos con la actividad Extraer datos estructurados y luego copiarlos en un excel, pero la columna de las imágenes la deja vacía.
No he encontrado ningún paquete que contenga actividades concretas para pasar de PDF a Excel que funcione en Proyectos Windows (sí en Windows-Legacy, pero esto no me sirve)
¿Alguna idea de cómo puedo hacerlo?

Gracias por adelantado

Hi @u_rpa

Hola,

Intente leer PDF con actividades de OCR y cambie la escala en el panel de propiedades para que pueda extraer el formato de datos correctamente.

Saludos

Muchas gracias por la rápida respuesta.
He probado lo que dices pero sigo sin poder obtener las imágenes, únicamente obtiene cadenas de texto.
Entiendo que va a pasar lo mismo con cualquier actividad cuya salida sea un string, no va a ser posible convertir las imágenes en string.
Lo ideal sería alguna que convirtiera directamente el PDF en Excel.
¿Alguna otra idea?

Hi @u_rpa

Extract the image column separately. Since the Extract Structured Data activity doesn’t handle image extraction, you’ll need to extract the image column separately. Use the Read PDF Text activity to extract the specific column containing the images as a string. And you can use string manipulation techniques to separate the image file names or paths. You can split the string based on a common separator or any specific patterns to extract the image references. Then copy the table to excel.

Hope it helps.

Muchas gracias @supriya117 por tu respuesta.
El problema es que las actividades Leer PDF no encuentran las imágenes. El string resultante de la actividad no muestra las imágenes de ninguna manera, por lo que no tengo forma de obtener esa columna con estas actividades.
Sigo buscando una solución