Extraer informacion de pdf

hola a todos, necesito extraer informacion de un pdf, una factura, puedo seleccionar campos del pdf, eso quiere decir que es nativo, pero al momento de usar get text o find element, me toma la hoja completa, no lo que necesito seleccionar, necesito ayudar para poder resolver esto, extraer la informacion y escribirla en un excel, estoy detenida en el proceso de extraccion debido a esto.
agradeceria su ayuda o algun xaml de ejemplo.
muchas gracias!

Hi @mively

You can use Document Understanding to extract data from the Invoice. If you are completely New to UiPath and want a simpler approach, you can extract the native text and then use Regex to extract the data you want.

Can you show me a sample of the PDF you wish to extract? share it if possible, I can help with a xaml.

Hi @mively

Can you try with Extract Document Data activity

Regards,


estaria bien asi la actividad ?

me podria mas dar informacion de como hacerlo con document understanding, usando la actividad Extract Document Data
soy nueva en esto y me gustaria aprender y hacerlo de buena forma, lo agradeceria!

1 Like

@mively

Please check below images

Regards,

1 Like

no me aparece la misma informacion que a ti cuando utilizo la actividad

@mively

Can you try to upgrade the UiPath.DocumentUnderstanding.Activities version to 2.12.1

Below are the examples of prompts

Regards,

listo, me podrias explicar como funciona la actividad en si, que pongo en promp o como puedo extraer la informacion que yo necesito ? por favor

@mively

Based on the fields you need from the invoice, you should include them in the prompt. Please watch the video below for a better understanding

Regards,

2 Likes

Hi @mively

Abre UiPath Studio y haz clic en Administrar Paquetes. Ve a la pestaña Oficial, busca UiPath.DocumentUnderstanding.Activities y selecciónalo. Haz clic en Instalar y luego en Guardar para confirmar la instalación. Espera a que se complete el proceso y reinicia UiPath Studio si es necesario. Una vez instalado, podrás ver las actividades de Document Understanding en el panel de Actividades y usarlas en tus automatizaciones.

Si te ha sido útil, márcalo como solución.

1 Like

@mively

First what kind of document is it?

Check if any of the predefined models are of same type like invoice,purchase order etc so that you can use the model and in the output you would have the fields to get the data

If you dont have any predefined model then go with generative extractor and provide what all fields you need and how do you identify that field like for example if you need a total cost…say you need total and it would have a prefix total and you. Eed the value for that…like that create prompts if no predefined model works

If you want all data as datatable then output.resultasdatatable will give the data as wel which is one of the methods…similarly you can get individual fields as well

Cheers

@mively

Please go throw below thread and attached video

1 Like

hola! la información que se extrae de esta forma, como se podría ir escribiendo en un Excel, en las columnas que correspondan, tengo una idea, pero me gustaría saber diferentes camino para poder hacerlo.
Me ayudaría demasiado.
Saludos!

1 Like

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.