hola!
quiero debatir ideas…
como harían ustedes o como implementarían una robotización, para recorrer todos los Pdf de una carpeta y extraer su información para posteriormente escribirle en un Excel??
quedo atenga
Hi @mively
try below steps,
-
Assign →
pdfFiles = Directory.GetFiles("C:\YourFolderPath", "*.pdf")
- Value:
Directory.GetFiles("C:\YourFolderPath", "*.pdf")
- Value:
-
Build Data Table (Create structure for extracted data)
- Columns: Example (
"FileName"
,"ExtractedText"
) - Output:
dataTable
- Columns: Example (
-
For Each (Iterate through PDFs)
- For Each item in:
pdfFiles
- Type Argument:
String
Inside For Each:
-
Read PDF Text
- FileName:
item
- Output:
pdfText
- FileName:
-
Add Data Row
- DataTable:
dataTable
- ArrayRow:
{ Path.GetFileName(item), pdfText }
- DataTable:
- For Each item in:
-
Write Range (Excel Application Scope)
- WorkbookPath:
"C:\Output.xlsx"
- DataTable:
dataTable
- SheetName:
"Sheet1"
- Starting Cell:
"A1"
- AddHeaders:
True
- WorkbookPath:
If you found helpful mark as a solution.
Happy Automation @mively
You take reference of below link,
como hacerlo con extract document data y for each file in folder ?
Hi @mively
Usa “Para cada archivo en la carpeta” para recorrer todos los archivos PDF en una carpeta específica. Dentro del bucle, utiliza “Extraer datos del documento” para extraer el texto de cada PDF. Guarda el texto extraído junto con el nombre del archivo en un DataTable utilizando “Agregar fila de datos”. Finalmente, usa “Escribir rango” para exportar el DataTable a un archivo de Excel.
Si esta respuesta te ha sido útil, márcala como solución. ¡Gracias!