Pdf excel

hola!
quiero debatir ideas…
como harían ustedes o como implementarían una robotización, para recorrer todos los Pdf de una carpeta y extraer su información para posteriormente escribirle en un Excel??
quedo atenga

@mively

Consulte el hilo a continuación sobre el mismo tema.

Saludos
Sonali

Hi @mively

try below steps,

  1. AssignpdfFiles = Directory.GetFiles("C:\YourFolderPath", "*.pdf")

    • Value: Directory.GetFiles("C:\YourFolderPath", "*.pdf")
  2. Build Data Table (Create structure for extracted data)

    • Columns: Example ("FileName", "ExtractedText")
    • Output: dataTable
  3. For Each (Iterate through PDFs)

    • For Each item in: pdfFiles
    • Type Argument: String

    Inside For Each:

    • Read PDF Text

      • FileName: item
      • Output: pdfText
    • Add Data Row

      • DataTable: dataTable
      • ArrayRow: { Path.GetFileName(item), pdfText }
  4. Write Range (Excel Application Scope)

    • WorkbookPath: "C:\Output.xlsx"
    • DataTable: dataTable
    • SheetName: "Sheet1"
    • Starting Cell: "A1"
    • AddHeaders: True

If you found helpful mark as a solution.
Happy Automation @mively

@mively

You take reference of below link,

como hacerlo con extract document data y for each file in folder ?

Hi @mively

Usa “Para cada archivo en la carpeta” para recorrer todos los archivos PDF en una carpeta específica. Dentro del bucle, utiliza “Extraer datos del documento” para extraer el texto de cada PDF. Guarda el texto extraído junto con el nombre del archivo en un DataTable utilizando “Agregar fila de datos”. Finalmente, usa “Escribir rango” para exportar el DataTable a un archivo de Excel.

Si esta respuesta te ha sido útil, márcala como solución. ¡Gracias!