PDF のページ範囲を抽出について

rkym123456 · October 30, 2020, 7:26am

例えば、送付というフォルダ内に、01PDF、02PDF、03PDFというPDFが3つある場合、それぞれの1ページ目のみを抽出したい場合はどのようにしたらよいのでしょうか。
（実際はフォルダ内のPDFは20～30ぐらいはあると思います）
初心者ですので、プロパティの設定なども細かく教えてくださると助かります。
どうぞよろしくお願いいたします。

rfu · October 30, 2020, 7:57am

こんにちは。

抽出の作業自体は表題にもなっている「PDFのページ範囲を抽出」でできると思います。
質問したいのは「フォルダ内にある全部のPDFに繰り返して抽出処理を行いたい」という事でしょうか。

ということであれば、一般的には
１．「送付」フォルダの中にある拡張子PDFのファイルの一覧を取得して変数に設定する
２．１で設定した変数の要素分繰り返してPDFのページ抽出処理を行う
という流れになると思われます。

１．については、Directory.GetFiles(送付フォルダのパス,"*.pdf")を
String配列型（Array Of String）の変数に「代入」してやればよいでしょう。
２．については「繰り返し（コレクションの各要素）」で、上記で設定した変数をコレクションとして、
その中に「PDFのページ範囲を抽出」を配置、入力ファイル名にコレクションの要素であるitemを設定してやってみる感じでいかがでしょうか。

rkym123456 · November 2, 2020, 12:51am

回答ありがとうございます。

1に関しては問題なく処理できました。
PDFNameという変数に3つのPDF名が入ってきました。

2なのですが、「繰り返し（コレクションの各要素）」の中に「PDFのページ範囲を抽出」を配置、入力ファイル名に itemを設定したのですが、何故か03PDFの分しか抽出してくれません。

自分なりに、"送付フォルダのパス*.pdf"や、PDFNameも入れてみたのですがどれもだめでした。

どなたか教えていただけると助かります。
どうぞよろしくお願いいたします。

rfu · November 2, 2020, 1:27am

おそらくですが、抽出したPDFの出力先のファイルパスが常に同じ場所を示している状態なのではないでしょうか。
（で、上書き上書きしてしまって多分３ファイル目が最後に残っている）
出力先のイメージができないのですが、どんな形にしたいでしょうか？
（入力PDFを上書き、出力用フォルダを用意してそこに元のPDF名で保存、等）

rkym123456 · November 2, 2020, 1:40am

おっしゃる通り、出力ファイル名は同じ場所を入れてます。
出力先のイメージですが、pdfというフォルダを用意してその中に元のｐｄｆ名で保存できればと思っています。

たびたび申し訳ありませんが、よろしくお願いいたします。

rfu · November 2, 2020, 1:47am

なるほど。

繰り返し内では入力PDFのファイルパスが変数「item」に格納されているので、
もとのPDFのファイル名はPath.GetFileName(item)で取得できると思います。
で、フォルダパスとファイル名はPath.Combine(フォルダパス文字列, ファイル名文字列)が
いい感じに結合してくれます。

ということで、今回の場合、出力先のパスは
Path.Combine(PDF出力フォルダのパス, Path(GetFileName(item)))とかで定義できそうですね。
お試しください。

※クローズ後追記：間違えてましたね、すみません・・！
書かれているとおり、Path.Combine(PDF出力フォルダのパス, Path.GetFileName(item))ですね・・

rkym123456 · November 2, 2020, 2:52am

出力先のパスにPath.Combine(“PDF出力フォルダのパス”,Path.GetFileName(item))で上手くいきました！（嬉）
とても助かりました。
私の悩みにお付き合いくださり、ありがとうございました。

Topic		Replies	Views
PDF注文書の情報の読み取り方フォーラム studio	5	2010	March 24, 2021
ExcelファイルをPDFとして保存に関するご質問です Studio	6	1040	January 17, 2024
Extract a page from a pdf file with several pages Studio studio , question , project_panel	8	1069	October 4, 2023
PDFを2ページずつ分割する方法を教えて下さい。フォーラム question	11	105	April 16, 2025
PDFファイルの中身を検索して別ファイルに分離したいフォーラム pdf , studio	5	1187	October 3, 2023

PDF のページ範囲を抽出について

Related topics