ウェブから表抽出は理解しました。同様に他のパターンで抽出したいのですが?
まず、注文書がPDFにて複数入ってきます。クリックしてダウンロード。
そこから、必要な情報のみ抽出してCSVなりエクセルに反映したいのですが、
教習本、チュートリアルのパターン以外の展開は初なので組み立てが全くわかりません。
PDF自体が読み取れるのか?あるいは元々がエクセルなので、事前にエクセル変換して特定のセルと指定すれば良いのでしょうか?
また、その注文書をフォルダの中にあるだけ繰り返し、エクセルに積み重ねていく方法を取りたいのです。
このフォーラムログインも初です。
よろしくご教授願います。
こんにちは。
ちょっとやりたいことがピンと来ていませんが、なんとなくポイントになるのは
どこかのフォルダ内にPDFファイルがx個あり、それぞれのファイルに対して
「必要な範囲の文字列(複数項目存在)だけ」読み取り、それを変数に格納する・・
といった感じでしょうか?
(PDFファイルのダウンロードとか、変数に格納した文字列のExcel等への転記とかは
次のステップということでいったん置いておくとして・・)
UiPath単体だと、PDF.ActivitiesというPDF操作を行うパッケージがあるはあるのですが、
PDFの内容に対して行える操作は「全テキストを取得して変数に格納」程度になりますので、
「必要な情報のみ抽出」をするのはなかなか難しそうですね。
具体的には「必要な情報」をどう定義するのかというところが大きな問題になると思います。
キーワードで定義できそうなら、いったん取得した全文テキスト内でそのキーワードが出現した辺りの文字列を切り取って・・等で対応できるかもしれませんが、そんな感じのルール化は出来そうでしょうか?
ブラウザ上に複数社向けの注文が羅列(チェックボックスで自社用のみ)しており、それをエクセルに1セルずつコピペして当日分の承り。なおかつ注文表示をクリックして詳細表示し、そこにリンクされた注文書がPDFダウンロード。そこからも必要項目を先のエクセルにコピペして…と回りくどい作業をしています。
とりあえず2項目
一覧をまとめてCSV書き出し、PDFもまとめてフォルダに一括、せめてそこまででも時短につながるので苦慮してます。
1つ目は表抽出でCSVに書き出すことができました。
2つ目ですがDownThemAll!というのを見つけ、一括でPDFダウンロードできると喜ぶも
1階層目しかダウンロードできず、目的のPDFは初めの複数ページから、クリックして単独ページ、そこにダウンロードクリックボタンがあるので、下層までは下りてくれないのか……
やはりstudioXで場所指定してクリックしてもらうか?
でも、クリック指定しても1つしかクリックできません。
となると、表抽出のように「順番に最後まで」や「繰り返し」と指定するのはどうすれば?
まずはお茶でも飲んで落ち着きましょう・・!
論点がどこにあるのかがちょっと見えていないです、すみません。
とりあえず以下3点確認させていただきたく。
確認①
1.ブラウザを使って、注文書情報?が表形式、複数ページ構成で表示されているサイトから、自社分だけにチェックを付けて注文書PDFをダウンロードする
2.ダウンロードした各PDF内に記載されている必要な情報をピックアップして、PDFごとに1行でExcel辺りに転記する
というのが最終的にやりたい事でしょうか?
確認②
先の私の回答は、上記2.のやり方について実現可能性を模索するお話でしたが、
その前に1.でうまいこと自社分だけを一括ダウンロードできないかを知りたい、という事でしょうか?
(トピックの題名とはちょっと話題がずれてしまいますが・・)
確認③
使用されているのはStudioでしょうか、それともStudioXでしょうか?
おそらく、何がやりたくてどこで詰まっていて何を教えてほしいのかがうまく伝わっていません。
この辺りから認識を合わせていきましょう・・。
なかなか言葉で伝わらず申し訳有りません。
確認①
複数社向けの「発注情報の羅列」(例えば100項目)表示サイトから、レ点で「選別」自社向け表示にする。
自社向け表示(承り作業分が例えば20項目)。
そこを項目毎にクリックすると、1項目ごとの品名等詳細情報と「PDFクリックボタン」があり、さらに詳しい納付先、数量が記された「注文書」のPDFが開きます。
当日の自社承り作業分をまとめるため、
「発注情報の羅列」から必要テキストをコピペ
「注文書」のPDFを開いて、そこからもコピペ
…と手作業で1セルごとコピペしてエクセルに集約するという手間のかかる作業
全て一括で…は無理にしろ、少しずつでも自動化したいのです。
まず「発注情報の羅列」はUipathの「表抽出」でCSVに書き出すことができました。
(セル毎のピックアップじゃないので不要な項目も含まれますが、これだけでも感動)
で、次の「個別の詳細情報」と「注文書PDF」の部分で悩んでいます。
「表抽出」した画面より1階層降りることになるので、「全て」が無理で「繰り返し」も
何を基準に指示したら良いのか?
確認②
PDF一括と調べると「Chrome」等ブラウザのプラグイン「DownThemAll!」を見つけ
試すも、表の階層上のみで、目的の下層までは見に行ってくれません。
確認③
エクセルもマクロは無理で多少の関数程度のレベルなので、初心者向けのstudioXで挑戦してますが、それでも難解です。
言い忘れました。PDF注文書が同一フォーマット…という前提で
PDFから必要箇所をコピペしたい。PDFは無理か?なら別ソフトにてエクセルに変換して、指定セルが同じレイアウトならコピペ可能?
それも無理なら、とにかくPDFをまとめてダウンロードしてフォルダインでも良い…と色々模索。