Document Understanding 設定

IntelligentOCRによるデータ抽出の自動化を実施したいのですが、
データ抽出スコープ内のフォーム抽出器において、下記エラーが発生します。

Request PredictionId:
Error performing OCR: Response indicates an error: Unauthorized, Error: Could not validate api key EngineError”
→こちらAutomationcloudよりAPI keyを取得しフォーム抽出器に設定しているのですが有効になりません。
アクティビティをワークフローにドロップした際に自動で入力されているAPIキーではこのエラーは発生しないのですが、下記エラーが発生します。
DocumentUnderstanding server returned 404 (Not Found). Additional details: The “syncAnalyze” endpoint is no longer supported. Please use the “analyze” endpoint instead by upgrading to OCR.Activities package >= 3.6.2…
Http Response Code: 404
Http Response Content: The “syncAnalyze” endpoint is no longer supported. Please use the “analyze” endpoint instead by upgrading to OCR.Activities package >= 3.6.2.
→こちらもOCR.Activitiesをバージョンアップしたうえで再実行しましたが改善しませんでした。
タクソノミー読み込み後のドキュメントをデジタル化にて OCR- Japanese,Chinese,Korean を設置し、上記で自動で入力されていたAPIキー、エンドポイント(“https://du-jp.uipath.com/cjk-ocr”)を設定したうえでメッセージボックスに出力した際には正常に動作します。フォーム抽出器でエラーが発生する原因がわかりません。

ご教授いただければと思います。

こんにちは

どのAPIキーを使用していますでしょうか?
また利用しているAutomationCloudのプランは何になりますでしょうか?(Enterpriseプランで、AI-Unit契約がありますでしょうか?)

アクティビティをドロップした際に自動で入力されているAPIキーを使用しています。
Enterpriseプランですが、AI-Unit契約はございません。

また、フォーム抽出器でのエンドポイントの設定を誤っていたので修正(“https://du-jp.uipath.com/svc/formextractor”)したのですが、下記エラーに躓いてしまいました。

フォーム抽出器
DocumentUnderstanding server returned 405 (Method Not Allowed). Additional details:

405 Not Allowed

405 Not Allowed


nginx/1.20.1 . CF-RAY: . Http Response Code: 405 Http Response Content: 405 Not Allowed

405 Not Allowed


nginx/1.20.1

おそらくEnterprise契約の場合、AI Unit契約が無いとフォーム抽出器は使えないように思えます。

こちらも参照ください

1 Like

AutomationcloudにはDocumentUnderstandingの項目もあるのですが、こちらだけでは使えないのでしょうか?

上記2つ目のリンクの内容の抜粋が以下になりますので、基本的には使えないものと考えた方が良いと思います。(3rd PartyのOCR等を使えば一部機能は使えるかもしれませんが)

1 Like

やりたいこととしては請求書等のpdfにあるテキストを読み取ってEXCELに書き出しをしたいのですが、上記の代替案はありますでしょうか。

まずPDFの中身が画像なのか、テキストが埋め込まれているかでアプローチが変わります。

後者なら以下のアクティビティで、テキスト情報は取得できます。(UiPath.PDF.Activities pacakgeに含まれます)正規表現等の文字列操作だけで取得できそうであれば、こちらだけで完結すると思います。(できるかどうかは内容次第ですね)

PDFが画像ベースの場合はOCRでpdfを読み込みを使うほうがよろしいという認識で良いでしょうか。
また、ご教示いただいた方法で書き出すと少し時間がかかるのですが、高速化する方法はございますでしょうか。

こんにちは

PDFが画像ベースの場合はOCRでpdfを読み込みを使うほうがよろしいという認識で良いでしょうか。

画像ベースの場合、PDFのテキスト読み込みアクティビティは使っても意味がないので、OCRの方を使用します。ただOCRの精度が100%にはならないと思いますので、正規表現での抽出は難しいケースもあると思います。

OCRではない方の読み取りでしょうか?
ファイルサイズやマシンスペックにも依存しますが、どのくらいのサイズで、何秒くらいかかっていますでしょうか?

100KBほどの1枚のpdfですが、1分少しかかっている状況です。

手元の環境ですと以下URLの資料(1MByte程度)で1秒以下ですね。

ファイル要因か環境要因かを切り分けるために、一度上記試してもらえればと思います。

テキストへの書き出しは問題ないのですが、Excelへの書き出しだと書き込み先のExcelが開いたまま完了までフリーズしたような形で時間がかかります。

どのようなアクティビティを使って、どのように実装していますでしょうか?
上記のアクティビティはテキストしか取得できないので、そのままではエクセルには同様には取り込めないと思いますが。

pdfファイルを読み込み にてpdfを読み込み、出力したテキストを一行ずつExcelに書き込むような実装をしています。

パフォーマンス重視するなら、一旦テキストに出力して、それを「エクセルファイルを使用」アクティビティで開けば良いように思えます。
あるいは、PDFから取得した文字列をGenerateDataTableアクティビティでDataTableに変換してから書き込んでも良いかもです。