Document Understanding 設定

MOMOMOMO · November 19, 2024, 9:21am

IntelligentOCRによるデータ抽出の自動化を実施したいのですが、
データ抽出スコープ内のフォーム抽出器において、下記エラーが発生します。

Request PredictionId:
Error performing OCR: Response indicates an error: Unauthorized, Error: Could not validate api key EngineError”
→こちらAutomationcloudよりAPI keyを取得しフォーム抽出器に設定しているのですが有効になりません。
アクティビティをワークフローにドロップした際に自動で入力されているAPIキーではこのエラーは発生しないのですが、下記エラーが発生します。
DocumentUnderstanding server returned 404 (Not Found). Additional details: The “syncAnalyze” endpoint is no longer supported. Please use the “analyze” endpoint instead by upgrading to OCR.Activities package >= 3.6.2…
Http Response Code: 404
Http Response Content: The “syncAnalyze” endpoint is no longer supported. Please use the “analyze” endpoint instead by upgrading to OCR.Activities package >= 3.6.2.
→こちらもOCR.Activitiesをバージョンアップしたうえで再実行しましたが改善しませんでした。
タクソノミー読み込み後のドキュメントをデジタル化にて OCR- Japanese,Chinese,Korean を設置し、上記で自動で入力されていたAPIキー、エンドポイント（“https://du-jp.uipath.com/cjk-ocr”）を設定したうえでメッセージボックスに出力した際には正常に動作します。フォーム抽出器でエラーが発生する原因がわかりません。

ご教授いただければと思います。

Yoichi · November 19, 2024, 9:31am

こんにちは

どのAPIキーを使用していますでしょうか？
また利用しているAutomationCloudのプランは何になりますでしょうか？（Enterpriseプランで、AI-Unit契約がありますでしょうか？）

MOMOMOMO · November 19, 2024, 9:44am

アクティビティをドロップした際に自動で入力されているAPIキーを使用しています。
Enterpriseプランですが、AI-Unit契約はございません。

また、フォーム抽出器でのエンドポイントの設定を誤っていたので修正（“https://du-jp.uipath.com/svc/formextractor”）したのですが、下記エラーに躓いてしまいました。

フォーム抽出器
DocumentUnderstanding server returned 405 (Method Not Allowed). Additional details:

405 Not Allowed

nginx/1.20.1 . CF-RAY: . Http Response Code: 405 Http Response Content: 405 Not Allowed

405 Not Allowed

nginx/1.20.1

Yoichi · November 19, 2024, 9:48am

おそらくEnterprise契約の場合、AI Unit契約が無いとフォーム抽出器は使えないように思えます。

こちらも参照ください

MOMOMOMO · November 20, 2024, 2:13am

AutomationcloudにはDocumentUnderstandingの項目もあるのですが、こちらだけでは使えないのでしょうか？

Yoichi · November 20, 2024, 2:36am

上記2つ目のリンクの内容の抜粋が以下になりますので、基本的には使えないものと考えた方が良いと思います。（3rd PartyのOCR等を使えば一部機能は使えるかもしれませんが）

MOMOMOMO · November 20, 2024, 9:37am

やりたいこととしては請求書等のpdfにあるテキストを読み取ってEXCELに書き出しをしたいのですが、上記の代替案はありますでしょうか。

Yoichi · November 20, 2024, 9:42am

まずPDFの中身が画像なのか、テキストが埋め込まれているかでアプローチが変わります。

後者なら以下のアクティビティで、テキスト情報は取得できます。（UiPath.PDF.Activities pacakgeに含まれます）正規表現等の文字列操作だけで取得できそうであれば、こちらだけで完結すると思います。（できるかどうかは内容次第ですね）

MOMOMOMO · November 20, 2024, 10:48am

PDFが画像ベースの場合はOCRでpdfを読み込みを使うほうがよろしいという認識で良いでしょうか。
また、ご教示いただいた方法で書き出すと少し時間がかかるのですが、高速化する方法はございますでしょうか。

Yoichi · November 20, 2024, 1:54pm

こんにちは

PDFが画像ベースの場合はOCRでpdfを読み込みを使うほうがよろしいという認識で良いでしょうか。

画像ベースの場合、PDFのテキスト読み込みアクティビティは使っても意味がないので、OCRの方を使用します。ただOCRの精度が100%にはならないと思いますので、正規表現での抽出は難しいケースもあると思います。

OCRではない方の読み取りでしょうか？
ファイルサイズやマシンスペックにも依存しますが、どのくらいのサイズで、何秒くらいかかっていますでしょうか？

MOMOMOMO · November 21, 2024, 4:44am

100KBほどの1枚のpdfですが、1分少しかかっている状況です。

Yoichi · November 21, 2024, 4:51am

手元の環境ですと以下URLの資料（1MByte程度)で1秒以下ですね。

ファイル要因か環境要因かを切り分けるために、一度上記試してもらえればと思います。

MOMOMOMO · November 21, 2024, 6:00am

テキストへの書き出しは問題ないのですが、Excelへの書き出しだと書き込み先のExcelが開いたまま完了までフリーズしたような形で時間がかかります。

Yoichi · November 21, 2024, 6:02am

どのようなアクティビティを使って、どのように実装していますでしょうか？
上記のアクティビティはテキストしか取得できないので、そのままではエクセルには同様には取り込めないと思いますが。

MOMOMOMO · November 22, 2024, 2:23am

pdfファイルを読み込みにてpdfを読み込み、出力したテキストを一行ずつExcelに書き込むような実装をしています。

Yoichi · November 22, 2024, 2:48am

パフォーマンス重視するなら、一旦テキストに出力して、それを「エクセルファイルを使用」アクティビティで開けば良いように思えます。
あるいは、PDFから取得した文字列をGenerateDataTableアクティビティでDataTableに変換してから書き込んでも良いかもです。

Topic		Replies	Views
Document understanding apiキーについて Orchestrator	5	360	April 11, 2024
ApiKey（APIキー）の取得方法についてフォーラム studio , question	6	2448	March 26, 2021
OCRアクティビティのAPIキー取得方法についてフォーラム	2	2773	August 7, 2020
OCRのエンドポイントキーが取得できないフォーラム	5	1295	March 28, 2023
Digitize Studio activities , studio , question , document_understanding , project_panel , activities_panel	4	246	March 1, 2024

Document Understanding 設定

405 Not Allowed

405 Not Allowed

Related topics