Excelの表の読み込みについて

ありがとうございます!エラーは表示されなくなり、一応読み取りはできているようです。
ただ、精度はかなり低く、このまま使えそうになさそうです。
実際の注文書PDFにしたところ、ほぼ文字化けしてしまいました。。。
ドキュメントテキスト.txt (2.3 KB)

先ほどの画像ファイルの場合の読み取り結果↓
あ り が と う ご さ い ま す , ` ド キ ュ ン メ ト を ジ デ タ ル J の ご と で 、 碁 諏 し た と こ ろ す で に エ ラ ー が H て い ま し た . ド キ ュ メ ン ト を デ ジ タ ル 化 : One ormore erors gccured. (One ormore enors cccuned.
0nvald CJK severconfguraton

Netherasync norsync endponts are enabled_MicosofAzuecomputervsionEnortunngne)

冒頭で

Tesseract OCRはともかく、他の2つはそこそこ精度が良いと思いますので

と申しました通り、Tesseractはそれほど精度が高くありません。

他のクラウド系のOCRエンジンを正しく動くよう調整してみてはと思います。
(通信がブロックされている等ありませんでしょうか?)

あるいはOmniPageOCRも使えますが、こちらも精度はクラウドOCRには及ばないと思います。

ありがとうございます。
引き続き明日別のクラウドOCRも試してみます。
今のところ、単純にエンジンを置き換えてもエラーがでてしまうので、通信等も確認してみます。

お世話になっております。
OCRエンジンについては、コストかけられるか別途社内で検討しています。

並行して、現在利用している無料で変換したExcelについても検証したいと思っています。
最初に投稿した②、③についてなにかお知恵があればいただけないでしょうか?

②については、オプションで「空白行をスキップ」で回避したのですが、48行目以降も値を取るようになってしまいました。

③こちらが一番困っています、それぞれの商品のJANコードや配送コードの値を取ってきたいのですが、Excelの繰り返しのアクティビティだと、1行ずつ取ってきてしまって…。どう取得すればいいか何も浮かばす…。

例えば以下の様になると思います。

Sample20230712-1L.zip (12.9 KB)

サンプルまでありがとうございます!
各アクティビティの設定確認して、自分の方でも作ってみます。

本当にいつも丁寧にありがとうございます、大変助かります!

度々申し訳ございません。
クラウドOCRのエラーが相変わらず解消できません。社内のネットワークも確認していますが、そもそもAPIキーとエンドポイントの設定は以下で合っていますでしょうか?ちなみに、Community版です。

・UiPath Document OCR
エンドポイント:https://du-jp.uipath.com/ocr
・OCR for Chinese,Japanese and Korean
エンドポイント:https://du-jp.uipath.com/cjk-ocr

APIキーは、Document UnderstandingとComputer Visionの両方を試しました。
【エラー】OCR-日本語、中国語、英語(エラーログ)、Uipath ドキュメント OCR.txt (342.2 KB)

こんにちは
エラーメッセージによると

	We are sorry. UiPath platform is not available in your country.

とありますので、利用できない国・地域とみなされているようです。
Enterprise契約があるのであれば公式サポートに調査を依頼できるかもしれませんが、Communityですと厳しいかもしれません。
あるいはインターネットアクセスに関して別のルートがあるようでしたらそちらを試してみるのも手かもしれません。

ありがとうございます。
本番環境はEnterprise契約なのですが、DocumentUnderstandingを購入していないので、検証用段階では別PCのCommunity版で利用していました。となると問い合わせも難しいかもしれませんね。

ひとまず引き続きインターネットアクセスのところで調査してみます。。。

こんにちは

エンタープライズ契約があるなら、評価目的でCEを使った場合の事象として公式ルートに相談する手もあるかもしれません。(本来はエンタープライズのトライアルを使うべきかもですが)

通信自体はUiPathのサーバー自体に届いている様に見えますので、あとはアクセス元となるIPアドレスが別となるようなルートがあれば、そちらで試してみる等が良いのではないかと思います。

ありがとうございます。
こちら公式に検証目的を伝えたところ、エンタープライズのトライアルでの使用を勧められました。

ネットの方は引き続きアドレス元を変更してみましたが、うまく行きませんでした。
ひとまずはサードパーティーのものでいただいたサンプルを元に仕様を検討してみます。

全く同じ問題が発生しており、現在苦戦をしております。
(ドキュメントをデジタル化にて
・日本語・中国語・韓国語/UipathドキュメントのOCRでエラー
・Tesseract OCRでは動くが精度が低い)

その後何か解決法補は見つかっていますか。
もしも何か進展がございましたらご教授いただけますと幸いです。
よろしくお願いします。