y.c
(BYC)
22
ありがとうございます!エラーは表示されなくなり、一応読み取りはできているようです。
ただ、精度はかなり低く、このまま使えそうになさそうです。
実際の注文書PDFにしたところ、ほぼ文字化けしてしまいました。。。
ドキュメントテキスト.txt (2.3 KB)
先ほどの画像ファイルの場合の読み取り結果↓
あ り が と う ご さ い ま す , ` ド キ ュ ン メ ト を ジ デ タ ル J の ご と で 、 碁 諏 し た と こ ろ す で に エ ラ ー が H て い ま し た . ド キ ュ メ ン ト を デ ジ タ ル 化 : One ormore erors gccured. (One ormore enors cccuned.
0nvald CJK severconfguraton
Netherasync norsync endponts are enabled_MicosofAzuecomputervsionEnortunngne)
Yoichi
(Yoichi)
23
冒頭で
Tesseract OCRはともかく、他の2つはそこそこ精度が良いと思いますので
と申しました通り、Tesseractはそれほど精度が高くありません。
他のクラウド系のOCRエンジンを正しく動くよう調整してみてはと思います。
(通信がブロックされている等ありませんでしょうか?)
あるいはOmniPageOCRも使えますが、こちらも精度はクラウドOCRには及ばないと思います。
y.c
(BYC)
24
ありがとうございます。
引き続き明日別のクラウドOCRも試してみます。
今のところ、単純にエンジンを置き換えてもエラーがでてしまうので、通信等も確認してみます。
y.c
(BYC)
25
お世話になっております。
OCRエンジンについては、コストかけられるか別途社内で検討しています。
並行して、現在利用している無料で変換したExcelについても検証したいと思っています。
最初に投稿した②、③についてなにかお知恵があればいただけないでしょうか?
②については、オプションで「空白行をスキップ」で回避したのですが、48行目以降も値を取るようになってしまいました。
③こちらが一番困っています、それぞれの商品のJANコードや配送コードの値を取ってきたいのですが、Excelの繰り返しのアクティビティだと、1行ずつ取ってきてしまって…。どう取得すればいいか何も浮かばす…。
Yoichi
(Yoichi)
26
例えば以下の様になると思います。
Sample20230712-1L.zip (12.9 KB)
y.c
(BYC)
27
サンプルまでありがとうございます!
各アクティビティの設定確認して、自分の方でも作ってみます。
本当にいつも丁寧にありがとうございます、大変助かります!
y.c
(BYC)
28
度々申し訳ございません。
クラウドOCRのエラーが相変わらず解消できません。社内のネットワークも確認していますが、そもそもAPIキーとエンドポイントの設定は以下で合っていますでしょうか?ちなみに、Community版です。
・UiPath Document OCR
エンドポイント:https://du-jp.uipath.com/ocr
・OCR for Chinese,Japanese and Korean
エンドポイント:https://du-jp.uipath.com/cjk-ocr
APIキーは、Document UnderstandingとComputer Visionの両方を試しました。
【エラー】OCR-日本語、中国語、英語(エラーログ)、Uipath ドキュメント OCR.txt (342.2 KB)
Yoichi
(Yoichi)
29
こんにちは
エラーメッセージによると
We are sorry. UiPath platform is not available in your country.
とありますので、利用できない国・地域とみなされているようです。
Enterprise契約があるのであれば公式サポートに調査を依頼できるかもしれませんが、Communityですと厳しいかもしれません。
あるいはインターネットアクセスに関して別のルートがあるようでしたらそちらを試してみるのも手かもしれません。
y.c
(BYC)
30
ありがとうございます。
本番環境はEnterprise契約なのですが、DocumentUnderstandingを購入していないので、検証用段階では別PCのCommunity版で利用していました。となると問い合わせも難しいかもしれませんね。
ひとまず引き続きインターネットアクセスのところで調査してみます。。。
Yoichi
(Yoichi)
31
こんにちは
エンタープライズ契約があるなら、評価目的でCEを使った場合の事象として公式ルートに相談する手もあるかもしれません。(本来はエンタープライズのトライアルを使うべきかもですが)
通信自体はUiPathのサーバー自体に届いている様に見えますので、あとはアクセス元となるIPアドレスが別となるようなルートがあれば、そちらで試してみる等が良いのではないかと思います。
y.c
(BYC)
32
ありがとうございます。
こちら公式に検証目的を伝えたところ、エンタープライズのトライアルでの使用を勧められました。
ネットの方は引き続きアドレス元を変更してみましたが、うまく行きませんでした。
ひとまずはサードパーティーのものでいただいたサンプルを元に仕様を検討してみます。
da-72
(共通 QC・QA)
34
全く同じ問題が発生しており、現在苦戦をしております。
(ドキュメントをデジタル化にて
・日本語・中国語・韓国語/UipathドキュメントのOCRでエラー
・Tesseract OCRでは動くが精度が低い)
その後何か解決法補は見つかっていますか。
もしも何か進展がございましたらご教授いただけますと幸いです。
よろしくお願いします。