Screen Scraping OCR 日本語文字化け

Remote Desktop の画面をScreen Scraping: OCRを取りました。
実際の文章は日本語文字+英語文字+数字が含めた場合は文字化けになります。
如何すればよいでしょうか?

When I use Screen Scraping OCR method on a sentence (for example news) where Japanese characters, English characters and numbers are included the extracted text will become garbled.
What should I do to fix it?

参考資料

https://www.osadasoft.com/uipath-%E7%94%BB%E5%83%8F%E8%AA%8D%E8%AD%98%E3%81%97%E3%81%9F%E6%97%A5%E6%9C%AC%E8%AA%9E%E6%96%87%E5%AD%97%E5%88%97%E3%82%92%E5%8F%96%E5%BE%97%E3%81%99%E3%82%8B/

For your reference
参考資料

基本的に標準のOCRでは日本語の精度が高くはないので、別途、日本語対応のOCRソフトの導入を検討頂くのも選択肢となります。

質問の直接の回答ではありませんが、
リモート操作間のテクノロジーとして、
共有のクリップボードが使用できる場合は、「select &copy」の使用、
操作できるアプリの制限が掛かりますが、Remode runtimeの使用が考えられます。

@Kitty
OCRは基本的にお勧めないです。精度が保証されないですから。
今までUIPATHがあるORCエンジンを試しました。
一番精度が高いのはOmniPageだと思います。

image

詳しくは

ご参考まで

1 Like

ご提案ありがとうございます。使いたい製品はリモートアプリケーションようなのでOCRを使いたいです。Remode runtimeがないアプリケーションですが、次回同じような事件があった時にクリップボードやRemode runtimeを考えおきます。ありがとうございます。勉強になりました。

ご指導ありがとうございます。
私が指定ようり一度やって見ましたが結果が文字化けでした。
私は何か間違い設定を行いましたか?

@Kitty

こんにちは。出力の変数の設定場所は「OmniPage OCR」のプロパティじゃなくて、「Get OCR Text」のプロパティです。

image

確かにそうですね。
すみません、ありがとうございます。
修正しましたが結果は変わりませんでした。

OmniPageOCR2

@Kitty

アクティビテ「OmniPage OCR」のプロパティ設定しているの変数は削除しましたか?

はい、そうです。
削除にしても変わりませんでした。
そう言えば、私が使っているUiPathの環境は英語版なので日本語版に変更必要でしょうか?関係と思いますが、一度やって見ます。少々お待ちください。

@Kitty

Uipathの環境に関係がないと思う。
よろしければ、xaml ファイル アップロードしてもらいませんか?

申し訳ございませんが、日曜日にアカウントを作っりました。
新アカウントではファイルをアップロードが出来なさそうです。

アップロードするときに以下エラーメッセージが出てきました。
Sorry, new users can not upload attachments.

以下にアップロード致しましたのでご確認お願い致します。

@Kitty

すみません、 プロパティのLanguageコードは”ja”を入り替えで実行してみてください。

image

1 Like

お手伝って頂いてありがとうございます。
"ja"に変更しましたら先の文章が完璧に出力できました。

色々な文書をやっていました、ほぼ間違いありませんでした。
一ヶ所だけで間違っている場合が気を付けました。
ラインの頭に「7/」を書くと漢字に認識されています。「合っている場合あります・合ってない場合もあります」
ラインの中に「7/」が書くと結果は間違いないです。

ご丁寧な対応ありがとうございます。感謝しております。

OmniPageOCR7

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.