Screen Scraping OCR 日本語文字化け

Kitty · July 22, 2019, 2:31pm

Remote Desktop の画面をScreen Scraping: OCRを取りました。
実際の文章は日本語文字＋英語文字＋数字が含めた場合は文字化けになります。
如何すればよいでしょうか？

When I use Screen Scraping OCR method on a sentence (for example news) where Japanese characters, English characters and numbers are included the extracted text will become garbled.
What should I do to fix it?

参考資料

https://www.osadasoft.com/uipath-%E7%94%BB%E5%83%8F%E8%AA%8D%E8%AD%98%E3%81%97%E3%81%9F%E6%97%A5%E6%9C%AC%E8%AA%9E%E6%96%87%E5%AD%97%E5%88%97%E3%82%92%E5%8F%96%E5%BE%97%E3%81%99%E3%82%8B/

Kitty · July 22, 2019, 2:33pm

For your reference
参考資料

Jun1 · July 22, 2019, 4:23pm

基本的に標準のOCRでは日本語の精度が高くはないので、別途、日本語対応のOCRソフトの導入を検討頂くのも選択肢となります。

質問の直接の回答ではありませんが、
リモート操作間のテクノロジーとして、
共有のクリップボードが使用できる場合は、「select &copy」の使用、
操作できるアプリの制限が掛かりますが、Remode runtimeの使用が考えられます。

ui-path-example · July 23, 2019, 2:14am

@Kitty
OCRは基本的にお勧めないです。精度が保証されないですから。
今までUIPATHがあるORCエンジンを試しました。
一番精度が高いのはOmniPageだと思います。

詳しくは
https://www.uipath-example.com/omnipage-ocri-ntroduction/

ご参考まで

Kitty · July 24, 2019, 12:16am

ご提案ありがとうございます。使いたい製品はリモートアプリケーションようなのでOCRを使いたいです。Remode runtimeがないアプリケーションですが、次回同じような事件があった時にクリップボードやRemode runtimeを考えおきます。ありがとうございます。勉強になりました。

Kitty · July 24, 2019, 1:41am

ご指導ありがとうございます。
私が指定ようり一度やって見ましたが結果が文字化けでした。
私は何か間違い設定を行いましたか？

ui-path-example · July 24, 2019, 1:56am

@Kitty

こんにちは。出力の変数の設定場所は「OmniPage OCR」のプロパティじゃなくて、「Get OCR Text」のプロパティです。

Kitty · July 24, 2019, 2:11am

確かにそうですね。
すみません、ありがとうございます。
修正しましたが結果は変わりませんでした。

ui-path-example · July 24, 2019, 2:15am

@Kitty

アクティビテ「OmniPage OCR」のプロパティ設定しているの変数は削除しましたか？

Kitty · July 24, 2019, 2:30am

はい、そうです。
削除にしても変わりませんでした。
そう言えば、私が使っているUiPathの環境は英語版なので日本語版に変更必要でしょうか？関係と思いますが、一度やって見ます。少々お待ちください。

Kitty · July 24, 2019, 2:31am

ui-path-example · July 24, 2019, 2:33am

@Kitty

Uipathの環境に関係がないと思う。
よろしければ、xaml ファイルアップロードしてもらいませんか？

Kitty · July 24, 2019, 2:36am

申し訳ございませんが、日曜日にアカウントを作っりました。
新アカウントではファイルをアップロードが出来なさそうです。

アップロードするときに以下エラーメッセージが出てきました。
Sorry, new users can not upload attachments.

Kitty · July 24, 2019, 2:39am

以下にアップロード致しましたのでご確認お願い致します。

https://drive.google.com/open?id=1CVQekRqRbvYxz2fAxx8D5elXhKRK68H8

ui-path-example · July 24, 2019, 2:55am

@Kitty

すみません、プロパティのLanguageコードは”ja”を入り替えで実行してみてください。

Kitty · July 24, 2019, 3:20am

お手伝って頂いてありがとうございます。
"ja"に変更しましたら先の文章が完璧に出力できました。

色々な文書をやっていました、ほぼ間違いありませんでした。
一ヶ所だけで間違っている場合が気を付けました。
ラインの頭に「7/」を書くと漢字に認識されています。「合っている場合あります・合ってない場合もあります」
ラインの中に「7/」が書くと結果は間違いないです。

ご丁寧な対応ありがとうございます。感謝しております。

OmniPageOCR7

system · August 23, 2019, 2:12am

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Screen scrapping japanese character does not correctly Help ocr , activities , data_scraping , error , question	1	914	November 11, 2019
OCR / Screen Scrapingで日本語が利用できない。ナレッジベース ocr , studio	0	11310	December 28, 2017
Ocr日本語パックのインストールフォーラム	12	8119	May 11, 2018
OCR Japanese Help ocr , studio	6	3849	July 1, 2019
ＰＤＦをＯＣＲで読みたいのですが。フォーラム ocr , activities , question	6	3627	November 29, 2019

Screen Scraping OCR 日本語文字化け

Related topics