_Chuki
(Chuki Tadayoshi Manabe(眞鍋 忠喜))
December 27, 2017, 10:11am
1
お世話になっております。
現在、Citrix環境でのテストを行っております。そこで2つの質問があります。
「OCR Engines in Studio - Setup and Languages」
Guidelines on how to use setup OCR engines with different languages:
Microsoft OCR
In Windows 10, you need to add the desired language in Control Panel - Language. Note that OCR support is not available for all languages.
In Windows 7, the OCR engine is not preinstalled. You need to install SharePoint 2007 MODI (Microsoft Office Document Imaging) and then the desired language pack for Office 2007.
Google OCR
Google OCR is using the Tesseract engine version 3.04 (at least in UiPath Studi…
1、v3.04の辞書で動作させる方法
上記ページの指示に従って、Tesseract-OCR v3.04の日本語辞書をダウンロードし、所定のフォルダに置くと、以下のエラーが出て実行できません。
⇒ OCR method failed to scrape this Region
これは、この辞書が使えないということでしょうか。解決策があればご教示いただけませんでしょうか。
2、v3.02の辞書で数字の読み取りがなぜか漢数字になってしまうことへの対処法
Tesseract-OCR v3.02の辞書を取得して動かしてみたところ、アラビア数字の1を漢数字の一として認識してしまい実行結果が 一996年などとなってしまい、困惑しています。
辞書が v3.02しか使えないということであれば、これらをちゃんと 1996年として認識させる方法をご教示いただけませんでしょうか。
Kingfisher
(Hiroaki Nakata)
January 7, 2018, 4:00am
2
@_Chuki 様
カスタマーサポートから現象の再現手順とワークフローおよび再現データを送っていただけますか?(UiPath Platformご契約済み、またはご契約検討中の場合のみ)
tango
January 16, 2018, 1:12am
3
@_Chuki さん、こんにちは
今朝、フォーラムみたらUiPath 2018.1.0がリリースされ、Tesseract 4.0になったようなのでバージョンアップすると改善されるかもしれません。
私の所でもTesseract3.0は実用に耐えがたく、詳しい人に4.0を使えとアドバイスをもらったことがあるので。私もこれから評価します。
1 Like
_Chuki
(Chuki Tadayoshi Manabe(眞鍋 忠喜))
January 16, 2018, 1:35am
4
ありがとうございます。正直、3台でCitrixの読み込みとかはあまり現実的ではなかったので早速確認させていただきます。
以上、よろしくお願いします。
system
(system)
Closed
June 23, 2020, 2:32am
5
This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.