OCR / Screen Scrapingで日本語が利用できない。

ocr
studio

#1

Version: 2018.1

質問)
Screen ScrapingなどOCRを利用したいと思いましたが、
選択肢に英語しかなく、日本語が利用できません。
どうしたらよいでしょうか。




回答)
OCRのインストールが必要になります。

​■Google OCRの日本語パックのインストール手順は以下となります。
(1) "jpn.traineddata"をダウンロードする。
https://github.com/tesseract-ocr/tessdata/blob/4.00/jpn.traineddata

(2) ダウンロードしたファイルを以下に置く。
C:\Program Files (x86)\UiPath\Studio\tessdata

(3) UiPathを再起動する。

■Microsoft OCRのインストールは以下の手順となります。
(1) Microsoft Office Document Imaging (MODI)のインストール
Sharepoint Designer 2007をインストールすることにより、MODIをインストールします。

以下のガイドの”Method 2: Install MODI by installing SharePoint Designer 2007"をご参照ください。
https://support.microsoft.com/en-us/help/982760/install-modi-for-use-with-microsoft-office-2010

(2)UiPathを再起動する。

参考リンク:


Ocr日本語パックのインストール