OCR / Screen Scrapingで日本語が利用できない。

Lisa_UiPath · December 28, 2017, 1:47am

Version: 2018.1

質問）
Screen ScrapingなどOCRを利用したいと思いましたが、
選択肢に英語しかなく、日本語が利用できません。
どうしたらよいでしょうか。

回答）
OCRのインストールが必要になります。

■Google OCRの日本語パックのインストール手順は以下となります。
(1) "jpn.traineddata"をダウンロードする。
https://github.com/tesseract-ocr/tessdata/blob/4.00/jpn.traineddata

(2) ダウンロードしたファイルを以下に置く。
C:\Program Files (x86)\UiPath\Studio\tessdata

(3) UiPathを再起動する。

■Microsoft OCRのインストールは以下の手順となります。
(1) Microsoft Office Document Imaging (MODI)のインストール
Sharepoint Designer 2007をインストールすることにより、MODIをインストールします。

以下のガイドの”Method 2: Install MODI by installing SharePoint Designer 2007"をご参照ください。
https://support.microsoft.com/en-us/help/982760/install-modi-for-use-with-microsoft-office-2010

(2)UiPathを再起動する。

参考リンク：

Topic		Replies	Views
Ocr日本語パックのインストールフォーラム	12	8211	May 11, 2018
ＰＤＦをＯＣＲで読みたいのですが。フォーラム ocr , activities , question	6	3740	November 29, 2019
『Tesseract OCR』で日本語を抽出する方法ナレッジベース activities , tesseract-ocr	0	2207	March 7, 2025
OCR Japanese Help ocr , studio	6	3905	July 1, 2019
Screen Scraping OCR 日本語文字化けフォーラム	15	4527	July 24, 2019