Extended Languages OCR Public Previewリリースのお知らせ
UiPath Extended Languages OCRがPublic Previewとしてリリースされました。このOCRエンジンは、200以上の言語で文書をデジタル化する能力を持っています。この新しいOCRエンジンは、特に中国語、日本語、韓国語に関して、従来のCJK OCRよりも大幅に改善されています。さらに、タイ語、ベトナム語、インドの主要言語、キリル文字アルファベットを使用する言語、ギリシャ語など、200以上の他の言語を処理することができます。
日本語のドキュメントが対象の場合、Document Understandingのプロジェクトを新規で作成する場合は、Extended Language OCRを選択することを推奨します。
StudioでUiPath Extended Languages OCRを使用する方法
Extended Languages OCRを使用するには、IntelligentOCRパッケージのバージョン6.18.0-previewを使用してインストールする必要があります。
インストールが完了したら、アクティビティパネルでExtended Languages OCRを検索します。それをDigitize Documentアクティビティにドラッグアンドドロップし、Document Understandingワークフローを実行してテストしてください。
エンドポイントとAPIキーは、自動的にプロジェクト設定に入力されます。
ラベリングでExtended Languages OCRを利用する方法
プロジェクトを作成する際には、Extended Languages OCRを選択することができます。詳細オプションをクリックしてください。クラシックプロジェクトとモダンプロジェクトの両方が、このOCRを使用して文書をデジタル化します。
制限
- Document Manager上の既存のプロジェクトにおいて、途中からOCRをExtended Language OCRに変更した場合、そのより以前にアップロードされたドキュメントは新しいOCRを適用することができません。その過去のドキュメントを新しいOCRに適用する方法は、それらをエクスポートして再インポートすることです。
- Extended Languages OCRは現在Automation Suiteでは利用できません。現時点では、それが利用可能になる具体的なタイムラインはありません。