Extended Languages OCR Public Previewリリースのお知らせ

Extended Languages OCR Public Previewリリースのお知らせ

UiPath Extended Languages OCRがPublic Previewとしてリリースされました。このOCRエンジンは、200以上の言語で文書をデジタル化する能力を持っています。この新しいOCRエンジンは、特に中国語、日本語、韓国語に関して、従来のCJK OCRよりも大幅に改善されています。さらに、タイ語、ベトナム語、インドの主要言語、キリル文字アルファベットを使用する言語、ギリシャ語など、200以上の他の言語を処理することができます。

日本語のドキュメントが対象の場合、Document Understandingのプロジェクトを新規で作成する場合は、Extended Language OCRを選択することを推奨します。

StudioでUiPath Extended Languages OCRを使用する方法

Extended Languages OCRを使用するには、IntelligentOCRパッケージのバージョン6.18.0-previewを使用してインストールする必要があります。

インストールが完了したら、アクティビティパネルでExtended Languages OCRを検索します。それをDigitize Documentアクティビティにドラッグアンドドロップし、Document Understandingワークフローを実行してテストしてください。

エンドポイントとAPIキーは、自動的にプロジェクト設定に入力されます。

ラベリングでExtended Languages OCRを利用する方法

プロジェクトを作成する際には、Extended Languages OCRを選択することができます。詳細オプションをクリックしてください。クラシックプロジェクトとモダンプロジェクトの両方が、このOCRを使用して文書をデジタル化します。


制限

  • Document Manager上の既存のプロジェクトにおいて、途中からOCRをExtended Language OCRに変更した場合、そのより以前にアップロードされたドキュメントは新しいOCRを適用することができません。その過去のドキュメントを新しいOCRに適用する方法は、それらをエクスポートして再インポートすることです。
  • Extended Languages OCRは現在Automation Suiteでは利用できません。現時点では、それが利用可能になる具体的なタイムラインはありません。

UiPth Docs

ML Package リリースノート

OCR別対応言語一覧

Document Understandingで利用可能なOCR一覧

エンドポイント

1 Like