Studio Xにて画像ベースのPDFをフォーム抽出し、表形式にするプロジェクトを作成したいと考えております。
しかしながら、タクソノミーマネージャーのリボンが存在しないため、PDF全体をOCRできたとしても、データ抽出スコープにも影響を及ぼすため、抽出したいところのみを抽出はできないと思われます。
そのため、別の方法を模索しており、やり方があれば教えていただきたいです。
一つのやり方としては座標指定でやる方法になるかと思案しております。
Studioを利用したことがありましたが、Studio Xについては初心者のため、教えていただけると助かります。
Hey @_Y1 yes StudioX doesn’t include full Document Understanding capabilities like Studio .but you can use Read pdf with ocr or extract text with pdf activity so it will give you the output .and after extraction you can perform string manipulation or regex to extract specific data from the output.
cheers