【再送】形式が異なる複数の請求書の読み取り自動化について


#1

こんにちは。
形式が異なる複数の請求書を読み取る処理の自動化について、
時間が空いてしまいましたので、再度質問させていただきます。

前提として、
・形式/フォームが異なる、複数の種類の請求書が存在する
-例えば、ある請求書では、請求金額が下の方に書いてあるが、
別の請求書では上の方に書いてあるとします。

複数の種類の請求書から請求金額を
抽出する自動化を実装する場合、どのような手法が
ありますでしょうか。

サンプルの請求書2種をお送り致します。

お返事をいただけましたら幸いです。

サンプルのuipathocr.zip (2.6 MB)


#2

必要なことを洗い出すと、

  • 請求書の種類の判別
  • 個別の請求書から必要な値を取り出す

でしょうか。

前者は、ちょっと条件がわからないので何ともいえません。ファイル名か、中の文字か、何かしらの判断基準が必要です。

後者は。

  1. 一種類の請求書から、値を読みとる処理に特化したWorkflowを作成する
  2. 必要な値(請求書番号・会社名・日付・摘要・金額、等)を引数として返す、という処理を行う
  3. メインの処理で、請求書ごとに対応したWorkflowをInvoke Workflowし、結果を受け取る

という流れにするとわかりやすいと思います。
特に、請求書を実際に読みとるWorkflowの、引数(戻り値)の内容を統一しておくと、保守はかなり容易になるのではないでしょうか。


#3

Honoka 様

お返事ありがとうございます。

メインの処理で、請求書ごとに対応したWorkflowをInvoke Workflowし、

請求書ごとに分岐を作ることは考えていましたが、
ここまでは考えられていませんでした。
仰る通り、請求書ごとにinvokeで切り出すと、保守性が向上しそうですね。

ご丁寧な回答をいただきまして、ありがとうございます。