Form Extractor를 사용한 문서 인식과 Action Center를 사용한 문서 검증

2020 FTS 버전 출시와 동시에 UiPath.IntelligentOCR.Activities 패키지에도 Form ExtractorIntelligent Form Extractor 액티비티가 추가되었습니다. 그리고, Create Document Validation ActionWait for Document Validation Action and Resume 액티비티를 사용하여 추출 결과에 대한 사용자 검증 부분을 Action Center로 넘겨서 문서 처리 프로세스에서 분리할 수 있게 되었습니다. 이렇게 하여 생기는 장점은

  1. 사용자가 문서를 검증할 때까지 로봇이 더 이상 기다리지 않아도 됩니다. 로봇은 추출한 결과를 Action Center에 넘긴 후 다른 업무를 수행할 수 있습니다.
  2. 문서 처리를 시작한 사용자와 검증자가 반드시 동일하지 않아도 됩니다. 오케스트레이터 관리자는 Action Center에 추가된 문서를 처리할 담당자를 지정할 수 있습니다.
  3. 문서 처리를 시작한 로봇과 검증 이후의 단계를 수행하는 로봇이 반드시 동일하지 않아도 됩니다.

이번 포스팅에서는 Form Extractor를 사용하여 세금계산서에서 데이터를 추출하고, Action Center를 이용하여 사용자가 검증하는 처리를 자동화 해보려고 합니다.

Form Extractor를 사용하려면 Document Understanding API Key가 필요합니다. 아래와 같이 UiPath Cloud Platform의 Community Plan에서 제공하는 것을 사용하면 됩니다.

Action Center를 사용하려면 먼저 Action Catalog를 만들어야 합니다. 아래와 같이 "세금계산서 검증"이라는 이름으로 만들기로 하겠습니다.

검증할 데이터를 저장하려면 Storage Bucket도 필요합니다. 몇 가지 storage provider 중 선택할 수 있는데, 우리는 아래와 같이 Orchestrator storage를 사용하기로 하고 이름은 "문서 검증 버킷"이라고 지정합니다.

이제 taxonomy를 정의해 보겠습니다. 처리할 대상 문서는 아래와 같고

추출할 항목을 taxonomy manager에서 아래와 같이 정의합니다.

이제 워크플로우를 만들 차례입니다. 우리가 처리할 문서는 그 종류가 한 가지 뿐이니까 document classification은 생략하고 이래와 같은 순서로 처리하기로 합니다.

Load Taxonomy → Digitize Document → Extract Data using Form Extractor → Create Document Validation Action → Wait For Document Validation Action And Resume → Export Extraction Results

Studio에서 프로젝트를 만들 때 아래와 같이 “Orchestration Process” 템플릿을 선택하여 만들어야 합니다.

그렇게 하지 않았다면 프로젝트 설정 중 "General → Supports Persistence"를 켜주어야 합니다.

완성된 워크플로우에서 핵심만 남기면 아래와 같습니다. Digitize Document 단계에서는 Microsoft OCR 엔진을 사용했고, Form Extractor 액티비티에서는 Template Manager를 이용하여 세금계산서에 대한 template을 정의해 주었습니다.

이 워크플로우를 실행하고 처리할 문서를 제공하면 로봇이 문서에서 데이터를 추출한 후 “Wait For Document Validation Action And Resume” 액티비티에서 이 job은 “suspended” 상태가 되고, 로봇은 다른 작업을 수행할 수 있게 됩니다.

image

Orchestrator의 Actions에는 아래와 같이 새로운 action 아이템이 생성됩니다.

Orchestrator 관리자가 이 action을 담당자에게 할당(assign)하면 그 담당자는 아래와 같이 Orchestrator의 웹 인터페이스 안에서 검증 작업을 수행하게 됩니다.

검증이 완료되면 자동으로 작업 가능한 로봇에게 나머지 작업이 할당됩니다. 워크플로우는 아래에 첨부했습니다.

세금계산서_인식_workflow.zip (1.8 MB)

작동하는 동영상은 여기에서 보실 수 있습니다.

4 Likes