Abbyy FlexiCapture Document Assembly

이번 포스팅에서는 Abbyy FlexiCapture의 장점 중 하나인 document assembly에 대해서 얘기해보려고 합니다.

"document"는 우리가 Abbyy FlexiCapture를 이용하여 처리하려고 하는 단위를 말합니다. 하나의 document는 하나 이상의 section으로 구성됩니다. 그리고, 하나의 section은 하나 이상의 page로 구성됩니다. 아래의 예는 세 개의 section으로 구성된 document를 보여줍니다. section a는 세 개의 page를 가지고 있고, section b는 두 개, section c는 세 개의 page를 가지고 있습니다. 그리고 page 8개 모두가 하나의 file에 담겨 있습니다.

이와 같이 하나의 file이 하나의 document만 담고 있는 경우에는 Abbyy 프로젝트의 property에서 아래와 같이 "For each image file"을 선택하면 됩니다. 메뉴의 경로는 “Project → Project Properties… → Image Processing → Create document” 입니다.

file 하나에 여러 개의 document가 담겨 있거나, 하나의 document가 여러 개의 file에 담겨 있는 경우에는 아래의 그림과 같이 "Automatically when Document Definition is applied"를 선택해야 합니다.

위의 예에서 보여드린 a, b, c 세 개의 section으로 이루어진 document는 아래와 같이 assembly 규칙을 정해주면 됩니다. 메뉴의 위치는 “Document Definition Editor → Document Definition → Document Definition Properties… → Assembly” 입니다.

각 section에 대하여 Min number와 Max number를 설정하여 section의 최소 개수와 최대 개수를 정해줄 수 있습니다. 만약 이 document가 section b를 반드시 하나 이상 가지고, 최대 3개까지 가질 수 있다면 아래와 같이 설정하면 됩니다.

이 document가 section a, b, c 중 어디에도 속하지 않는 page를 최대 5개까지 가질 수 있다면 “Enable annex pages” 옵션을 체크하고 아래와 같이 설정하면 됩니다.

section a는 항상 가장 앞에 오지만 section b와 section c의 순서는 뒤바뀔 수 있다면 아래와 같이 "Disable sections order check"와 "Begin document from first section"을 체크해주면 됩니다.

section a가 항상 가장 먼저 온다는 보장마저 없다면 “Begin document from first section” 체크를 지워주면 되는데, 이런 경우 assembly가 잘못될 가능성도 있습니다.