DU 프레임웍을 이용한 OCR 샘플(옴니페이지 ocr 엔진 사용)

Document Understanding 프레임웍을 이용하여 표가 포함된 이미지를 읽어오는 샘플입니다.

이미지를 하나만 가지고 테스트를 해서 부족한 면이 있지만 간단히 사용법을 익히고 성능을 가름하는 차원에서 진행한 샘플 코드입니다. OCR을 검토하는 분들은 좋은 대안이 될것이라고 생각됩니다.
옴니페이지 OCR을 처음 사용해 보았는데 성능이 상당히 괜찮은 것 같습니다.
아래 사용법과 샘플 코드 참고하세요.

Extractor API 키는 본인의 Orchestrator Cloud에 Du License에 API Key를 생성하고
생성된 API Key를 사용하시면 됩니다.
[참고]https://docs.uipath.com/automation-cloud/docs/about-licensing
이후 Orchestrator 서버를 통한 결과 검증 프로세스를 추가하려면 Action center을 이용하시면 됩니다.
[참고]https://www.uipath.com/product/action-center

*** 사용법 ***

  1. 필요 패키지
  • Intelleligent OCR
  • OminPage 3개
  • Persistence
    dupackage
  1. 개발 순선
  • taxonomy 생성
  • load taxonomy
  • digitizing
  • classification
  • extraction
    duframework

[결과]

  1. 원본 파일
    Main.xaml (5.3 KB)
    이미지 파일 : https://aws1.discourse-cdn.com/uipath/optimized/3X/f/1/f122bd2ba18b76548e079b220b8852b5e9da8dcc_2_690x367.png
  2. 출력 결과
    ocrresult
1 Like