공공기관 Document AI 도입 전 반드시 확인해야 할 5가지 체크리스
공공기관의 문서 업무는 민간 기업과 다릅니다.
민원 신청서, 증빙자료, 공문, 기록물, 연구자료 등 다양한 문서를 처리해야 하며, 개인정보 보호와 폐쇄망 환경도 함께 고려해야 합니다.
최근에는 단순 OCR을 넘어 문서를 이해하고 업무를 자동화하는 Document AI 도입이 늘고 있습니다. 하지만 실제 사업에서는 OCR 정확도만으로 솔루션을 선택하지 않습니다.
운영 과정에서 얼마나 쉽게 확장할 수 있는지, 현업 담당자가 직접 활용할 수 있는지, 그리고 사용할수록 성능이 개선되는지가 더욱 중요해지고 있습니다.
로민은 국내 공공기관 Document AI 플랫폼 최다 구축 경험을 바탕으로 행정안전부 국가기록원, 특허청, 우정사업본부, 국립보건연구원, 한국환경공단 등 다양한 공공기관의 문서 업무 혁신을 지원해 왔습니다.
기관마다 처리하는 문서도 달랐고 업무 프로세스도 달랐지만, 실제 사업 과정에서 중요하게 검토하는 기준은 크게 다르지 않았습니다.
이번 글에서는 공공기관 Document AI 사업을 검토할 때 담당자들이 반드시 확인해야 할 핵심 기준 5가지를 정리했습니다.
1. 우리 기관 문서를 실제로 처리할 수 있나요?
공공기관 Document AI 사업을 검토할 때 가장 먼저 확인해야 할 것은 기능 목록이 아닙니다.
바로 실제 업무 문서를 안정적으로 처리할 수 있는지입니다.
공공기관이 처리하는 문서는 민원 신청서, 공문, 가족관계증명서, 사업자등록증, 진단서, 연구과제 신청서, 중소기업 확인서, 기록물 등 매우 다양합니다. 한 건의 업무 안에서도 신청서, 첨부 증빙자료, 확인서가 함께 제출되는 경우가 많습니다.
실제로 공공기관마다 처리하는 문서도 다릅니다.
국가기록원은 기록물과 행정문서를, 특허청은 특허 문서를, 한국환경공단은 차량 번호판·계기판 이미지와 각종 증빙서류를 처리합니다.
따라서 특정 문서 유형에서 높은 정확도를 보이는 것보다 다양한 문서를 안정적으로 처리할 수 있는지가 중요합니다.
특히 저품질 스캔본, 회전된 이미지, 필기체, 타자체, 복잡한 표 구조가 포함된 문서는 실제 운영 환경에서 자주 등장합니다.
최근에는 단순 OCR보다 문서를 이해하고 처리하는 Document AI Agent가 주목받고 있습니다. 문서를 읽는 것에서 끝나는 것이 아니라 어떤 문서인지 판단하고 이후 업무에 필요한 작업까지 연결해야 실제 자동화 효과를 얻을 수 있기 때문입니다.
따라서 솔루션을 평가할 때는 데모 문서가 아니라 실제 기관에서 사용하는 문서를 기준으로 성능을 검증하는 것이 중요합니다.
2. 새로운 문서가 추가될 때마다 비용이 발생하나요?
공공기관의 업무는 계속 변화합니다.
신규 사업이 생기고, 신청서 양식이 변경되고, 새로운 증빙서류가 추가됩니다.
문제는 많은 문서 자동화 프로젝트가 구축 당시 정의한 문서만 처리하도록 설계된다는 점입니다.
예를 들어 기존에 가족관계증명서, 사업자등록증, 진단서를 처리하던 시스템에 새로운 신청서나 확인서가 추가되면 별도 모델 개발과 유지보수가 필요한 경우가 있습니다.
실제 공공기관 사업에서는 구축 당시 정의되지 않았던 문서가 추가되는 경우가 자주 발생합니다.
신청서 양식이 개정되거나 새로운 증빙서류가 추가되면 기존 OCR 방식은 별도 개발이나 유지보수가 필요할 수 있습니다.
최근에는 새로운 문서 유형을 보다 쉽게 추가하고 운영할 수 있는 플랫폼 기반 Document AI에 대한 수요가 늘고 있습니다.
공공기관 입장에서 중요한 것은 현재 문서를 얼마나 잘 처리하느냐보다 앞으로 발생할 변화에 얼마나 유연하게 대응할 수 있느냐입니다.
따라서 솔루션을 검토할 때는 정확도뿐 아니라 새로운 문서 유형을 얼마나 쉽고 빠르게 추가할 수 있는지, 장기적으로 운영 비용을 줄일 수 있는 구조인지 함께 확인해야 합니다.
3. 현업 담당자가 직접 사용할 수 있나요?
Document AI의 실제 사용자는 개발자가 아닙니다.
민원 담당자, 심사 담당자, 운영 담당자 등 현업 사용자가 대부분입니다.
하지만 많은 솔루션은 새로운 문서를 등록하거나 추출 항목을 변경할 때 개발사 지원이 필요합니다.
예를 들어 연구과제 신청서에서 추출해야 할 항목이 변경되거나 새로운 민원 신청서가 추가되었을 때 매번 개발 요청이 필요하다면 운영 효율은 크게 떨어질 수 있습니다.
최근에는 생성형 AI를 활용해 문서를 자동으로 분석하고 필요한 추출 항목과 구조를 자동 생성하는 기능도 등장하고 있습니다.
예를 들어 사용자가 문서를 업로드하면 AI가 문서 유형을 분석하고, 추출해야 할 Key-Value 항목을 자동 추천하거나 생성할 수 있습니다.
신청인 성명, 주소, 접수번호, 신청유형, 접수일자와 같은 정보를 자동으로 추출하고 구조화할 수 있는 것입니다.
이를 통해 현업 담당자는 복잡한 프롬프트나 설정 없이도 새로운 문서를 빠르게 업무에 적용할 수 있습니다.
공공기관은 구축보다 운영 기간이 훨씬 길기 때문에 실제 사용자가 얼마나 쉽게 활용할 수 있는지가 매우 중요합니다.
4. 운영할수록 성능이 개선되는 구조인가요?
Document AI 사업은 구축이 끝이 아닙니다.
실제 운영이 시작되면 새로운 서식이 등장하고, 예외 문서가 유입되고, 품질이 낮은 문서도 계속 들어오게 됩니다.
그래서 중요한 것은 현재 성능보다 앞으로 얼마나 좋아질 수 있는가입니다.
예를 들어 담당자가 검수 과정에서 수정한 결과가 학습 데이터로 반영되고 동일한 오류가 반복되지 않는 구조라면 운영 부담은 점점 줄어들게 됩니다.
실제 운영 환경에서는 새로운 서식과 예외 문서가 지속적으로 발생합니다.
로민은 Active Learning 기능을 통해 담당자가 수정한 결과를 학습 데이터로 활용하고, 이를 기반으로 모델 성능을 지속적으로 개선할 수 있도록 지원하고 있습니다.
공공기관처럼 장기간 운영이 필요한 환경에서는 이러한 성능 개선 체계가 운영 효율성과 유지보수 비용에 직접적인 영향을 미칩니다.
결국 장기적으로 높은 성과를 만드는 것은 최초의 정확도가 아니라 운영 과정에서 얼마나 빠르게 학습하고 개선할 수 있는지에 달려 있습니다.
5. 폐쇄망과 개인정보 보호 요건을 충족할 수 있나요?
공공기관에서 Document AI를 도입할 때 성능만큼 중요하게 검토하는 것이 보안입니다.
많은 기관은 폐쇄망 또는 망분리 환경에서 시스템을 운영하고 있으며 개인정보와 민감정보를 포함한 문서를 처리합니다.
따라서 솔루션이 온프레미스(On-Premise) 또는 프라이빗 클라우드 환경을 지원하는지, 기존 업무 시스템과 안전하게 연계할 수 있는지 확인해야 합니다.
또한 주민등록번호, 휴대전화번호, 계좌번호, 건강정보 등 민감한 개인정보를 자동으로 탐지하고 비식별화할 수 있는 기능도 중요합니다.
최근에는 생성형 AI 활용이 늘어나면서 데이터가 어디에서 처리되고 저장되는지, 외부 서비스와 어떤 방식으로 연계되는지에 대한 검토도 더욱 중요해지고 있습니다.
공공기관 Document AI는 단순한 OCR 솔루션이 아니라 기관의 중요 정보를 다루는 업무 시스템의 일부입니다.
따라서 도입 단계부터 보안과 개인정보 보호 체계를 충분히 검토해야 합니다.
결론
공공기관 Document AI 사업의 성공은 OCR 정확도만으로 결정되지 않습니다.
실제 업무 문서를 처리할 수 있는지, 새로운 문서가 추가되어도 유연하게 대응할 수 있는지, 현업 담당자가 직접 활용할 수 있는지, 그리고 운영할수록 성능이 개선되는지가 더욱 중요합니다.
로민은 국가기록원, 특허청, 우정사업본부, 국립보건연구원, 정보통신산업진흥원(NIPA), 한국환경공단 등 다양한 공공기관에서 문서 인식과 문서 이해를 넘어 실제 업무 자동화를 지원해 왔습니다.
최근에는 문서를 읽는 OCR을 넘어 문서를 이해하고 업무를 수행하는 Document AI Agent 플랫폼으로 발전하고 있습니다.
공공기관 Document AI 사업을 검토하고 있다면 단순 정확도보다 실제 업무를 얼마나 효율적으로 수행할 수 있는지 중심으로 평가해 보시기 바랍니다.
FAQ
공공기관 Document AI와 일반 OCR의 차이는 무엇인가요?
일반 OCR은 문서의 텍스트를 읽는 데 집중합니다. 반면 Document AI는 문서 분류, 정보 추출, 문서 이해, 검수, 시스템 연계까지 지원합니다. 최근에는 Document AI Agent를 통해 문서 기반 업무 자동화까지 가능해지고 있습니다.
공공기관 문서 자동화에 어떤 문서를 활용할 수 있나요?
민원 신청서, 공문, 가족관계증명서, 사업자등록증, 중소기업 확인서, 진단서, 연구과제 신청서, 기록물, 각종 증빙서류 등 다양한 문서를 활용할 수 있습니다.
공공기관에서 가장 중요하게 보는 Document AI 평가 기준은 무엇인가요?
실제 운영 단계에서는 정확도뿐 아니라 신규 문서 추가 시 비용 발생 여부, 현업 담당자의 사용 편의성, Active Learning 기반 성능 개선 체계, 폐쇄망 지원 여부 등을 함께 검토합니다.
Key-Value 추출이란 무엇인가요?
문서에서 필요한 정보를 구조화된 데이터 형태로 추출하는 기술입니다. 예를 들어 신청서에서 성명, 접수번호, 주소, 신청유형, 접수일자 등을 추출해 업무 시스템에서 바로 활용할 수 있도록 제공합니다.
Active Learning은 왜 중요한가요?
공공기관 문서는 서식 변경과 예외 문서가 자주 발생합니다. Active Learning은 담당자가 수정한 결과를 학습 데이터로 활용해 모델 성능을 지속적으로 개선하는 방식입니다. 장기 운영이 중요한 공공기관에서는 특히 중요한 기능입니다.
공공기관에서도 생성형 AI 기반 Document AI를 사용할 수 있나요?
가능합니다. 다만 온프레미스(On-Premise), 프라이빗 클라우드, 개인정보 보호 체계, 폐쇄망 지원 여부 등을 함께 검토해야 합니다. 공공기관은 일반 기업보다 보안 요구사항이 높은 경우가 많습니다.