Introduction to Document AI
Last updated
Last updated
📌 목차
Document AI 란?
DocAI의 중요성?
Upstage Document AI 비교
Document AI는 문서를 디지털화하고, 문서 내 정보를 자동으로 추출하는 AI 기술입니다.
생소하게 느껴질 수도 있지만, 사실 우리는 이미 일상 속에서 DocAI를 경험하고 있습니다. 예시를 같이 살펴볼까요?
✔ 자동 문서 스캔 및 데이터 추출
은행에서 신분증을 촬영하거나, 계약서를 스캔할 때 자동으로 중요한 정보가 추출되는 경험을 해보셨나요?
DocAI는 문서 내 글자를 인식하고, 이름, 날짜, 주소와 같은 필수 정보를 정확하게 추출하여 자동으로 입력해 줍니다.
✔ 영수증 자동 처리
회식 후 회사에 영수증을 제출할 때, 날짜나 금액을 일일이 입력하는 과정이 번거로우셨나요?
DocAI는 영수증을 스캔하면 날짜, 금액, 품목 등을 자동으로 인식하고, 정리해줍니다.
덕분에 반복적인 수작업을 줄이고, 보다 효율적으로 업무를 처리할 수 있습니다.
✔ 자동 문서 분류
보험사 등에서 여러 종류의 문서를 한 번에 스캔했을 때, 이를 자동으로 분류해주는 기능을 사용해본 적이 있으신가요?
DocAI는 계약서, 인보이스, 신분증 등 다양한 문서 내 텍스트를 스스로 인식하고 자동으로 분류해줍니다.
덕분에 문서 관리가 훨씬 간편해지고, 필요한 정보를 빠르게 찾을 수 있습니다.
DocAI는 문서 처리 AI 기술로 혁신적인 변화를 이끌고 있습니다.
자동화된 문서 처리: 문서 스캔, 데이터 추출, 분류 작업 등을 자동화하여 업무의 속도와 효율성을 향상.
정확한 데이터 추출: 다양한 문서에서 핵심 정보를 신속하고 정확하게 추출하여 수작업 입력 오류 감소.
시간 절약: 반복작업 자동화를 통한 업무 시간 단축 및 중요 업무에 집중 지원
다양한 문서 형식 지원: 종이 문서, PDF, 이미지 등 다양한 형태의 문서를 처리할 수 있어, 디지털화 가능.
글로벌 문서 처리: 다국어 문서도 자동으로 인식하고 처리하여, 국제 업무에서도 효율성을 극대화.
구조화된 데이터 제공: 추출된 데이터 자동 정리를 통해 쉽게 검색하고 분석할 수 있도록 지원.
인건비 절감: 수작업을 자동화함으로써 인건비를 절감 및 더 효율적인 인력 운영
오류 감소: 자동화된 데이터 추출을 통해 입력 오류를 최소화 및 데이터의 신뢰성 제고.
Upstage는 문서 처리와 정보 추출을 위한 세 가지 주요 도구를 제공합니다 : Document OCR, Document Parse, Information Extract.
Document OCR은 스캔된 이미지나 문서에서 텍스트를 그대로 추출하는 기술입니다.
예시: Apple 재무제표에서 "Apple Inc."라는 문구를 단순히 텍스트 형태로 추출합니다.
활용 시점: 문서에서 텍스트만 빠르게 추출하고 싶을 때 사용합니다.
아웃풋 형태 : 단순 텍스트
Information Extract는 문서에서 핵심 정보를 자동으로 추출해 구조화된 형태로 제공합니다.
예시: Apple 재무제표에서 기업명을 자동으로 인식하고, {Company Name : 'Apple Inc'}
형태로 추출합니다.
활용 시점: 계약서 등의 문서 내 텍스트 뿐만 아니라 텍스트의 정보(회사명, 날짜, 금액 등)를 함께 추출해야 할 때 사용합니다.
아웃풋 형태 : JSON 형태의 구조화된 데이터
Document Parse는 문서의 구조를 인식해, LLM이 이해할 수 있도록 HTML이나 Markdown 같은 구조화된 포맷으로 변환합니다.
예시: Apple 재무제표에서 "Apple Inc."라는 문구를 HTML로 구조화하여 추출합니다.
활용 시점:
논문, 보고서, 재무제표 같이 표, 도식, 수식 등이 포함된 복잡한 문서의 구조를 명확하게 정리하고 싶을 때 사용됩니다.
LLM을 통해 문서 요약, 분석을 진행하기 전 정형화된 형태로 문서를 준비할 때 유용합니다.
아웃풋 형태 : HTML 형태로 구조화된 데이터.
아래는 Upstage의 세 가지 주요 문서 처리 도구인 Document OCR, Information Extract, Document Parse의 기능을 표로 비교 정리한 내용입니다.
구분
Document OCR
Information Extract
Document Parse
기능
문서에서 텍스트만 추출
문서에서 텍스트 + 핵심 정보를 자동으로 추출하고 구조화된 형태로 제공
문서의 구조(레이아웃)을 인식해 HTML 포맷으로 변환
활용 시점
문서에서 텍스트만 빠르게 추출하고 싶을 때 사용
계약서, 인보이스 등 핵심 정보를 함께 추출해야 할 때 사용
논문, 보고서, 재무제표처럼 복잡한 문서의 구조를 정리하고 싶을 때 사용
출력 형태
단순 텍스트
JSON 형태의 구조화된 데이터
HTML 형태의 구조화된 데이터
이번 글에서는 DocAI의 정의, 중요성, 그리고 Upstage DocAI 제품들을 살펴보았습니다.
🔹 DocAI 정의: 자동 스캔, 데이터 추출, 문서 분류 등 문서 처리를 자동화하여 효율성 극대화.
🔹 DocAI의 중요성: 업무 생산성 향상, 접근성 증대, 비용 절감 효과.
🔹 Upstage Document OCR: 문서에서 텍스트로 변환하는 기본적인 기능을 제공합니다.
🔹 Upstage Information Extract: 문서 내에서 텍스트와 함께 자동으로 해당 텍스트의 의미를 담은 정보를 추출합니다.
🔹 Upstage Document Parse: 추출된 텍스트를 구조화된 형식(HTML 등) 으로 변환하여 LLM이 효율적으로 처리할 수 있도록 지원하며, 표와 차트 인식 기능을 포함합니다.
👉 이제 Upstage DocAI를 직접 체험하고 각 제품의 차이점을 비교해볼까요?
Suwan Kim | AI Edu | Upstage