# Introduction to Document AI

{% embed url="<https://youtu.be/-OvqZrwkDEE>" %}

**📌 목차**

* Document AI 란?
* DocAI의 중요성?
* Upstage Document AI 비교

## 1. Document AI란?

Document AI는 **문서를 디지털화하고, 문서 내 정보를 자동으로 추출하는 AI 기술**입니다.

생소하게 느껴질 수도 있지만, 사실 우리는 이미 일상 속에서 DocAI를 경험하고 있습니다. 예시를 같이 살펴볼까요?

✔ **자동 문서 스캔 및 데이터 추출**

<figure><img src="/files/1VmmpJ5WZjsYk7dOZtLR" alt=""><figcaption></figcaption></figure>

은행에서 신분증을 촬영하거나, 계약서를 스캔할 때 자동으로 중요한 정보가 추출되는 경험을 해보셨나요?

DocAI는 문서 내 글자를 인식하고, 이름, 날짜, 주소와 같은 필수 정보를 **정확하게 추출**하여 자동으로 입력해 줍니다.

✔ **영수증 자동 처리**

<figure><img src="/files/O7HG3PYNhIlSsybrvFsT" alt=""><figcaption></figcaption></figure>

회식 후 회사에 영수증을 제출할 때, 날짜나 금액을 일일이 입력하는 과정이 번거로우셨나요?

DocAI는 영수증을 스캔하면 **날짜, 금액, 품목 등을 자동으로 인식**하고, 정리해줍니다.

덕분에 반복적인 수작업을 줄이고, 보다 효율적으로 업무를 처리할 수 있습니다.

✔ **자동 문서 분류**

<figure><img src="/files/ui3kUrBO8D8Kx6PHgkCb" alt=""><figcaption></figcaption></figure>

보험사 등에서 여러 종류의 문서를 한 번에 스캔했을 때, 이를 자동으로 분류해주는 기능을 사용해본 적이 있으신가요?

DocAI는 **계약서, 인보이스, 신분증** 등 다양한 문서 내 텍스트를 스스로 인식하고 자동으로 분류해줍니다.

덕분에 문서 관리가 훨씬 간편해지고, 필요한 정보를 빠르게 찾을 수 있습니다.

## 2. DocAI의 중요성

DocAI는 문서 처리 AI 기술로 혁신적인 변화를 이끌고 있습니다.

### **🚀 (1) 업무 생산성 향상**

* **자동화된 문서 처리**: 문서 스캔, 데이터 추출, 분류 작업 등을 자동화하여 업무의 속도와 효율성을 향상.
* **정확한 데이터 추출**: 다양한 문서에서 핵심 정보를 신속하고 정확하게 추출하여 수작업 입력 오류 감소.
* **시간 절약**: 반복작업 자동화를 통한 업무 시간 단축 및 중요 업무에 집중 지원

### **🌎 (2) 접근성 향상**

* **다양한 문서 형식 지원**: 종이 문서, PDF, 이미지 등 다양한 형태의 문서를 처리할 수 있어, 디지털화 가능.
* **글로벌 문서 처리**: 다국어 문서도 자동으로 인식하고 처리하여, 국제 업무에서도 효율성을 극대화.
* **구조화된 데이터 제공**: 추출된 데이터 자동 정리를 통해 쉽게 검색하고 분석할 수 있도록 지원.

### **💰 (3) 비용 절감과 오류 감소**

* **인건비 절감**: 수작업을 자동화함으로써 인건비를 절감 및 더 효율적인 인력 운영
* **오류 감소**: 자동화된 데이터 추출을 통해 입력 오류를 최소화 및 데이터의 신뢰성 제고.

## 3. Upstage DocAI 비교

Upstage는 문서 처리와 정보 추출을 위한 세 가지 주요 도구를 제공합니다\
: **Document OCR, Document Parse, Information Extract.**

### 💡 Upstage Document OCR (Optical Character Recognition)

<figure><img src="/files/7OxSlnMP5gLCSDJD75o6" alt=""><figcaption></figcaption></figure>

**Document OCR**은 스캔된 이미지나 문서에서 **텍스트를 그대로 추출**하는 기술입니다.

* **예시**: Apple 재무제표에서 "Apple Inc."라는 문구를 단순히 텍스트 형태로 추출합니다.
* **활용 시점**: 문서에서 **텍스트만** 빠르게 추출하고 싶을 때 사용합니다.
* **아웃풋 형태** : 단순 텍스트

### 💡 **Upstage Information Extract**

<figure><img src="/files/XMGoyLIZnqAFgWR841x8" alt=""><figcaption></figcaption></figure>

**Information Extract**는 문서에서 **핵심 정보를 자동으로 추출**해 구조화된 형태로 제공합니다.

* **예시**: Apple 재무제표에서 기업명을 자동으로 인식하고, `{Company Name : 'Apple Inc'}` 형태로 추출합니다.
* **활용 시점**: 계약서 등의 문서 내 텍스트 뿐만 아니라 텍스트의 정보(회사명, 날짜, 금액 등)를 함께 추출해야 할 때 사용합니다.
* **아웃풋 형태** : JSON 형태의 구조화된 데이터

### 💡 **Upstage Document Parse**

<figure><img src="/files/AlTgn13qdHXdR5xUPli2" alt=""><figcaption></figcaption></figure>

**Document Parse**는 문서의 구조를 인식해, **LLM이 이해할 수 있도록 HTML이나 Markdown 같은 구조화된 포맷으로 변환**합니다.

* **예시**: Apple 재무제표에서 "Apple Inc."라는 문구를 HTML로 구조화하여 추출합니다.
* **활용 시점**:
  * 논문, 보고서, 재무제표 같이 표, 도식, 수식 등이 포함된 **복잡한 문서의 구조를 명확하게 정리**하고 싶을 때 사용됩니다.
  * LLM을 통해 문서 요약, 분석을 진행하기 전 **정형화된 형태로 문서를 준비**할 때 유용합니다.
* **아웃풋 형태** : HTML 형태로 구조화된 데이터.

아래는 Upstage의 세 가지 주요 문서 처리 도구인 **Document OCR, Information Extract, Document Parse**의 기능을 표로 비교 정리한 내용입니다.

#### :bulb: **최종 비교**&#x20;

<table data-header-hidden><thead><tr><th width="67.73828125"></th><th></th><th></th><th></th></tr></thead><tbody><tr><td><strong>구분</strong></td><td><strong>Document OCR</strong></td><td><strong>Information Extract</strong></td><td><strong>Document Parse</strong></td></tr><tr><td><strong>기능</strong></td><td>문서에서 <strong>텍스트만 추출</strong></td><td>문서에서 텍스트 + <strong>핵심 정보를 자동으로 추출</strong>하고 구조화된 형태로 제공</td><td>문서의 <strong>구조(레이아웃)을 인식</strong>해 HTML 포맷으로 변환</td></tr><tr><td><strong>활용 시점</strong></td><td>문서에서 <strong>텍스트만 빠르게 추출</strong>하고 싶을 때 사용</td><td>계약서, 인보이스 등  <strong>핵심 정보를 함께 추출</strong>해야 할 때 사용</td><td>논문, 보고서, 재무제표처럼 <strong>복잡한 문서의 구조를 정리</strong>하고 싶을 때 사용</td></tr><tr><td><strong>출력 형태</strong></td><td><strong>단순 텍스트</strong></td><td><strong>JSON 형태</strong>의 구조화된 데이터</td><td><strong>HTML 형태</strong>의 구조화된 데이터</td></tr></tbody></table>

### Wrap Up

이번 글에서는 **DocAI의 정의, 중요성, 그리고 Upstage DocAI 제품들**을 살펴보았습니다.

🔹 **DocAI 정의**: 자동 스캔, 데이터 추출, 문서 분류 등 문서 처리를 자동화하여 효율성 극대화.

🔹 **DocAI의 중요성**: 업무 생산성 향상, 접근성 증대, 비용 절감 효과.

**🔹 Upstage** **Document OCR**: 문서에서 텍스트로 변환하는 기본적인 기능을 제공합니다.

**🔹 Upstage Information Extract**: 문서 내에서 텍스트와 함께  자동으로 해당 텍스트의 의미를 담은 정보를 추출합니다.

**🔹 Upstage Document Parse**: 추출된 텍스트를 구조화된 형식(HTML 등) 으로 변환하여 LLM이 효율적으로 처리할 수 있도록 지원하며, 표와 차트 인식 기능을 포함합니다.

**👉 이제 Upstage DocAI를 직접 체험하고 각 제품의 차이점을 비교해볼까요?**

[**Upstage DocAI 체험하러 가기**](https://console.upstage.ai/playground/document-parse?utm_source=gitbook\&utm_medium=platform\&utm_campaign=edu-gitbook-kr\&utm_content=05-dp-console)

***

**Suwan Kim** | **AI Edu** | **Upstage**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://upstage-ai-education.gitbook.io/upstage-edustage/basics/editor/introduction-to-document-ai.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
