6Introduction to Document Parse

πŸ“Œ λͺ©μ°¨

  • Upstage Document Parse λž€ ?

  • Document Parse의 μ€‘μš”μ„±

  • Document Parse : LLM의 눈

  • Document Parse λΉ„μ¦ˆλ‹ˆμŠ€ μœ μ¦ˆμΌ€μ΄μŠ€

  • Demo: Playgroundμ—μ„œ DP 써보기

Upstage의 Document AI κΈ°μˆ μ€ κΈ°μ‘΄ OCR을 λ„˜μ–΄μ„  κ³ λ„ν™”λœ λ¬Έμ„œ 처리 κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.

특히 Upstage Document Parse (DP)λŠ” λ¬Έμ„œμ˜ λ ˆμ΄μ•„μ›ƒμ„ λΆ„μ„ν•˜μ—¬ 보닀 μ •ν™•ν•œ λ¬Έμ„œ 이해 및 정보 μΆ”μΆœμ΄ κ°€λŠ₯ν•©λ‹ˆλ‹€.

1. Upstage Document Parse λž€ ?

LLM은 λ‹€μ–‘ν•œ μ™ΈλΆ€ λ¬Έμ„œ 정보λ₯Ό μ°Έμ‘°ν•˜μ—¬ 정확도λ₯Ό λ†’μ΄μ§€λ§Œ, 원본 λ¬Έμ„œ νŒŒμΌμ„ 직접 읽고 μ²˜λ¦¬ν•  수 μ—†μŠ΅λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ λ¬Έμ„œλ₯Ό LLM이 읽을 수 μžˆλŠ” ν˜•μ‹(HTML, Markdown)으둜 λ³€ν™˜ν•˜λŠ” 과정이 ν•„μš”ν•©λ‹ˆλ‹€.

Document Parse(DP)λŠ” λ³΅μž‘ν•œ λ¬Έμ„œλ₯Ό HTML ν˜•νƒœμ˜ ν…μŠ€νŠΈ λ°μ΄ν„°λ‘œ λ³€ν™˜ν•˜λŠ” κΈ°μˆ μž…λ‹ˆλ‹€.

2. Document Parse의 μ€‘μš”μ„±

✨ Upstage DP만의 강점 : λ‹€μ–‘ν•œ λ¬Έμ„œ λ ˆμ΄μ•„μ›ƒ 인식

Upstage Document ParseλŠ” λ‹¨μˆœν•œ ν…μŠ€νŠΈ μΆ”μΆœμ„ λ„˜μ–΄, λ¬Έμ„œμ˜ λ ˆμ΄μ•„μ›ƒ λ‹¨μœ„λ‘œ μΈμ‹ν•˜μ—¬ 보닀 깊이 μžˆλŠ” 정보 뢄석을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. κΈ°μ‘΄ OCR은 이미지 λ‚΄ ν…μŠ€νŠΈ 인식에 κ΅­ν•œλ˜μ§€λ§Œ, DPλŠ” λ¬Έμ„œμ˜ λ ˆμ΄μ•„μ›ƒμ„ κ³ λ €ν•˜μ—¬ 보닀 μ •κ΅ν•˜κ²Œ 정보λ₯Ό λΆ„μ„ν•˜κ³  μ œκ³΅ν•©λ‹ˆλ‹€.

  • Table Recognition

    • λ³‘ν•©λœ μ…€, 계측적 ꡬ쑰 λ“± λ³΅μž‘ν•œ ν‘œλ„ μ •ν™•ν•˜κ²Œ μΈμ‹ν•˜μ—¬ μ •ν™•ν•˜κ³  μΌκ΄€λœ λ°μ΄ν„°λ‘œ λ³€ν™˜ν•¨.

    • 데이터 무결성을 보μž₯ν•˜μ—¬, LLM이 ν‘œμ˜ 의미λ₯Ό μ •ν™•νžˆ 이해할 수 μžˆλ„λ‘ 지원.

  • Equation Recognition

    • μˆ˜μ‹(Equation)을 μ •ν™•νžˆ μΈμ‹ν•˜μ—¬ LLM이 μˆ˜ν•™μ  κ΄€κ³„λ‚˜ 계산을 μ΄ν•΄ν•˜λ„λ‘ 지원.

  • Chart Recognition

    • 차트 데이터λ₯Ό 뢄석해 LLM이 μ •ν™•νžˆ 해석할 수 μžˆλ„λ‘ κ΅¬μ‘°ν™”λœ ν˜•νƒœλ‘œ λ³€ν™˜.

    • λ°”, μ„ , μ›ν˜• μ°¨νŠΈκΉŒμ§€ λ‹€μ–‘ν•œ ν˜•νƒœλ₯Ό 지원.

⚑ λΉ λ₯΄κ³  μ •ν™•ν•œ μ„±λŠ₯

  • 고속 처리 λŠ₯λ ₯

    • 100νŽ˜μ΄μ§€ λ¬Έμ„œλ„ 1λΆ„ 이내에 μ²˜λ¦¬ν•¨.

    • κ²½μŸμ‚¬ λŒ€λΉ„ μ΅œλŒ€ 10λ°° λΉ λ₯Έ 처리 속도.

  • μ •ν™•μ„±

    • TEDS(93.48) 및 TEDS-S(94.16) κΈ°μ€€, μ£Όμš” κ²½μŸμ‚¬ λŒ€λΉ„ 5% 이상 높은 정확도λ₯Ό 보μž₯.

    • λ³΅μž‘ν•œ ν‘œλ‚˜ μ°¨νŠΈμ—μ„œλ„ λ›°μ–΄λ‚œ 인식λ₯ μ„ 제곡.

3. Document Parse : LLM의 눈

κ·Έ μ΄μœ λŠ” LLM(λŒ€ν˜• μ–Έμ–΄ λͺ¨λΈ)이 λ¬Έμ„œλ₯Ό 더 잘 μ΄ν•΄ν•˜κ³  μ •ν™•ν•˜κ²Œ μ²˜λ¦¬ν•˜λ„λ‘ 돕기 μœ„ν•΄μ„œμž…λ‹ˆλ‹€.

πŸ“š 1. λ¬Έμ„œμ˜ "ꡬ쑰"λ₯Ό λͺ…ν™•ν•˜κ²Œ μ „λ‹¬ν•˜κΈ° μœ„ν•΄

원본 λ¬Έμ„œλŠ” ν…μŠ€νŠΈ, ν‘œ, 차트, μˆ˜μ‹, 이미지 λ“± λ‹€μ–‘ν•œ ꡬ쑰적 μš”μ†Œλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

LLM은 λ¬Έμ„œμ˜ ꡬ쑰λ₯Ό 인식할 λ•Œ 더 μ •κ΅ν•œ μ²˜λ¦¬κ°€ κ°€λŠ₯ν•˜μ§€λ§Œ, λ‹¨μˆœ ν…μŠ€νŠΈλ‘œλ§Œ 제곡되면 μ΄λŸ¬ν•œ ꡬ쑰λ₯Ό μΈμ‹ν•˜κΈ°μ–΄λ ΅μŠ΅λ‹ˆλ‹€.

HTML은 <h1>, <figure>, <table>κ³Ό 같은 νƒœκ·Έλ₯Ό 톡해 λ¬Έμ„œμ˜ 계측과 관계λ₯Ό λͺ…ν™•νžˆ ꡬ뢄해 μ€λ‹ˆλ‹€.

βš™οΈ 2. LLM의 정확도와 νš¨μœ¨μ„±μ„ 높이기 μœ„ν•΄

LLM은 κ΅¬μ‘°ν™”λœ 데이터λ₯Ό 톡해 λ”μš± λΉ λ₯΄κ³  μ •ν™•ν•˜κ²Œ λ‚΄μš©μ„ νŒŒμ•…ν•©λ‹ˆλ‹€.

HTML은 λ¬Έμ„œμ˜ ꡬ쑰λ₯Ό λͺ…ν™•νžˆ μ œμ‹œν•˜μ—¬ LLM이 μ–΄λŠ 뢀뢄이 제λͺ©, λ³Έλ¬Έ, ν‘œ, μ°¨νŠΈμΈμ§€ μ‰½κ²Œ μΈμ‹ν•˜λ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

결과적으둜, μš”μ•½, 뢄석, μ§ˆμ˜μ‘λ‹΅ μ²˜λ¦¬κ°€ 훨씬 μ •ν™•ν•˜κ³  μΌκ΄€λ˜κ²Œ μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€.

πŸš€ 3. λ³΅μž‘ν•œ λ¬Έμ„œμ—μ„œ 정보 손싀을 막기 μœ„ν•΄

μž¬λ¬΄μ œν‘œ, λ…Όλ¬Έ, λ³΄κ³ μ„œμ²˜λŸΌ λ³΅μž‘ν•œ λ¬Έμ„œλŠ” λ‹¨μˆœνžˆ ν…μŠ€νŠΈλ§Œ μΆ”μΆœν•˜λ©΄ μ€‘μš”ν•œ ꡬ쑰적 정보가 손싀될 수 μžˆμŠ΅λ‹ˆλ‹€.

HTML은 ν‘œ, 차트, μˆ˜μ‹ 등을 μ •ν™•νžˆ ꡬ뢄해 μ£ΌκΈ° λ•Œλ¬Έμ— LLM이 정보λ₯Ό 더 μ •ν™•νžˆ 해석할 수 μžˆμŠ΅λ‹ˆλ‹€.

특히, LLM을 μ΄μš©ν•΄ λ¬Έμ„œ 뢄석, 데이터 μš”μ•½, 정보 μΆ”μΆœμ„ ν•  λ•Œ 정보 손싀을 μ΅œμ†Œν™”ν•  수 μžˆμŠ΅λ‹ˆλ‹€

πŸ’‘ Eyes of LLM

Upstage Document ParseλŠ” LLM의 눈이 λ˜μ–΄ λ³΅μž‘ν•œ 데이터λ₯Ό 효율적으둜 λΆ„μ„ν•˜κ³  μ œκ³΅ν•©λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄, Apple의 μž¬λ¬΄μ œν‘œλ₯Ό Document Parseλ₯Ό 톡해 HTML ν˜•νƒœλ‘œ λ³€ν™˜ν•˜μ—¬ LLMμ—κ²Œ 제곡 ν›„ μ œν’ˆ λ§€μΆœμ— λŒ€ν•΄μ„œ 물어보면, ν…Œμ΄λΈ” 정보λ₯Ό κΈ°λ°˜ν•˜μ—¬ μ •ν™•ν•˜κ²Œ λ§€μΆœμ•‘μ„ λ‹΅λ³€ν•΄μ£ΌλŠ” 것을 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

DPλŠ” HTML ν˜•νƒœμ˜ 아웃풋을 톡해 λ¬Έμ„œμ˜ ꡬ쑰와 λ ˆμ΄μ•„μ›ƒμ„ μΈμ‹ν•˜μ—¬, λ³΅μž‘ν•œ ν‘œμ™€ 차트 κ΅¬μ‘°κΉŒμ§€ μžλ™μœΌλ‘œ μ •ν™•ν•˜κ²Œ LLMμ—κ²Œ μ „λ‹¬ν•˜μ—¬ λ¬Έμ„œ/데이터 기반 뢄석이 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. 즉, λ¬Έμ„œ 기반의 데이터 μΆ”μΆœκ³Ό μžλ™ν™”λœ μ›Œν¬ν”Œλ‘œμš° ꡬ좕이 κ°€λŠ₯ν•©λ‹ˆλ‹€.

μ—¬κΈ°μ„œ 이 μ›Œν¬ν”Œλ‘œμš°λ₯Ό RAG(Retrieval-Augmented Generation)라고 λΆ€λ¦…λ‹ˆλ‹€.

RAGλž€, LLM이 μ™ΈλΆ€ 정보λ₯Ό μ°Έκ³ ν•  수 μžˆλ„λ‘ μ œκ³΅ν•΄μ£ΌλŠ” λ°©λ²•λ‘ μž…λ‹ˆλ‹€.

LLM이 λͺ¨λ“  정보λ₯Ό 미리 μ•Œκ³  μžˆμ§€λŠ” μ•ŠκΈ° λ•Œλ¬Έμ—, ν•„μš”ν•œ 정보λ₯Ό μ™ΈλΆ€μ—μ„œ μ°Ύμ•„(κ²€μƒ‰ν•˜μ—¬) LLMμ—κ²Œ μ œκ³΅ν•΄μ£Όλ©΄, LLM은 κ·Έ 정보λ₯Ό λ°”νƒ•μœΌλ‘œ 더 μ •ν™•ν•œ 닡변을 ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

4. Document Parse λΉ„μ¦ˆλ‹ˆμŠ€ μœ μ¦ˆμΌ€μ΄μŠ€

1/ πŸ₯ λ³΄ν—˜ (Insurance): ν΄λ ˆμž„ λ¬Έμ„œ 처리 μžλ™ν™” 및 νš¨μœ¨ν™”

  • λŒ€μƒ: λ³΄ν—˜μ‚¬

  • Problem:

    • 맀일 수백 건의 μ˜λ£Œμ²­κ΅¬μ„œ, μ‚¬κ³ λ³΄κ³ μ„œ λ“± μ„œλ‘œ λ‹€λ₯Έ μœ ν˜•μ˜ ν΄λ ˆμž„ λ¬Έμ„œμ™€ 이미지λ₯Ό λŒ€λŸ‰μœΌλ‘œ μˆ˜μ‹ ν•˜κ³  있음.

    • κΈ°μ‘΄ OCR μ†”λ£¨μ…˜μ€ λ³΅μž‘ν•œ 의료 μš©μ–΄μ™€ λΉ„μ •ν˜• λ¬Έμ„œ ꡬ쑰둜 인해 μ •ν™•ν•œ 인식에 어렀움이 있음.

  • Solution:

    • Upstage Document Parse와 Solar LLM을 κ²°ν•©ν•΄ λ‹€μ–‘ν•œ λ¬Έμ„œ ν˜•μ‹μ„ μ •ν™•ν•˜κ²Œ μΈμ‹ν•˜κ³ , ν•„μš”ν•œ 정보λ₯Ό μžλ™μœΌλ‘œ λΆ„λ₯˜Β·μ •리함.

    • Upstage Document Parseλ₯Ό 톡해 κΈ°μ‘΄ OCR μ†”λ£¨μ…˜μ΄ μ–΄λ €μ› λ˜ λ³΅μž‘ν•œ λ°μ΄ν„°κΉŒμ§€ ν­λ„“κ²Œ μ²˜λ¦¬ν•˜μ—¬ 더 μ •λ°€ν•œ 인식과 효율적인 정보 μΆ”μΆœμ΄ κ°€λŠ₯함.

    • Solar LLM을 ν™œμš©ν•΄ λΉ λ₯΄κ³  μ •ν™•ν•˜κ²Œ ν•„μš”ν•œ 정보λ₯Ό 검색할 수 μžˆμ–΄, ν΄λ ˆμž„ λ¬Έμ„œ 처리 νš¨μœ¨μ„±μ„ 크게 κ°œμ„ ν•¨.

2/ πŸ—οΈ 건섀 (Construction): κΈ€λ‘œλ²Œ μž…μ°°λ¬Έμ„œ RAG νŒŒμ΄ν”„λΌμΈ ꡬ좕

  • λŒ€μƒ: 건섀사

  • Problem:

    • μ „ μ„Έκ³„μ—μ„œ μˆ˜μ‹ λ˜λŠ” μž…μ°° μ΄ˆλŒ€ λ¬Έμ„œμ™€ 뢀속 μžλ£Œλ“€μ΄ 수백 개 폴더에 λΆ„μ‚°λ˜μ–΄ 있음.

    • λ‹€κ΅­μ–΄λ‘œ μž‘μ„±λœ 수천 μž₯의 λ¬Έμ„œλ₯Ό λ‹¨μˆœ κ²€μƒ‰μœΌλ‘œλŠ” 핡심 정보λ₯Ό μ‹ μ†ν•˜κ²Œ μ°ΎκΈ° 어렀움.

    • μˆ˜μž‘μ—…μœΌλ‘œ λ¬Έμ„œλ₯Ό λΆ„μ„ν•˜λ˜ κΈ°μ‘΄ 방식은 전체 λ¬Έλ§₯ νŒŒμ•…μ— ν•œκ³„κ°€ μžˆμ–΄, μž…μ°° μ „λž΅ 수립과 κΈ€λ‘œλ²Œ 경쟁λ ₯ 강화에 μž₯μ• κ°€ 됨.

  • Solution:

    • Document Parse둜 λ°©λŒ€ν•œ μž…μ°° λ¬Έμ„œλ₯Ό μžλ™μœΌλ‘œ μ „μ²˜λ¦¬ν•˜μ—¬, λ¬Έμ„œ λ‚΄ μ˜μ—­μ„ μ„Έλ°€ν•˜κ²Œ λΆ„ν• ν•˜κ³  핡심 정보λ₯Ό μ •ν™•νžˆ μΆ”μΆœν•¨.

    • μΆ”μΆœλœ λ°μ΄ν„°λŠ” μ²΄κ³„μ μœΌλ‘œ μ •λ¦¬ν•˜κ³ , Solar LLM 기반 챗봇을 톡해 μ‚¬μš©μžκ°€ λ¬Έμ„œ λ‚΄μš©μ„ μ‰½κ²Œ μ§ˆμ˜ν•˜κ³  λ‹΅λ³€ 받을 수 μžˆλ„λ‘ 지원함.

    • 이λ₯Ό 톡해 μž…μ°° λ¬Έμ„œ 관리와 뢄석 νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•˜κ³ , κΈ€λ‘œλ²Œ μž…μ°° 경쟁λ ₯을 κ°•ν™”.

3/ πŸ‘— 이컀머슀 (E-commerce): μƒν’ˆ 정보 처리 μžλ™ν™” 및 κΈ€λ‘œλ²Œ ν™•μž₯ 지원

  • λŒ€μƒ: νŒ¨μ…˜ μ΄μ»€λ¨ΈμŠ€μ‚¬

  • Problem:

    • ν”Œλž«νΌμ— μ—…λ‘œλ“œλ˜λŠ” μƒν’ˆ 정보가 μ„Έλ‘œλ‘œ κΈ΄ 이미지 ν˜•νƒœλ‘œ κ΄€λ¦¬λ˜μ–΄ μ™”μ§€λ§Œ, κΈ°μ‘΄ OCR 및 ParserλŠ” 이미지λ₯Ό resizeν•˜γ…‘λŠ” κ³Όμ •μ—μ„œ 해상도 μ €ν•˜λ‘œ 인식 μ„±λŠ₯이 μ œν•œμ μ΄μ—ˆμŒ.

    • λ˜ν•œ, λ‹€κ΅­μ–΄(ν•œκ΅­μ–΄, μ˜μ–΄, 일본어) 지원이 μ–΄λ €μ›Œ ν•΄μ™Έ μ‹œμž₯ μ§„μΆœμ— μ œμ•½μ΄ μžˆμ—ˆκ³ , μƒν’ˆ 속성 데이터가 μ œλŒ€λ‘œ μ •λ¦¬λ˜μ§€ μ•Šμ•„ 검색과 필터링 κΈ°λŠ₯도 μ œν•œμ μ΄μ—ˆμŒ.

    • μˆ˜μž‘μ—… κ²€μˆ˜λ‘œ μΈν•œ 운영 뢀담도 μ§€μ†μ μœΌλ‘œ μ¦κ°€ν•˜κ³  μžˆμ—ˆμŒ.

  • Solution:

    • Document Parseλ₯Ό 톡해 이미지 λ‚΄ μ˜μ—­μ„ μ„ΈλΆ„ν™”ν•˜μ—¬ 인식 정확도λ₯Ό λŒ€ν­ ν–₯μƒμ‹œν‚΄. λ˜ν•œ, κ΅¬μ‘°ν™”λœ λ°μ΄ν„°λŠ” 검색 μ—”μ§„ 인덱싱에 ν™œμš©λ˜μ–΄ μ‚¬μš©μžκ°€ λΉ λ₯΄κ³  μ •ν™•ν•˜κ²Œ μƒν’ˆμ„ 검색 κ°€λŠ₯ν•˜κ²Œ 함.

    • Solar LLM을 ν™œμš©ν•΄ μƒν’ˆμ˜ 속성 정보λ₯Ό μ •ν™•νžˆ μΆ”μΆœν•˜κ³ , λ‹€κ΅­μ–΄ λ²ˆμ—­κΉŒμ§€ μ§€μ›ν•˜μ—¬ ν•΄μ™Έ 판맀 채널 μš΄μ˜μ„ μ›ν™œν•˜κ²Œ 함. λ˜ν•œ, λ‹€κ΅­μ–΄ μƒν’ˆ 정보λ₯Ό μ²΄κ³„μ μœΌλ‘œ μ •λ¦¬ν•˜μ—¬ κΈ€λ‘œλ²Œ 고객듀도 μ†μ‰½κ²Œ μ›ν•˜λŠ” μƒν’ˆμ„ 찾을 수 μžˆλ„λ‘ 지원함.

4. πŸ› οΈ Demo: Playgroundμ—μ„œ DP 써보기

Upstage의 Playgroundμ—μ„œ DP의 κ°•λ ₯ν•œ κΈ°λŠ₯을 직접 μ²΄ν—˜ν•΄ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

λ‹€μ–‘ν•œ λ¬Έμ„œλ₯Ό μ—…λ‘œλ“œν•˜μ—¬ λ¬Έμ„œ μžλ™ 뢄석 κΈ°λŠ₯을 ν™œμš©ν•΄λ³΄μ„Έμš”!

Upstage Console Playgroundλž€?

  • Upstageκ°€ μ œκ³΅ν•˜λŠ” μ‹€μ‹œκ°„ μ œν’ˆ μ²΄ν—˜ ν™˜κ²½

  • λ‹€μ–‘ν•œ λ¬Έμ„œ μœ ν˜•μ„ μ—…λ‘œλ“œν•˜κ³ , Document Parse κΈ°μˆ μ„ μ‹€ν—˜ν•΄ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

  • 개발자뿐만 μ•„λ‹ˆλΌ λΉ„κ°œλ°œμžλ„ μ‰½κ²Œ μ—…λ‘œλ“œν•˜μ—¬ μ‚¬μš©ν•  수 μžˆλ„λ‘ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

πŸ“Œ μ‹€μŠ΅ λͺ©ν‘œ

  • Playground에 μ ‘μ†ν•˜μ—¬ Document Parse κΈ°λŠ₯을 μ‹€ν–‰ν•΄λ³Έλ‹€.

  • λ¬Έμ„œλ₯Ό μ—…λ‘œλ“œν•˜κ³ , 뢄석 κ²°κ³Όλ₯Ό ν™•μΈν•œλ‹€.

  • λ‹€μ–‘ν•œ λ¬Έμ„œ μœ ν˜•κ³Ό λ³΅μž‘ν•œ λ ˆμ΄μ•„μ›ƒμ„ μ‹€ν—˜ν•΄λ³Έλ‹€.

πŸ’‘ μ‹€μŠ΅ μ§„ν–‰ 방법

  1. Playground μ ‘μ†ν•˜κΈ°

  1. λ¬Έμ„œ μ—…λ‘œλ“œν•˜κΈ° : λΆ„μ„ν•˜λ €λŠ” PDF, 이미지 λ“± λ¬Έμ„œλ₯Ό μ—…λ‘œλ“œν•©λ‹ˆλ‹€.

upload file
  1. κ²°κ³Ό 확인 및 λΉ„κ΅ν•˜κΈ° : λΆ„μ„λœ κ²°κ³Όλ₯Ό ν™•μΈν•˜κ³ , ν•„μš”ν•œ 경우 κ²°κ³Όλ₯Ό λ‹€μš΄λ‘œλ“œν•˜μ—¬ ν™•μΈν•©λ‹ˆλ‹€.

πŸš€ Playground λ°”λ‘œκ°€κΈ°arrow-up-right

이제 Document Parseλ₯Ό ν™œμš©ν•˜λŸ¬ κ°€λ³ΌκΉŒμš”~?

Wrap Up

이번 κΈ€μ—μ„œλŠ” Upstage Document Parse(DP)의 μ •μ˜, μž₯점, ν™œμš© 사둀, λΉ„μ¦ˆλ‹ˆμŠ€ μœ μ¦ˆμΌ€μ΄μŠ€λ₯Ό μ‚΄νŽ΄λ³΄μ•˜μŠ΅λ‹ˆλ‹€.

πŸ”Ή Upstage Document Parseλž€?: λ³΅μž‘ν•œ λ¬Έμ„œ λ ˆμ΄μ•„μ›ƒμ„ μΈμ‹ν•˜κ³ , 이λ₯Ό LLM이 읽을 수 μžˆλŠ” ν˜•νƒœλ‘œ λ³€ν™˜ν•˜λŠ” 기술.

πŸ”Ή Why DP?: λ³΅μž‘ν•œ ν‘œ, μˆ˜μ‹, μ°¨νŠΈκΉŒμ§€ μ •ν™•ν•˜κ²Œ λΆ„μ„ν•˜μ—¬ κ³ μ†μœΌλ‘œ 처리. κ²½μŸμ‚¬ λŒ€λΉ„ 높은 정확도와 처리 속도λ₯Ό 제곡.

πŸ”Ή λΉ„μ¦ˆλ‹ˆμŠ€ μœ μ¦ˆμΌ€μ΄μŠ€: λ³΄ν—˜, 건섀, 이컀머슀 λ“± λ‹€μ–‘ν•œ μ‚°μ—… 뢄야에 ν™œμš©.

πŸ’‘ Upstage DPλŠ” λ³΅μž‘ν•œ λ¬Έμ„œ 데이터 μ²˜λ¦¬μ—μ„œ LLM의 μ„±λŠ₯을 κ·ΉλŒ€ν™”ν•˜λ©°, AI 기반 업무 μžλ™ν™”μ— μžˆμ–΄ ν•„μˆ˜μ μΈ κΈ°μˆ μž…λ‹ˆλ‹€.


Suwan Kim | AI Edu | Upstage

Last updated