Introduction to Document Parse
π λͺ©μ°¨
Upstage Document Parse λ ?
Document Parseμ μ€μμ±
Document Parse : LLMμ λ
Document Parse λΉμ¦λμ€ μ μ¦μΌμ΄μ€
Demo: Playgroundμμ DP μ¨λ³΄κΈ°
Upstageμ Document AI κΈ°μ μ κΈ°μ‘΄ OCRμ λμ΄μ κ³ λνλ λ¬Έμ μ²λ¦¬ κΈ°λ₯μ μ 곡ν©λλ€.
νΉν Upstage Document Parse (DP)λ λ¬Έμμ λ μ΄μμμ λΆμνμ¬ λ³΄λ€ μ νν λ¬Έμ μ΄ν΄ λ° μ 보 μΆμΆμ΄ κ°λ₯ν©λλ€.
1. Upstage Document Parse λ ?

LLMμ λ€μν μΈλΆ λ¬Έμ μ 보λ₯Ό μ°Έμ‘°νμ¬ μ νλλ₯Ό λμ΄μ§λ§, μλ³Έ λ¬Έμ νμΌμ μ§μ μ½κ³ μ²λ¦¬ν μ μμ΅λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ λ¬Έμλ₯Ό LLMμ΄ μ½μ μ μλ νμ(HTML, Markdown)μΌλ‘ λ³ννλ κ³Όμ μ΄ νμν©λλ€.
Document Parse(DP)λ 볡μ‘ν λ¬Έμλ₯Ό HTML ννμ ν μ€νΈ λ°μ΄ν°λ‘ λ³ννλ κΈ°μ μ λλ€.
2. Document Parseμ μ€μμ±
β¨ Upstage DPλ§μ κ°μ : λ€μν λ¬Έμ λ μ΄μμ μΈμ
Upstage Document Parseλ λ¨μν ν μ€νΈ μΆμΆμ λμ΄, λ¬Έμμ λ μ΄μμ λ¨μλ‘ μΈμνμ¬ λ³΄λ€ κΉμ΄ μλ μ 보 λΆμμ κ°λ₯νκ² ν©λλ€. κΈ°μ‘΄ OCRμ μ΄λ―Έμ§ λ΄ ν μ€νΈ μΈμμ κ΅νλμ§λ§, DPλ λ¬Έμμ λ μ΄μμμ κ³ λ €νμ¬ λ³΄λ€ μ κ΅νκ² μ 보λ₯Ό λΆμνκ³ μ 곡ν©λλ€.
Table Recognition
λ³ν©λ μ , κ³μΈ΅μ ꡬ쑰 λ± λ³΅μ‘ν νλ μ ννκ² μΈμνμ¬ μ ννκ³ μΌκ΄λ λ°μ΄ν°λ‘ λ³νν¨.
λ°μ΄ν° 무결μ±μ 보μ₯νμ¬, LLMμ΄ νμ μλ―Έλ₯Ό μ νν μ΄ν΄ν μ μλλ‘ μ§μ.
Equation Recognition
μμ(Equation)μ μ νν μΈμνμ¬ LLMμ΄ μνμ κ΄κ³λ κ³μ°μ μ΄ν΄νλλ‘ μ§μ.
Chart Recognition
μ°¨νΈ λ°μ΄ν°λ₯Ό λΆμν΄ LLMμ΄ μ νν ν΄μν μ μλλ‘ κ΅¬μ‘°νλ ννλ‘ λ³ν.
λ°, μ , μν μ°¨νΈκΉμ§ λ€μν ννλ₯Ό μ§μ.
β‘ λΉ λ₯΄κ³ μ νν μ±λ₯
κ³ μ μ²λ¦¬ λ₯λ ₯
100νμ΄μ§ λ¬Έμλ 1λΆ μ΄λ΄μ μ²λ¦¬ν¨.
κ²½μμ¬ λλΉ μ΅λ 10λ°° λΉ λ₯Έ μ²λ¦¬ μλ.
μ νμ±
TEDS(93.48) λ° TEDS-S(94.16) κΈ°μ€, μ£Όμ κ²½μμ¬ λλΉ 5% μ΄μ λμ μ νλλ₯Ό 보μ₯.
볡μ‘ν νλ μ°¨νΈμμλ λ°μ΄λ μΈμλ₯ μ μ 곡.
3. Document Parse : LLMμ λ

κ·Έ μ΄μ λ LLM(λν μΈμ΄ λͺ¨λΈ)μ΄ λ¬Έμλ₯Ό λ μ μ΄ν΄νκ³ μ ννκ² μ²λ¦¬νλλ‘ λκΈ° μν΄μμ λλ€.
π 1. λ¬Έμμ "ꡬ쑰"λ₯Ό λͺ
ννκ² μ λ¬νκΈ° μν΄
μλ³Έ λ¬Έμλ ν μ€νΈ, ν, μ°¨νΈ, μμ, μ΄λ―Έμ§ λ± λ€μν ꡬ쑰μ μμλ‘ κ΅¬μ±λμ΄ μμ΅λλ€.
LLMμ λ¬Έμμ ꡬ쑰λ₯Ό μΈμν λ λ μ κ΅ν μ²λ¦¬κ° κ°λ₯νμ§λ§, λ¨μ ν μ€νΈλ‘λ§ μ 곡λλ©΄ μ΄λ¬ν ꡬ쑰λ₯Ό μΈμνκΈ°μ΄λ ΅μ΅λλ€.
HTMLμ <h1>, <figure>, <table>κ³Ό κ°μ νκ·Έλ₯Ό ν΅ν΄ λ¬Έμμ κ³μΈ΅κ³Ό κ΄κ³λ₯Ό λͺ
νν ꡬλΆν΄ μ€λλ€.
βοΈ 2. LLMμ μ νλμ ν¨μ¨μ±μ λμ΄κΈ° μν΄
LLMμ ꡬ쑰νλ λ°μ΄ν°λ₯Ό ν΅ν΄ λμ± λΉ λ₯΄κ³ μ ννκ² λ΄μ©μ νμ ν©λλ€.
HTMLμ λ¬Έμμ ꡬ쑰λ₯Ό λͺ νν μ μνμ¬ LLMμ΄ μ΄λ λΆλΆμ΄ μ λͺ©, λ³Έλ¬Έ, ν, μ°¨νΈμΈμ§ μ½κ² μΈμνλλ‘ λμ΅λλ€.
κ²°κ³Όμ μΌλ‘, μμ½, λΆμ, μ§μμλ΅ μ²λ¦¬κ° ν¨μ¬ μ ννκ³ μΌκ΄λκ² μ΄λ£¨μ΄μ§λλ€.
π 3. 볡μ‘ν λ¬Έμμμ μ 보 μμ€μ λ§κΈ° μν΄
μ¬λ¬΄μ ν, λ Όλ¬Έ, λ³΄κ³ μμ²λΌ 볡μ‘ν λ¬Έμλ λ¨μν ν μ€νΈλ§ μΆμΆνλ©΄ μ€μν ꡬ쑰μ μ λ³΄κ° μμ€λ μ μμ΅λλ€.
HTMLμ ν, μ°¨νΈ, μμ λ±μ μ νν ꡬλΆν΄ μ£ΌκΈ° λλ¬Έμ LLMμ΄ μ 보λ₯Ό λ μ νν ν΄μν μ μμ΅λλ€.
νΉν, LLMμ μ΄μ©ν΄ λ¬Έμ λΆμ, λ°μ΄ν° μμ½, μ 보 μΆμΆμ ν λ μ 보 μμ€μ μ΅μνν μ μμ΅λλ€
π‘ Eyes of LLM

Upstage Document Parseλ LLMμ λμ΄ λμ΄ λ³΅μ‘ν λ°μ΄ν°λ₯Ό ν¨μ¨μ μΌλ‘ λΆμνκ³ μ 곡ν©λλ€.
μλ₯Ό λ€μ΄, Appleμ μ¬λ¬΄μ νλ₯Ό Document Parseλ₯Ό ν΅ν΄ HTML ννλ‘ λ³ννμ¬ LLMμκ² μ 곡 ν μ ν λ§€μΆμ λν΄μ λ¬Όμ΄λ³΄λ©΄, ν μ΄λΈ μ 보λ₯Ό κΈ°λ°νμ¬ μ ννκ² λ§€μΆμ‘μ λ΅λ³ν΄μ£Όλ κ²μ νμΈν μ μμ΅λλ€.
DPλ HTML ννμ μμνμ ν΅ν΄ λ¬Έμμ ꡬ쑰μ λ μ΄μμμ μΈμνμ¬, 볡μ‘ν νμ μ°¨νΈ κ΅¬μ‘°κΉμ§ μλμΌλ‘ μ ννκ² LLMμκ² μ λ¬νμ¬ λ¬Έμ/λ°μ΄ν° κΈ°λ° λΆμμ΄ κ°λ₯νκ² ν©λλ€. μ¦, λ¬Έμ κΈ°λ°μ λ°μ΄ν° μΆμΆκ³Ό μλνλ μν¬νλ‘μ° κ΅¬μΆμ΄ κ°λ₯ν©λλ€.
μ¬κΈ°μ μ΄ μν¬νλ‘μ°λ₯Ό RAG(Retrieval-Augmented Generation)λΌκ³ λΆλ¦ λλ€.
RAGλ, LLMμ΄ μΈλΆ μ 보λ₯Ό μ°Έκ³ ν μ μλλ‘ μ 곡ν΄μ£Όλ λ°©λ²λ‘ μ λλ€.
LLMμ΄ λͺ¨λ μ 보λ₯Ό 미리 μκ³ μμ§λ μκΈ° λλ¬Έμ, νμν μ 보λ₯Ό μΈλΆμμ μ°Ύμ(κ²μνμ¬) LLMμκ² μ 곡ν΄μ£Όλ©΄, LLMμ κ·Έ μ 보λ₯Ό λ°νμΌλ‘ λ μ νν λ΅λ³μ ν μ μμ΅λλ€.
4. Document Parse λΉμ¦λμ€ μ μ¦μΌμ΄μ€
1/ π₯ 보ν (Insurance): ν΄λ μ λ¬Έμ μ²λ¦¬ μλν λ° ν¨μ¨ν
λμ: 보νμ¬
Problem:
λ§€μΌ μλ°± 건μ μλ£μ²κ΅¬μ, μ¬κ³ λ³΄κ³ μ λ± μλ‘ λ€λ₯Έ μ νμ ν΄λ μ λ¬Έμμ μ΄λ―Έμ§λ₯Ό λλμΌλ‘ μμ νκ³ μμ.
κΈ°μ‘΄ OCR μ루μ μ 볡μ‘ν μλ£ μ©μ΄μ λΉμ ν λ¬Έμ κ΅¬μ‘°λ‘ μΈν΄ μ νν μΈμμ μ΄λ €μμ΄ μμ.
Solution:
Upstage Document Parseμ Solar LLMμ κ²°ν©ν΄ λ€μν λ¬Έμ νμμ μ ννκ² μΈμνκ³ , νμν μ 보λ₯Ό μλμΌλ‘ λΆλ₯Β·μ 리ν¨.
Upstage Document Parseλ₯Ό ν΅ν΄ κΈ°μ‘΄ OCR μ루μ μ΄ μ΄λ €μ λ 볡μ‘ν λ°μ΄ν°κΉμ§ νλκ² μ²λ¦¬νμ¬ λ μ λ°ν μΈμκ³Ό ν¨μ¨μ μΈ μ 보 μΆμΆμ΄ κ°λ₯ν¨.
Solar LLMμ νμ©ν΄ λΉ λ₯΄κ³ μ ννκ² νμν μ 보λ₯Ό κ²μν μ μμ΄, ν΄λ μ λ¬Έμ μ²λ¦¬ ν¨μ¨μ±μ ν¬κ² κ°μ ν¨.
2/ ποΈ κ±΄μ€ (Construction): κΈλ‘λ² μ
μ°°λ¬Έμ RAG νμ΄νλΌμΈ ꡬμΆ
λμ: 건μ€μ¬
Problem:
μ μΈκ³μμ μμ λλ μ μ°° μ΄λ λ¬Έμμ λΆμ μλ£λ€μ΄ μλ°± κ° ν΄λμ λΆμ°λμ΄ μμ.
λ€κ΅μ΄λ‘ μμ±λ μμ² μ₯μ λ¬Έμλ₯Ό λ¨μ κ²μμΌλ‘λ ν΅μ¬ μ 보λ₯Ό μ μνκ² μ°ΎκΈ° μ΄λ €μ.
μμμ μΌλ‘ λ¬Έμλ₯Ό λΆμνλ κΈ°μ‘΄ λ°©μμ μ 체 λ¬Έλ§₯ νμ μ νκ³κ° μμ΄, μ μ°° μ λ΅ μ립과 κΈλ‘λ² κ²½μλ ₯ κ°νμ μ₯μ κ° λ¨.
Solution:
Document Parseλ‘ λ°©λν μ μ°° λ¬Έμλ₯Ό μλμΌλ‘ μ μ²λ¦¬νμ¬, λ¬Έμ λ΄ μμμ μΈλ°νκ² λΆν νκ³ ν΅μ¬ μ 보λ₯Ό μ νν μΆμΆν¨.
μΆμΆλ λ°μ΄ν°λ 체κ³μ μΌλ‘ μ 리νκ³ , Solar LLM κΈ°λ° μ±λ΄μ ν΅ν΄ μ¬μ©μκ° λ¬Έμ λ΄μ©μ μ½κ² μ§μνκ³ λ΅λ³ λ°μ μ μλλ‘ μ§μν¨.
μ΄λ₯Ό ν΅ν΄ μ μ°° λ¬Έμ κ΄λ¦¬μ λΆμ ν¨μ¨μ±μ κ·Ήλννκ³ , κΈλ‘λ² μ μ°° κ²½μλ ₯μ κ°ν.
3/ π μ΄μ»€λ¨Έμ€ (E-commerce): μν μ 보 μ²λ¦¬ μλν λ° κΈλ‘λ² νμ₯ μ§μ
λμ: ν¨μ μ΄μ»€λ¨Έμ€μ¬
Problem:
νλ«νΌμ μ λ‘λλλ μν μ λ³΄κ° μΈλ‘λ‘ κΈ΄ μ΄λ―Έμ§ ννλ‘ κ΄λ¦¬λμ΄ μμ§λ§, κΈ°μ‘΄ OCR λ° Parserλ μ΄λ―Έμ§λ₯Ό resizeνγ ‘λ κ³Όμ μμ ν΄μλ μ νλ‘ μΈμ μ±λ₯μ΄ μ νμ μ΄μμ.
λν, λ€κ΅μ΄(νκ΅μ΄, μμ΄, μΌλ³Έμ΄) μ§μμ΄ μ΄λ €μ ν΄μΈ μμ₯ μ§μΆμ μ μ½μ΄ μμκ³ , μν μμ± λ°μ΄ν°κ° μ λλ‘ μ 리λμ§ μμ κ²μκ³Ό νν°λ§ κΈ°λ₯λ μ νμ μ΄μμ.
μμμ κ²μλ‘ μΈν μ΄μ λΆλ΄λ μ§μμ μΌλ‘ μ¦κ°νκ³ μμμ.
Solution:
Document Parseλ₯Ό ν΅ν΄ μ΄λ―Έμ§ λ΄ μμμ μΈλΆννμ¬ μΈμ μ νλλ₯Ό λν ν₯μμν΄. λν, ꡬ쑰νλ λ°μ΄ν°λ κ²μ μμ§ μΈλ±μ±μ νμ©λμ΄ μ¬μ©μκ° λΉ λ₯΄κ³ μ ννκ² μνμ κ²μ κ°λ₯νκ² ν¨.
Solar LLMμ νμ©ν΄ μνμ μμ± μ 보λ₯Ό μ νν μΆμΆνκ³ , λ€κ΅μ΄ λ²μκΉμ§ μ§μνμ¬ ν΄μΈ νλ§€ μ±λ μ΄μμ μννκ² ν¨. λν, λ€κ΅μ΄ μν μ 보λ₯Ό 체κ³μ μΌλ‘ μ 리νμ¬ κΈλ‘λ² κ³ κ°λ€λ μμ½κ² μνλ μνμ μ°Ύμ μ μλλ‘ μ§μν¨.
4. π οΈ Demo: Playgroundμμ DP μ¨λ³΄κΈ°
Upstageμ Playgroundμμ DPμ κ°λ ₯ν κΈ°λ₯μ μ§μ 체νν΄ λ³Ό μ μμ΅λλ€.
λ€μν λ¬Έμλ₯Ό μ λ‘λνμ¬ λ¬Έμ μλ λΆμ κΈ°λ₯μ νμ©ν΄λ³΄μΈμ!
Upstage Console Playgroundλ?
Upstageκ° μ 곡νλ μ€μκ° μ ν 체ν νκ²½
λ€μν λ¬Έμ μ νμ μ λ‘λνκ³ , Document Parse κΈ°μ μ μ€νν΄ λ³Ό μ μμ΅λλ€.
κ°λ°μλΏλ§ μλλΌ λΉκ°λ°μλ μ½κ² μ λ‘λνμ¬ μ¬μ©ν μ μλλ‘ μ€κ³λμμ΅λλ€.
π μ€μ΅ λͺ©ν
Playgroundμ μ μνμ¬ Document Parse κΈ°λ₯μ μ€νν΄λ³Έλ€.
λ¬Έμλ₯Ό μ λ‘λνκ³ , λΆμ κ²°κ³Όλ₯Ό νμΈνλ€.
λ€μν λ¬Έμ μ νκ³Ό 볡μ‘ν λ μ΄μμμ μ€νν΄λ³Έλ€.
π‘ μ€μ΅ μ§ν λ°©λ²
Playground μ μνκΈ°

λ¬Έμ μ λ‘λνκΈ° : λΆμνλ €λ PDF, μ΄λ―Έμ§ λ± λ¬Έμλ₯Ό μ λ‘λν©λλ€.

κ²°κ³Ό νμΈ λ° λΉκ΅νκΈ° : λΆμλ κ²°κ³Όλ₯Ό νμΈνκ³ , νμν κ²½μ° κ²°κ³Όλ₯Ό λ€μ΄λ‘λνμ¬ νμΈν©λλ€.

μ΄μ Document Parseλ₯Ό νμ©νλ¬ κ°λ³ΌκΉμ~?
Wrap Up
μ΄λ² κΈμμλ Upstage Document Parse(DP)μ μ μ, μ₯μ , νμ© μ¬λ‘, λΉμ¦λμ€ μ μ¦μΌμ΄μ€λ₯Ό μ΄ν΄λ³΄μμ΅λλ€.
πΉ Upstage Document Parseλ?: 볡μ‘ν λ¬Έμ λ μ΄μμμ μΈμνκ³ , μ΄λ₯Ό LLMμ΄ μ½μ μ μλ ννλ‘ λ³ννλ κΈ°μ .
πΉ Why DP?: 볡μ‘ν ν, μμ, μ°¨νΈκΉμ§ μ ννκ² λΆμνμ¬ κ³ μμΌλ‘ μ²λ¦¬. κ²½μμ¬ λλΉ λμ μ νλμ μ²λ¦¬ μλλ₯Ό μ 곡.
πΉ λΉμ¦λμ€ μ μ¦μΌμ΄μ€: 보ν, 건μ€, μ΄μ»€λ¨Έμ€ λ± λ€μν μ°μ λΆμΌμ νμ©.
π‘ Upstage DPλ 볡μ‘ν λ¬Έμ λ°μ΄ν° μ²λ¦¬μμ LLMμ μ±λ₯μ κ·Ήλννλ©°, AI κΈ°λ° μ 무 μλνμ μμ΄ νμμ μΈ κΈ°μ μ λλ€.
Suwan Kim | AI Edu | Upstage
Last updated