LLM κ°λλ μΌ μ΅μ νλ₯Ό ν΅ν μμ± AIμ Operational Reliability ν보
Granite Guardian πͺ¨
AI μμ½
Context
μμ±ν AIμ μμ¨ μμ΄μ νΈ μ ν κ³Όμ μμ λ°μνλ Hallucination λ° μ μ± μλ° λ¦¬μ€ν¬ μ¦κ°. κΈ°μ‘΄ λ²μ© λͺ¨λΈλ§μΌλ‘λ μ€μκ° νμ§ μ§μ° μκ°κ³Ό μΈλΆ λλ©μΈλ³ μ μ½ μ¬ν μ€μ μ¬λΆλ₯Ό μ λ°νκ² κ²μ¦νλ λ° νκ³ μ‘΄μ¬.
Technical Solution
- Instruction-fine-tuned λͺ¨λΈ κΈ°λ°μ λ 립μ νκ° λ μ΄μ΄ μ€κ³λ₯Ό ν΅ν μμ€ν μμ μ± ν보
- λͺ¨λμ Low-latency νλ¨ λ‘μ§μ μ μ©ν μ€μκ° Production Guardrail ꡬν
- λͺ¨λμ Reasoning Trace μμ±μ ν΅ν κ°μ¬ κ°λ₯νκ³ μ€λͺ κ°λ₯ν(Explainable) κ²°μ ꡬ쑰 μ€κ³
- BYOC(Bring Your Own Criteria) λ©μ»€λμ¦μ ν΅ν μμ°μ΄ κΈ°λ°μ μ¬μ©μ μ μ μ μ½ μ‘°κ±΄ λμ μ μ©
- Human-annotated λ° Synthetic Red-teaming λ°μ΄ν°μ μ νμ©ν κ³ μν μλλ¦¬μ€ νμ§ μ λ°λ ν₯μ
- RAG λ° Tool-calling μν¬νλ‘μ° λ΄ Groundedness κ²μ¦μ μν μ μ© νκ° λ‘μ§ ν΅ν©
μ€μ² ν¬μΈνΈ
1. μ€μκ° μλΉμ€ μ μ© μ <no-think> λͺ¨λμ κ°μ μ μ§μ° νλ¨ κ²½λ‘κ° ν보λμλμ§ νμΈ
2. λ¨μ Yes/No κ²°κ³Ό μΈμ κ°μ¬ λ° λλ²κΉ μ μν Reasoning Trace μ μ₯ ꡬ쑰 μ€κ³ κ²ν
3. λλ©μΈ νΉν μ μ½ μ¬νμ μμ°μ΄ κ·μΉμΌλ‘ μ μνκ³ μ΄λ₯Ό λͺ¨λΈμ μ£Όμ νλ BYOC μΈν°νμ΄μ€ ꡬν κ³ λ €
4. RAG μμ€ν κ΅¬μΆ μ λ΅λ³μ μ¬μ€ κ΄κ³λ₯Ό κ²μ¦νλ λ 립μ μΈ κ°λλ μΌ λͺ¨λΈ λ°°μΉ κ²ν