피드로 돌아가기
Cloudflare BlogBackend
원문 읽기
Slashing agent token costs by 98% with RFC 9457-compliant error responses
Cloudflare가 AI 에이전트 요청에 RFC 9457 준수 구조화된 에러 응답(Markdown/JSON)을 도입해 HTML 대비 페이로드 크기와 토큰 사용량을 98% 削减
AI 요약
Context
AI 에이전트가 프로덕션 인프라로 운영되며 하루에 수십억 건의 HTTP 요청을 처리하고 있으나, 에러 발생 시 브라우저용으로 설계된 수백 줄의 HTML 마크업을 받게 된다. 에이전트는 HTML 페이지에서 오류 원인을 파악할 수 없고, 재시도 여부나 대기 시간 같은 실행 가능한 지시사항을 얻을 수 없어 토큰을 낭비한다.
실천 포인트
API 또는 프록시 서비스를 운영하는 팀에서 에이전트/자동화 클라이언트 지원을 추가할 때, RFC 9457 Problem Details 형식으로 에러 응답을 구조화하고 Accept 헤더로 응답 형식을 선택 가능하게 구현하면, 클라이언트 개발자가 에러 처리 로직을 간단히 작성할 수 있고 token 낭비를 크게 줄일 수 있다.