피드로 돌아가기
Dev.toAI/ML
원문 읽기
xAI Ranker 오픈소스의 Schema Leak를 통한 Search Space 설계 분석
xAI open-sourced their ranker. It doesn't compile.
AI 요약
Context
xAI가 X의 'For You' 피드를 생성하는 recommender 시스템인 x-algorithm을 공개했으나, 실제 실행 가능한 코드가 아닌 불완전한 아티팩트 형태로 배포됨. 기계적인 Sanitization 과정에서 핵심 수치(Weights)는 제거되었으나 시스템의 설계 의도가 담긴 심볼(Symbols)들이 그대로 노출된 상황임.
Technical Solution
- 단순 수치 데이터가 아닌 FAVORITE_WEIGHT, REPORT_WEIGHT 등 60개 이상의 Named Symbols를 통해 Recommender의 튜닝 축(Tunable Axis)을 공개한 구조
- Cargo.toml 및 핵심 Prod*Client 구현체를 제외하여 런타임 실행은 불가능하게 하되, 시스템의 입력 변수와 가중치 스키마를 노출시킨 설계
- Mechanical Search-and-Replace 방식을 통한 String Literal 제거로 인해 변수명은 유지되고 값만 빈 문자열("")로 처리된 Sanitization 파이프라인
- 내부 모델 식별자(_INTERNAL)와 정책 경계(PTOS_CUTOFF_TWEET_ID)를 포함한 Plaintext 노출로 시스템의 내부 정책 로직을 간접적으로 시사
- Search Value(개별 수치)보다 Search Space(설계 범위)를 공개함으로써 경쟁사가 자체 데이터를 활용해 최적값을 역추적할 수 있게 만든 아키텍처적 단서 제공
실천 포인트
1. 오픈소스 공개 전 단순 문자열 치환이 아닌 AST(Abstract Syntax Tree) 기반의 정밀한 Sanitization 도구 검토
2. 내부 식별자(_INTERNAL) 및 정책 관련 상수가 포함된 소스코드에 대한 정규표현식 기반의 Leak 검사 파이프라인 구축
3. 코드 배포 전 Test Suite 재실행을 통한 구문 오류(Syntax Error) 및 컴파일 가능 여부 검증 프로세스 강제화
4. 공개 범위 설정 시 '실행 가능성'과 '설계 노출' 사이의 Trade-off를 정의하고 이에 따른 Redaction 전략 수립