피드로 돌아가기
Your UMAP Looks Great. But Can You Prove the Annotation Is Correct?
Dev.toDev.to
AI/ML

Weighted F1 0.915 달성, 정량적 벤치마크 기반 Single-cell Annotation 검증 체계 구축

Your UMAP Looks Great. But Can You Prove the Annotation Is Correct?

Oluwagbade Odimayo2026년 6월 15일10advanced

Context

기존 Single-cell 분석 파이프라인은 UMAP 시각화와 육안 확인에 의존하여 Annotation 결과의 객관적 검증이 불가능한 한계 존재. 임상 및 연구 환경에서 요구되는 정밀한 세포 정체성 확인을 위한 정량적 평가 프레임워크의 부재를 해결하고자 함.

Technical Solution

  • CellTypist Reference Model을 Oracle로 설정하여 정답 라벨을 생성하고 Prediction 단계에서 격리하는 Blind Test 구조 설계
  • 전체 데이터의 20%를 Stratified Holdout 방식으로 분리하여 각 세포 타입별 비율을 유지한 테스트 셋 구성
  • 세포 풍부도와 전사 유사성에 따라 Easy, Medium, Hard로 Difficulty Tier를 구분하여 단순 평균 지표 뒤에 숨겨진 성능 병목 지점을 식별
  • Cluster Purity, Marker Recovery, Biological Consistency라는 세 가지 독립적 Validator를 통해 Oracle 없이도 생물학적 타당성을 검증하는 다중 필터링 계층 도입
  • CellTypist의 세분화된 라벨을 53개 매핑 테이블을 통해 Coarse Category로 통일함으로써 서로 다른 전략 간의 비교 가능성 확보

- 모델 성능 평가 시 단순 평균 지표 대신 데이터 특성에 따른 Difficulty Tier를 설정하여 취약 구간을 분석했는가? - Ground Truth 외에 도메인 지식 기반의 독립적인 Validator(생물학적 제약 조건 등)를 구축하여 교차 검증하고 있는가? - 서로 다른 예측 모델의 결과를 비교하기 위해 일관된 Label Harmonization 매핑 테이블을 정의했는가?

원문 읽기