피드로 돌아가기
Векторы, размерности и пространства признаков
Dev.toDev.to
AI/ML

Feature Space 설계를 통한 객체의 수치화 및 ML 모델 입력 최적화

Векторы, размерности и пространства признаков

Samuel Akopyan2026년 5월 11일16beginner

Context

현실 세계의 비정형 객체를 ML 모델이 처리 가능한 수학적 형태로 변환하는 과정에서의 데이터 구조 정의 필요성 대두. 단순 배열 형태의 데이터 전달 시 요소 순서 및 차원 불일치로 인한 모델 예측 오류 가능성 존재.

Technical Solution

  • 객체의 속성을 고정된 순서의 수치 집합으로 정의한 Vector 구조 채택
  • 데이터의 상세도와 모델 복잡도를 결정하는 Vector Dimensionality 설정
  • 모든 입력 데이터를 동일한 차원($R^n$)의 Feature Space 내 점(Point)으로 매핑
  • 각 Feature를 좌표축으로 설정하여 데이터 간의 기하학적 거리 및 유사도 측정 기반 마련
  • Feature 간 Scale 차이로 인한 거리 왜곡 방지를 위해 Normalization 및 Scaling 적용
  • 불필요한 차원 확장을 억제하여 Curse of Dimensionality로 인한 데이터 희소성 문제 해결

- 모델 입력 Vector의 차원(Dimension)과 순서가 정의된 고정 컨트랙트 준수 여부 검토 - Feature 간 단위 차이가 클 경우 거리 기반 알고리즘 성능 저하를 막기 위한 Scaling 적용 - 모델 성능 향상을 위해 무분별하게 Feature를 추가하는 대신, 유의미한 도메인 지식 기반의 차원 선택

원문 읽기