Query와 Key 벡터 생성을 통한 Transformer Self-Attention 유사도 측정 메커니즘

Understanding Transformers Part 5: Queries, Keys, and Similarity

Rijul Rajesh2026년 4월 11일1분intermediate

AI 요약

Context

단순한 단어 임베딩만으로는 문맥 내 단어 간의 유동적인 관계를 정의하기 어려운 한계 존재. Positional Encoding이 적용된 벡터를 기반으로 단어 간의 연관성을 동적으로 계산하는 구조적 필요성 대두.

실천 포인트

1. 입력 데이터의 역할에 따라 가중치 행렬을 분리하여 다각도의 특징 추출 구조를 설계했는지 확인

2. 단순 벡터 비교가 아닌 학습 가능한 가중치를 통한 투영(Projection) 과정이 포함되었는지 검토

3. 데이터의 순서 정보(Positional Encoding)가 벡터 생성 단계에 적절히 반영되었는지 점검

태그