Raw Characters를 Token으로 추상화하는 Lexer 설계 원리

Lexers

Pi2026년 6월 7일3분beginner

AI 요약

Context

컴파일러가 소스 코드를 단순한 문자열 스트림으로 인식하여 발생하는 처리 효율 저하 문제. 개별 문자를 반복적으로 분석하는 오버헤드를 줄이기 위해 의미 단위의 분류 체계 필요.

실천 포인트

1. 입력 스트림의 처리 단위를 최소 의미 단위로 정의했는가

2. 분석 단계(Lexer)와 검증 단계(Parser)의 책임을 명확히 분리했는가

3. 불필요한 공백이나 무의미한 문자를 효율적으로 스킵하는 로직이 포함되었는가

태그