피드로 돌아가기
올리브영 테크블로그Career
원문 읽기
KPT 회고, 이렇게 했더니 스쿼드 문화가 바뀌었습니다: 올리브영 주문결제 스쿼드의 애자일 성장기
올리브영 주문결제 스쿼드가 KPT 회고와 PR 템플릿, 데일리 스크럼 도입으로 휴먼 에러 90% 이상 사전 차단 및 DB 쿼리 54% 감소
AI 요약
Context
주문결제 스쿼드는 복잡한 도메인 특성상 도메인별 격리된 업무로 인해 코드 리뷰가 형식적이 되었고, 휴먼 에러로 인한 잦은 장애가 발생했다. 또한 바쁜 일정 속 스쿼드원 간 소통 부재로 피로도 누적 및 문제 파악이 어려웠으며, 기존 회고 방식으로는 근본적인 개선이 불가능했다.
Technical Solution
- KPT(Keep, Problem, Try) 회고 프레임워크 도입: 지속할 점, 개선할 점, 시도할 점을 3단계 구조로 구분하여 명확한 인사이트 도출
- PR 템플릿 정의 및 적용: 작업명, 변경 요약, 영향 범위, 리뷰어가 꼭 봐야 할 부분, 특이사항 필수 항목으로 코드 리뷰 효율성 향상
- Slack 데일리 스크럼 봇 도입: 매일 아침 간단한 업무 진행 상황 공유로 업무 가시성 및 협업 투명성 증대
- 시니어-주니어 페어링 디스커션: 주문결제 고객 여정 속 문제점을 각자의 시각에서 정의하고 What/Why/How 구조로 함께 고민
- 타임 박싱 및 집중 항목 선정: 주제별 논의 시간 제한 적용 및 분기별 가장 임팩트 있는 개선 항목 1개만 선정하여 실행력 집중
- 장바구니 캐싱 도입: 복잡한 주문 로직의 첫 번째 개선으로 장바구니 영역에 캐싱 적용
Impact
- 휴먼 에러로 인한 인시던트 90% 이상을 배포 전 코드 리뷰 단계에서 조기 발견
- 장바구니 조회 쿼리 사용량 54% 이상 감소
- 9월 세일 기간 중 DB 커넥션풀 부하 완화로 안정적인 운영 달성
Key Takeaway
복잡한 도메인의 개발팀은 기술 개선뿐 아니라 회고 프로세스, 코드 리뷰 체계화, 일일 커뮤니케이션 자동화를 통합적으로 개선할 때 장애율 감소와 팀 신뢰도 향상을 동시에 달성할 수 있다. 특히 시니어-주니어 상호작용을 회고에 구조화하면 문제 발굴 질과 해결책의 현실성이 모두 높아진다.
실천 포인트
복잡한 주문결제·결제 관련 서비스 팀에서 코드 리뷰 효율성이 낮고 휴먼 에러 장애가 잦을 때, PR 템플릿에 '영향 범위'와 '리뷰어가 꼭 봐야 할 부분' 필수 항목을 추가하고 KPT 회고 시 시니어-주니어 페어링으로 문제를 심화 토론하면, 배포 전 결함 발견율을 80% 이상 높이고 관련 인시던트를 대폭 감소시킬 수 있다.