피드로 돌아가기
How Excel is Used in Real-World Data Analysis
Dev.toDev.to
Career

데이터 분석가가 Excel의 데이터 정제·변환·시각화 기능으로 Jumia 제품 성능 대시보드 구축

How Excel is Used in Real-World Data Analysis

Brian Munene2026년 3월 27일11beginner

Context

원본 데이터는 누락된 값, 중복 항목, 텍스트 형식의 숫자, 불일치한 데이터 타입 등 여러 문제를 포함하고 있었다. 예를 들어 Reviews 및 Rating 열에 누락값이 있었고, 가격 열에는 'KSh' 텍스트가 붙어있었으며, 평점은 "4.5 out of 5" 형식으로 저장되어 있었다.

Technical Solution

  • 누락값 처리: Find and Replace(Ctrl + H)를 사용해 Blank reviews를 "No Reviews"로, Blank ratings를 "No Rating"으로 일괄 변환
  • 중복 제거: Data 탭의 "Remove Duplicates" 기능으로 중복 제품 항목 제거, 결과적으로 중복 항목을 제거하고 109개의 고유 항목 확보
  • 통화 형식 변환: Find and Replace로 "KSh" 텍스트 제거 후 Currency 데이터 타입으로 변환, 수치 계산 가능하게 전환
  • 텍스트 함수를 통한 데이터 추출: LEFT(), RIGHT() 함수로 텍스트에서 필요한 부분 추출, 평점에서 "4.5 out of 5"에서 숫자만 추출
  • 공백 제거 및 이상값 정정: TRIM() 함수로 텍스트 앞뒤 여백 제거, ABS() 함수로 음수 review count를 양수로 변환
  • 계산 열 생성: Discount Amount = Old Price - Current Price 등 새로운 분석 열 추가
  • Pivot Table 및 Slicer 활용: 대시보드에 Slicer 추가로 "Excellent" 등 등급별 필터링 시 연결된 모든 차트가 즉시 업데이트되도록 구성

Impact

  • 평균 할인율 36%에 비해 54% 이상의 제품이 40% 이상 할인 적용
  • 최다 review 제품(177개)의 평점은 4.6, 완벽한 5.0 평점 제품은 12개 review만 보유
  • Poor 평점(3 이하) 제품이 전체 카탈로그의 약 11% 구성

Key Takeaway

Excel은 프로그래밍 환경 설정 없이 접근 가능한 Grid 기반 인터페이스와 Formula, Pivot Table, Conditional Formatting, 차트 기능만으로 원본 데이터에서 대화형 대시보드까지 전 과정을 구현할 수 있으며, 중소 규모 데이터셋 분석에서 전문 BI 도구 없이도 충분한 분석 능력을 제공한다.


중소 규모 비정형 데이터(CSV, 텍스트 파일)를 다루는 비즈니스 분석팀에서 Find and Replace, TRIM(), ABS(), LEFT()/RIGHT() 등 Excel 기본 함수와 Remove Duplicates 기능을 조합하면 데이터 정제 작업을 수작업 없이 자동화할 수 있으며, Pivot Table과 Slicer를 활용하면 별도 개발 없이 대화형 필터링이 가능한 대시보드를 구축할 수 있다.

원문 읽기