피드로 돌아가기
How I Mapped Brain Cell Changes in Alzheimer's Disease Using Single-Cell RNA Sequencing
Dev.toDev.to
AI/ML

63K개 세포 데이터 기반 scRNA-seq 분석 파이프라인 구축을 통한 AD 병리 분석

How I Mapped Brain Cell Changes in Alzheimer's Disease Using Single-Cell RNA Sequencing

Farhan Rehman Sherief2026년 6월 6일4intermediate

Context

알츠하이머병(AD)의 개별 세포 수준 분자 변화 분석을 위해 대규모 전전두엽 피질 데이터셋 활용. 기존 조직 단위 분석의 한계를 극복하고 단일 세포 해상도의 전사체 프로파일링을 통한 세포 특이적 병리 기전 파악 필요.

Technical Solution

  • 데이터 정제: 200~6,000개 유전자 범위 필터링 및 Mitochondrial Gene Content 20% 초과 세포 제거를 통한 데이터 무결성 확보
  • 정규화 및 변동성 분석: 라이브러리 크기를 10,000 counts로 Normalisation 후 log1p 변환 및 5,607개 High Variable Genes 추출을 통한 분석 효율 증대
  • 차원 축소 체인: PCA(50 components)와 Neighbourhood Graph를 거쳐 UMAP Embedding으로 시각화함으로써 7종의 세포군 클러스터 분리
  • 통계적 검증: Wilcoxon rank-sum test와 Benjamini-Hochberg 보정을 적용한 Differential Expression 분석으로 AD 특이적 유전자 식별
  • 메모리 최적화: 60K cells x 30K genes의 대규모 행렬 처리를 위해 Sparse AnnData 객체 활용 및 전략적 Disk Checkpointing 설계

1. 고차원 데이터 분석 시 PCA-Graph-UMAP으로 이어지는 차원 축소 파이프라인의 적절성 검토

2. 대규모 데이터셋 처리 시 메모리 부족 방지를 위해 Sparse Data Structure 적용 여부 확인

3. 다중 가설 검정 시 False Discovery Rate 제어를 위한 통계적 보정 기법(예: Benjamini-Hochberg) 적용

원문 읽기