Hugging Face BlogSnowflake AI Research가 Ulysses Sequence Parallelism으로 어텐션 헤드를 GPU 간 분산 처리하여 64K 토큰에서 3.7배 처리량 증가 달성Ulysses Sequence Parallelism: Training with Million-Token ContextsAI/MLadvanced38 분 소요2026년 3월 9일