Train High, Infer Low - 머신러닝 학습과 서빙의 FP32, FP16, BF16, INT8 정밀도 선택
머신러닝 모델의 학습과 서빙 단계에서 수치 정밀도(FP32, BF16, FP16, INT8)를 전략적으로 선택하여 메모리 50~75% 절감과 추론 속도 2~4배 향상 달성
머신러닝 모델의 학습과 서빙 단계에서 수치 정밀도(FP32, BF16, FP16, INT8)를 전략적으로 선택하여 메모리 50~75% 절감과 추론 속도 2~4배 향상 달성
도커(Docker)를 통해 macOS에서 Rocky Linux 환경을 1분 이내에 실행하고 Dockerfile로 이미지를 정의한 후 Docker Compose로 다중 컨테이너를 관리하여 클라우드 배포까지 자동화
앤트로픽이 Claude 모델의 서로 다른 두 가지 버그를 수정해 8월 5일~9월 5일 동안 발생한 품질 저하 문제 해결
Google Gemini 2.5 Flash Image 모델 배포 이후 Gemini API 빌링 시스템의 결함으로 8월 23일부터 이미지 생성을 하지 않았음에도 불구하고 과다 청구 발생
44bits가 AWS EKS에서 미니 PC 홈서버로 마이그레이션해 월 30만원대 서버비를 초기 투자 30만원으로 전환
Kamal2의 kamal-proxy 레이어를 활용해 애플리케이션 재시작 없이 503 점검 페이지를 즉시 반환하는 maintenance 모드 구현
Anthropic이 Claude Code를 Team/Enterprise 플랜에 프리미우 시트 옵션으로 추가해 기업 사용자의 코드 생성 기능 접근 확대
Django 4.1이 클래스 기반 뷰의 비동기 핸들러와 비동기식 ORM 인터페이스를 도입해 async/await 기반 웹 애플리케이션 개발 지원 확대
fly.io가 Docker 이미지 배포 자동화로 5분 내 배포 및 10초 이내 업데이트 실현
Django Rest Framework의 ViewSet에서 get_queryset(), get_serializer_class(), SerializerMethodField를 활용해 인증된 사용자별 데이터 필터링, 메서드별 시리얼라이저 전환, 추가 필드 동적 생성을 구현