Bedrock AgentCore 기반 Prompt 최적화 루프 및 A/B 테스트 검증 체계 구축
Improving and Validating Multi-Agent Prompts with Bedrock AgentCore Optimization
Improving and Validating Multi-Agent Prompts with Bedrock AgentCore Optimization
Skills Without Evals Are Just Markdown and Hope
🧩 Frontend Architecture for Dynamic Content: Hardcoded UI vs CMS/BE vs Server-Driven UI
Why I'm Done Making Desktop Applications (2009)
Eval workflow for agentic builders: fork any prompt through baseline vs scaffolded agents, blind third-party judge.
Anthropic tests how devs react to yanking Claude Code from Pro plan
A/B Testing Your App Store Screenshots: A Complete Framework
TraceMind v2 — I added hallucination detection and A/B testing to my open-source LLM eval platform
Next.js Middleware in 2026: Beyond Auth — Advanced Patterns Most Developers Miss
Onde e como usar o Schepta
Why We Use Separate Tech Stacks for Personalization and Experimentation
LINE Plus가 사용자 세그먼트 기반 동적 분할 기법을 도입해 특정 사용자군만 대상으로 하는 A/B 테스트 시스템 구축
올리브영이 SDUI(Server-Driven UI) 아키텍처를 도입해 앱 스토어 심사 없이 서버 설정만으로 화면 변경 가능하도록 구현
강남언니가 채팅 기능 배포 후에도 '연락이 안 된다'는 VOC가 계속되자, 사용자 관찰과 병원 인터뷰를 통해 진짜 문제(채팅 접근성 부족, 병원 관리 환경 미흡)를 파악하고 UI/UX 개선으로 VOC 72% 감소
컬리가 BERT4Rec 모델과 NPMI 기반 카테고리 필터링으로 장바구니 보완재 추천을 구현해 전환율 약 100% 상승
강남언니가 AB테스트 설계 개선을 통해 일본 유저 회원가입 전환율을 59.9%에서 79.9%로 20% 포인트 상승
뱅크샐러드가 Python Notebook 기반 수동 분석에서 Pyspark 자동 파이프라인으로 전환해 Data Scientist 주간 2시간 리소스 절감 및 인적 오류 제거
뱅크샐러드가 데이터 교육과 인하우스 실험 플랫폼 구축으로 분기당 7개에서 100개 이상의 실험 진행으로 조직 문화 전환