Dev.to이원화된 레이어 설계로 Mind2Web 벤치마크 81% 달성OpenAI Operator scores 43% on hard web tasks. We scored 81%. Here are all 300 runs.AI/MLadvanced13 분 소요2026년 5월 19일