피드로 돌아가기
Hacker NewsHacker News
Backend

개발자가 $7/월 VPS에 AI 에이전트를 배포하고 IRC를 통신 계층으로 사용해 포트폴리오 문의를 코드 기반 답변으로 처리

Show HN: I put an AI agent on a $7/month VPS with IRC as its transport layer

2026년 3월 26일12intermediate

Context

포트폴리오 사이트의 AI 챗봇들은 이력서를 모델에 입력해 방문자가 이력서를 다시 표현하게 하는 수준에 머물러 있었다. 이 접근법은 실제 코드 검증 없이 사전 작성된 내용만 반복하므로 기술적 깊이를 표현하기 어려웠다.

Technical Solution

  • nullclaw(공개 에이전트)와 ironclaw(비공개 에이전트)를 분리: 678 KB Zig 바이너리로 구현된 nullclaw는 최소 권한으로 공개 GitHub 저장소만 접근 가능, ironclaw는 Tailscale을 통해 분리된 박스에서 이메일/달력 등 개인 정보 관리
  • Ergo IRC 서버(2.7 MB RAM)를 중앙 통신 계층으로 사용: WebSocket 클라이언트인 gamja(152 KB)를 포트폴리오 사이트에 임베드해 방문자는 #lobby 채널에 접속, nullclaw가 IRC 클라이언트로 참여해 메시지 처리
  • 모델 계층화를 비용·레이턴시 최적화로 설계: Haiku 4.5를 인사말/기본 질문용(초 단위 응답, 문장당 몇 센트), Sonnet 4.6을 저장소 클론·코드 읽기 등 도구 사용시 fallback으로 배정
  • 지출 상한선 설정: nullclaw는 하루 $2, 월 $30 한도로 제한해 남용·예산 초과 방지
  • Cloudflare를 TLS 종료·비율 제한·봇 필터링용 프록시로 배치: 방문자 트래픽이 VPS에 직접 도달하지 않음
  • 보안 하드닝: SSH는 키 기반만 허용, 비표준 포트 사용, UFW로 SSH·IRC(TLS)·HTTPS만 개방, nullclaw는 workspace 범위 내 파일 접근만 가능, 시간당 10개 작업 제한

Impact

전체 바이너리 용량 10 MB 미만, 유휴 상태 메모리 5 MB 미만으로 $7/월 VPS 최저 등급에서 운영 가능. 월 비용을 $30(추론)로 예측 가능하게 제한.

Key Takeaway

AI 에이전트 구축에서 모델 선택과 통신 계층 설계가 시스템 효율성만큼 중요하며, 공개·비공개 경계를 명확히 분리한 다중 에이전트 구조가 보안과 기능성을 동시에 확보할 수 있다는 점이다. IRC 같은 검증된 프로토콜을 택하면 공급업체 종속성을 제거하고 장기 운영 비용을 최소화할 수 있다.


포트폴리오·기술 블로그를 운영하는 개발자가 비용 제한이 있는 공개 AI 에이전트를 구축할 때, 저비용 모델(Haiku)을 기본으로 설정하되 복잡한 작업에만 고급 모델(Sonnet)을 fallback으로 사용하고, Cloudflare 같은 관리형 프록시를 앞단에 배치한 후 도구 사용·응답 수·일일 지출 상한을 코드 수준에서 강제하면 수십 달러 이상의 월 비용 없이 신뢰성 있는 기술 문의 처리 시스템을 구축할 수 있다.

원문 읽기
Show HN: I put an AI agent on a $7/month VPS with IRC as its transport layer | Devpick