시스메틱 데일리1인기업이 바로 쓰는 AI 자동화 뉴스
기술·논문

클로드 코드 한도, 미리 예측한다

OAuth 사용량 API로 사용 한계를 통계 예측하는 단일 바이너리 claumon

클로드 코드 한도, 미리 예측한다

클로드 코드(Claude Code)를 종일 돌리다 보면 어느새 사용 한도에 부딪힌다. 문제는 개인 프로(Pro)·맥스(Max) 요금제 사용자에게는 "내가 언제 한도에 닿을지" 알려주는 대시보드가 없다는 점이다. 클로몬(claumon)은 바로 그 빠진 대시보드를, 통계 예측까지 얹어 로컬에서 띄워준다.

무슨 일인가

앤트로픽(Anthropic)의 사용량 분석 대시보드는 팀·엔터프라이즈 조직 관리자 전용이다. 개인 사용자가 보는 화면은 "지금 어디까지 썼다"는 현재 상태만 보여줄 뿐, 이력도 세션별 비용도 없고 무엇보다 "앞으로 어떻게 될지"에 대한 예측이 없다. 클로몬은 이 공백을 메우려 만들어진 도구로, 설정이 필요 없는 단일 Go 바이너리 하나로 macOS·리눅스·윈도우에서 브라우저 탭 하나로 돈다. 노드도 파이썬도 빌드 단계도 필요 없다.

핵심 짚어보기

클로몬의 강점은 "추정"이 아니라 "측정"이라는 데 있다. 세션·주간·모델별 사용률을 로컬 로그에서 추정하는 게 아니라 클로드 OAuth 사용량 API에서 직접 측정해 실시간 게이지로 보여준다. 여기에 통계적 예측이 더해진다. 리셋 시점의 예상 사용률을 80% 신뢰구간과 함께 제시하고, 특정 한계선에 닿는 예상 시각(ETA)까지 계산한다.

이 예측은 단순 소진율 외삽이나 백분위 어림셈이 아니다. 사용자 본인의 이력으로 매일 다시 적합되는 경험적 베이즈(empirical-Bayes) 모델을 쓰고, 그 모델은 문서(MODEL.pdf)로 공개돼 있으며 적절한 채점 규칙으로 표본 외 검증까지 거쳤다고 한다. 이 밖에 세션별 토큰·비용 분석, SQLite에 쌓이는 추세, 실행 중 프로세스 제어, 그리고 건강 점수와 관계 그래프가 달린 메모리 파일 브라우저까지 묶여 있다. 모든 지표는 SSE로 실시간 갱신된다.

1인기업 실전 적용 포인트

  • 한도 소진을 미리 보고 작업을 분산하라: ETA 예측을 보고 "오후에 한도가 빌 것"이 보이면, 무거운 리팩터링은 리셋 이후로 미뤄 막판 병목을 피한다.
  • 세션별 비용으로 자동화 ROI를 따져라: 어떤 반복 작업이 토큰을 많이 먹는지 수치로 보이면, 비싼 작업만 로컬 모델로 떼어낼 판단 근거가 된다.
  • 구독 요금제를 데이터로 선택하라: 주간 사용률 추세를 몇 주 쌓아 보면 프로로 충분한지, 맥스가 필요한지 감이 아니라 숫자로 결정할 수 있다.
  • 단일 바이너리 특성을 살려 서버에 얹어라: 설치 의존성이 없어, 에이전트를 돌리는 원격 머신에 그대로 띄워 원격 사용량을 모니터링하기 쉽다.

전망 / 주의점

클로몬은 ccusage(노드 CLI), Claude-Code-Usage-Monitor(파이썬 TUI) 등 비슷한 도구들과 경쟁하는데, 강점은 "검증된 예측"과 "라이브 대시보드"에 있다. 빠른 비용 리포트만 필요하면 더 검증된 대안도 있다고 만든 이 스스로 밝힌다. 사용량을 데이터로 관리하는 일이 곧 AI 운영비를 통제하는 일이라는 점에서, 1인기업에게는 "감으로 쓰던 AI 구독"을 회계 가능한 자원으로 바꾸는 도구로 읽힌다.

출처: 깃허브 claumon (https://github.com/fabioconcina/claumon)
← 전체 기사 보기