코덱스, 같은 사용량에 비용 10배 논란
GPT-5.5 코덱스, 6월 16일부터 토큰당 한도 소비가 10~20배 늘었다는 신고
AI 코딩 도구의 ‘정액제 안정성’을 흔드는 신고가 나왔다. 오픈AI의 코딩 에이전트 코덱스(Codex) 사용자가 같은 요금제·같은 모델인데 6월 16일을 기점으로 토큰당 사용 한도 소비가 10~20배로 뛰었다며 깃허브 이슈를 올렸다. 한 달에 수십 번 쓰던 작업이 며칠 새 두세 번 만에 한도에 막히기 시작했다는 호소다.
무슨 일인가 / 배경
6월 18일 깃허브의 오픈AI 코덱스 저장소에 올라온 이슈(#28879)에서 작성자는 챗GPT 플러스(Plus) 요금제로 GPT-5.5 모델을 쓰는데, 원래 하루 20번 넘게 쓰던 프롬프트가 2~3번 만에 5시간 예산을 소진한다고 밝혔다. 그는 자신의 설정은 그대로이며, 오히려 프롬프트는 더 작아지고 추론(reasoning) 토큰은 거의 0에 가깝다고 덧붙였다. 즉 더 적게 쓰는데 한도는 훨씬 빨리 닳는다는 것이다.
핵심 짚어보기
작성자가 제시한 세션 로그가 구체적이다. 정상이던 6월 12일에는 5만 7,000토큰 입력에 추론 3,600토큰을 쓴 무거운 요청이 5시간 예산의 약 1%만 소비했다. 반면 6월 18일에는 2만 토큰짜리 가벼운 요청 하나가 예산의 10~27%를 잡아먹었다. 그는 추론 강도 차이도, 컨텍스트 비대도, 자신의 설정도, 주간 한도도 아니라고 로그로 하나씩 배제했다. 부차적 한도는 12%에 불과한데 유독 5시간 창만 빠르게 마른다는 것이다. 시점도 의심을 키운다. 오픈AI 상태 페이지에 6월 16일경부터 약 이틀간 진행된 장애 기록이 있어, 사용 가능 횟수가 하루 9세션에서 4세션으로 줄어든 시기와 맞아떨어진다고 그는 지적했다.
1인기업 실전 적용 포인트
- AI 코딩 도구 하나에 일을 몰아주면 이런 한도 변동에 그대로 노출된다. 클로드 코드(Claude Code) 등 대체 도구를 평소에 한 곳 더 익혀 두면 작업이 멈추는 사고를 피할 수 있다.
- 코덱스 세션 로그의 token_count·rate_limits 항목처럼, 쓰는 도구의 토큰·한도 소비를 주기적으로 기록해 두면 ‘체감상 빨라졌다’를 숫자로 입증해 문의·환불 근거로 쓸 수 있다.
- 정액제라도 실사용량을 추적해, 한 달 작업량을 한도에 맞춰 분산하면 중요한 마감일에 한도에 막히는 일을 줄일 수 있다.
- 비용 민감한 반복 작업은 무료·저비용 로컬 모델로 폴백을 구성해 두는 것이 1인 운영의 비용 방어선이 된다.
전망 / 주의점
이 내용은 현재 한 사용자의 보고이며 오픈AI의 공식 확인은 나오지 않았다. 의도적인 예산 조정인지, 일시적 장애인지, 측정 오류인지는 아직 단정하기 어렵다. 다만 요금제가 같아도 토큰당 비용이 조용히 바뀔 수 있다는 점은, AI 도구에 운영을 의존하는 1인기업이 반드시 염두에 둬야 할 리스크다.
출처: Hacker News / GitHub (https://github.com/openai/codex/issues/28879)