코덱스, 같은 사용량에 비용 10배 논란

GPT-5.5 코덱스, 6월 16일부터 토큰당 한도 소비가 10~20배 늘었다는 신고

AI 코딩 도구의 ‘정액제 안정성’을 흔드는 신고가 나왔다. 오픈AI의 코딩 에이전트 코덱스(Codex) 사용자가 같은 요금제·같은 모델인데 6월 16일을 기점으로 토큰당 사용 한도 소비가 10~20배로 뛰었다며 깃허브 이슈를 올렸다. 한 달에 수십 번 쓰던 작업이 며칠 새 두세 번 만에 한도에 막히기 시작했다는 호소다.

무슨 일인가 / 배경

6월 18일 깃허브의 오픈AI 코덱스 저장소에 올라온 이슈(#28879)에서 작성자는 챗GPT 플러스(Plus) 요금제로 GPT-5.5 모델을 쓰는데, 원래 하루 20번 넘게 쓰던 프롬프트가 2~3번 만에 5시간 예산을 소진한다고 밝혔다. 그는 자신의 설정은 그대로이며, 오히려 프롬프트는 더 작아지고 추론(reasoning) 토큰은 거의 0에 가깝다고 덧붙였다. 즉 더 적게 쓰는데 한도는 훨씬 빨리 닳는다는 것이다.

핵심 짚어보기

작성자가 제시한 세션 로그가 구체적이다. 정상이던 6월 12일에는 5만 7,000토큰 입력에 추론 3,600토큰을 쓴 무거운 요청이 5시간 예산의 약 1%만 소비했다. 반면 6월 18일에는 2만 토큰짜리 가벼운 요청 하나가 예산의 10~27%를 잡아먹었다. 그는 추론 강도 차이도, 컨텍스트 비대도, 자신의 설정도, 주간 한도도 아니라고 로그로 하나씩 배제했다. 부차적 한도는 12%에 불과한데 유독 5시간 창만 빠르게 마른다는 것이다. 시점도 의심을 키운다. 오픈AI 상태 페이지에 6월 16일경부터 약 이틀간 진행된 장애 기록이 있어, 사용 가능 횟수가 하루 9세션에서 4세션으로 줄어든 시기와 맞아떨어진다고 그는 지적했다.

1인기업 실전 적용 포인트

AI 코딩 도구 하나에 일을 몰아주면 이런 한도 변동에 그대로 노출된다. 클로드 코드(Claude Code) 등 대체 도구를 평소에 한 곳 더 익혀 두면 작업이 멈추는 사고를 피할 수 있다.
코덱스 세션 로그의 token_count·rate_limits 항목처럼, 쓰는 도구의 토큰·한도 소비를 주기적으로 기록해 두면 ‘체감상 빨라졌다’를 숫자로 입증해 문의·환불 근거로 쓸 수 있다.
정액제라도 실사용량을 추적해, 한 달 작업량을 한도에 맞춰 분산하면 중요한 마감일에 한도에 막히는 일을 줄일 수 있다.
비용 민감한 반복 작업은 무료·저비용 로컬 모델로 폴백을 구성해 두는 것이 1인 운영의 비용 방어선이 된다.

전망 / 주의점

이 내용은 현재 한 사용자의 보고이며 오픈AI의 공식 확인은 나오지 않았다. 의도적인 예산 조정인지, 일시적 장애인지, 측정 오류인지는 아직 단정하기 어렵다. 다만 요금제가 같아도 토큰당 비용이 조용히 바뀔 수 있다는 점은, AI 도구에 운영을 의존하는 1인기업이 반드시 염두에 둬야 할 리스크다.

출처: Hacker News / GitHub (https://github.com/openai/codex/issues/28879)

코덱스, 같은 사용량에 비용 10배 논란

무슨 일인가 / 배경

핵심 짚어보기

1인기업 실전 적용 포인트

전망 / 주의점

AI 코딩 비용, 팀 단위로 들여다본다

커서, 코드 호스팅 '오리진' 예고

챗GPT 점유율 첫 50% 붕괴, 추격 거세다