시스메틱 데일리1인기업이 바로 쓰는 AI 자동화 뉴스
에이전트

서브에이전트가 서브에이전트를 부른다

클로드 코드 2.1.172, 에이전트 5단계 중첩 허용… 토큰 비용 폭탄 주의보

서브에이전트가 서브에이전트를 부른다

앤트로픽(Anthropic)이 2년 동안 단 한 번도 풀지 않았던 규칙을 조용히 해제했다. 클로드 코드(Claude Code) v2.1.172가 6월 10일 공개되면서, 이제 하위 에이전트(서브에이전트)가 또 다른 하위 에이전트를 직접 띄울 수 있게 됐다. 중첩 한계는 5단계다. 변경 로그에는 한 줄뿐이지만, 자동화 워크플로를 설계하는 1인기업 입장에서 의미는 결코 한 줄이 아니다.

무슨 일인가

그동안 클로드 코드에는 예외 없는 원칙이 하나 있었다. 하위 에이전트는 또 다른 하위 에이전트를 호출할 수 없다는 것이다. 이번 버전이 그 빗장을 풀었다. 다만 5단계라는 상한선은 서버 쪽에서 강제되며, 설정으로 올리거나 끌 수 없다. 클로드 코드를 이끄는 책임자는 이 기능의 취지를 "맥락(컨텍스트)을 더 잘 관리하기 위해 에이전트가 에이전트를 띄우는 것"이라고 설명했다. 핵심은 더 많은 작업을 병렬로 돌리는 게 아니라, 시끄러운 작업을 메인 대화가 보지 못하는 곳에서 처리하는 데 있다. 예전에는 로그 분석을 맡은 하위 에이전트가 수천 토큰짜리 원시 로그를 부모 대화창에 쏟아부었고, 부모는 다시 자기 맥락을 복구하느라 토큰을 추가로 태웠다.

핵심 짚어보기

구조를 이해하는 가장 쉬운 비유는 '5층짜리 콜스택'이다. 각 층은 자기만의 시스템 프롬프트, 자기만의 모델 선택, 자기만의 20만 토큰 맥락 창을 갖는다. 부모는 가장 아래층이 돌려준 요약만 읽고, 중간 과정의 검색·파일 읽기·중간 추론은 토큰을 쓴 뒤 부모 시야에서 사라진다. 실제 디버깅 사슬은 이런 식이다. 메인 세션(오푸스)이 사건을 불러오면, 분류 책임 에이전트가 네 갈래 원인으로 펼치고, 그중 로그를 뒤지는 노이즈 작업은 더 저렴한 모델에게 넘겨 한 줄 결과만 받는다. 메인 스레드는 5만 토큰짜리 원시 로그가 아니라 깔끔한 결론 네 개만 본다. 대부분의 쓸모 있는 사슬은 깊이 2~3단계에 머문다. 5단계는 목표가 아니라 천장이다.

1인기업 실전 적용 포인트

  • 비용 구조를 먼저 계산하라. 중첩은 가지·레벨당 약 7배씩 토큰을 곱한다. 한 개발자는 분당 88만 7천 토큰을 모르고 태웠고, 어느 금융팀은 하위 에이전트 23개를 동원한 '간단한' 코드 품질 작업으로 사흘 뒤 4만 7천 달러 청구서를 받았다.
  • 모델을 층마다 다르게 써라. 오케스트레이션은 오푸스, 중간 구현은 소네트, 로그 읽기·grep·테스트 생성 같은 말단 작업은 하이쿠로 돌리면 세션당 약 2.02달러가 0.98달러로 51% 줄었다(품질 저하 없음).
  • 순환 호출을 막아라. Agent() 허용 목록을 명시해 'A가 B를, B가 다시 A를' 부르는 무한 비용 루프를 차단한다. 깊이 제한은 순환 논리를 막아주지 않는다.
  • 짧은 작업은 중첩하지 마라. 출력이 1,000토큰 미만인 작업은 별도 프레임으로 빼는 오버헤드가 격리 이득보다 크다. 열 줄짜리 grep은 그냥 그 자리에서 처리하는 편이 싸다.

전망 / 주의점

5단계 상한은 무한 루프는 막아주지만, 새벽 3시에 울리는 과금 경보까지 막아주지는 않는다. 운영에 투입하기 전에 세션당 지출 한도를 반드시 걸어두는 편이 안전하다. 1인기업에게 이 기능은 '에이전트를 더 많이 쓰는 도구'가 아니라 이미 쓰고 있는 에이전트에게서 더 깨끗한 결과를 받는 도구로 받아들이는 것이 맞다.

출처: ByteIota (https://byteiota.com/claude-code-v2-1-172-sub-agents-can-now-spawn-sub-agents/)
← 전체 기사 보기