서브에이전트가 서브에이전트를 부른다

클로드 코드 2.1.172, 에이전트 5단계 중첩 허용… 토큰 비용 폭탄 주의보

앤트로픽(Anthropic)이 2년 동안 단 한 번도 풀지 않았던 규칙을 조용히 해제했다. 클로드 코드(Claude Code) v2.1.172가 6월 10일 공개되면서, 이제 하위 에이전트(서브에이전트)가 또 다른 하위 에이전트를 직접 띄울 수 있게 됐다. 중첩 한계는 5단계다. 변경 로그에는 한 줄뿐이지만, 자동화 워크플로를 설계하는 1인기업 입장에서 의미는 결코 한 줄이 아니다.

무슨 일인가

그동안 클로드 코드에는 예외 없는 원칙이 하나 있었다. 하위 에이전트는 또 다른 하위 에이전트를 호출할 수 없다는 것이다. 이번 버전이 그 빗장을 풀었다. 다만 5단계라는 상한선은 서버 쪽에서 강제되며, 설정으로 올리거나 끌 수 없다. 클로드 코드를 이끄는 책임자는 이 기능의 취지를 "맥락(컨텍스트)을 더 잘 관리하기 위해 에이전트가 에이전트를 띄우는 것"이라고 설명했다. 핵심은 더 많은 작업을 병렬로 돌리는 게 아니라, 시끄러운 작업을 메인 대화가 보지 못하는 곳에서 처리하는 데 있다. 예전에는 로그 분석을 맡은 하위 에이전트가 수천 토큰짜리 원시 로그를 부모 대화창에 쏟아부었고, 부모는 다시 자기 맥락을 복구하느라 토큰을 추가로 태웠다.

핵심 짚어보기

구조를 이해하는 가장 쉬운 비유는 '5층짜리 콜스택'이다. 각 층은 자기만의 시스템 프롬프트, 자기만의 모델 선택, 자기만의 20만 토큰 맥락 창을 갖는다. 부모는 가장 아래층이 돌려준 요약만 읽고, 중간 과정의 검색·파일 읽기·중간 추론은 토큰을 쓴 뒤 부모 시야에서 사라진다. 실제 디버깅 사슬은 이런 식이다. 메인 세션(오푸스)이 사건을 불러오면, 분류 책임 에이전트가 네 갈래 원인으로 펼치고, 그중 로그를 뒤지는 노이즈 작업은 더 저렴한 모델에게 넘겨 한 줄 결과만 받는다. 메인 스레드는 5만 토큰짜리 원시 로그가 아니라 깔끔한 결론 네 개만 본다. 대부분의 쓸모 있는 사슬은 깊이 2~3단계에 머문다. 5단계는 목표가 아니라 천장이다.

1인기업 실전 적용 포인트

비용 구조를 먼저 계산하라. 중첩은 가지·레벨당 약 7배씩 토큰을 곱한다. 한 개발자는 분당 88만 7천 토큰을 모르고 태웠고, 어느 금융팀은 하위 에이전트 23개를 동원한 '간단한' 코드 품질 작업으로 사흘 뒤 4만 7천 달러 청구서를 받았다.
모델을 층마다 다르게 써라. 오케스트레이션은 오푸스, 중간 구현은 소네트, 로그 읽기·grep·테스트 생성 같은 말단 작업은 하이쿠로 돌리면 세션당 약 2.02달러가 0.98달러로 51% 줄었다(품질 저하 없음).
순환 호출을 막아라. Agent() 허용 목록을 명시해 'A가 B를, B가 다시 A를' 부르는 무한 비용 루프를 차단한다. 깊이 제한은 순환 논리를 막아주지 않는다.
짧은 작업은 중첩하지 마라. 출력이 1,000토큰 미만인 작업은 별도 프레임으로 빼는 오버헤드가 격리 이득보다 크다. 열 줄짜리 grep은 그냥 그 자리에서 처리하는 편이 싸다.

전망 / 주의점

5단계 상한은 무한 루프는 막아주지만, 새벽 3시에 울리는 과금 경보까지 막아주지는 않는다. 운영에 투입하기 전에 세션당 지출 한도를 반드시 걸어두는 편이 안전하다. 1인기업에게 이 기능은 '에이전트를 더 많이 쓰는 도구'가 아니라 이미 쓰고 있는 에이전트에게서 더 깨끗한 결과를 받는 도구로 받아들이는 것이 맞다.

출처: ByteIota (https://byteiota.com/claude-code-v2-1-172-sub-agents-can-now-spawn-sub-agents/)

서브에이전트가 서브에이전트를 부른다

무슨 일인가

핵심 짚어보기

1인기업 실전 적용 포인트

전망 / 주의점

비주얼 디프 896장, AI가 1분 만에 전수 리뷰

AI 에이전트에 '경찰서'를 붙인다

텔레그램으로 AI 에이전트 팀을 부린다