시스메틱 데일리1인기업이 바로 쓰는 AI 자동화 뉴스
AI 도구

코덱스가 짜고 클로드가 깐다, 데브루프

스펙 기반 코드·리뷰 자동 반복으로 사람은 검수만

코덱스가 짜고 클로드가 깐다, 데브루프

코딩 에이전트가 짠 코드를 누가 검토할 것인가. 개발자 satyaborg가 공개한 데브루프(Devloop)의 답은 "같은 에이전트에게 맡기지 말라"다. 코덱스(Codex)가 구현하면 클로드 코드(Claude Code)가 적대적으로 리뷰하게(혹은 그 반대로) 만들어, 모든 인수 조건이 충족되고 버그가 잡힐 때까지 코드·리뷰 루프를 자동으로 돌린다. macOS에서 동작하며 코덱스와 클로드 코드 둘 다 필요하다.

무슨 일인가

데브루프가 출발점으로 삼은 문제의식은 이렇다. 같은 모델 계열은 코딩과 리뷰를 동시에 잘하지 못한다는 것이다. 자기가 짠 결과물을 편애하기 때문이다. 그래서 데브루프는 한 에이전트가 구현하고 다른 에이전트가 깐다. 사람은 판단이 정말 필요한 두 지점, 즉 스펙 작성과 PR 최종 승인에만 개입한다.

작동은 네 단계다. 먼저 /devloop-spec 스킬이 문제·목표·인수 조건·범위를 담은 짧은 마크다운 스펙을 만든다. 그다음 코덱스가 격리된 깃 워크트리(git worktree) 안에서 스펙대로 구현한다. 이어 클로드 코드가 /devloop-review로 스펙의 인수 조건과 함께 보안·유지보수성·정확성·단순성 같은 엔지니어링 기준을 충족하는지 검사한다. 마지막으로 거부되면 다시 돌고, 통과하거나 최대 횟수에 도달하면 멈추며, 사람이 검토할 PR을 만들어낸다.

핵심 짚어보기

안전장치도 분명하다. 데브루프는 기본적으로 격리된 형제 워크트리에서만 작동하며, --create-pr을 넘기지 않는 한 푸시하거나 PR을 열지 않는다. 현재 체크아웃에서 바로 작업하려면 --in-place를 쓴다. 기본값은 코덱스가 코딩, 클로드가 리뷰지만 --coder/--reviewer로 역할을 맞바꿀 수 있다.

.devloop/verify 훅에 빌드·린트·테스트 명령을 넣으면 그 결과가 인수 게이트가 되어, 실패 시 루프를 막는다. 루프는 통과(ACCEPT)하거나 진전이 멈추거나 기본 5회(1~10회 조정) 패스를 소진하면 멈추고, 매 실행에는 30분 제한이 걸린다. 텔레메트리는 없으며 감사 가능한 단일 Bash 스크립트 하나로 동작한다는 점도 강조됐다.

1인기업 실전 적용 포인트

  • 혼자 개발하는 1인기업일수록 '짠 사람과 깐 사람을 다르게' 두는 효과가 크다. 코덱스로 구현하고 클로드 코드로 적대적 리뷰를 붙이면, 리뷰어가 없는 1인 환경에서도 자기 코드 편애로 놓치던 버그를 잡을 수 있다.
  • 모든 작업에 쓰지 말고 선별하자. 스펙으로 또렷이 정의되고, 규모가 커서 적대적 리뷰가 실제로 뭔가 걸러낼 만한 작업에만 돌리는 게 효율적이다. 한 번에 끝나는 작은 작업은 그냥 에이전트에게 직접 시키는 편이 낫다.
  • .devloop/verify에 테스트 명령을 걸어두면 테스트 통과를 루프의 합격 조건으로 강제할 수 있다. 1인기업의 품질 게이트를 사람 손 없이 자동화하는 실전적인 방법이다.

전망 / 주의점

데브루프는 "에이전트가 알아서 반복하고 사람은 스펙과 승인만"이라는 흐름을 한 단계 구체화했다. 다만 인수 조건을 미리 글로 못 박을 수 없는 탐색적·열린 작업에는 맞지 않는다. 모든 편집을 직접 통제하고 싶은 사람에게도 부담스럽다. 자동 루프가 강력한 만큼, 스펙을 얼마나 잘 쓰느냐가 결과를 좌우한다.

출처: Devloop (https://devloop.sh)
← 전체 기사 보기