AI 코딩의 정답은 프롬프트 아닌 '루프'

한 방 프롬프트의 한계 — 작은 변경·하드 게이트·정직한 종료의 3원칙

대부분은 아직 AI를 「기억력 없는 빠른 인턴」처럼 쓴다. 프롬프트를 쓰고, 코드 덩어리를 받고, 대충 훑어 붙여넣고, 잘 되기를 빈다. 기술 블로그 스킬디비(SkillDB)는 진짜 성과를 내는 팀들이 이미 다른 모양으로 옮겨갔다고 말한다. 한 방의 프롬프트가 아니라, 「루프」다.

무슨 일인가

에이전트 루프의 공식은 간단하다. 「실행 → 하드 게이트로 검사 → 반복, 종료 신호가 멈추라고 할 때까지.」 에이전트가 작은 변경 하나를 만들면 자동 게이트가 그것이 유효한지 판정하고, 통과하면 남기고 실패하면 되돌린 뒤 다시 돈다. 한 방 프롬프트는 네 곳에서 무너진다. 200개 파일을 고치는 리팩터링은 문맥 창에 다 들어가지 않아 에이전트가 안 보이는 부분을 추측하고, 600줄짜리 한 번의 변경은 아무도 정직하게 읽지 못하며, 검증 장치가 없으면 「그럴듯하지만 틀린」 답이 자신감만으로 통과되고, 「버그 찾아」 같은 지시는 다 찾았든 못 찾았든 한 번 돌고 멈춘다.

핵심 짚어보기

좋은 루프는 세 가지 불변 원칙을 지킨다. 첫째, 매 반복마다 「하드 게이트」를 둔다. 테스트 종료 코드, 타입 검사 통과, 평가 점수 비퇴행처럼 에이전트가 말로 우길 수 없는 결정적 검사다. 게이트를 통과하지 못한 변경은 「일어나지 않은 것」으로 보고 되돌린다. 둘째, 한 번에 하나의 추적 가능한 변경만 한다. 네 가지를 한꺼번에 고치면 둘은 통과하고 둘은 망가졌을 때 무엇이 원인인지 가릴 수 없다. 셋째, 정직한 종료 신호를 심는다. 「수정할 게 없으면 멈춘다」를 건너뛰기 비율, 실패 테스트 0, 버그 탐색기의 침묵 같은 지표로 계측한다. 글쓴이는 실제 사례를 든다. 운영 중인 관리자 화면을 매 페이지 스크린샷 찍고 한 가지씩 개선하며 타입·린트 검사를 돌리는 자가 개선 루프로 약 85건을 고쳤는데, 그 과정에서 서버 헬스 체크는 멀쩡한데 화면만 크래시 나던 버그를 스크린샷 하네스가 잡아내 뿌리째 고쳤다.

1인기업 실전 적용 포인트

작업을 루프로 쪼개라: 「전체 리팩터링」을 한 번에 시키지 말고, 작은 변경 하나마다 테스트·타입 검사를 게이트로 걸어 통과한 것만 남긴다.
한 단계 한 변경: 커밋 단위를 잘게 가져가, 무언가 깨졌을 때 정확히 어느 줄이 문제인지 곧바로 되짚는다.
멈춤 조건을 먼저 정하라: 「실패 테스트 0」, 「세 번 연속 새 버그 없음」처럼 끝을 숫자로 정의해, 에이전트가 무한히 헛돌거나 멋대로 멈추지 않게 한다.
정직한 건너뛰기: 이미 잘 된 부분은 「바꾼 것 없음, 이유는 이것」이라고 말하게 두고, 일하는 척 억지 수정을 막는다.

전망 / 주의점

루프의 힘은 에이전트를 더 똑똑하게 만드는 데 있지 않고, 작업의 단위를 「큰 한 방」에서 「작고 검증된 여러 걸음」으로 바꾸는 데 있다. 다만 게이트가 허술하면 루프 전체가 값비싼 헛수고로 전락하므로, 무엇으로 통과를 판정할지를 가장 먼저 설계해야 한다. 1인기업이라면 테스트 한 줄, 타입 검사 한 줄이라도 게이트로 걸어두는 것에서 시작하는 게 현실적이다.

출처: 스킬디비 (https://skilldb.dev/blog/agentic-loops-why-the-best-ai-coding-workflows-are-loops)

AI 코딩의 정답은 프롬프트 아닌 '루프'

무슨 일인가

핵심 짚어보기

1인기업 실전 적용 포인트

전망 / 주의점

AI는 '접근성'을 선택사항으로 본다

클로드 코드로 메타 모델 제친 신약 AI

가짜 버그리포트로 AI 코딩 에이전트가 털린다