클로드 코드로 메타 모델 제친 신약 AI
앙스트롬, GPU 10만 잡을 에이전트에 맡겨 DFT 정확도·1만배 속도 모델 완성
AI 에이전트가 연구실의 실험 루프 자체를 대신 돌릴 수 있을까. 그 답에 가까운 사례가 나왔다. 신약 분야 스타트업 앙스트롬 AI(Ångstrom AI, YC S24)가 케임브리지대 차니 그룹, 제약사 아스트라제네카와 함께 기존 정밀 계산(DFT)과 같은 정확도를 유지하면서 계산 속도를 1만 배 끌어올린 결정구조 예측 모델 'CSP-MACE-Å'를 공개했다. 이 모델은 메타(Meta)의 범용 원자·분자 모델 UMA-OMC를 벤치마크에서 앞섰다.
무슨 일인가
결정구조 예측(CSP)은 '어떤 분자가 고체로 굳을 때 어떤 결정 형태들을 만들 수 있는가'를 푸는 문제다. 신약 개발에서 특히 중요하다. 같은 분자라도 다른 결정형(다형체)으로 굳으면 약효와 안정성이 달라지기 때문이다. 1998년 에이즈 치료제 리토나비르는 출시 2년 뒤 더 안정한 결정형이 뒤늦게 나타나면서 제품을 회수·재제조해야 했고, 애벗은 2억 5천만 달러 넘는 손실을 봤다. 이런 위험을 미리 거르려면 가능한 결정형을 전부 계산해봐야 하는데, 표준 도구인 DFT는 분자 하나에 며칠에서 몇 주가 걸릴 만큼 느리고 비싸다.
핵심 짚어보기
CSP-MACE-Å는 이 계산을 머신러닝으로 대체해 몇 주짜리 작업을 몇 분으로 줄였다. 주목할 대목은 모델을 만든 방식이다. 앙스트롬은 자체 클라우드 계정에서 GPU 작업을 돌리는 CLI '애니클라우드(anycloud)'에 클로드 코드를 연결했다. 연구자는 어떤 실험을 돌릴지, 무엇을 비교할지 가설과 계획만 세우고, 클로드 코드가 GPU 작업 묶음을 띄우고 상태를 감시하고 결과를 내려받아 그래프와 요약까지 만들어냈다. 이렇게 돌린 GPU 작업이 약 10만 건, 대부분 여러 클라우드의 저가 스팟 인스턴스였다.
다만 이 자동화에는 위험이 따른다. 에이전트가 잘못된 작업 묶음을 띄우면 누구도 알아채기 전에 수천 달러가 새어나갈 수 있다. 앙스트롬은 애니클라우드의 '세션 단위 지출 통제' 기능으로 동시 작업 수를 제한하는 스로틀과 기간별 총지출 상한을 함께 걸어 이를 막았다. 상한에 닿으면 새 작업은 대기열에서 멈추고 진행 중인 작업만 마저 돌아간다. 덕분에 연구자가 잠든 밤에도 에이전트가 실험을 자율적으로 굴렸다고 한다.
1인기업 실전 적용 포인트
- 핵심 교훈은 '에이전트에게 실행과 집계를 맡기고 사람은 판단에 집중한다'는 분업 구조다. 1인 연구·개발자도 반복적인 빌드·테스트·결과 정리를 에이전트에 위임하고 가설 설계에만 시간을 쓰는 식으로 응용할 수 있다.
- 에이전트에게 클라우드 자원을 맡길 때는 반드시 세션·기간 단위 지출 상한을 먼저 건다. 비용 폭주는 자동화의 가장 큰 실전 리스크다.
- 며칠씩 걸리던 계산·렌더링·대량 처리 작업이 있다면, 직접 서버를 떠안기보다 종량제 스팟 GPU와 CLI를 에이전트에 연결하는 구조를 검토할 만하다.
전망
프런티어 모델의 똑똑함보다, 에이전트가 도구를 호출해 수백 수천 건의 실험을 자동으로 굴리는 '루프의 속도'가 연구 생산성을 가른다는 점을 보여준 사례다. 단, 자동 팬아웃이 빠른 만큼 비용·실패 관리를 게을리하면 그대로 손실로 돌아온다. 가드레일 설계가 곧 실력인 시대다.
출처: Hacker News / anycloud (https://anycloud.sh/blog/angstrom-case-study/)