17배 저렴한 AI 에이전트, 어떻게 만들고 어떻게 봐야 할까?

야, DeepClaude 이거 봤어? Claude Code가 월 200달러 하는데, 백엔드만 DeepSeek V4 Pro로 바꾸니까 월 12달러로 뚝 떨어진대. 무려 17배 싸지는 건데, 기존 UI랑 기능은 그대로래. 이게 진짜 대박인 게, 마치 최신형 고성능 게임기 본체는 그대로 두고 내부 CPU만 가성비 좋은 걸로 갈아 끼운 격이잖아. 기존 에이전트 로직이나 인터페이스는 그대로 쓰면서 '뇌'만 바꿔서 비용 효율을 극대화한 거지.

AI 에이전트, '뇌'를 갈아 끼우는 시대

DeepClaude 사례는 AI 에이전트 개발 방식에 중요한 시사점을 줘. 이제 에이전트 시스템을 설계할 때 특정 LLM에 종속될 필요가 없다는 거야. 에이전트의 '몸통'이라고 할 수 있는 도구 루프, 파일 편집, 쉘 실행, Git 연동 같은 기능은 그대로 두고, '생각'을 담당하는 LLM은 가장 효율적인 모델로 그때그때 바꿔 쓸 수 있는 거지.

지금은 DeepSeek V4 Pro로 17배 싸게 돌리지만, 언젠가 더 좋은 가성비 모델이 나오면 또 바꿔 끼울 수 있어. OpenRouter나 Fireworks AI 같은 백엔드를 바로 연결할 수 있다는 것도 그걸 보여줘. 필요한 순간엔 Claude Opus 같은 고성능 모델을 쓰고, 평소에는 가성비 좋은 모델로 돌리는 유연성이 생긴 거야. 에이전트 개발 워크플로우에 엄청난 자유를 주는 변화라고 봐.

똑똑한 에이전트, 설계부터 달라야지

이렇게 모델을 갈아 끼우는 것도 중요한데, 아예 에이전트 시스템 자체를 어떻게 설계하느냐도 비용이랑 효율에 직결되잖아. 이정민 님의 'Subagent vs 팀' 글을 보니까 멀티 에이전트를 무턱대고 늘리는 게 능사가 아니라고 하더라고.

핵심은 에이전트마다 독립적인 컨텍스트를 주고 결과를 요약해서 부모 에이전트에게 넘기는 '서브에이전트' 방식과, 에이전트끼리 직접 대화하면서 협업하는 '에이전트 팀' 방식을 명확히 구분해야 한다는 거야. 코드베이스 탐색이나 독립 리서치처럼 각자 알아서 할 수 있는 병렬 작업에는 서브에이전트가 좋고, 한 에이전트의 결과가 전체 방향을 바꾸거나 실시간 조율이 필요할 땐 팀 방식이 맞다는 거지.

가장 중요한 인사이트는 이거야. "멀티 에이전트가 필요 없는 경우를 먼저 판단하세요." 하나의 잘 다듬어진 프롬프트와 에이전트가 오히려 더 효율적일 때가 많대. 굳이 에이전트를 나눈다면 '역할'이 아니라 '필요한 컨텍스트'를 기준으로 나누는 게 좋아. 예를 들어, 코딩 작업에서 병렬 에이전트는 코드 충돌이나 디버깅 문제 때문에 오히려 독이 될 수 있으니, 코드 작성은 메인 에이전트 하나가 맡고 서브에이전트는 탐색이나 질문 응답에만 쓰는 게 안전하다는 조언은 진짜 실용적이야.

결국 DeepClaude가 모델 레벨에서 최적화를 보여준다면, 이 글은 아키텍처 레벨에서 최적화의 중요성을 말하는 거지. 무조건 병렬로 돌리면 빠를 거라는 환상에서 벗어나, 작업의 특성에 맞춰 가장 적절한 에이전트 구조를 선택하는 안목이 필요하다는 얘기야. 토큰 비용은 에이전트 수만큼 빠르게 불어나니 핵심 작업에만 고성능 모델을 쓰고 나머지는 가벼운 모델로 돌리는 전략도 고려해야 하고 말이야.

AI 자원의 분배, '컴퓨팅'이 핵심이다

이런 효율화 논의는 단순히 개발 비용 절감 차원을 넘어, AI 시대의 핵심 자원인 '컴퓨팅'의 접근성 문제로도 확장돼. 샘 알트만 얘기가 딱 그 지점을 건드리잖아. 알트만이 UBI(기본소득) 실험을 포기하고 더 이상 믿지 않는다고 말한 게 흥미로웠어. 현금 지급 대신 AI가 만들어내는 컴퓨팅 자원이나 지분 같은 'Universal Basic Wealth' 또는 'Compute'를 분배하는 방안을 제시했잖아.

이건 단순한 선의를 넘어선 매우 영리한 전략이라고 봐. 현금은 사람들이 무엇이든 할 수 있게 하지만, 컴퓨팅 자원이나 토큰은 해당 생태계 안에서만 가치를 발휘하거든. 즉, AI 자원을 분배하면서 동시에 사용자들을 자신들의 생태계로 락인(lock-in) 시키는 효과를 노리는 거지. 가장 많은 컴퓨팅 파워를 가진 자가 이 게임의 규칙을 설계하고, 토큰의 가치와 분배 방식을 결정하는 거야.

DeepClaude를 통해 훨씬 저렴하게 고성능 에이전트를 돌릴 수 있게 된 건, 결과적으로 더 많은 개발자와 사용자가 AI 컴퓨팅 파워에 접근할 수 있게 해주는 거잖아. 이는 알트만이 말하는 'Universal Basic Compute'의 실제적인 확장판처럼 느껴지기도 해. 물론 알트만의 목표는 더 큰 그림에서의 생태계 장악이겠지만, 개발자 입장에서 저렴한 컴퓨팅 자원은 AI 실험과 적용의 문턱을 낮추는 중요한 역할을 하는 거지.

결국 AI를 쓰는 방식, AI의 배분, 이 모든 것이 우리의 워크플로우와 세상의 판도를 어떻게 바꿀지 계속 관찰해야 하는 숙제 같아. 우리 팀은 지금 어떤 모델을 어떻게 쓰고 있고, 어떤 부분을 최적화할 수 있을까?

참고

DeepClaude – Claude Code agent loop with DeepSeek V4 Pro, 17x cheaper: https://github.com/aattaran/deepclaude
Subagent vs 팀: 멀티 에이전트, 제대로 쓰는 법 (by 이정민 (Jeongmin Lee)): https://www.linkedin.com/feed/update/urn:li:activity:7456689855134191616/
알트만 UBI 포기, AI 분배는 생태계 락인 전략 (by 비즈카페 (BZCF)): https://www.linkedin.com/feed/update/urn:li:activity:7456553131041218560/