AI 에이전트, 단순한 코딩을 넘어 시스템 아키텍처와 '생각'까지 설계한다

이거 봤어? 오늘 아침에 클라우드플레어 블로그에서 본 기사인데, AI 코딩 에이전트들이 워드프레스 프로젝트를 처음부터 다시 만들었단다. 이름은 EmDash. 그냥 비슷한 걸 만든 게 아니라, 워드프레스가 24년 동안 안고 있던 고질적인 플러그인 보안 문제를 서버리스 아키텍처와 샌드박싱으로 해결했다고 강조하더라. 마치 "정신적 후계자"라는 표현이 딱 맞았다. "저는 10년 동안 워드프레스를 사용해왔는데, 이 프로젝트가 TypeScript와 워커 플러그인 두 가지를 정말 제대로 잡았다고 확신해요."라는 댓글이 인상 깊었다.

이건 단순히 AI가 코드를 뱉어내는 수준을 넘어선다. AI가 기존 시스템의 근본적인 문제를 이해하고, 현대적인 기술 스택(TypeScript, 서버리스, Astro 프레임워크)을 활용해 새로운 아키텍처를 설계하고 구현했다는 방증이다. 우리가 'AI 코딩'이라고 하면 흔히 함수 하나, 컴포넌트 하나를 생성하는 걸 떠올리지만, EmDash는 '시스템 설계자'로서의 AI 에이전트의 가능성을 보여주는 사례다.

AI, 재창조를 넘어 아키텍처를 혁신하다

EmDash 프로젝트는 AI 에이전트들이 Next.js를 1주일 만에 재구축한 경험을 바탕으로, 두 달에 걸쳐 워드프레스 같은 거대한 오픈소스 프로젝트를 밑바닥부터 다시 만들었다고 한다. 여기서 핵심은 '재구축'에 그치지 않고 '혁신'을 이뤘다는 점이다. 워드프레스의 가장 큰 약점 중 하나가 플러그인 보안 취약성인데, EmDash는 이를 `Dynamic Workers`를 통한 샌드박싱 방식으로 해결했다. 각 플러그인이 독립된 `isolate` 환경에서 실행되도록 하여, 한 플러그인의 문제가 전체 시스템에 영향을 미치지 않도록 설계한 것이다. 이는 웹 서비스 아키텍처의 오랜 숙제를 AI가 제안하고 구현한 것에 가깝다.

기존 웹 기술 스택, 특히 PHP 기반의 워드프레스가 만들어지던 시기에는 AWS EC2조차 없었다. 하지만 EmDash는 현재의 클라우드 및 서버리스 환경을 최대한 활용한다. Astro를 기반으로 하고, TypeScript로 전체 코드를 작성했으며, 서버리스 환경에서 `isolate` 기반의 플러그인을 실행한다. 이는 AI 에이전트가 단순히 코드를 최신화하는 것을 넘어, 현재의 인프라와 개발 패러다임을 깊이 이해하고 최적의 솔루션을 도출해냈음을 의미한다.

이러한 변화는 우리가 레거시 시스템을 대하는 방식에도 큰 시사점을 준다. 기존에는 수십 년 된 시스템을 개선하려면 막대한 시간과 비용을 들여 수동으로 재설계하거나 점진적으로 마이그레이션하는 방법밖에 없었다. 하지만 EmDash 사례는 AI 에이전트가 단기간에 기존 시스템의 본질을 파악하고, 현대적인 아키텍처와 기술을 적용하여 "정신적 후계자"를 만들어낼 수 있다는 가능성을 보여준다. 이제 우리는 AI에게 "워드프레스의 핵심 철학을 유지하면서 최신 웹 기술과 보안 아키텍처를 적용해 다시 만들어봐"라고 지시할 수 있게 된 것이다.

독자들은 이러한 변화에 어떻게 대응해야 할까. 당장 오늘부터 시작할 수 있는 구체적인 행동은 다음과 같다. 첫째, 현재 진행 중이거나 앞으로 시작할 프로젝트의 초기 아키텍처 설계 단계에서 AI 에이전트 도구를 활용하는 방안을 적극적으로 탐색해 봐야 한다. 단순히 아이디어를 얻는 수준을 넘어, 특정 기술 스택(예: TypeScript, 서버리스)을 명시하고 핵심 기능 요구사항을 제시하여 AI에게 초안을 만들어보라고 지시해 볼 수 있다. 둘째, 기존 레거시 시스템을 현대화할 계획이 있다면, EmDash가 보여준 `Dynamic Workers`와 `isolate` 기반의 샌드박싱 모델을 참고하여 플러그인이나 모듈 단위의 보안 강화 및 고립 아키텍처를 설계하는 방법을 연구할 필요가 있다. 서버리스 및 엣지 컴퓨팅 환경을 활용한 웹 서비스 아키텍처가 점차 대세가 될 것이라는 점을 미리 숙지하고, AI 에이전트가 제안하는 이러한 기술 트렌드를 이해하는 것도 중요하다.

투명한 '생각'을 가진 AI 에이전트의 등장

AI 에이전트가 이처럼 복잡한 시스템을 설계하고 구축하려면, 그 이면에 강력한 추론 능력이 필수적이다. Arcee AI 팀이 개발한 오픈소스 추론 모델 'Trinity Large Thinking'의 출시는 이러한 맥락에서 매우 주목할 만하다. 이 모델은 PinchBench, 에이전트 작업 부하 및 추론 작업에서 강력한 성능을 보인다. 특히, 최초의 고성능 완전 공개 가중치(open weights) 미국 모델 중 하나라는 평가를 받았다.

여기서 가장 중요한 부분은 'Large Thinking'이라는 이름과 OpenRouter에서 지원하는 '추론 토큰(reasoning tokens)' 개념이다. OpenRouter는 요청 시 `reasoning` 매개변수를 활성화하면 모델이 최종 답변을 내놓기 전 내부적인 사고 과정을 `reasoning_details` 배열로 제공한다. 이는 AI 에이전트가 "어떻게 생각했는지"를 우리가 엿볼 수 있게 해준다. 복잡한 시스템을 설계하거나 중요한 결정을 내리는 AI 에이전트의 내부 로직을 투명하게 볼 수 있다는 점은 개발자에게 엄청난 이점이다.

지금까지 많은 AI 모델들은 마치 '블랙박스'처럼 작동했다. 입력이 들어가면 출력이 나오지만, 그 사이에 어떤 과정을 거쳤는지는 알기 어려웠다. 하지만 Trinity 같은 모델이 추론 과정을 공개한다면, 우리는 AI 에이전트가 왜 특정 아키텍처를 제안했는지, 왜 특정 보안 모델을 선택했는지 등을 이해하고 디버깅하며 개선할 수 있다. 이는 AI 에이전트의 신뢰성을 높이고, 개발자가 AI를 활용하는 방식을 근본적으로 변화시킬 잠재력을 가진다.

독자들은 이러한 '투명한 사고'를 가진 AI 모델을 어떻게 활용할 수 있을까. 첫째, AI 에이전트를 활용한 개발 작업에서 Trinity와 같이 추론 과정을 보여주는 모델을 우선적으로 고려해야 한다. OpenRouter와 같은 플랫폼에서 `reasoning` 매개변수를 사용하여 모델의 사고 과정을 요청하고, 이를 통해 AI가 어떤 논리로 문제를 해결하는지 파악하는 연습을 해 볼 수 있다. 둘째, 특히 중요한 시스템의 설계나 코드 생성에 AI를 활용할 때는, AI의 추론 과정을 기록하고 검토하는 워크플로우를 도입해야 한다. 이는 AI의 오류를 줄이고, 최종 결과물의 품질을 높이는 데 기여할 것이다. AI가 "왜 그렇게 생각했는지"를 묻고 그 답을 분석하는 능력은 미래의 개발자에게 핵심 역량이 될 것이다.

다중 에이전트 시스템, 개인화된 자동화의 미래

마지막으로 Lenny Rachitsky 팟캐스트에서 Claire Vo가 OpenClaw라는 개인 AI 도구를 사용하는 "파워 유저 가이드"를 공유했다는 소식은, 앞서 살펴본 에이전트 기술이 우리의 일상과 비즈니스에 어떻게 적용될 수 있는지를 구체적으로 보여준다. Claire Vo는 무려 9개의 전용 AI 에이전트를 활용하여 비즈니스 관리, 코드 작성, 영업, 심지어 아이들 농구 경기 스케줄까지 처리한다고 한다.

이 사례는 AI 에이전트가 단일한 거대 AI 모델의 역할을 넘어, 특정 목적을 가진 여러 에이전트가 서로 협력하며 복잡한 워크플로우를 처리하는 '멀티 에이전트 시스템'의 중요성을 강조한다. 마치 한 명의 비서가 모든 일을 처리하는 것이 아니라, 각기 다른 전문성을 가진 팀원들이 협업하는 방식과 같다. 한 에이전트는 코드를 생성하고, 다른 에이전트는 보안 취약점을 검토하며, 또 다른 에이전트는 프로젝트 스케줄을 관리하는 식이다. OpenClaw는 이러한 다중 에이전트 환경을 개인 사용자도 구축할 수 있도록 돕는 도구로 보인다.

이러한 개인화된 AI 에이전트 팀은 EmDash가 보여준 시스템 아키텍처 혁신과 Trinity가 제공하는 투명한 추론 능력을 바탕으로, 우리의 생산성을 비약적으로 향상시킬 수 있다. 단순히 챗봇과 대화하는 수준을 넘어, 특정 목표를 부여받은 AI 에이전트들이 자율적으로 움직이며 실제 세계와 연동되는 작업을 처리하는 것이다. Claire Vo의 사례는 AI 에이전트가 비즈니스 운영의 모든 측면을 자동화하는 것은 물론, 개인의 삶의 질까지 높일 수 있음을 보여준다.

독자들은 오늘부터 어떻게 이러한 다중 에이전트 시스템을 자신의 워크플로우에 적용할 수 있을까. 첫째, 자신의 업무나 일상생활에서 반복적이고 규칙적인 작업을 목록화하고, 이를 특정 역할(예: 이메일 분류, 보고서 초안 작성, 회의 요약)을 부여할 AI 에이전트의 후보로 삼아야 한다. 둘째, OpenClaw와 같은 개인 에이전트 도구나 LangChain, AutoGen 등 오픈소스 에이전트 프레임워크를 탐색하여, 작은 규모의 에이전트 팀을 구성하는 연습을 시작해야 한다. 예를 들어, "최신 기술 동향을 매일 아침 요약해주는 에이전트"와 "그 요약 중 특정 주제에 대한 심층 분석을 요청하는 에이전트"를 두어 협업하게 해보는 식이다. 셋째, 에이전트들이 외부 도구(예: 캘린더, 이메일, 코드 리포지토리)와 연동될 수 있도록 API 통합 방안을 미리 고려해야 한다.

이 세 가지 기사는 AI가 단순한 도구를 넘어, 시스템의 아키텍처를 재설계하고, 그 설계 과정의 '생각'을 투명하게 드러내며, 나아가 여러 에이전트가 팀을 이루어 우리의 복잡한 업무와 일상을 총체적으로 관리하는 단계로 진화하고 있음을 명확히 보여준다. AI 에이전트가 이제는 단순한 조력자가 아니라, 능동적으로 문제를 정의하고 해결하며, 심지어는 우리를 대신해 '생각하는' 존재가 되어가고 있는 것이다. 과연 우리는 이 새로운 'AI 동료'들과 어떻게 협력하며 더 높은 가치를 만들어낼 수 있을까.

참고

Cloudflare. "EmDash – A spiritual successor to WordPress that solves plugin security." Cloudflare Blog, 2026년 4월 1일. https://blog.cloudflare.com/emdash-wordpress/
Arcee AI. "Trinity Large Thinking." OpenRouter, 2026년 4월 2일. https://openrouter.ai/arcee-ai/trinity-large-thinking
Rachitsky, Lenny. "Listen: OpenClaw: A power-user's guide to the most powerful personal AI tool since ChatGPT (by Lenny Rachitsky)." Lenny's Newsletter, 2026년 4월 1일. https://www.lennysnewsletter.com/p/listen-openclaw-a-power-users-guide