AI 시대, 고립된 지식과 그럴듯한 코드 사이: 협업의 재정의를 위한 실천적 제언

데이터 통합 회사 Fivetran의 CEO는 "우리 회사의 Slack 메시지 기록은 회사의 축적된 부족 지식 그 자체다"라고 말합니다. 하지만 그 지식은 현재 '기업 소프트웨어 중 최악의 데이터 접근 정책'을 가진 제품 안에 갇혀 있다고 그는 목소리를 높였습니다. AI 시대에 접어들면서, 기업의 핵심 자산인 지식이 사일로화된 기존 협업 도구에 갇혀 AI와의 효율적인 협업을 가로막는 상황에 대한 강한 문제 제기입니다. 그는 Anthropic이 Claude 같은 AI가 대화에 직접 참여하고 기업 지식을 쉽게 활용할 수 있는 개방형 협업 플랫폼을 만들어주기를 요구하고 있습니다.

이 주장은 우리가 AI를 단순히 새로운 도구로만 볼 것이 아니라, 기존의 업무 방식과 인프라 전체를 재설계해야 할 필요성을 시사합니다. AI가 비즈니스 대화의 일등 시민(first-class participant)이 되어야 한다는 그의 말은, AI가 기존 워크플로우에 통합되는 수준을 넘어, 워크플로우 자체가 AI의 참여를 전제로 재편되어야 한다는 의미입니다. 이는 많은 기업이 당면한 현실적인 과제이기도 합니다. AI를 도입하면서도 데이터 접근성과 보안, 그리고 기존 시스템과의 연동 문제에 부딪히는 경우가 허다합니다. 지금 우리는 AI가 지식의 생산과 공유를 극대화할 수 있도록, 지식이 고립된 환경을 과감히 부수고 개방성을 확보하는 데 집중해야 합니다. 당장 우리 회사에서 사용하는 협업 도구의 데이터 내보내기 정책이나 API 연동 수준을 확인해보고, 필요한 경우 공급업체에 개선을 요구하거나 대안을 모색하는 적극적인 행동이 필요합니다.

AI 에이전트의 성공, '체계적인 루프'에 달렸다

한편, OpenAI의 에이전트가 25시간 동안 약 1,300만 토큰을 사용해 3만 줄의 코드를 생성한 사례는 AI 에이전트의 장기적인 작업 능력을 보여주었습니다. 하지만 여기서 핵심은 모델 자체의 지능보다 `docs/` 폴더 기반의 체계적인 운영 구조에 있었습니다. 목표, 계획, 실행 규칙, 그리고 지속적인 문서화가 에이전트의 작업을 가능하게 한 핵심 요소였습니다.

여기서 우리가 얻어야 할 인사이트는 명확합니다. 긴 호흡의 AI 에이전트 개발은 뛰어난 프롬프트 한 번에 의존하는 것이 아닙니다. `docs/ prompt.md`, `docs/ plans.md`, `docs/ implement.md`, `docs/ documentation.md` 같은 파일들이 구성하는 Plan → Edit code → Run tools → Observe results → Repair failures → Update docs/status → Repeat의 체계적인 루프가 성공을 좌우합니다. 마일스톤마다 `tests`, `lint`, `typecheck`, `build` 같은 검증을 돌리고, 문제가 생기면 고친 뒤에야 다음 단계로 넘어가는 방식입니다. 이는 AI 에이전트가 단순히 코드를 생성하는 것을 넘어, '검증 가능한 상태로 전진'하도록 하는 사람의 역할이 얼마나 중요한지 보여줍니다.

이러한 접근 방식은 우리가 AI 에이전트를 실제 업무에 도입할 때 따라야 할 중요한 가이드라인입니다. 단순히 AI에게 일을 던져주는 것을 넘어, 마치 주니어 개발자와 협업하듯이 명확한 목표, 세분화된 계획, 구체적인 검증 기준, 그리고 지속적인 문서화를 제공해야 합니다. 오늘부터 팀 내 AI 에이전트 워크플로우를 설계할 때 `docs/` 폴더 기반의 구조화된 접근 방식을 실험해볼 수 있습니다. 에이전트에게 맡길 작업의 목표, 제약 조건, 단계별 계획, 그리고 각 단계의 성공 기준을 문서화하고, 에이전트가 진행 상황과 의사결정 과정을 `documentation.md` 파일에 기록하도록 지시해보십시오.

'그럴듯한 코드'와 '제대로 된 코드' 사이

하지만 AI 에이전트의 이런 발전에도 불구하고, LLM이 생성한 코드의 실용적 한계는 여전히 존재합니다. LLM이 57만 줄짜리 Rust SQLite 재구현 코드를 생성했는데, 벤치마크 결과 기본 키 조회 한 번에 SQLite보다 20,171배 느렸다고 합니다. 코드는 컴파일되고 테스트도 통과했지만, 치명적인 성능 저하를 안고 있었습니다. 쿼리 플래너의 문제, 안전한 기본값의 복리 효과, 불필요하게 복잡한 솔루션 등이 그 원인이었습니다. 이는 LLM이 요구사항을 만족하는 '그럴듯한' 코드를 만들지만, 비효율적인 디자인 패턴이나 알고리즘을 숨겨 실제 프로덕션 환경에서는 쓸모없는 결과를 초래할 수 있음을 보여줍니다.

이 사례는 우리가 AI가 생성한 결과물을 맹목적으로 신뢰해서는 안 된다는 교훈을 줍니다. 특히 성능, 확장성, 유지보수성이 중요한 시스템에서는 더욱 그렇습니다. AI는 놀라운 속도로 많은 양의 코드를 생성하지만, 깊이 있는 최적화나 복잡한 시스템 아키텍처에 대한 통찰은 아직 인간 전문가의 영역에 남아 있습니다. 이는 AI 시대에도 개발자의 역할이 여전히 중요하다는 증거이기도 합니다.

그렇다면 우리는 이런 간극을 어떻게 줄여야 할까요? METR의 실험에서 AI를 사용한 그룹이 19% 더 느렸지만 본인들은 20% 빨라졌다고 믿었다는 결과는 우리가 AI 결과물을 검증하는 데 더 많은 주의를 기울여야 함을 강조합니다. AI가 코드를 생성하면, 우리는 그 코드가 '맞아 보이는가'가 아니라 '맞다는 것을 어떻게 증명할 것인가'를 고민해야 합니다. 생성된 코드에 대한 철저한 벤치마크, 성능 프로파일링, 그리고 코드 리뷰는 필수적인 과정입니다. 지금 팀에서 AI가 생성한 코드에 대한 최소한의 성능 기준을 정의하고, 이를 검증하는 자동화된 테스트 파이프라인을 구축하는 것을 고려해 보십시오. 단순히 기능적 올바름을 넘어, 실제 프로덕션 환경에서의 효율성까지 검토하는 루틴을 만드는 것이 중요합니다.

AI 시대, '느린 듣기'의 지능이 필요하다

이런 상황에서, 청력을 잃은 언어학자 야마다 하루의 '경청의 기술'은 AI 시대를 살아가는 우리에게 또 다른 관점을 제시합니다. 그는 경청이 단순한 수동적 활동이 아닌 고도의 지능이라고 말하며, 특히 핵심 요약만 빠르게 골라내는 '빠른 듣기' 대신 맥락과 의도를 두루 살피는 '느린 듣기'의 중요성을 강조합니다. 상대방이 말하지 않는 암묵적인 의미, 즉 음색, 억양, 단어 뒤에 숨은 의도와 맥락을 함께 듣는 능력입니다. 이 느린 듣기는 심지어 '거짓말을 감지하는 능력'까지 키워준다고 합니다.

AI가 생성하는 방대한 정보와 '그럴듯한' 결과물 앞에서, 우리는 야마다 하루가 말하는 '느린 듣기' 지능을 훈련할 필요가 있습니다. AI가 제시하는 솔루션이 단순히 명시된 요구사항을 충족하는지 여부를 넘어, 그 솔루션이 가진 비효율성, 숨겨진 문제점, 또는 더 나은 대안은 없는지 '맥락적으로' 탐색하는 능력이 중요합니다. LLM이 57만 줄짜리 느린 코드를 만들었을 때, 빠른 듣기로는 '컴파일되고 테스트 통과했으니 괜찮다'고 넘길 수 있지만, 느린 듣기는 '왜 이렇게 느리지?'라는 질문을 던지고 그 밑바탕의 비효율적인 설계를 파고들게 합니다.

60세 개발자가 Claude Code를 통해 프로그래밍에 대한 식지 않는 열정을 다시 발견했다는 이야기처럼, AI는 인간의 생산성을 증강시키고 새로운 영감을 줄 수 있는 강력한 도구입니다. 하지만 그 잠재력을 온전히 실현하려면, 우리는 AI가 던지는 정보를 수동적으로 받아들이는 것을 넘어, 능동적으로 '느리게 듣고', '검증하고', '재설계하는' 지적 활동을 멈추지 않아야 합니다. 단순히 코딩을 자동화하는 것을 넘어, AI를 활용하여 우리가 미처 생각하지 못했던 새로운 가치를 창출하고, 더 본질적인 문제 해결에 집중할 수 있는 기회로 삼아야 합니다. 이는 결국 개발자를 포함한 화이트칼라 직군이 AI 노출도를 위기가 아닌 새로운 커리어 성장의 동력으로 삼는 길이기도 합니다. AI의 '말'을 제대로 듣고, 그 안에 담긴 가능성과 한계를 정확히 파악하는 우리의 지적 역량이 그 어느 때보다 중요합니다.

참고

Fivetran, Anthropic, please make a new Slack. (2026-03-06)
정구봉. 에이전트 코딩의 진짜 변화는 모델이 더 똑똑해진 게 아닙니다. 시간 지평이 바뀌고 있습니다. (2026-03-06)
박원익. AI 노출 가장 높은 직군은?… 앤트로픽이 밝혀낸 화이트칼라 위기의 실체. (2026-03-06)
롱블랙. 경청의 기술 : 말없이 대화를 주도하는 사람들의 비밀. (2026-03-07)
이정민. 🧩 LLM 이 쓴 57만 줄은 틀리지 않습니다. 그런데 맞지도 않아요. (2026-03-07)
I'm 60 years old. Claude Code has ignited a passion again. (2026-03-07)