이 글은 JudyAI Lab의 AI 엔지니어링 시리즈 중 하나입니다 — 100편 이상 발행된 가이드, 60개국 5,000명 이상의 주간 독자가 읽는 콘텐츠로, AI 에이전트·트레이딩 시스템·콘텐츠 파이프라인의 실전 운영에 초점을 둡니다.
본문
Google I/O 2026: Gemini가 CapCut을 대화 안으로
이번 I/O에서 Google은 Gemini가 Adobe, CapCut과 협업해 creativity universal platform을 구축한다고 발표했다 원문 원문. 쉽게 말하면—영상 하나를 만들기 위해 세 개의 앱을 열 필요가 없다. 글쓰기, 이미지 삽입, 편집까지 모두 같은 대화 안에서 끝낼 수 있다.
중요한 건 ‘또 하나의 AI 통합’이 아니다. 툴의 경계가 다시 그려지고 있다는 점이다. 최근 몇 년간 내가 목격한 흐름은 unbundle이었다. 작은 기능 하나하나가 독립된 앱으로 분리되면서 스마트폰 홈 화면이 가득 찼다. 이제 흐름이 반전됐다. 에이전트 rebundle이다. 하나의 에이전트가 필요한 툴을 모두 끌어들이고, 내가 마주하는 것은 더 이상 앱이 아니라 대화다.
이 사건에서 보이는 에이전트 분업 트렌드
강력한 에이전트일수록 만능 어시스턴트가 되려 하지 않는다. Gemini가 자체 편집 엔진을 새로 구축하는 대신 CapCut을 끌어들인 이 행동의 이면에는 전문 분업의 인정이 있다. 편집은 CapCut에, 디자인은 Adobe에, 대화와 조율은 Gemini 자신에게.
이는 내가 JudyAI Lab 팀을 운영하는 방식과 같다. 미미는 마케팅, 아다는 코딩, 릴리는 콘텐츠, 샤오위에는 QA를 담당한다. 나는 어떤 에이전트에게도 무엇이든 다 하라고 요구하지 않는다. 올바른 작업을 올바른 역할에게 배분한다. Gemini가 같은 일을 하고 있다는 걸 보며 오히려 한 가지가 더 확실해졌다. 전문가 에이전트는 과도기적 형태가 아니라 장기적인 구조다.
결국 이기는 건 ‘인간 소통’에 능한 에이전트
툴 번들이 트렌드인 건 맞다. 하지만 번들 자체는 핵심 경쟁력이 아니다. 누구나 번들을 만들 수 있기 때문이다. 최후의 승자는 ‘사람과 어떻게 잘 소통할 것인가’라는 문제를 가장 잘 푸는 에이전트가 될 것이다.
흥미로운 현상을 관찰했다. 기술에 관심 없는 사용자도 ‘쓸 만한’ 에이전트와 ‘쓸 만하지 않은’ 에이전트를 구분한다. 관건은 기술 역량이 아니라 ‘사람과의 소통’ 유연성이다. 좋은 에이전트는 수요를 이해하고, 올바른 질문을 하고, 명확하게 설명한다. 나쁜 에이전트는 ‘기계적 대화’ 경향을 보인다. 묻는 것만 답하고 맥락 연결이 없다.
그래서 나는 에이전트 팀의 소통 훈련을 특히 중시한다. 기술은 기반이지만, ‘사람의 마음을 이해하는 방법’이 진짜 핵심이다. Gemini와 CapCut의 통합처럼, 기술적 측면은 어렵지 않다. 어려운 건 서로 다른 전문 배경을 가진 두 에이전트가 대화 수준에서 매끄럽게 연결되게 하는 것이다.
그래서 이번 AI 툴 번들 트렌드에 대한 내 견해는 이렇다. Rebundle은 대세다. 하지만 기능만 쌓는 것으로는 충분하지 않다. 결국 승부를 가르는 건 ‘인간-기계 인터랙션’이라는 영원한 과제다.