2024년 초만 해도 "에이전트"는 스타트업 피칭 슬라이드에나 등장하는 단어였습니다. 그런데 2025년 상반기, 상황이 달라졌습니다. Latent Space가 "모든 모델 랩이 이제 에이전트 랩"이라는 문장을 공개적으로 내놓은 날, GitHub 트렌딩 1위에는 AI 에이전트를 실제 팀원처럼 운용하는 오픈소스 프로젝트 multica가 올라 있었습니다. 같은 날 네이버와 카카오는 멀티 AI 에이전트를 사내에 배포했다는 사실을 각각 공개 채널을 통해 알렸습니다. 피칭 슬라이드 속 개념이 국내 대기업 사내 시스템으로 들어오기까지, 12개월이 채 걸리지 않았습니다.

이 속도를 단순히 "AI가 빠르다"는 말로 묶어버리면 중요한 것을 놓칩니다. 지금 일어나는 변화는 도구의 성능 향상이 아니라, 일하는 방식 자체의 단위가 바뀌는 과정입니다. 1인 사업자와 소규모 팀에게 이 변화는 경쟁 조건의 재설정을 뜻합니다.

에이전트가 사내에 배포된다는 말의 무게

"에이전트 랩"이라는 표현은 선언처럼 들릴 수 있지만, 실제로 무슨 의미인지 짚어볼 필요가 있습니다. 기존 AI 모델 랩의 역할은 더 크고 정확한 언어 모델을 훈련시키는 것이었습니다. GPT-4가 나오면 GPT-4.5가 나오고, Claude 2가 나오면 Claude 3이 나오는 식이었습니다. 성능 벤치마크가 경쟁의 척도였습니다.

에이전트 랩은 다른 문제를 풉니다. 모델이 얼마나 똑똑한가보다, 모델이 어떤 도구를 쓰고, 어떤 순서로 작업을 실행하고, 어떤 조건에서 다른 에이전트에게 작업을 넘기는가를 설계합니다. 모델의 내부 구조가 아니라 모델들 간의 협업 구조가 핵심 경쟁 영역으로 이동한 셈입니다.

multica 같은 오픈소스 프로젝트가 GitHub 트렌딩에 오른 것은 이 흐름의 민주화 단계를 보여줍니다. 에이전트 인프라가 처음 등장했을 때는 대형 클라우드 기업이나 스타트업들만 접근 가능했습니다. 그 다음 단계에서 도구가 오픈소스로 풀렸습니다. 지금은 네이버·카카오처럼 기술력이 있는 기업이 사내 실배포에 진입하고 있습니다. 이 세 단계가 단기간에 연속적으로 일어났다는 점이 중요합니다. 확산이 가속 구간에 들어섰다는 신호입니다.

NVIDIA가 공개한 확산 언어 모델(Diffusion LM)은 또 다른 층위에서 이 흐름과 맞닿아 있습니다. 기존 언어 모델은 텍스트를 한 토큰씩 순서대로 생성하는 자기회귀 방식을 씁니다. NVIDIA의 실험적 접근은 이 과정을 병렬 디코딩으로 전환해 생성 속도를 대폭 높이는 방향을 탐색합니다. 에이전트가 많아질수록 추론 속도와 비용이 병목이 됩니다. 한 에이전트가 작업을 완료해야 다음 에이전트가 시작할 수 있다면, 속도는 곱이 아니라 합으로만 늘어납니다. 병렬 디코딩이 실용화되면 이 병목이 크게 줄어들고, 에이전트 운용 비용 구조 전체가 달라집니다.

도구 사용에서 팀 설계로

이 변화가 왜 1인 사업자나 소규모 팀에게 직접적인 의미를 갖는지 구체적으로 들여다봐야 합니다.

지금까지 AI 도구 활용은 대체로 "어떤 프롬프트를 쓰면 더 좋은 결과물이 나오는가"의 문제였습니다. ChatGPT에 더 정교한 지시문을 넣고, Claude에서 더 나은 초안을 받고, Midjourney로 이미지를 생성하는 식의 작업입니다. 사람이 도구를 하나씩 꺼내 쓰고, 결과물을 다음 단계로 직접 넘기는 방식입니다.

에이전트 패러다임은 이 구조를 뒤집습니다. 사람은 목표와 맥락을 설정하고, 에이전트들이 작업을 분배하고 실행하고 검토합니다. 조사 에이전트가 데이터를 모으면, 분석 에이전트가 패턴을 뽑고, 작성 에이전트가 초안을 만들고, 검토 에이전트가 오류를 잡습니다. 사람은 각 단계의 실행자가 아니라 흐름의 설계자 역할로 올라섭니다.

이것은 단순히 "더 편해진다"는 이야기가 아닙니다. 커리어 설계에서 오랫동안 간과됐던 질문이 다시 중요해집니다. "나는 이 일에서 어떤 판단을 내리고 있는가." 실무 출력물을 생산하는 손이 AI로 대체될수록, 판단의 질과 맥락 이해가 한 사람의 실질적 가치가 됩니다. 직장을 생존하는 공간으로 쓰다 보면 이 판단 근육이 잘 훈련되지 않습니다. 에이전트 시대에 경쟁력이 있는 사람은 더 많이 아는 사람이 아니라, 무엇을 시키고 무엇을 직접 챙길지 구분하는 사람입니다.

또 하나 주목할 지점이 있습니다. 에이전트 레이어가 오픈소스로 풀리면, 대기업이 수십 명의 팀원과 함께 하던 일을 1인 사업자가 에이전트 팀으로 구성해 수행할 수 있는 범위가 넓어집니다. 네이버·카카오의 사내 배포가 "기업 레벨"에서 일어나고 있다고 해서 1인 사업자와 무관한 사건이 아닙니다. 오픈소스 버전은 이미 GitHub에 올라와 있습니다.

1인 사업자가 지금 점검해야 할 것

그렇다면 이 흐름을 실무에서 어떻게 연결해볼 수 있을까요.

반복 작업의 흐름을 한번 그려보십시오. 매주, 매달 반복하는 업무를 나열하고, 각 작업이 어떤 순서로 이어지는지 흐름도로 만들어보면 됩니다. 에이전트가 가장 잘 대체하는 것은 "인풋을 받아 처리하고 아웃풋을 내는" 단계가 명확한 작업입니다. 이 흐름도가 있으면, 어느 단계에 어떤 에이전트를 붙일 수 있는지 보이기 시작합니다.

멀티 에이전트 오픈소스를 직접 테스트해볼 시점입니다. multica 외에도 AutoGen(Microsoft), CrewAI, LangGraph 등 멀티 에이전트 프레임워크들이 이미 오픈소스로 공개돼 있습니다. 이것들을 직접 써보는 것과 그냥 뉴스로 접하는 것 사이에는 감각의 차이가 있습니다. 구현 코드를 읽지 않아도 됩니다. 어떤 역할을 어떤 에이전트에게 맡기는지 설계 구조를 파악하는 것만으로도 충분히 유용합니다.

에이전트에 맡길 수 없는 작업을 의식적으로 구분해두십시오. 고객과의 신뢰 형성, 상황 맥락을 읽는 판단, 기준이 모호할 때의 우선순위 결정 — 이런 작업들은 에이전트가 수행하기 어렵습니다. 지금 내가 하는 일 중 어디에 이런 판단이 들어있는지 파악하고 있어야, 에이전트 도입 이후에도 내 역할이 명확하게 남습니다.

비용 구조를 모니터링하십시오. NVIDIA의 확산 LM 실험이 실용화 단계에 들어오면 API 호출 비용이 현재보다 낮아질 가능성이 있습니다. 지금 에이전트 운용을 비용 이유로 보류하고 있다면, 6개월 단위로 비용 추이를 확인하는 것이 합리적입니다. 클라우드 추론 비용은 지난 2년 사이에도 비약적으로 하락했습니다.

에이전트 설계를 배우는 데 투자하십시오. 프롬프트 엔지니어링이 2023년의 핵심 스킬이었다면, 2025년 하반기의 핵심 스킬은 에이전트 오케스트레이션 — 누가 무엇을 하고, 언제 사람에게 검토를 요청하는지 — 을 설계하는 능력입니다. 이것은 기술 지식이 아니라 업무 설계 감각에 가깝습니다. 자신의 일을 가장 잘 아는 사람이 가장 잘 설계할 수 있습니다.


모델 랩이 에이전트 랩으로 전환했다는 선언이 나온 날, 오픈소스가 트렌딩에 올랐고, 국내 대기업이 사내 배포를 발표했습니다. 이 세 개의 신호가 같은 날 겹친 것은 우연이 아닙니다. 지금 이 흐름을 관찰하면서 자신의 업무 흐름을 재설계하는 사람과, 나중에 정착된 후 따라가는 사람 사이의 간격은 기술 격차가 아니라 설계 감각의 격차로 드러날 것입니다.