5월 26일, 더 버지가 한 줄짜리 헤드라인을 띄웠습니다. "우버 대표가 AI 지출이 '정당화하기 어려워지고 있다'고 말했다." 단순한 임원 발언으로 넘기기에는 함의가 무거운 이야기입니다.

우버는 2025년 한 해 연구개발에 34억 달러를 썼습니다. 전년 대비 9% 증가입니다. 그런데 2026년에 들어서 4개월 만에 연간 AI 예산을 다 소진했다는 보도가 나왔습니다. 그러자 회사 안에서 질문이 커지기 시작합니다. "이렇게 쓰는 돈이 실제로 가치를 만들고 있는가?"

우버 대표이자 최고운영책임자(COO)인 앤드류 맥도널드가 한 인터뷰에서 던진 답이 핵심입니다. "그 연결고리가 아직 없습니다. 암묵적으로 더 많은 것이 출시되고 있을 수는 있지만, 토큰 사용량 같은 지표 하나와 '이제 우리가 실제로 25% 더 유용한 소비자 기능을 만들고 있다'를 잇는 선을 긋는 건 매우 어렵습니다."

이 발언이 의미심장한 이유가 있습니다. AI 도입의 두 번째 라운드, 즉 "성과를 증명하라"는 단계가 시작됐다는 신호이기 때문입니다.

토큰 소비가 늘면 가치도 느는가

맥도널드의 진단을 다시 정리하면 이렇습니다. 클로드 코드 같은 AI 도구의 토큰 사용량은 천문학적으로 늘고 있다. 그런데 그 사용량 증가와 사용자가 받는 가치 증가 사이의 직접적 연결고리가 보이지 않는다.

이건 단순히 우버 한 회사의 고민이 아닙니다. AI 도구를 본격 도입한 거의 모든 기업이 같은 질문에 도달하는 단계입니다. 도입 초기에는 "AI를 쓴다"는 사실 자체가 성과처럼 보였습니다. 코드 라인이 자동으로 생성되고, 보고서가 빨리 정리되고, 디자인 시안이 한 번에 여러 개 나옵니다. 그것만으로도 충분한 성과처럼 느껴졌습니다.

지금은 다릅니다. 도입한 지 1년이 지나면서 비용 청구서가 명확해지고 있습니다. 그 청구서를 보고 경영진이 묻기 시작합니다. "이 돈을 써서 우리 매출이 얼마나 늘었는가? 우리 사용자가 얼마나 더 행복해졌는가? 우리 제품이 얼마나 더 좋아졌는가?"

이 질문에 명확한 답을 내놓을 수 있는 기업이 의외로 적습니다. 우버처럼 데이터에 능한 거대 기업조차 그렇습니다.

우버가 처한 구조적 딜레마

맥도널드 발언의 또 다른 흥미로운 부분이 있습니다. 우버 CEO 다라 코스로샤히가 이달 초에 한 말입니다. "우리는 AI 투자 증가를 인력 채용 감소로 상쇄하고 있습니다."

이게 의미하는 것은 분명합니다. 우버는 인건비를 줄이고 그 돈으로 AI 도구를 쓰고 있습니다. 사람을 덜 뽑는 대신 토큰을 더 사고 있는 것입니다.

이 트레이드가 합리적이려면 한 가지 조건이 필요합니다. AI가 사람의 일을 정말로 대신해야 합니다. 그게 매출이나 사용자 경험으로 측정 가능하게 드러나야 합니다.

맥도널드가 던진 한 마디가 이 조건의 무게를 보여줍니다. "토큰 소비와 그에 따른 비용 대 인력에 대해 이야기하기 시작해야 합니다. 사용자에게 얼마나 많은 유용한 기능과 기능성을 출시하고 있는지에 직접적으로 선을 그을 수 없다면, 그 트레이드는 정당화하기 어려워집니다."

사람을 덜 뽑는다는 결정은 되돌리기 어렵습니다. 일단 인력 구조를 줄여놓고 나서 "AI가 기대만큼 안 됐다"는 결론이 나오면, 회사 운영이 흔들립니다. 이미 일부 빅테크는 AI를 이유로 정리해고를 단행한 후, 다시 채용을 재개해야 하는 상황을 겪고 있습니다.

측정의 함정

AI 투자의 ROI를 측정하는 일이 왜 이렇게 어려운가. 몇 가지 구조적 이유가 있습니다.

첫째, 일선 작업의 효율 향상이 최종 결과로 전달되지 않습니다. 개발자 한 명의 코딩 속도가 30% 빨라졌다고 합시다. 그게 회사의 신제품 출시 속도 30% 향상으로 이어지지 않습니다. 그 사이에 기획, 의사결정, 검토, 배포, 마케팅, 영업 같은 단계가 있고, 각 단계가 병목입니다. 코딩이 빨라져도 다른 단계가 그대로면 최종 출력은 별로 달라지지 않습니다.

둘째, 가속의 그림자가 따라붙습니다. AI로 코드가 빨리 생성되면 그만큼 검토할 코드가 늘어납니다. AI로 콘텐츠가 많이 만들어지면 그만큼 검수할 콘텐츠가 늘어납니다. 사람의 일이 줄어드는 게 아니라 형태가 바뀝니다. 그런데 그 새로운 일은 잘 측정되지 않습니다.

셋째, 비교 기준점이 사라집니다. "AI 없이 했으면 얼마나 걸렸을까?"라는 질문에 답하기 어렵습니다. 도입 이전과 이후를 같은 조건에서 비교할 수 없기 때문입니다. 시장 상황도 변하고, 제품도 변하고, 인력 구성도 변합니다.

넷째, 생산성 향상이 영구적이지 않습니다. AI 도구의 효용은 도입 초기에 가장 크고, 시간이 지날수록 한계 효용이 줄어듭니다. 처음 한 달은 놀라운 변화가 보이다가, 6개월 후에는 비용 대비 효과가 점점 모호해지는 경험을 많은 팀이 겪고 있습니다.

이런 이유들이 합쳐져, AI 투자의 ROI는 측정하기에 가장 까다로운 영역 중 하나가 됐습니다.

"정당화하기 어려워진다"는 의미

맥도널드의 표현이 흥미롭습니다. "정당화하기 어려워진다"고 했지, "정당화할 수 없다"고는 하지 않았습니다. 이 뉘앙스 차이가 중요합니다.

AI 투자를 멈춘다는 결정이 아닙니다. 다만 그 투자에 대한 설명 책임이 강화된다는 의미입니다. 작년에는 "AI에 투자하지 않으면 뒤처진다"는 압력 하나로 예산이 통과됐습니다. 올해부터는 "그래서 결과가 무엇인가"라는 질문에 답해야 합니다. 답을 못 하면 예산이 깎이거나, 사용처가 제한되거나, 책임을 누군가 져야 하는 상황이 옵니다.

이게 의미하는 것은 "AI 도입의 영업 라운드가 끝났다"는 신호입니다. 도입 자체를 결정하는 단계에서, 도입한 것을 정당화하는 단계로 넘어갔습니다. 이 단계에서는 화려한 데모가 아니라 명확한 숫자가 필요합니다.

작은 회사가 더 유리한 자리

이 흐름이 큰 회사에는 부담이지만, 작은 회사와 1인 사업자에게는 오히려 기회를 만들기도 합니다.

큰 회사는 AI 도입을 전사 차원에서 결정합니다. 예산도 크고, 사용처도 광범위하고, ROI 측정도 복잡합니다. 우버 같은 규모에서는 토큰 사용량과 사용자 가치 사이의 인과관계를 추적하는 것 자체가 거대한 프로젝트입니다.

작은 회사는 다릅니다. 한 명의 사업자가 클로드 코드 구독료를 내고, 그 도구로 어떤 기능을 만들고, 그 기능이 어떤 매출을 만드는지를 한 사람의 머리 안에서 추적할 수 있습니다. 측정의 단위가 작아서 인과관계가 명확합니다.

"이 도구를 한 달 써봤더니 매출이 늘었나, 안 늘었나?" 작은 회사는 이 질문에 한 달 안에 답을 낼 수 있습니다. 큰 회사는 같은 질문에 분기 단위, 연 단위로도 답을 못 내는 경우가 많습니다.

이 비대칭이 작은 회사의 의외의 강점입니다. AI 시대의 ROI 측정이 어려워질수록, 작은 단위로 빠르게 실험하고 결과를 확인할 수 있는 조직이 유리해집니다.

ROI를 측정하는 현실적 방법

자기 사업이나 팀에서 AI 투자의 ROI를 측정하려는 사람을 위한 실용적 접근법이 있습니다.

1. 측정 단위를 작게 잡습니다. "전체 AI 투자 효과"가 아니라 "이 한 가지 워크플로에서 AI 도입 효과"를 측정합니다. 고객 응대 자동화 하나, 콘텐츠 생성 한 종류, 코드 리뷰 한 단계. 좁은 단위일수록 효과가 명확하게 보입니다.

2. 비용을 직접 비용으로만 계산하지 않습니다. 구독료뿐 아니라 학습 시간, 시스템 통합 비용, 검수에 드는 추가 시간, 사고 발생 시 복구 비용까지 포함합니다. 이걸 다 합쳐야 진짜 비용입니다.

3. 가치를 사용자 행동 변화로 측정합니다. "내부 효율 30% 향상"은 그 자체로는 가치가 없습니다. 그게 사용자가 더 빨리 답을 받거나, 더 자주 재방문하거나, 더 많이 구매하는 행동으로 이어졌는지를 봐야 합니다.

4. 3개월 단위로 재평가합니다. AI 도구의 효용은 시간이 지나면서 변합니다. 처음 효과가 좋아 보였던 도구가 6개월 후에는 비용 대비 효과가 떨어질 수 있습니다. 한 번 도입해서 영구히 쓰는 게 아니라, 주기적으로 그 가치를 재검토하는 습관이 필요합니다.

5. "AI 없이 한다면?"을 의식적으로 묻습니다. 모든 작업에 AI를 동원하는 게 답이 아닙니다. 어떤 작업은 사람이 직접 하는 게 더 빠르고 더 정확합니다. AI를 쓸 자리와 안 쓸 자리를 의식적으로 구분하는 게 ROI를 높이는 가장 직접적인 방법입니다.

두 번째 라운드의 시작

지금 AI 시장의 풍경을 정리하면 이렇습니다.

빅테크는 인프라에 막대한 자본을 쏟아붓고 있습니다. 엔비디아는 올해에만 AI 지분 투자에 400억 달러를 썼고, OpenAI와 앤트로픽은 사모펀드와 합작해 수십억 달러 규모의 컨설팅 조직을 만들었습니다. 도구를 만드는 쪽은 여전히 공격적입니다.

도구를 쓰는 쪽은 다릅니다. 우버 같은 거대 기업도 이제 "이 도구가 정말 우리에게 가치를 주는가"를 묻기 시작했습니다. 더 정확히 말하면, 도입 영업이 끝나고 정당화의 단계가 시작됐습니다.

이 두 흐름이 부딪치는 자리가 가장 흥미롭습니다. 도구 회사는 "더 많이 써라"고 압박하고, 사용자 회사는 "쓴 만큼 가치가 있는가"를 의심합니다. 이 긴장이 앞으로 몇 분기 동안 AI 시장의 가격, 패키지 구조, 차별화 전략 모두를 결정할 겁니다.

AI 도입의 첫 번째 라운드는 흥분이 동력이었습니다. "안 쓰면 뒤처진다"는 두려움이 가장 강한 마케팅이었습니다. 그 라운드가 이제 끝나가고 있습니다.

두 번째 라운드는 검증입니다. "써봤더니 어땠는가"가 핵심 질문이 됩니다. 이 라운드에서 살아남는 도구는 명확한 가치를 증명할 수 있는 도구이고, 살아남는 회사는 그 가치를 자기 사업 안에서 측정할 수 있는 회사입니다.

우버의 4개월 만에 다 써버린 AI 예산은 첫 번째 라운드의 결과입니다. 그리고 맥도널드의 "정당화하기 어렵다"는 발언은 두 번째 라운드의 시작 신호입니다.

자기 사업과 팀이 이 두 라운드 중 어느 쪽에 서 있는지 점검해 볼 시점입니다. 여전히 흥분에 휘둘리고 있는지, 아니면 차분하게 검증하는 단계로 넘어갔는지. 이 질문에 솔직하게 답할 수 있느냐가 AI 시대 다음 단계의 경쟁력을 결정합니다.

도구가 더 강력해질수록, 그 도구를 어디에 쓸지 결정하는 사람의 안목이 더 중요해집니다. 우버가 지금 묻고 있는 질문은 결국 모든 사업자가 곧 마주칠 질문이기도 합니다.