맥킨지 컨설턴트들이 올해 AI를 가장 잘 활용한다고 알려진 기업 15곳의 경영진을 직접 만났습니다. 인터뷰 결과물로 나온 보고서의 첫 문장은 이렇습니다. 거의 모든 기업이 AI 도구를 갖고 있지만, 제대로 쓸 줄 아는 곳은 많지 않습니다. 성공 비법을 기대했다면 다소 허탈한 출발입니다.

이 보고서가 눈길을 끄는 건 잘하는 방법이 아니라 공통 실수를 꺼내 들었다는 점입니다. AI 네이티브라고 불리는 기업들조차 같은 지점에서 걸립니다. 그 패턴이 7가지로 정리됐습니다. 그리고 그 7가지 중 상당수는 도구의 성능이나 예산과 무관했습니다. 도구를 쌓는 것과 도구를 소화하는 것 사이에는 생각보다 깊은 간격이 있었습니다. 이 간격이 지금 조직들이 가장 많이 막히는 곳입니다.

빨라졌다고 착각하는 구간

보고서가 공통으로 발견한 첫 번째 오류는 속도 착각입니다. AI가 초안을 만들어 주면 업무 전체가 빨라질 것이라는 기대가 현장에서는 다른 방식으로 작동합니다. AI가 생성한 결과물을 검토하고, 수정하고, 어느 부분을 쓸지 판단하고, 그것을 팀 안에서 커뮤니케이션하는 데 실제로 더 많은 시간이 쓰입니다. 빨라진 구간은 존재합니다. 그런데 동시에 느려진 구간도 생깁니다. 도구가 생성하는 속도와 사람이 소화하는 속도 사이의 간격이 좁혀지지 않으면, 전체 생산성은 기대를 밑돌 수 있습니다.

두 번째로 등장하는 패턴은 노하우 고립 현상입니다. 새 AI 도구를 가장 먼저 쓰기 시작하는 건 열정 있는 팀원 한두 명입니다. 문제는 그 경험이 개인 자산으로 머문다는 점입니다. 6개월이 지나도 같은 사람들이 같은 방식으로 도구를 씁니다. AI 활용이 팀 역량이 아니라 개인 역량에 고정됩니다. 그 결과 도구를 쓰는 사람과 그렇지 않은 사람 사이의 생산성 격차가 시간이 갈수록 벌어집니다.

세 번째는 검증 회피입니다. AI가 만들어 낸 결과물을 어떻게 점검할 것인지에 대한 체계를 처음부터 명시적으로 설계하지 않으면, 사람들은 암묵적으로 그 결과물을 신뢰하게 됩니다. 오류가 발견되면 'AI가 틀렸다'는 말이 나오지만, 검증 과정 자체를 설계하지 않은 것이 더 앞선 문제입니다. 15개 기업 중 이 구조를 명시적으로 만든 곳과 그렇지 않은 곳의 차이는 오류율보다 오류를 발견하는 속도에서 갈렸습니다.

나머지 패턴들도 비슷한 선에서 나타났습니다. 데이터가 부서별로 분리돼 있어 AI 활용 프로젝트마다 접근 협상이 반복되는 문제, AI가 생성한 제안을 실행할 권한이 어디에 있는지 불분명한 문제, AI 도입을 인력 감축의 신호로 읽어 도구 운영에 투자해야 할 사람의 시간이 충분히 확보되지 않는 문제, 새 도구가 계속 추가되면서 어디에 무엇을 써야 하는지 판단 자체가 부담이 되는 도구 피로 문제까지 이어집니다.

이 7가지를 처음 봤을 때 눈에 띄는 것이 있습니다. 기술 문제가 없습니다. GPT-4가 느리다거나, API가 불안정하다거나, 비용이 지나치게 높다거나 하는 항목이 없습니다. 모두 사람과 조직이 도구를 받아들이는 방식에서 생기는 문제들입니다. AI 성능이 충분히 올라온 지금, 병목은 도구 쪽이 아니라 도구를 다루는 습관 쪽으로 이동했습니다.

이 보고서를 믿지 않는 사람들

이 보고서를 접한 성장 단계 스타트업 CPO들 사이에서는 "7가지 원칙 자체가 이미 대기업 운영 언어"라는 반응이 나옵니다. 수백 명 규모 조직을 전제로 한 검증 체계나 데이터 거버넌스 논의를 3인 팀이나 솔로 사업자에게 적용하면, 실행보다 설계에 더 많은 시간을 쓰게 된다는 것입니다. 이 지적은 완전히 틀리지 않습니다.

더 근본적인 비판도 있습니다. 운영 진실처럼 원칙을 명문화하는 행위 자체가 실험과 반복을 억제할 수 있다는 주장입니다. 구조를 먼저 설계하는 조직보다, 빠르게 실패하고 조정하는 조직이 AI 활용 면에서 더 빠르게 성장한다는 사례들이 실제로 보고되고 있습니다. 맥킨지 보고서 자체도 이 지점을 완전히 부정하지 않습니다. 15개 기업 중 일부는 공식 지침 없이도 자연발생적으로 AI 활용 문화가 자리 잡혔다고 응답했습니다. 원칙이 선행한 게 아니라, 실험이 반복되면서 패턴이 생긴 것입니다.

이와 별도로, 7가지 진실이 측정되지 않았다는 비판도 유의미합니다. 인터뷰 기반 보고서는 경영진의 자기 인식에 의존합니다. 노하우 고립이나 검증 회피가 실제로 얼마나 성과에 영향을 주는지를 통제된 방식으로 측정한 데이터가 이 보고서에는 없습니다. 15개 기업이라는 표본도 제한적입니다. 'AI 활용에서 앞서 있다'는 기준이 무엇인지도 명확하게 서술되지 않았습니다.

다만 이 회의적 시각이 보고서를 폐기해야 한다는 주장은 아닙니다. 7가지 패턴은 사전 설계보다 사후 진단으로 더 유용합니다. '우리 팀이 지금 어디서 막혔는가'를 점검하는 참조점으로 쓸 때, 대기업 문서라는 한계가 상당히 좁아집니다.

지금 내 AI 루틴이 실제로 작동하고 있는가

맥킨지 보고서가 대기업 언어로 쓰였다는 건 맞습니다. 그러나 그 안에는 솔로 사업자와 소규모 팀에게 직접 이어지는 지점이 있습니다.

지금 쓰고 있는 AI 도구들이 실제로 의사결정에 개입하고 있는지 살펴볼 필요가 있습니다. 초안 생성에서 멈추고 있다면 도구를 쓰는 것이 아니라 도구를 가져다 놓은 것에 가깝습니다. 어떤 판단을 AI에게 위임하고 있는지, 어떤 판단은 반드시 본인이 내리는지를 한 번 정리해 보면 실제 활용 수준이 드러납니다. 특히 제안서 초안을 AI로 뽑은 뒤 얼마나 고치고 있는지, 그 수정 과정에서 무엇을 기준으로 판단하는지를 추적해 보는 것이 출발점이 됩니다.

검증 루틴도 확인이 필요합니다. AI가 만들어 낸 콘텐츠, 기획안, 요약본을 어떤 기준으로 검토하고 있는지 명시적으로 정해 두지 않으면 어느 순간 검토 과정이 사라집니다. 1인 사업자에게 이 과정은 복잡한 내부 체계가 아니어도 됩니다. '이 초안에서 내가 직접 확인해야 할 사항 3가지'를 미리 정해 두는 것만으로도 검증 루틴이 됩니다. 간단한 점검 목록 하나가 블로그 포스트나 제안서 품질에서 체감할 수 있는 차이를 만듭니다.

보유 도구 수도 점검 항목입니다. 새 AI 도구가 출시될 때마다 추가하면, 어느 순간 어디에 무엇을 써야 하는지 판단하는 데 더 많은 에너지가 쓰입니다. 맥킨지 보고서가 지적한 도구 피로는 대기업만의 현상이 아닙니다. 분기에 한 번, 현재 쓰고 있는 도구 목록을 검토하고 실제로 의사결정에 기여하지 않는 도구를 걷어내는 것이 AI 활용 수준을 유지하는 데 도움이 됩니다.

AI 시대에 사람에게 남는 역량이 무엇인지를 다루는 논의들에서 공통으로 관찰되는 것이 있습니다. 도구의 기능이 빠르게 확장될수록, 그 도구를 어떤 맥락에서 어느 지점까지 사용할지를 판단하는 능력의 간극이 점점 벌어집니다. 도구 사용 시간을 늘리는 것만으로 이 간극이 좁혀지지 않는 이유가 여기에 있습니다. 맥락을 읽고 판단을 유보할 줄 아는 태도가 실제 역량 차이를 만들고, 이는 특정 도구에 얼마나 익숙한지와는 다른 층위의 이야기입니다.

맥킨지가 15개 기업에서 관찰한 것도 같은 방향이었습니다. 어떤 도구를 쓰느냐보다 먼저, 도구를 앞에 놓고 무엇을 결정하느냐였습니다. AI 네이티브라고 불리는 팀들은 새 기능이 출시될 때마다 가장 먼저 배포한 곳이 아니었습니다. 어떤 목적에 어느 도구를 쓸지를 미리 정하고, 그 결정이 틀렸을 때 빠르게 조정하는 루틴이 있는 곳이었습니다.