AI 도입 후 드러난 데이터 혼란

회사에 챗GPT 엔터프라이즈를 도입했습니다. 부서마다 클로드와 제미나이를 결제했습니다. RAG 시스템을 구축하고, 사내 문서를 임베딩해서 벡터 DB에 넣었습니다. 그런데 이상한 일이 벌어집니다.

영업팀이 AI에게 "올해 우리 회사 매출 목표는?"이라고 물으면 한 숫자가 나옵니다. 마케팅팀이 같은 질문을 하면 다른 숫자가 나옵니다. 재무팀이 물으면 또 다른 숫자가 나옵니다. AI가 잘못된 게 아닙니다. 각 팀이 참조하는 문서가 다르기 때문입니다. 영업팀 슬라이드의 매출 목표, 마케팅팀 기획안의 매출 목표, 재무팀 예산서의 매출 목표가 모두 다른 숫자를 담고 있는 겁니다.

AI 시대가 노출시킨 것은 AI의 한계가 아닙니다. 회사 데이터가 얼마나 엉망이었는지를 드러낸 겁니다. 이 문제의 해결책으로 다시 부상하고 있는 개념이 SSoT(Single Source of Truth, 단일 진실 공급원)입니다.

SSoT의 개념과 가치

SSoT가 뭔가요

직역하면 "진실의 단일 공급원". 의역하면 "이 데이터의 정답은 여기에만 있다"는 원칙입니다.

조직 안의 모든 데이터 요소를 단 하나의 장소에서 제어하고 저장합니다. 데이터 중복과 불일치를 없앱니다. 핵심 데이터가 한 곳에서 관리되므로, 신뢰할 수 있는 정보를 기반으로 정확한 의사결정이 가능해집니다.

비유하면 이렇습니다. 가족 5명이 각자 가계부를 따로 적습니다. 한 달이 지나면 다섯 개의 가계부에 적힌 식비가 전부 다릅니다. 누가 맞는지 모릅니다. 결국 누구의 가계부도 신뢰할 수 없게 됩니다.

SSoT는 가족 가계부 하나를 만들어서 그것만 보는 것입니다. 식비를 확인하려면 거기를 봅니다. 누가 수정하든 그 한 곳을 수정합니다. 다른 데에 적어둔 메모는 참고용일 뿐, 진실은 가계부에만 있습니다.

기업으로 옮기면 이렇습니다. 고객 정보의 정답은 CRM에만 있습니다. 매출 수치의 정답은 ERP에만 있습니다. 제품 스펙의 정답은 PIM에만 있습니다. 이메일에 첨부된 엑셀, 누군가의 PC에 저장된 PDF, 슬랙 채널에 붙여넣어진 표는 전부 사본일 뿐 진실이 아닙니다.

SSoT가 주는 네 가지 가치

중복 제거와 일관성. 같은 정보가 여러 곳에 흩어져 있으면, 어느 한 곳을 수정해도 다른 곳은 그대로 남습니다. 어느 버전이 최신인지 알 수 없게 됩니다. SSoT는 원본을 하나로 고정해서 이 혼란을 없앱니다.

신뢰할 수 있는 데이터. 회사 구성원 모두가 하나의 최신 데이터 버전을 기준으로 일합니다. "내가 본 자료에서는…"이라는 말로 시작하는 회의가 사라집니다.

효율적인 관리. 하나의 원본 데이터만 수정하면, 연결된 시스템 전체에 즉시 반영됩니다. 같은 정보를 다섯 군데에 따로따로 업데이트하느라 쓰는 시간이 사라집니다.

사일로 방지. 정보가 부서 간에 막히지 않고 공유됩니다. 영업팀의 데이터, 마케팅팀의 데이터, 운영팀의 데이터가 같은 출처를 참조하면서 협업의 마찰이 줄어듭니다.

이건 SSoT의 일반적인 장점입니다. 그런데 AI 시대가 오면서 이 원칙의 가치가 차원이 달라집니다.

AI 시대에 SSoT가 필수인 이유

왜 AI 시대에 SSoT가 결정적인가

AI 도입이 기대만큼 효과를 내지 못하는 가장 큰 원인이 데이터입니다. AI는 강력한 추론 엔진이지만, 무엇을 추론할지는 입력된 데이터에 달려 있습니다. 입력이 흩어져 있고 모순되면, 출력도 흩어지고 모순됩니다. AI가 똑똑할수록 잘못된 데이터에서 그럴듯한 결론을 더 자신 있게 만들어냅니다.

세 가지 구체적인 문제가 있습니다.

환각(hallucination)이 더 위험해집니다. AI는 모르는 것을 자신 있게 지어내는 경향이 있습니다. RAG로 사내 문서를 참조하게 해도, 그 문서들이 서로 다른 숫자를 담고 있으면 AI는 무엇이 맞는지 판단하지 못합니다. 가장 최근 것을 고르거나, 가장 자주 등장하는 것을 고르거나, 그냥 평균을 내거나. 어떤 선택이든 위험합니다. 진실이 한 곳에 고정되어 있어야 AI도 진실을 말할 수 있습니다.

AI 에이전트가 자율적으로 행동하면 일관성이 더 중요해집니다. AI가 보조 도구일 때는 사람이 결과를 검증할 수 있습니다. 하지만 AI 에이전트가 여러 시스템을 자동으로 오가며 일하기 시작하면, 데이터의 일관성이 깨질 때마다 에이전트가 잘못된 판단을 내립니다. CRM의 고객 정보와 마케팅 자동화 도구의 고객 정보가 다르면, 에이전트가 같은 고객에게 두 번 메일을 보내거나 엉뚱한 메시지를 보냅니다. SSoT 없이는 자율 에이전트를 신뢰할 수 없습니다.

AI 학습 데이터의 품질이 결과를 결정합니다. 사내 데이터로 모델을 미세조정하거나 RAG를 구축할 때, 그 데이터의 품질이 결과의 상한선을 결정합니다. 모순된 데이터로 훈련된 AI는 모순된 답을 합니다. 같은 질문에 다른 답을 하는 AI를 신뢰할 사람은 없습니다.

요약하면 이렇습니다. AI는 데이터의 품질을 증폭시킵니다. 좋은 데이터를 주면 좋은 결과가 더 빠르고 풍부하게 나옵니다. 나쁜 데이터를 주면 나쁜 결과가 더 빠르고 자신 있게 나옵니다. AI를 도입하기 전에 SSoT가 갖춰져 있어야 하는 이유입니다.

SSoT 구축과 실행 방안

우리 회사에 SSoT가 없다는 신호들

다음 중 몇 개가 해당되는지 점검해보면 됩니다.

같은 지표(매출, 고객 수, 전환율 등)에 대해 부서마다 다른 숫자를 가지고 있습니다. 회의에서 "그 자료의 출처가 어디예요?"라는 질문이 자주 나옵니다. 같은 고객 정보가 CRM, 영업 스프레드시트, 마케팅 도구에 각각 다르게 저장되어 있습니다. 누군가의 PC에만 있는 엑셀 파일이 회사의 핵심 데이터를 담고 있습니다. 신입사원이 들어오면 "그 파일은 어디에 있어요?"라는 질문에 사람마다 다르게 답합니다. 외부에서 받은 데이터를 누가 어떻게 정리했는지 추적할 수 없습니다.

세 개 이상 해당된다면, AI 도입을 본격화하기 전에 SSoT 구축을 먼저 검토해야 합니다.

SSoT를 어떻게 구축하나

기술 도입의 문제로 시작해서 결국 조직 문화의 문제로 끝나는 작업입니다. 단계별로 정리하면 이렇습니다.

1단계: 핵심 데이터 도메인을 식별합니다. 회사가 다루는 데이터를 전부 SSoT로 만들 수는 없습니다. 가장 중요한 것부터 시작합니다. 보통 고객, 제품, 직원, 거래, 재무가 핵심 도메인입니다. 각 도메인의 진실이 어디에 있어야 하는지 정합니다. 고객은 CRM에. 직원은 HR 시스템에. 재무는 ERP에.

2단계: 흩어진 사본을 식별합니다. 핵심 데이터가 어디어디에 사본으로 존재하는지 추적합니다. 영업팀의 엑셀, 마케팅팀의 자동화 도구, 운영팀의 대시보드. 모든 사본을 목록화합니다.

3단계: 단방향 흐름을 설계합니다. 진실은 한 곳에서만 만들어지고, 다른 곳으로는 자동으로 동기화되어 흐릅니다. CRM에서 수정한 고객 정보가 마케팅 도구로 자동 흘러가는 구조입니다. 반대 방향은 차단합니다. 마케팅 도구에서 고객 정보를 수정해도 CRM에 반영되지 않습니다.

4단계: 거버넌스 규칙을 만듭니다. "이 데이터의 수정 권한은 누구에게 있는가." "수정 시 누가 승인하는가." "변경 이력은 어떻게 기록되는가." 데이터의 소유권과 책임 소재를 명확히 합니다.

5단계: 도구로 강제합니다. 정책만으로는 안 됩니다. 시스템적으로 진실의 출처가 한 곳임을 강제하는 도구가 필요합니다. 마스터 데이터 관리(MDM) 솔루션, 데이터 카탈로그, 통합 데이터 플랫폼이 여기에 해당합니다.

6단계: 문화로 정착시킵니다. 가장 어려운 단계입니다. "엑셀로 따로 관리하면 편한데"라는 관성이 가장 큰 적입니다. SSoT 외부의 데이터는 의사결정에 쓰지 않는다는 원칙을 경영진부터 보여줘야 합니다. SSoT에 없는 자료를 들고 와서 보고하는 것이 용납되지 않는 분위기가 만들어져야 합니다.

SSoT가 AI 도입의 진짜 진입장벽입니다

많은 회사가 AI 도입의 어려움을 모델 선택, 프롬프트 작성, 도구 통합의 문제로 봅니다. 사실 이건 표면입니다. 진짜 장벽은 데이터입니다.

좋은 모델, 좋은 프롬프트, 좋은 도구를 다 갖춰도 데이터가 흩어져 있으면 AI는 잘 작동하지 않습니다. 반대로 SSoT가 잘 갖춰진 회사는 평범한 AI 도구로도 놀라운 결과를 냅니다. 입력의 품질이 출력의 상한선을 결정하기 때문입니다.

AI 시대에 기업이 가장 먼저 갖춰야 할 인프라는 가장 비싼 GPU도, 가장 똑똑한 모델도 아닙니다. "이 데이터의 정답은 여기에만 있다"고 모두가 합의할 수 있는 단일 진실 공급원입니다. 이게 없으면, 그 위에 쌓는 모든 AI 시스템이 모래 위의 성이 됩니다.

거꾸로, SSoT가 갖춰지면 그 위에 쌓는 AI는 폭발적인 효과를 냅니다. AI가 회사를 이해하고, 일관된 답을 하고, 자율적으로 행동해도 신뢰할 수 있게 됩니다.

AI 도입을 검토하는 회사라면, 도입 전에 한 번 점검해볼 일입니다. 우리 회사에 진실은 어디에 있는가. 그 진실은 한 곳에 있는가, 아니면 다섯 군데에 흩어져 있는가. 이 질문에 깔끔하게 답할 수 있는 회사가 AI 시대의 진짜 승자가 됩니다.