입력 100만 토큰당 0.8달러, AI 수익 구조를 알면 도구 선택이 달라집니다

어느 AI 스타트업 대표가 기자 앞에서 이런 말을 꺼냈습니다. "우리가 만든 모델이 얼마나 많은 토큰을 생산하느냐, 그 토큰이 얼마나 많이 소비되느냐." 기업 비전이나 기술 역량을 이야기할 자리에서 매출 계산식을 꺼낸 셈입니다. 업스테이지 김성훈 대표가 2026년 6월 한 인터뷰에서 언급한 'AI 토큰노믹스'라는 표현이었습니다.

국내 AI 기업이 수익 모델을 이렇게 직접 설명하는 경우는 드뭅니다. 대부분의 인터뷰에서 AI 기업 수장은 기술의 우수성, 파트너십의 규모, 적용 사례의 다양성을 나열합니다. 그런 자리에서 "돈을 어떻게 버냐"는 질문에 "토큰 생산량과 소비량의 곱"이라고 답했다면, 그 안에는 AI 사업 구조를 이해하는 데 쓸 만한 시각이 담겨 있습니다.

토큰이 어떻게 매출로 변환되는가

업스테이지는 2023년 자체 언어모델 '솔라Solar'를 공개하며 허깅페이스 오픈LLM 리더보드 상위권에 오른 이후, 삼성전자·SK 등 국내 대기업과 API 공급 계약을 맺었습니다. 의료, 금융, 제조 분야의 기업 고객을 대상으로 모델을 공급하고, 최근에는 국내 플랫폼 기업 인수와 관련한 움직임도 알려졌습니다.

토큰노믹스의 구조는 단순합니다. 언어모델은 텍스트를 '토큰' 단위로 처리합니다. 영어 기준으로 단어 하나가 약 1.3토큰, 한국어는 조사와 어미가 분리되므로 같은 의미를 전달하는 데 더 많은 토큰이 소비됩니다. AI 기업의 매출은 토큰 단가에 소비량을 곱한 값입니다. 더 많은 사용자가 더 자주, 더 길게 사용할수록 수익이 늘어납니다.

비용 구조는 정반대 방향입니다. 언어모델 학습에는 수십억 원에서 수백억 원이 들지만, 이 비용은 한 번 집행됩니다. 이후의 핵심 비용은 추론(inference), 즉 사용자가 질문을 보낼 때마다 GPU를 돌리는 비용입니다. 사용자가 늘어날수록 단위 추론 비용이 낮아지고, 소비량이 임계점을 넘으면 초기 고정 비용을 회수하고도 남습니다. 이 구조에서 기업이 원하는 상태는 명확합니다. 더 많은 사람이 더 오래 쓰는 것입니다.

플랫폼 인수의 경제학도 이 관점에서 읽힙니다. 모델 성능이 아무리 뛰어나도 토큰을 소비할 사용자가 없으면 매출이 발생하지 않습니다. 기존 트래픽과 사용자 기반을 보유한 플랫폼은 토큰 소비 접점을 한꺼번에 확보하는 수단입니다. 기술 역량을 쌓는 전략이 아니라 소비 채널을 확보하는 전략입니다.

네트워크 효과가 빠르게 돌아가는 구조, 그리고 그 이면

경영학 교과서에서 다루는 네트워크 효과 논의가 AI 분야에서는 더 빠른 속도로 작동합니다. 사용자가 늘어날수록 학습에 쓸 데이터가 쌓이고, 쌓인 데이터로 모델이 개선되며, 개선된 모델이 다시 사용자를 끌어당기는 사이클입니다. 이 사이클을 먼저 완성한 기업이 시장 주도권을 가져가는 구조여서, AI 기업들이 단기 손실을 감수하고 사용자 기반을 선점하려 하는 이유도 여기서 나옵니다. 업스테이지의 플랫폼 인수 움직임은 이 관점에서 보면, 기술 고도화보다 사이클의 입구를 확보하려는 시도로 이해됩니다.

그러나 이 프레임을 그대로 받아들이기 전에 반대쪽 시각도 살펴볼 필요가 있습니다. 토큰노믹스는 공급자의 언어입니다. '소비량을 늘린다'는 기업 목표는 사용자 입장에서 '더 많이 쓰게 만든다'로 번역됩니다. OpenAI가 GPT를 점점 더 일상적인 과업에 끼워 넣고, Google이 제미나이를 검색과 문서 도구에 통합하는 방식은 SNS 플랫폼이 체류 시간을 늘리려는 구조와 닮아 있습니다. 토큰을 많이 소비하는 것이 사용자에게 실질적 가치를 만드는지, 아니면 습관과 편의에 묶이는 것인지는 공급자가 대답하기 어려운 질문입니다. 한국 스타트업 생태계 일각에서는 "AI 서비스의 실질 단가는 사용자의 주의력"이라는 표현도 씁니다.

더 구체적인 문제도 있습니다. 토큰노믹스가 작동하려면 소비 규모가 전제입니다. OpenAI는 2024년 연 매출 40억 달러를 넘겼고, Anthropic은 2025년 30억 달러를 목표로 합니다. 이 수준의 소비 기반이 없는 상태에서 토큰 단가 경쟁에 들어가면 수익 구조가 이 논리대로 작동하기 어렵습니다. 프레임이 타당하더라도, 그 프레임 안에서 모든 참여자가 같은 조건에 있지는 않습니다. 한국의 AI 기업이 독자 모델로 글로벌 소비 경쟁에서 장기 생존 가능한지는 아직 열린 질문입니다.

AI 도구를 사는 사람의 계산식

이 구조가 AI 도구를 쓰는 1인 사업자나 소규모 조직에 어떤 의미를 갖는지, 실제로 확인해 볼 지점이 있습니다.

지금 쓰는 AI 도구의 과금 구조를 정확히 아는 것이 출발점입니다. 월정액처럼 보여도 내부에서 토큰 단가가 작동하는 서비스가 있고, 무제한처럼 보여도 일일 한도나 컨텍스트 길이 제한이 설정되어 있는 경우가 많습니다. Claude Pro, ChatGPT Plus, Gemini Advanced는 표면적으로 비슷한 월 $20 내외이지만, 처리할 수 있는 작업의 복잡도와 분량은 차이가 납니다. 짧고 반복적인 작업이 많으면 단가 효율이 높고, 긴 문서 처리나 복잡한 추론이 잦으면 실질 원가가 달라집니다. 어떤 작업에 어떤 모델을 쓰느냐도 월정액 안에서 선택의 폭이 됩니다.

AI API를 직접 활용하는 단계라면 수치가 더 명확해집니다. 자동화 파이프라인, 고객 응대 봇, 문서 처리 워크플로를 구축할 경우, 모델 선택이 운영 비용에 직결됩니다. Anthropic의 경우 Claude Haiku가 입력 100만 토큰당 약 0.8달러이고, Claude Sonnet은 약 3달러, Claude Opus는 그보다 훨씬 비쌉니다. 과업의 복잡도와 모델 단가를 맞추면 같은 작업량에서 비용이 수십 퍼센트 이상 차이납니다. 고성능 모델을 쓴다고 항상 더 좋은 결과가 나오는 것도 아닙니다. 단순 분류나 정형화된 요약에는 저가 모델이, 복잡한 판단이나 창의적 생성에는 고성능 모델이 각각 더 적합합니다.

어떤 AI 기업을 장기 파트너로 신뢰할지 고를 때도 이 관점이 기준이 됩니다. 토큰 소비량을 늘려야 이익이 나는 구조의 기업과, 사용자당 성과 지표로 계약하는 기업은 서비스를 다르게 설계합니다. 전자는 더 자주 쓰게 유도할 동기가 있고, 후자는 더 적게 쓰고도 더 좋은 결과를 내도록 최적화할 이유가 있습니다. 이 차이는 제품 UI나 마케팅 문구로는 보이지 않습니다. 과금 구조와 계약 조건을 들여다볼 때 어떤 방향으로 설계되어 있는지 단서가 드러납니다.

토큰노믹스는 AI 기업이 자신의 수익 구조를 설명하기 위해 쓴 개념입니다. 그 개념을 뒤집어 놓으면 AI 도구를 구매하는 사람이 어떤 경제 관계 안에서 선택을 내리는지가 드러납니다. 같은 월 구독료를 내더라도 그 구조를 이해하는 사람과 그렇지 않은 사람 사이에는, 비용 효율과 실질 성과 모두에서 차이가 생깁니다.