저커버그가 직접 "라이선스 멈추라"고 했습니다

5월 5일, 미국 뉴욕 남부지구 연방법원에 소장이 접수됐습니다. 피고는 메타와 마크 저커버그. 원고는 5개 출판사(아셰트, 맥밀런, 맥그로힐, 엘스비어, 센게이지)와 작가 스콧 터로우. 혐의는 "역사상 가장 대규모의 저작권 침해 중 하나".

이 소송이 이전의 AI 저작권 소송과 결정적으로 다른 점이 있습니다. CEO인 저커버그가 직접 침해를 지시했다는 구체적인 정황을 원고들이 들고나온 겁니다. 출판인이라면 이 소장의 모든 문장을 정독해야 합니다. AI 시대에 저작권 보호가 어떻게 작동하는지, 그리고 어떻게 깨지는지를 가장 선명하게 보여주는 사례이기 때문입니다.

무엇이 새로운가

작가들이 메타를 상대로 저작권 소송을 건 게 처음이 아닙니다. 2025년 6월에 사라 실버맨, 주노 디아스 등 작가 13명이 메타를 상대로 같은 종류의 소송을 걸었다가 패소했습니다. 빈센트 차브리아 판사가 메타의 라마(Llama) 학습 행위를 "공정 이용(fair use)"으로 판단했기 때문입니다.

이번 소송의 핵심은 그 패소 판결의 전제를 정면으로 흔드는 것입니다. 원고들이 들고나온 주장은 두 가지입니다. 첫째, 메타가 저작권 보호 메커니즘을 의도적으로 우회했다는 것. 둘째, 메타가 라이선스 계약을 검토하다가 저커버그가 직접 중단시켰다는 것. 이 두 가지가 사실로 인정되면, "공정 이용"이라는 방패가 무너집니다.

소장의 표현이 적나라합니다. "메타와 저커버그는 그들의 잘 알려진 모토를 따랐다. 빠르게 움직이고 깨뜨려라. 그들은 먼저 악명 높은 해적 사이트에서 수백만 권의 저작권 책과 학술 논문을 불법 토렌트로 다운로드했고, 인터넷 거의 전체의 무단 웹 스크랩을 받았다. 그런 다음 그 훔친 과실을 여러 번 복사해서 메타의 수십억 달러짜리 생성형 AI 시스템 라마를 훈련시켰다."

결정적 증거: 라이선스를 검토했다는 사실

이번 소송에서 가장 강력한 카드가 이 부분입니다. 라마 1을 출시한 후, 메타는 주요 출판사들과 라이선스 계약을 잠시 검토했습니다. 2023년 1월부터 4월 사이에 "데이터셋 라이선스" 예산을 최대 2억 달러까지 늘리는 방안이 논의됐습니다.

그런데 2023년 4월 초, 라이선스 전략이 갑자기 중단됐습니다. 소장에 따르면 "라이선스를 살지 해적질을 할지의 문제가 저커버그에게 에스컬레이션됐고, 저커버그에게 올라간 후 메타의 사업개발팀은 라이선스 노력을 중단하라는 구두 지시를 받았다"고 합니다.

한 메타 직원이 그 이유를 이렇게 설명했다고 소장에 인용되어 있습니다. "단 한 권의 책이라도 라이선스를 사면, 우리는 공정 이용 전략에 기댈 수 없게 된다."

이 한 문장이 소송의 핵심입니다. 메타가 라이선스 계약을 살 수도 있었지만, 사면 "공정 이용" 주장이 무너진다는 것을 알고 있었기 때문에 일부러 사지 않았다는 정황이 드러난 겁니다. 의도성이 명백하면 단순한 공정 이용 주장은 통하지 않습니다.

출판인이 주목해야 할 세 가지

이 소송이 한국 출판인에게 주는 시사점이 큽니다.

첫째, "AI가 학습한 콘텐츠"의 흔적이 남습니다. 소장에서 흥미로운 대목은, 라마가 "원고와 클래스 작품의 대체물을 빠르고 대규모로 생성한다"는 주장입니다. 축자적 또는 거의 축자적 사본, 학술 교과서의 대체 챕터, 유명 소설과 학술 논문의 요약 및 대안 버전, 원본의 창의적 요소를 베낀 열등한 모방품. 심지어 "라마는 특정 작가의 표현 요소와 창의적 선택을 모방하도록 출력을 맞춤화한다"고 합니다.

이는 AI 학습 데이터의 흔적이 학습된 모델의 출력에 남는다는 의미입니다. 출판한 책이 어떤 AI에 학습되었는지를 역추적할 수 있는 기술적·법적 근거가 쌓이고 있는 겁니다.

둘째, 저작권 관리 정보(CMI) 제거가 별도 위반입니다. 소장은 메타가 "저작권 관리 정보를 훔친 저작권 작품에서 제거했다"고 명시합니다. 학습 출처를 숨기고 무단 사용을 용이하게 하기 위해서라는 겁니다. 미국 디지털 밀레니엄 저작권법(DMCA)에서 CMI 제거는 별도의 위반 행위입니다.

이 부분이 한국 출판인에게 의미가 있습니다. 디지털 출판물에 명시한 저작권 표시, 메타데이터, 워터마크 같은 정보가 AI 학습 과정에서 제거되었다는 사실 자체가 손해배상의 근거가 됩니다. 출판물의 메타데이터를 어떻게 관리할 것인가가 새로운 저작권 방어선입니다.

셋째, "라이선스를 안 사면 공정 이용"이라는 논리는 깨질 가능성이 큽니다. 메타 내부 직원의 말이 그것을 증명합니다. 라이선스를 살 수 있었지만 일부러 안 산 행위는 공정 이용으로 보호받기 어렵습니다. 이 판결이 어떻게 나오든, AI 회사들이 라이선스 계약을 회피하기 위해 의도적으로 행동했다는 정황이 공개된 것 자체가 중요합니다.

한국 시장에 던지는 신호

미국에서 일어나는 일이지만, 한국 출판 시장에도 직접적인 영향이 있습니다.

한국 출판물도 학습 대상에 포함되었을 가능성이 높습니다. 메타가 "인터넷 거의 전체의 무단 웹 스크랩"을 받았다고 소장은 명시합니다. 한국어로 출판된 책과 학술 논문도 그 안에 포함되었을 가능성이 매우 높습니다. 한국 출판사들이 이 사안에 대해 어떤 입장을 취할지가 향후 몇 년의 핵심 의제가 될 겁니다.

라이선스 협상의 시점이 다가오고 있습니다. 미국 출판사들이 소송으로 압박을 가하는 동안, 일부 AI 회사들은 라이선스 계약으로 방향을 트는 중입니다. OpenAI는 이미 여러 언론사와 콘텐츠 라이선스를 체결했고, 앤트로픽도 일부 콘텐츠 파트너십을 발표했습니다. 한국 출판사들도 자기 콘텐츠의 라이선스 가치를 평가하고, 협상 테이블에 앉을 준비를 해야 합니다.

작은 출판사의 협상력도 집단 행동으로 만들 수 있습니다. 이번 소송이 "제안된 집단소송(proposed class-action)"이라는 점이 중요합니다. 큰 출판사 5곳뿐 아니라 같은 처지의 모든 출판사를 대표하는 형태입니다. 한국에서도 개별 출판사의 협상력은 약하지만, 출판사 단체나 연합 형태로 움직이면 다른 게임이 됩니다.

"빠르게 움직이고 깨뜨려라"의 청구서

페이스북 시절부터 메타의 모토였던 "Move fast and break things"가 이번에 청구서로 돌아왔습니다. 이 모토는 기술 스타트업의 자랑이었지만, 깨뜨린 것이 다른 사람의 권리일 때는 다른 이름이 붙습니다. 침해.

소장에 인용된 메타 직원의 말이 그 본질을 보여줍니다. "단 한 권의 책이라도 라이선스를 사면, 우리는 공정 이용 전략에 기댈 수 없게 된다." 이 말은 메타가 자기 행위가 라이선스가 필요한 행위라는 사실을 알고 있었다는 의미입니다. 알면서도 안 산 겁니다.

AI 회사가 콘텐츠를 어떻게 다루는지에 대한 공개적 기록이 빠르게 쌓이고 있습니다. 이 기록들이 향후 몇 년간의 판결에 결정적인 영향을 미칠 겁니다. 그리고 그 판결이 나오기 전에, AI 회사와 콘텐츠 회사 사이의 협상 테이블이 곳곳에서 차려지고 있습니다.

한국 출판인이라면, 이 소송의 결말이 아니라 진행 과정에서 드러나는 정황들을 주시해야 합니다. AI 학습 데이터에 어떤 책이 들어갔는지, 어떤 라이선스 협상이 거부되었는지, 어떤 메타데이터가 제거되었는지. 이 정보들이 향후 한국 출판사의 협상 카드가 될 수 있습니다.

저커버그가 "라이선스 멈추라"고 한 결정이, 이제 메타의 가장 큰 부담이 되어 돌아오고 있습니다. AI 시대에 콘텐츠 권리를 가진 자는 약자가 아닙니다. 협상 테이블에 앉을 자격이 있는 자입니다.