로컬 AI를 직접 돌리는 비용

윌리엄 앤젤은 M 시리즈 맥으로 오픈소스 LLM을 한 달간 운용한 뒤, 전기 요금 청구서와 OpenRouter API 청구서를 나란히 놓았습니다. 전기 요금이 더 높았습니다. 그가 2026년 5월 17일 공개한 계산은 Hacker News에서 280개 이상의 추천을 받았고, 댓글 231개 중 상당수는 "비슷하게 느꼈지만 수치로 확인한 건 처음"이라는 반응이었습니다. 로컬에서 AI를 돌리면 클라우드 API보다 저렴하다는 판단이, 실제 전력 측정값 앞에서 다른 모습을 드러냈습니다.

전력계가 보여준 토큰당 비용

앤젤의 방법론은 직접적입니다. Apple Silicon 칩이 LLM 추론 중 소비하는 와트수를 실측하고, 그 수치를 실제 전기 요금으로 환산해 OpenRouter에서 같은 쿼리를 처리할 때 드는 API 비용과 비교했습니다.

M 시리즈 맥에서 7B~13B 파라미터 오픈소스 모델을 추론할 때 시스템 전체 소비전력은 대략 20~40W 수준입니다. 화면, 팬, 배경 프로세스를 모두 포함한 수치입니다. 한 시간 추론에 약 0.03~0.04kWh가 소비됩니다. 전기 요금이 비싼 미국 평균을 기준으로 시간당 비용을 계산하면 수 센트 안팎이고, 한국 전기 요금을 적용하면 더 낮습니다. 숫자만 보면 무시해도 될 것처럼 보입니다.

그런데 처리 속도에서 차이가 납니다. 로컬 추론은 클라우드 서버보다 훨씬 느리고, 같은 양의 토큰을 생성하는 데 훨씬 긴 시간이 필요합니다. 속도 차이를 반영해 토큰 1,000개당 전력 비용을 계산하면, OpenRouter에서 Meta Llama 3나 Mistral 계열 모델을 쓸 때의 API 단가를 넘어서는 경우가 생깁니다. 요금 체계가 다릅니다. 클라우드 API는 처리된 토큰 수에 비례해 요금이 부과되고, 모델이 빠를수록 같은 비용에 더 많은 작업이 처리됩니다. 로컬은 추론 속도와 무관하게 전력이 소모되며, 느린 추론이 길수록 더 많은 전기를 씁니다.

대기 전력도 더해집니다. API 서비스는 쿼리를 보낼 때만 요금이 발생합니다. 로컬 서버를 24시간 켜 두면 쿼리를 보내지 않는 시간에도 전기가 나갑니다. 앤젤의 분석에서 이 상시 대기 전력이 월간 비용의 상당 부분을 차지했습니다. 하루 두 시간만 실제로 사용하더라도 컴퓨터를 종일 켜 두면 나머지 스물두 시간의 대기 전력이 누적됩니다. "내 컴퓨터에서 돌리면 공짜"라는 감각은, 추론하는 순간만 보고 대기 시간 비용을 빠뜨린 계산에서 나옵니다.

로컬 AI가 더 비싸도 쓰는 상황이 있습니다

이 계산에 반박하는 입장도 분명히 있습니다. 로컬 AI를 선택하는 근거가 비용 절감 하나만이 아닌 경우가 많기 때문입니다.

고객 데이터, 내부 계약서, 미공개 재무 수치가 담긴 프롬프트를 외부 API로 전송하면, 그 내용이 어느 서버를 거치는지 추적하기 어렵습니다. 개인정보보호법을 엄격하게 적용받는 업종이나, 내부 정보 보안 정책상 외부 망 접근을 제한하는 환경에서는 클라우드 API 사용 자체가 리스크가 됩니다. 의료, 법률, 금융 분야에서 높은 운용 비용을 감수하면서도 사설 LLM 서버를 유지하는 배경이 여기 있습니다. 인터넷 연결이 불안정한 현장이나 망 분리 환경에서도 로컬 추론은 실질적인 선택지가 됩니다.

앤젤의 계산이 미국 전기 요금을 기준으로 한다는 점도 유의해야 합니다. 한국의 가정용 전기 요금은 미국 평균보다 낮은 구간이 있으며, 누진 구조도 다릅니다. 소규모 사업자가 가정용 요금 체계를 적용받는다면 실제 비용 차이는 계산보다 작을 수 있습니다. 클라우드 데이터센터의 에너지 효율이 꾸준히 개선되고 있어, 탄소 비용 관점에서도 단순 비교가 어렵다는 시각이 있습니다.

그럼에도 전기는 비용입니다. 그 비용이 API 요금보다 높을 수도 있고 낮을 수도 있지만, 측정하지 않으면 어느 쪽인지 알 수 없습니다.

AI 도구 비용을 직접 계산한 사람이 드뭅니다

앤젤의 글이 280개 이상의 추천을 받은 이유를 생각해 봅니다. 수치 자체가 놀라워서라기보다, 그런 계산을 실제로 해본 사람이 드물었기 때문에 공감이 모였을 것입니다. AI 도구 목록이 빠르게 늘어나는 환경에서, 각 도구의 실제 운용 비용을 측정하고 비교하는 습관을 가진 사람은 많지 않습니다.

1인 사업자 입장에서 먼저 확인할 것은 현재 쓰는 AI 도구의 한 달 비용입니다. 클라우드 API는 청구서가 자동으로 발행되므로 확인이 쉽습니다. 로컬 AI는 스마트 플러그나 macOS 전력 모니터링 도구로 실측하거나, 칩 TDP와 평균 사용 시간을 기반으로 추정할 수 있습니다. 한국전력 요금표에 대입하면 월 비용이 나옵니다. 이 수치가 동일 쿼리 수를 클라우드 API로 처리할 때의 비용보다 높다면, 정보 보안 등 명확한 다른 이유가 없는 한 현재 선택을 다시 검토할 여지가 있습니다.

로컬과 클라우드를 병행하는 방식도 검토할 수 있습니다. 고객 데이터나 기밀 문서가 포함된 쿼리는 로컬로, 일반적인 작업은 클라우드로 분리하면 보안과 비용을 함께 조율할 수 있습니다. 이 분리 자체가 AI 도구 운용에 대한 의식적인 결정입니다. 그 결정을 내리려면 각 도구의 실제 비용을 알고 있어야 합니다.

AI 시대에 인간에게 남는 역량을 주제로 쓴 한 책에는, AI 도구를 평가하는 기준을 스스로 갖추고 있어야 한다는 이야기가 나옵니다. 도구가 빠르게 늘어나는 속도에 맞춰 판단 기준도 함께 다듬어야 한다는 논지입니다. 이 관점에서 보면, 전기 요금 계산은 단순한 비용 관리 팁이 아닙니다. 어떤 AI 도구를 왜 쓰는지, 그 선택에 기준이 있는지를 스스로 묻는 과정입니다.

앤젤이 청구서 두 장을 나란히 놓은 행동이 수백 명의 공감을 얻었다는 사실은, 비슷한 질문을 해야 한다고 느끼지만 아직 하지 못한 사람이 그만큼 많다는 뜻입니다. AI 도구가 생산성 도구로 자리잡는 속도는 빠르지만, 그 도구를 어떻게 평가하고 운용할지에 대한 기준은 천천히 만들어집니다.