이 글의 핵심
  • 클로드(Claude)를 무료로 쓰며 모바일 게임을 만들다 사용량 한도에 걸려 작업이 멈췄습니다. 결제했고 지금은 맥스 요금제($100/월)를 씁니다
  • 빨리 막힌 이유는 "채팅창에 코드를 통째로 붙여넣고 끝없이 이어 묻는" 방식이었습니다. 토큰이 뭔지 몰랐기 때문입니다
  • 직접 만든 모니터링 도구로 보니 누적 약 23억 토큰97%가 "캐시 읽기"였습니다
  • 지금 할 일 하나 — 본인이 쓰는 AI 서비스의 사용량 페이지를 한 번 열어보는 것

무료로 게임 만들다, 작업이 멈췄다

결론부터 적습니다. 토큰이 뭔지 모르고 클로드를 쓰다가 작업이 한 번 멈췄고, 결제했고, 지금은 한 달에 $100짜리 맥스 요금제를 씁니다. 지금은 어느 프로젝트에 토큰이 얼마나 들어가는지 직접 집계해 보는 대시보드도 만들어 쓰고 있습니다.

시작은 게임이었습니다. 모바일 클리커 게임 하나을 혼자 만들어보고 싶었습니다. 코딩을 정식으로 배운 사람은 아니라서, 막히는 부분이 나오면 클로드 무료 플랜에 그냥 물어봤습니다. 코드를 통째로 붙여넣고 "이거 왜 안 돼?", "여기 이렇게 바꿔줘"를 계속 주고받았습니다. 챗(chat) 하나에 코드를 다 던져놓고 대화로 게임을 만들어가는 방식이었습니다.

그러던 중에 화면에 안내가 떴습니다. 사용량 한도에 도달했으니 몇 시간 뒤에 다시 시도하라는 내용이었습니다.

토큰 사용량 대시보드 — 프로젝트별 분배

그 몇 시간이 아까웠습니다. 막 잡힌 흐름은 식으면 다시 안 돌아오니까요. 고민은 짧았고, 결제했습니다. 다만 이때까지도 내가 왜 이렇게 빨리 막혔는지는 몰랐습니다.

빨리 막힌 건 운이 아니라 '몰라서'였다

결제하고 나서 천천히 따져봤습니다. 남들은 무료로 한참 쓴다는데 왜 나는 이렇게 빨리 막혔을까. 이유는 두 개였고, 둘 다 몰라서 생긴 일이었습니다.

하나, 채팅창에 코드를 통째로 주고받았습니다. 게임 코드 전체를 대화창에 붙여넣고 후속 질문을 끝없이 이어 붙였습니다. AI는 대화가 길어질수록 이전 내용을 매번 다시 읽습니다. 그러니 제가 짧게 "여기만 고쳐줘" 한 줄을 보내도, 그 안에는 그동안 쌓인 긴 코드 전체가 매번 같이 따라간 셈입니다. 짧은 질문 하나가 사실은 긴 질문 수십 개였던 거죠. 이게 토큰 낭비의 왕이라는 걸 그때는 몰랐습니다.

둘, 토큰이 뭔지를 몰랐습니다. AI는 글자가 아니라 '토큰'이라는 단위로 글을 처리하고, 한도도 메시지 개수가 아니라 토큰 양으로 닳습니다. 저는 "메시지 몇 개 보냈다고 벌써 막혀?"라고 억울해했는데, 실제로 닳고 있던 건 메시지 수가 아니라 누적된 코드가 매번 다시 계산되는 토큰이었습니다. 단위를 모르니 내가 뭘 쓰고 있는지도 몰랐습니다.

그러니까 한도는 갑자기 닥친 게 아니었습니다. 토큰을 알았다면 같은 게임도 무료로 훨씬 더 갔을 겁니다.

토큰 모르던 사람이 사용량 대시보드를 만들기까지

여기서부터 전개가 좀 엉뚱합니다.

계기는 거창하지 않았습니다. 프로젝트를 몇 개 같이 돌리다 보니 어느 쪽에 토큰이 얼마나 들어가는지, 내가 AI를 얼마나 활용하고 있는 건지 궁금해졌습니다. 한도가 무서워서가 아니라, 그냥 내 사용 패턴이 보고 싶었던 겁니다. 그래서 사용량 기록을 직접 긁어다 프로젝트별로 비교해 주는 작은 대시보드를 만들었습니다.

거기서 본 숫자가 좀 의외였습니다.

  • 누적 총 약 23억 토큰 (세션 150여 개)
  • 그중 캐시 읽기 약 22억 토큰 — 전체의 약 97%
  • 출력 720만쯤, 입력 100만이 안 되는 수준
  • 프로젝트별 1위는 "클리커 게임" 게임 하나가 16.8억 토큰 — 전체 사용량의 대부분

가장 눈에 박힌 건 캐시 읽기가 97%라는 점이었습니다. 캐시 읽기는 쉽게 말하면 "이전 대화·코드를 다시 읽어 들이는 데 든 양"입니다. 제가 새로 던진 질문(입력 100만이 안 되는 수준)이나 AI가 써준 답(출력 720만쯤)은 전체의 1%도 안 됩니다. 사용량의 거의 전부가 내가 채팅창에 쌓아둔 걸 매번 다시 읽는 데서 나왔다는 뜻입니다. 작업을 멈추게 만든 게 이거였구나, 숫자로 보고 나서야 납득이 됐습니다.

그 게임 하나가 16.8억으로 압도적 1위인 것도 그래서였습니다. 가장 무겁고, 가장 길고, 가장 코드를 통째로 주고받은 작업이 정확히 거기였으니까요.

[캡처#2 클로드 결제/맥스 화면]

그래서 지금은 어떻게 쓰냐면

같은 실수를 안 하려고 바꾼 습관은 두 개뿐입니다.

클로드 맥스 플랜 결제 화면

긴 작업은 대화를 새로 시작합니다. 한 채팅창을 끝없이 늘리지 않습니다. 코드 한 덩어리가 끝나거나 주제가 바뀌면 새 대화로 넘어갑니다. 그것만으로 누적되던 게 리셋돼서, 매번 옛날 코드를 다시 읽는 낭비가 확 줄어듭니다.

필요한 부분만 붙여넣습니다. 게임 코드 전체가 아니라 문제 난 함수 하나만 넣어도 답은 거의 똑같이 나오는데, 드는 토큰은 비교가 안 되게 적습니다. "전부 보여줘야 안다"는 건 대부분 사실이 아니었습니다.

지금은 맥스 요금제라 예전만큼 한도를 신경 쓰진 않습니다. 매일 가장 무겁게 쓰는 도구가 돼서 $100이 안 아까울 만큼 값을 합니다. 대시보드는 그래도 계속 켜둡니다. 한도 걱정 때문은 아니고, 어느 프로젝트에 얼마나 쓰는지가 보이는 게 그냥 편해서입니다.

닥치기 전에, 사용량부터 한 번 보세요

제 실수의 핵심은 결제를 안 해서가 아니라, 내가 뭘 얼마나 쓰는지 모르는 채로 썼다는 점이었습니다.

그러니 하나만 해보시길 권합니다. 본인이 쓰는 AI 서비스(클로드든 ChatGPT든) 설정에서 사용량 페이지를 한 번 열어보는 것. 한 달에 얼마나 쓰는지, 어디서 한도가 닳는지 한 번만 봐두면 한창 흐름 탔을 때 멈춰 서는 일은 적어도 줄어듭니다.