5일 전, Claude가 완전히 달라졌습니다

2026년 4월 16일, Anthropic이 최신 모델 Claude Opus 4.7을 정식 출시했습니다. "마이너 업데이트"가 아니에요. 시각 능력, 코딩 성능, 추론 방식까지 한 번에 바뀐 메이저 업그레이드입니다.

직접 써보니 체감되는 변화가 있었고, 반대로 "이건 별 차이 없네" 싶은 부분도 있었어요. 벤치마크 숫자보다 실제로 쓸 때 뭐가 다른지에 초점을 맞춰서 정리합니다.

1. 이미지를 진짜로 "읽게" 됐습니다

이번 업데이트에서 가장 체감이 큰 변화입니다. 이미지 해상도 지원이 3.75MP(메가픽셀)로 올라갔어요. Opus 4.6보다 약 3배 높은 수준입니다.

숫자보다 중요한 건 실제 차이예요.

이전에는 스크린샷을 넣으면 작은 글자를 못 읽거나 추측하는 경우가 종종 있었어요. 4.7에서는 확 달라졌습니다.

이런 상황에서 차이가 큽니다:

  • 엑셀 표를 캡처해서 "이 데이터 분석해줘" → 작은 셀 값까지 정확하게 읽어냄
  • 계약서나 영수증 사진을 찍어서 올리기 → 세부 조항, 금액까지 파악
  • 웹사이트 캡처해서 "이 UI 개선점 찾아줘" → 아이콘, 버튼 텍스트까지 인식

ChatGPT로 엑셀 업무 자동화하는 방법에서 다뤘던 것처럼 데이터 분석 업무를 하는 분이라면, 엑셀 화면을 캡처해서 바로 붙여넣는 방식이 훨씬 실용적으로 변했어요.

2. 코딩 성능 — 벤치마크 1위

개발자가 아니어도 알아두면 좋은 변화입니다. Claude Opus 4.7이 소프트웨어 엔지니어링 벤치마크(SWE-bench)에서 GPT-5.4와 Gemini 3.1 Pro를 제치고 1위를 차지했어요.

핵심 수치:

  • CursorBench: 58% → 70% (Opus 4.6 대비 +12%p)
  • SWE-bench Pro: 53.4% → 64.3% (약 20% 향상)

개발자가 아닌 분한테는 이게 무슨 의미일까요?

코딩 성능이 좋아졌다는 건, 코드가 아닌 작업에서도 복잡한 지시사항을 더 정확하게 따른다는 뜻이에요. 예를 들어:

  • "이 표를 3개 기준으로 정렬하고, 상위 5개만 뽑아서, 각각에 대한 코멘트를 달아줘" 같은 복합 지시
  • 여러 조건을 동시에 만족시키는 글쓰기 (톤, 분량, 형식, 키워드 모두 지정)

이런 복잡한 요청에서 4.6보다 빗나가는 경우가 줄었습니다.

AI 코딩 도구 비교 글에서 다뤘던 Cursor AI와 함께 쓰면 시너지가 더 커졌어요.

3. xhigh 추론 — "더 깊이 생각해" 옵션

기존에는 Claude의 사고 깊이를 low, medium, high 3단계로 설정할 수 있었는데, xhigh라는 새 단계가 추가됐습니다.

쉽게 말하면 이런 차이예요:

  • high: 일반적인 복잡한 질문에 충분한 수준
  • xhigh: 수학 증명, 다단계 논리 문제, 깊은 코드 분석처럼 "한참 고민해야 하는" 문제에 적합

주의할 점이 있어요. xhigh를 쓰면 응답 시간이 눈에 띄게 길어지고, 토큰 소모도 많아집니다. "블로그 글 써줘"나 "이거 요약해줘" 같은 일상적인 요청에는 쓸 필요 없어요. 오히려 느려지기만 합니다.

xhigh가 빛나는 순간:

  • "이 사업 모델의 수익성을 5가지 시나리오별로 분석하고, 각각의 리스크를 평가해줘"
  • "이 코드의 보안 취약점을 찾고, 수정 방안까지 제안해줘"
  • 복잡한 법률/재무 문서에서 모순점이나 빠진 조항 찾기

4. Task Budgets — API 비용 폭탄 방지

API 사용자를 위한 새 기능이에요 (일반 사용자는 해당 없음). 현재 퍼블릭 베타 단계입니다.

AI 에이전트가 혼자서 작업할 때, 예상보다 토큰을 많이 쓰면 비용이 폭증하는 문제가 있었어요. Task Budgets를 설정하면 "이 작업에 최대 이만큼만 써라"고 미리 제한할 수 있습니다. 개발자에게는 꽤 중요한 기능이에요.

5. 알아둬야 할 변화 — 토크나이저

가격은 Opus 4.6과 동일합니다 (API 기준 입력 $5/출력 $25 per 100만 토큰).

하지만 새로운 토크나이저가 적용되면서, 같은 텍스트라도 토큰 수가 최대 35% 늘어날 수 있어요. 쉽게 말하면 같은 내용을 처리하는데 토큰이 더 들 수 있다는 뜻이에요.

Pro 구독자($20/월)에게는 큰 체감 차이는 없어요. 메시지 수 제한이 살짝 빡빡해질 수는 있지만, 일상적인 사용에는 문제 없습니다.

API를 많이 쓰는 개발자라면 기존 프로젝트의 토큰 소모량을 확인해볼 필요가 있어요.

그래서, 4.7로 바꿔야 할까?

모든 사람에게 "무조건 바꿔라"고 말하기는 어렵습니다. 용도에 따라 다르거든요.

바꾸면 확실히 좋은 경우:

  • 이미지·문서를 많이 분석하는 업무 → 시각 능력이 3배 좋아졌으니 체감이 큼
  • 코딩 작업이 주 용도 → 벤치마크 대폭 향상, 실제로도 복잡한 코드를 더 잘 처리함
  • 복잡한 다단계 분석이 필요한 경우 → xhigh 추론 활용

굳이 안 바꿔도 되는 경우:

  • 일반적인 글쓰기, 요약, 번역 → 4.6과 체감 차이가 크지 않음
  • 빠른 응답이 중요한 경우 → Sonnet 4.6이 더 빠르고 가벼움

claude.ai에서 모델을 직접 선택할 수 있으니, 같은 질문을 4.6과 4.7에 각각 해보고 비교하는 걸 추천합니다.

2026년 Claude 그 외 주요 업데이트

Opus 4.7만 나온 게 아니에요. 2026년에 Claude가 전체적으로 크게 진화했습니다.

100만 토큰 컨텍스트 (3월): 책 한 권 분량(약 75만 단어)을 한 번에 넣고 분석할 수 있게 됐어요. 100페이지짜리 보고서를 통째로 넣고 요약을 요청하는 게 가능합니다. Max, Team, Enterprise 요금제에서 사용 가능해요.

시각화 기능 (3월): 대화 중에 플로우차트, 데이터 차트, 타임라인, UI 목업 등을 직접 생성해줍니다. "이 과정을 플로우차트로 그려줘"라고 하면 바로 보여줘요.

Claude Design (4월): Figma를 몰라도 대화만으로 피치덱, 랜딩페이지, 마케팅 자료를 만들 수 있는 디자인 도구. claude.ai/design에서 Pro 이상 구독자가 사용할 수 있어요.

Claude Code 대규모 업데이트: 5주 만에 30개 이상 버전 릴리스. VS Code 네이티브 통합, 체크포인트 기반 자율 작동 등 개발자 도구로 크게 진화했어요.

ChatGPT vs Claude, 2026년 4월 기준

이전 비교 글을 쓸 때보다 판도가 꽤 바뀌었어요.

Claude가 확실히 앞서는 영역:

  • 긴 문서 처리 (100만 토큰 vs ChatGPT 12만 8천)
  • 코딩 벤치마크 (SWE-bench 1위)
  • 이미지 분석 정확도 (3.75MP 고해상도)
  • 디자인 도구 (Claude Design)

ChatGPT가 여전히 강한 영역:

  • GPTs와 플러그인 생태계의 규모
  • AI 이미지 생성 (DALL·E, GPT-Image-2)
  • 음성 대화와 멀티모달 상호작용
  • 사용자 수와 커뮤니티 크기

어떤 AI가 더 좋다기보다, 용도에 따라 선택이 달라집니다. 프롬프트 작성법을 잘 알면 어떤 AI를 써도 결과가 좋아지니까, 도구보다 사용법이 더 중요해요.

핵심 요약

  • Claude Opus 4.7은 시각 능력 3배, 코딩 +12%p, xhigh 추론 등 메이저 업그레이드
  • 이미지 분석과 코딩이 주 용도라면 업그레이드 가치 확실
  • 일반 글쓰기·요약은 4.6과 큰 차이 없음 — 용도에 맞게 선택
  • 가격은 동일하지만 토크나이저 변경으로 토큰 소모 최대 35% 증가 가능
  • Claude Design, 100만 토큰, 시각화 등 2026년 전체적으로 큰 진화