본문 바로가기
AI 실전 활용

모든 작업에 'High'만 쓰는 이유, effort 레벨이 말 안 하는 비밀 - Claude Code의 Low,Medium,High 설정으로 토큰과 지능 조절하기

by 심독 2026. 7. 1.
반응형

Boris Cherny가 모든 작업에 'High'만 쓰는 이유, effort 레벨이 말 안 하는 비밀

핵심 요약

  • Claude Code는 /model 명령으로 Low·Medium·High 3단계 effort 레벨을 선택할 수 있다. (출처: Boris Cherny X, 2026.02)
  • Low는 토큰 사용량이 적고 응답 속도가 빠르며, High는 토큰 사용량이 많지만 더 높은 지능 수준을 제공한다.
  • Claude Code 창시자 Boris Cherny는 모든 작업에 High를 사용한다고 공개했다.
  • effort 레벨은 단순 설정이 아니라 비용과 응답 품질 사이의 트레이드오프를 직접 조절하는 핵심 레버다.

목차

  1. 문제 제기 — Claude Code 응답이 가끔 너무 단순하다면
  2. effort 레벨 3단계의 정확한 차이
  3. Boris Cherny가 모든 작업에 High를 쓰는 이유
  4. 작업별 effort 레벨 선택 기준
  5. 설정 방법과 확인 방법
  6. 마치며

1. 문제 제기 — Claude Code 응답이 가끔 너무 단순하다면

Claude Code를 쓰다 보면 같은 모델인데도
어떤 날은 깊이 있는 결과를 내고,
어떤 날은 평범한 수준에서 멈추는 느낌을 받을 수 있다.

 

이런 차이가 모델 자체의 변덕이 아니라
effort 레벨이라는 설정값 때문일 수 있다는 것은 잘 알려져 있지 않다.

 

최근 Claude Code 창시자 Boris Cherny가 X에 공개한 커스터마이징 팁 12가지 중에는
effort 레벨 조정이 포함되어 있다.
이 설정 하나가 응답의 깊이와 비용을 동시에 좌우한다.


2. effort 레벨 3단계의 정확한 차이

공개된 내용에 따르면
/model 명령으로 effort 레벨을 선택할 수 있으며, 3단계는 다음과 같다.

레벨 토큰 사용량 응답 속도 지능 수준
Low 적음 빠름 기본
Medium 보통 균형 균형
High 많음 느림 높음

 

이 표가 보여주는 것은 단순한 트레이드오프다.

 

토큰을 더 많이 쓸수록 Claude가 더 깊이 사고하고,
그 결과 더 높은 수준의 답을 낼 가능성이 커진다.

반대로 Low는 빠르고 저렴하지만 사고의 깊이가 제한된다.

 

Claude Code effort 레벨 Low, Medium, High 토큰 사용량과 응답 속도 비교


3. Boris Cherny가 모든 작업에 High를 쓰는 이유

가장 주목할 부분은 Claude Code를 만든 사람의 실제 선택이다.
"Boris는 모든 작업에 High를 사용한다"는 것이 공개된 내용이다.

 

이것이 의미하는 바를 생각해보면,
Claude Code 창시자는 비용이나 속도보다 결과물의 품질을 우선시한다는 명확한 신호로 읽을 수 있다.


코드 작성이나 디버깅처럼 정확성이 중요한 작업에서는,
약간의 속도 손실을 감수하더라도 더 높은 지능 수준에서 나오는 결과가
장기적으로 더 적은 재작업을 만든다는 판단으로 해석할 수 있다.

[Low/Medium의 함정]
빠른 응답 → 표면적으로 작동하는 코드
→ 숨겨진 엣지 케이스 누락
→ 나중에 재작업 필요 → 시간 손실

[High의 효과]
느린 응답 → 더 깊은 추론
→ 엣지 케이스까지 고려
→ 처음부터 완성도 높은 결과

 

다만 이것이 "항상 High가 정답"이라는 절대적 규칙은 아니다.
작업의 성격에 따라 다른 레벨이 더 적합한 경우도 있다.


4. 작업별 effort 레벨 선택 기준

Boris Cherny의 선택을 참고하되, 작업 유형별로 합리적인 기준을 세워볼 수 있다.

작업 유형 추천 레벨 이유
복잡한 버그 디버깅 High 깊은 추론으로 근본 원인 파악 필요
아키텍처 설계 High 장기적 영향이 큰 결정
단순 포맷팅·린트 수정 Low 빠른 처리가 더 중요, 복잡한 사고 불필요
빠른 프로토타입 작업 Low~Medium 속도가 품질보다 우선
일반적인 기능 구현 Medium 균형 잡힌 처리

 

이 기준에서 알 수 있는 것은,

  • effort 레벨이 "항상 켜두는 설정"이 아니라
  • "작업에 맞춰 전환하는 도구"라는 점이다.

Boris Cherny가 모든 작업에 High를 쓰는 것은
그의 작업 특성(주로 복잡한 코드베이스 작업)을 반영한 선택일 수 있다.


5. 설정 방법과 확인 방법

effort 레벨을 변경하는 방법은 간단하다.

# Claude Code 터미널에서
/model

# 메뉴가 나타나면 Low, Medium, High 중 선택

 

설정을 바꾼 뒤에는 실제로 응답 속도와 토큰 사용량의 차이를 직접 체감해보는 것이 좋다.


같은 질문을 Low와 High로 각각 시도해보면,
사고 과정의 깊이와 결과물의 디테일에서 차이를 확인할 수 있다.

실무 적용 가이드:
처음 시도한다면 일주일 동안 Medium으로 기본 작업을 하다가,
복잡한 버그나 설계 결정이 필요한 순간에만 일시적으로 High로 전환해보는 방식을 추천한다.
이렇게 하면 비용과 품질의 균형점을 직접 파악할 수 있다.


FAQ

Q: Claude Code의 effort 레벨은 어떻게 변경하는가?
A: 터미널에서 /model 명령을 입력하면
Low, Medium, High 중에서 선택할 수 있는 메뉴가 나타난다.

 

Q: Boris Cherny는 왜 모든 작업에 High를 쓰는가?
A: 공개된 내용에는 구체적인 이유가 명시되지 않았지만,
High가 더 높은 지능 수준을 제공한다는 점에서 결과물의 품질을 토큰 비용보다 우선시하는 선택으로 해석할 수 있다.

 

Q: Low와 High의 가장 큰 차이는 무엇인가?
A: Low는 토큰 사용량이 적고 응답 속도가 빠른 반면,
High는 토큰 사용량이 많지만 더 높은 지능 수준을 제공한다.
속도와 깊이 사이의 트레이드오프다.

 

Q: 모든 작업에 High를 쓰는 것이 항상 좋은가?
A: 반드시 그렇지는 않다.
단순 포맷팅이나 빠른 프로토타입 작업처럼 복잡한 추론이 필요 없는 경우에는 Low나 Medium이 더 효율적일 수 있다.
작업 성격에 맞춰 전환하는 것이 합리적이다.


마치며

effort 레벨은 Claude Code에서 가장 단순하면서도 가장 직접적인 효과를 주는 설정이다.

Low·Medium·High 세 단계는 토큰 비용과 응답 품질 사이의 트레이드오프를 명확하게 보여준다.


Claude Code를 만든 사람이 모든 작업에 High를 쓴다는 사실은,
적어도 정확성이 중요한 작업에서는 속도보다 깊이를 우선하는 것이 합리적이라는 신호로 받아들일 수 있다.
자신의 작업 패턴에 맞게 이 설정을 직접 실험해보는 것이 첫걸음이다.


참고자료

반응형