본문 바로가기
반응형

전체 글118

AI에게 정답을 물으면 안 된다 — 프롬프트 엔지니어링을 넘어 '프로세스 엔지니어링'이 중요해지는 이유 핵심 요약노스웨스턴대 브라이언 우지 교수의 연구에서 AI와 인간의 창의성 테스트 점수는 유사했지만, AI는 과제에 접근하는 더 나은 방법을 제시했다. (출처: 월스트리트저널, 2026)AI의 더 나은 방법은 10개의 개별 단어를 바로 생각하는 대신, 매우 다른 10개의 범주를 먼저 정하고 그 안에 단어를 채우는 방식이었다.우지 교수는 "AI를 창의적 파트너로 활용하려면 정답을 묻지 말고 정답에 도달하는 방법을 생각해 내도록 요청해야 한다"고 말했다.메드비 창업자 매튜 갤러거의 성공 사례도 AI에게 답을 구하기보다 AI를 적재적소에 배치하고 조율하는 능력에서 나왔다는 분석이 이를 뒷받침한다.목차문제 제기 — AI에게 정답만 묻는 사용법의 한계우지 교수의 창의성 실험 설계점수는 같았지만 방법은 달랐다"범주를.. 2026. 7. 4.
모든 작업에 'High'만 쓰는 이유, effort 레벨이 말 안 하는 비밀 - Claude Code의 Low,Medium,High 설정으로 토큰과 지능 조절하기 Boris Cherny가 모든 작업에 'High'만 쓰는 이유, effort 레벨이 말 안 하는 비밀핵심 요약Claude Code는 /model 명령으로 Low·Medium·High 3단계 effort 레벨을 선택할 수 있다. (출처: Boris Cherny X, 2026.02)Low는 토큰 사용량이 적고 응답 속도가 빠르며, High는 토큰 사용량이 많지만 더 높은 지능 수준을 제공한다.Claude Code 창시자 Boris Cherny는 모든 작업에 High를 사용한다고 공개했다.effort 레벨은 단순 설정이 아니라 비용과 응답 품질 사이의 트레이드오프를 직접 조절하는 핵심 레버다.목차문제 제기 — Claude Code 응답이 가끔 너무 단순하다면effort 레벨 3단계의 정확한 차이Boris Ch.. 2026. 7. 1.
Claude Code 창시자가 말하는 프롬프트 레벨업 실전 팁 4가지 - '고쳐줘' 대신 써야 할 진짜 지시문들 핵심 요약Claude Code 창시자 Boris Cherny는 "이 변경사항을 엄격히 검토하고, 내가 테스트를 통과할 때까지 PR 만들지 마"라는 지시로 Claude를 리뷰어로 활용한다고 공개했다. (출처: Boris Cherny X, 2026.02)"이게 작동한다는 걸 증명해봐"라는 요청으로 main 브랜치와 feature 브랜치 간 동작 차이를 diff하도록 시킨다.평균적인 수정 결과가 나오면 "지금까지 알게 된 모든 것을 바탕으로 이걸 버리고 우아한 솔루션을 구현해"라고 재요청한다.Claude가 더 많은 연산을 투입하길 원할 때는 요청에 "use subagents"라는 문구를 추가하면 메인 에이전트의 컨텍스트가 깔끔하게 유지된다.목차문제 제기 — "고쳐줘"로만 지시하고 있다면팁 1: Claude를 .. 2026. 6. 28.
CLAUDE.md에 이 한 문장을 안 넣으면 같은 실수를 계속 반복하게 된다 Claude Code 창시자가 공개한 CLAUDE.md 지속 투자법과 Skill 만들기핵심 요약Claude Code 창시자 Boris Cherny는 매번 수정할 때마다 "CLAUDE.md를 업데이트해서 같은 실수를 반복하지 않도록 해라"라고 지시한다고 공개했다. (출처: Boris Cherny X, 2026.02)Claude는 스스로 지켜야 할 규칙을 매우 잘 문서화하는 특성이 있어, 이 한 문장만으로도 효과적인 자기 개선이 이뤄진다.한 엔지니어는 모든 작업·프로젝트에 대해 notes 디렉토리를 유지하고 PR마다 업데이트하도록 지시한 뒤, CLAUDE.md가 이를 참조하도록 설정했다.하루에 한 번 이상 반복하는 작업은 Skill 또는 Slash Command로 만들어 git에 커밋하는 것이 클로드 코드 .. 2026. 6. 26.
세계 4위 AI LLM 모델 - 중국 오픈소스 모델 최초로 지능 지수 50점을 넘은 GLM-5.2 완전 분석 11점 올랐을 뿐인데 세계 4위가 됐다 — GLM-5.2가 보여준 오픈소스의 진짜 실력핵심 요약GLM-5.2는 Artificial Analysis 지능 지수 v4.1에서 51점을 기록하며 세계 4위에 올랐다. (출처: Artificial Analysis, 2026.06.17)1위 Claude Fable 5(60점), 2위 Claude Opus 4.8(56점), 3위 GPT-5.5(55점)에 이은 4위이며, 오픈웨이트 모델 중에서는 1위다.매개변수 구조(총 7,440억·활성 400억개)를 그대로 유지한 채 지능 지수만 11점 끌어올렸다.중국 오픈소스 경쟁 모델인 MiniMax-M3(44점), DeepSeek V4 Pro(44점), Kimi K2.6(43점)을 모두 앞섰다.목차문제 제기 — 오픈소스는 항상 .. 2026. 6. 24.
effort 파라미터를 잘못 쓰고 있는 이유 - max~low 5단계 실전 선택 기준 토큰을 10배 쓰는데 답변이 나빠진다 — Anthropic 공식 가이드로 정리한 max~low 5단계 실전 선택 기준문제 제기: effort를 높이면 항상 좋아질 것이라는 착각Claude API를 쓰는 개발자들이 자주 하는 실수가 있다."성능을 최대화하려면 effort를 max로 설정하면 된다"는 생각이다.Anthropic 공식 문서는 이것을 명확하게 경고한다.**max 설정은 일부 use case에서 성능을 높이지만token 사용량이 증가해도 수익이 감소하는 지점이 있으며,과도한 thinking에 빠질 수 있다.단순한 질문에 max effort를 설정하면모델이 불필요하게 길게 생각하고,토큰을 10배 쓰면서 오히려 답변이 이상해지는 경우가 생긴다. effort는 지능 vs 토큰 비용의 트레이드오프를 조절.. 2026. 6. 22.
반응형