반응형 전체 글109 같은 AI를 써도 결과가 160배 다른 이유 — AI는 덧셈이 아니라 곱셈이다 Motion 개발자 Matt Perry가 1분기에 160개의 프로그램을 완성한 것은 AI 덕분이 아니다문제 제기: AI를 쓰면 누구나 Matt Perry처럼 될 수 있는가2026년 초부터 반복되는 주장이 있다."AI가 개발자를 대체한다.""코딩을 배울 필요가 없다.""AI에게 시키면 된다." 이 주장을 뒷받침하는 사례로 자주 인용되는 것 중 하나가바로 Motion 개발자 Matt Perry 같은 사람의 이야기다.그는 2026년 1분기에 목표였던 깃허브 이슈 60개를 넘어 160개를 닫았다. 이런 식의 이야기를 들으면 자연스럽게 이런 결론이 나온다."AI가 대단하다." 그러나 Josh Comeau는 완전히 반대 방향의 결론을 내린다.핵심은 AI가 아니라 Matt Perry에 있다는 것이다.공감: AI가 .. 2026. 6. 13. 순차적으로 하면 10분, 병렬로 하면 90초 — 에이전트 속도를 10배 높이는 프롬프트 설계 병렬 도구 호출·서브에이전트 오케스트레이션 Anthropic 공식 가이드문제 제기: 에이전트가 파일을 하나씩 읽고 있다에이전트를 써보면 이런 상황이 있다.10개 파일을 분석해달라고 했는데 하나씩 순서대로 읽는다.3개의 API를 동시에 호출할 수 있는데 하나씩 기다린다. 이것이 왜 문제인가.파일 하나 읽는 데 1초라면, 10개를 순차로 읽으면 10초, 병렬로 읽으면 1초다.복잡한 리서치 작업에서 이 차이는 수분 단위가 된다. Anthropic 공식 문서에 따르면Claude 최신 모델들은 병렬 도구 실행을 뛰어나게 잘 한다. 다만 최적화하려면 프롬프트 설정이 필요하다.공감: "병렬로 해줘"라고 말해도 잘 안 된다단순히 "병렬로 실행해줘"라고 지시하면 잘 작동하지 않는 경우가 있다.Claude가 어떤 작업을 .. 2026. 6. 12. Anthropic이 공식으로 밝힌 프롬프트 품질을 3배 높이는 5가지 기법 - 실전 예제 포함 XML 태그·역할 부여·예시·명확성·컨텍스트 — 더 이상 감으로 쓰지 않아도 된다문제 제기: 프롬프트를 열심히 썼는데 왜 결과가 다를까두 개발자가 Claude API를 쓴다.한 명은 "이 코드 리뷰해줘"라고 하고,다른 한 명은 역할을 부여하고 XML로 구조화하고 예시를 3개 넣는다.결과는 완전히 다르다. 프롬프트 엔지니어링이 "감"의 영역처럼 느껴지는 이유가 있다.어떤 기법이 왜 효과가 있는지,얼마나 넣어야 하는지에 대한 명확한 기준이 없기 때문이다.이러한 막막함을 풀어주고자 Anthropic이 공식 가이드를 통해 다섯 가지 가이드를 제시하였다.공감: 예시를 넣었는데 오히려 이상해진다예시를 넣으면 좋다고 해서 10개를 넣었더니Claude가 예시의 패턴을 과도하게 따라가 실제 작업에서 이상한 결과가 나왔다.. 2026. 6. 10. 인코더를 없앴더니 성능은 올라가고 메모리는 절반이 됐다 — Gemma 4 12B 아키텍처의 진짜 의미 이미지·오디오를 직접 처리하는 방식이 왜 기존 구조보다 훨씬 나은가문제 제기: 멀티모달 모델이 무거운 근본 원인은 아키텍처에 있었다"왜 멀티모달 모델은 이렇게 무거운가?" 이 질문의 답은 아키텍처에 있다. 기존 멀티모달 AI 모델의 구조를 따라가 보자.이미지 입력 → 비전 인코더 (CLIP, ViT 등 — 별도 모델) → 프로젝션 레이어 (인코더 출력을 LLM 차원으로 변환) → LLM 백본 → 텍스트 출력오디오 입력 → 오디오 인코더 (Whisper 등 — 또 다른 별도 모델) → 프로젝션 레이어 → LLM 백본 → 텍스트 출력 이 구조에서 메모리는 세 층에서 동시에 잡는다.비전 인코더 파라미터,오디오 인코더 파라미터,LLM 백본 파라미터.그리고 각 단계를 거칠 때마다 지연시간이 누적된다.. 2026. 6. 8. 클라우드 없이도 된다 — Gemma 4 12B, 16GB 노트북에서 돌아가는 멀티모달 AI의 실체 이미지·오디오를 별도 인코더 없이 처리하면서 26B 모델 성능에 근접한 12B의 등장문제 제기: 멀티모달 AI를 쓰려면 항상 클라우드가 필요했다이미지와 오디오를 동시에 처리하는 AI를 쓰려면 지금까지 선택지가 제한적이었다.Claude API를 호출하거나,GPT-4o를 사용하거나,Google Cloud에 올리거나.모두 외부 서버가 필요했다.왜인가?멀티모달 모델은 구조적으로 무겁기 때문이다.이미지를 처리하는 비전 인코더,오디오를 처리하는 오디오 인코더,그것을 언어 모델과 연결하는 레이어까지 쌓이면메모리 요구량이 급격히 올라간다.16GB RAM 노트북에서 돌리기에는 너무 크다.그러나 Google이 Gemma 4 12B를 발표하면서 이 구조적 제약은 사라지게 되었다. Gemma 4 12B, 16GB 노트북에서 .. 2026. 6. 6. '이거 전체 다 해줘' — AI에게 큰 작업을 통째로 맡기는 사람들의 비밀 한 줄씩 지시하던 사람이 병렬 3개 세션으로 바뀌는 Anthropic 엔지니어의 위임 전략큰 작업 위임 병렬 세션 검증 구조 설계문제 제기: AI에게 "이거 전체 다 해줘"가 왜 안 되는가"이 평가 세트 전체를 격리된 컨테이너에서 빌드하고,테스트 돌리고,결과 분석하고,리포트 만들어서 슬랙으로 보내줘."이런 요청을 AI에게 해봤는가? 대부분은 중간에 막힌다.AI가 방향을 잃거나, 에러가 쌓이면서 흐려지거나,내가 결국 개입해서 다시 처음부터 설명해야 하는 상황이 된다. 그래서 많은 사람이 AI를 한 줄씩 지시하는 방식으로 쓴다.안전하지만 느리다. AI의 진짜 능력을 10분의 1도 못 쓰는 것이다. 오늘은 Anthropic의 Technical Staff인 Eugene Yan의 해결책을 통해AI를 진짜 능력을 .. 2026. 6. 4. 이전 1 2 3 4 ··· 19 다음 반응형