반응형 GPT-Realtime-Translate1 GPT-Realtime-2 완전 분석 — 음성 AI가 드디어 생각하기 시작했다 GPT-5급 추론·128K 컨텍스트·병렬 도구 호출 — 2026년 5월 7일 출시된 3가지 실시간 음성 모델1. 2026년 5월 7일, 음성 AI의 패러다임이 바뀐 날2026년 5월 7일, OpenAI가 Realtime API를 통해 3개의 새로운 음성 모델을 동시에 출시하였다. 이날은 단순한 신모델 공개가 아니었다.음성 AI의 아키텍처 패러다임이 바뀐 날이었다. 이전까지 모든 음성 AI 시스템의 동작 방식은 동일하였다.사용자가 말한다음성을 텍스트로 변환한다텍스트를 LLM이 처리한다 다시 음성으로 변환한다.이 4단계 파이프라인에서 각 단계는독립적인 지연시간을 만들고,중간에 컨텍스트가 손실되며,"생각하는 동안 침묵"이 발생하였다.GPT-Realtime-2는 이 구조를 하나의 연속 스트림으로 대체한다. 오디.. 2026. 5. 10. 이전 1 다음 반응형