Frontier labs 01 – 03

OpenAI, GPT-5.5 Instant를 ChatGPT 기본 모델로 — 추론 점수 점프, 응답 30% 단축

OpenAI는 5월 5일 GPT-5.5 Instant를 모든 ChatGPT 사용자에게 순차 배포하며, 기존 GPT-5.3 Instant를 대체해 기본 모델로 올렸다. API에는 chat-latest 별칭으로 동시에 노출된다. AIME 2025 수학 평가에서 81.2점(이전 65.4)을, MMMU-Pro 벤치마크에서 76점(이전 69.2)을 기록해 추론 영역의 성능 격차를 끌어올렸다.

의료·법률·금융 등 고난도 프롬프트에서 환각 주장을 GPT-5.3 Instant 대비 52.5% 줄였고, 동일 질문에 대해 단어 수는 30.2%, 줄 수는 29.2% 줄였다. 톤은 더 실무적·간결하게 조정됐다는 게 OpenAI의 설명이다.

개인화는 새 검색 도구로 작동한다. 모델이 사용자의 과거 대화·업로드 파일·연결된 Gmail을 참조해 답변을 맞춤화하며, 우선 Plus·Pro 웹부터 적용되고 모바일은 곧, 무료·Go·Business·Enterprise는 수 주 내에 풀린다. GPT-5.3 Instant는 유료 사용자에 한해 3개월간 모델 설정에서 선택 가능하다.

왜 중요한가 — '기본 모델 교체'는 분기당 한두 번 있는 이벤트다. 응답을 짧게·정확하게 만드는 방향성과 Gmail까지 끌어오는 개인화는, 기업용 ChatGPT 도입 검토에서 컨텍스트 통합 기준이 다시 설정된다는 신호다.

81.2 AIME 2025 (이전 65.4)
52.5% 환각 주장 감소
30.2% 응답 단어 수 감축
OpenAI

실시간 음성 3종 — GPT-Realtime-2가 추론·번역·전사를 하나의 API로

OpenAI는 5월 7일 Realtime API에 새 음성 모델 3종을 동시에 투입했다. 핵심은 GPT-Realtime-2로, GPT-5급 추론을 갖춘 첫 음성 모델이라는 회사 설명대로 Big Bench Audio에서 96.6%(이전 GPT-Realtime-1.5는 81.4%)를 기록했고, 컨텍스트 윈도우는 32K에서 128K로 늘어 긴 통화나 다중 단계 작업을 지원한다.

두 번째는 GPT-Realtime-Translate로, 70여 개 입력 언어를 13개 출력 언어로 거의 즉시 통역한다. 세 번째 GPT-Realtime-Whisper는 화자가 말하는 동안 스트리밍 방식으로 텍스트를 받아쓴다. 가격은 GPT-Realtime-2가 100만 오디오 입력 토큰당 32달러(캐시 입력은 0.40달러), 출력은 64달러이며, Translate는 분당 0.034달러, Whisper는 분당 0.017달러로 책정됐다.

이번 묶음은 콜센터·실시간 통역·음성 에이전트 같은 프로덕션 워크로드를 겨냥한다. 5월 5일 ChatGPT 기본 모델 교체와 합쳐 보면, OpenAI가 한 주 안에 소비자(Default 모델)와 개발자(API) 양쪽을 동시에 갱신한 셈이다.

왜 중요한가 — 96.6% 점수는 음성 에이전트가 텍스트 LLM의 추론 능력을 뒤늦게 따라잡는 변곡점을 시사한다. 가격 구조도 분 단위로 내려가, 기존 외주 통역·콜봇 RFP의 경제성이 재계산될 것으로 보인다.

OpenAI

AlphaEvolve 1년 — 유전체·전력망·재해예측·양자에서 측정 가능한 개선

구글 딥마인드는 5월 7일 Gemini 기반 코딩 에이전트 AlphaEvolve가 출시 1년간 만든 임팩트를 정량 공개했다. 지난해에는 4×4 복소 행렬 곱셈을 48회의 스칼라 곱셈으로 처리하는 알고리즘을 찾아 56년 만에 슈트라센 알고리즘을 갱신한 게 화제였고, 이번엔 응용 분야에서의 수치가 핵심이다.

유전체에서는 PacBio와 함께 시퀀싱 오류 보정 모델 DeepConsensus를 개선해 변이 검출 오류를 30% 줄였다. 전력망에서는 그래프 신경망 모델의 AC 최적조류계산(AC-OPF) 가용해 도출률이 14%에서 88%로 올라, 사후 보정 비용이 크게 줄었다. 지구과학에서는 산불·홍수·토네이도 등 20개 카테고리의 재해 위험 예측 정확도가 종합 5% 향상됐다.

가장 두드러진 사례는 양자 분야다. AlphaEvolve가 제안한 양자 회로가 구글의 Willow 프로세서에서 기존 최적화 대비 오류를 10배 낮춰, 분자 시뮬레이션 같은 실험에 즉시 투입할 수 있는 수준이 됐다는 게 회사 설명이다.

분야지표변화
유전체 (DeepConsensus)변이 검출 오류-30%
전력망 (AC-OPF)가용해 도출률14% → 88%
재해 예측 (Earth AI)20개 카테고리 정확도+5%
양자 (Willow)회로 오류×10 감소

왜 중요한가 — '코딩 에이전트가 알고리즘을 발견한다'는 시연 단계에서, 측정 가능한 분야별 개선으로 이행한 첫 케이스다. AI가 과학 인프라 자체의 ROI를 끌어올리는 흐름이 가시화됐다.

Google Blog
Korea 04 – 05

업스테이지, 5,600억 조달 — 국민성장펀드 'AI 모델 부문 1호 직접투자' 1,000억 포함

업스테이지는 5월 7일 국민성장펀드의 첨단전략산업기금 1,000억 원을 'AI 모델 부문 1호 직접투자'로 받는 것을 포함, 산업은행·기업은행·우리은행 등 정책금융과 사제파트너스·SK네트웍스·우리벤처파트너스·미래에셋·현대자동차 등 민간을 합쳐 총 5,600억 원 규모의 자금 조달을 발표했다.

김성훈 대표는 미국과 중국이 천문학적 자본을 투입하며 AI 패권 경쟁을 벌이는 상황에서, 이번 투자는 대한민국이 자체 파운데이션 모델로 기술 주권을 확보하겠다는 결단이라고 밝혔다. 자금은 자체 LLM 'Solar' 성능 고도화, AI 인프라 구축, 한국어 특화 데이터 확보에 우선 투입된다.

업스테이지는 같은 시기 포털 '다음' 운영사 인수와 연계해 수억 건 규모의 검색 데이터를 LLM 학습 파이프라인으로 끌어오겠다는 계획을 함께 공개했다. 회사는 'Solar Open'이라는 오픈소스 모델 라인을 별도로 유지해 국내 생태계 활용을 늘리겠다고 덧붙였다.

왜 중요한가 — 국민성장펀드가 AI 파운데이션 모델 회사에 직접투자한 첫 사례다. '소버린 AI' 정책 자금이 컴퓨팅 인프라(국가 AI컴퓨팅센터)에서 모델사 자본금으로 확장되는 첫 신호다.

AI타임스

'AI 데이터센터 특별법' 본회의 통과 — 비수도권 전력평가 면제·인허가 일괄처리

국회는 5월 7일 본회의에서 인공지능 데이터센터 특별법을 의결했다. 더불어민주당 정동영·한민수·황정아·조인철, 국민의힘 김장겸, 조국혁신당 이해민 의원이 각각 발의한 6건의 법안을 과방위(4월 14일)와 법사위(5월 6일)를 거쳐 병합해 처리했다. 시행은 9개월의 유예 기간을 거쳐 2027년 2월부터다.

핵심은 세 가지다. 제18조는 과기정통부에 통합 인허가 창구를 두고 타임아웃제를 도입해 그동안 부처별로 흩어졌던 입지·환경·전력 인허가를 일괄 처리하도록 했다. 제19조는 비수도권 AI데이터센터에 대해 분산에너지 특별법상 전력계통영향평가를 면제해, 호남·동남권 등으로의 분산 입지를 유도한다. 제21조는 승강기·주차장·미술작품 설치 등 일반 시설 기준을 대통령령으로 완화한다.

법안은 또 전문인력 양성(제14조), 해외진출 촉진(제15조), 지역사회 협력(제16조), 전자파 영향 측정 지침 고시(제17조)를 명문화했다. 배경훈 부총리는 AI고속도로 구축을 가속화할 수 있는 핵심 기반이 마련됐다고 평가했다.

왜 중요한가 — 국가 AI컴퓨팅센터(해남 솔라시도)에 이어 민간 AI데이터센터까지 비수도권 입지를 사실상 정책적으로 유도하는 구조가 완성됐다. 27년 2월 시행 전까지 과기정통부의 하위 법령이 전력 배분의 1차 변수가 된다.

AI타임스