OpenAI, 'Trusted Access for Cyber' 3단계 — GPT-5.5-Cyber로 보안 거부율 낮춘다
OpenAI는 5월 7일 검증된 보안 연구·방어 인력에게 GPT-5.5와 그 변형 모델 GPT-5.5-Cyber의 권한을 풀어주는 'Trusted Access for Cyber' 프로그램을 공개했다. 일반 모델(표준 거부율) → 중간 등급(완화된 필터, 방어 전용) → GPT-5.5-Cyber(최소 제한)의 3단계 접근 체계로, 가장 권한이 높은 GPT-5.5-Cyber는 취약점 식별·트리아지, 멀웨어 분석, 바이너리 리버스 엔지니어링, 디텍션 엔지니어링, 패치 검증까지 허용된다. 단 자격 증명 탈취·은닉·지속화·외부 시스템 침투처럼 공격 색이 짙은 워크플로우는 차단을 유지한다.
론칭 파트너는 7개사로 전 세계 보안 1군이 모였다. CrowdStrike·SentinelOne(엔드포인트), Palo Alto Networks·Cisco(네트워크·SOC), Cloudflare(엣지), Snyk(소프트웨어 공급망), Intel(하드웨어 보안)이 조합돼 있다. 개별 사용자 단위로 Trusted Access를 받는 연구자는 2026년 6월 1일부터 피싱 저항형 인증(Advanced Account Security) 활성화가 의무
라는 게 OpenAI의 공지다.
벤치마크는 영국 AI Safety Institute(AISI)가 작성했다. 32단계로 구성된 기업망 모의 침투 시나리오에서 GPT-5.5는 10회 중 2회 전 단계를 완주했고, Anthropic의 동급 모델 Mythos는 10회 중 3회 완주했다. 개별 전문가 과제에서는 GPT-5.5가 약간 우세였다는 게 AISI의 평가다. Anthropic Mythos는 'Project Glasswing'이라는 자체 트러스트 프로그램으로 약 40개 조직만 접근하는 폐쇄형이라, OpenAI 쪽이 파트너 폭에서 한 차원 넓힌 셈이다.
OpenAI는 이번 첫 프리뷰가 GPT-5.5 대비 사이버 능력을 비약적으로 끌어올린 모델은 아니며, 사용 권한을 보안 워크플로우 쪽으로 더 넓혀준 모델
이라고 명시했다. 모델 자체보다 '검증·등급·인증'이라는 운용 프레임이 핵심이라는 의미다.
왜 중요한가 — 거부율을 낮춘 보안 전용 LLM은 그동안 '미러 코인' 문제(공격에도 그대로 쓰일 수 있다)로 막혀 있었다. OpenAI가 7개 보안업체와 묶어 등급제로 풀면서, 사이버 방어용 LLM 시장의 표준 운영 모델이 사실상 정해졌다. 안트로픽이 Mythos 액세스를 어디까지 풀지가 다음 변수다.