IT/과학

#오픈AI

#AI 모델

#벤치마크

#토큰

#GPT 5.5

오픈AI "AI 벤치마크 한계…토큰·비용·시간 고려해야"

logo

뉴스보이

2026.07.03. 15:39

오픈AI "AI 벤치마크 한계…토큰·비용·시간 고려해야"

간단 요약

오픈AI는 AI 모델의 실제 역량과 잠재적 위험을 파악하기 위해 새로운 기준이 필요하다고 밝혔습니다.

현재 벤치마크는 모델이 추론에 투입하는 연산 자원을 반영하지 못하는 한계가 있습니다.

이 기사는 5개 언론사의 보도를 교차 검증하여 작성되었습니다.

오픈AI 노엄 브라운 리서치 부문 부사장은 최신 인공지능(AI) 모델의 성능과 안전성을 정확히 평가하기 위한 새로운 기준이 필요하다고 강조했습니다. 현재의 AI 벤치마크 방식은 모델이 추론에 투입하는 연산 자원을 제대로 반영하지 못한다고 지적했습니다. 이는 AI 모델의 실제 역량과 잠재적 위험을 파악하는 데 한계가 있다는 의미입니다. 브라운 부사장은 지난 3일 서울 강남구 웨스틴 서울 파르나스에서 열린 글로벌 AI 프론티어 심포지엄 2026 기조연설에서 이같이 밝혔습니다. 그는 최첨단 AI 모델은 추론 과정에서 사용하는 연산 자원인 토큰 수, 비용, 시간이 늘어날수록 문제 해결 능력이 함께 개선된다고 설명했습니다. 실제 오픈AI의 GPT 5.5 모델은 기존 벤치마크상 소폭 개선된 것처럼 보였지만, 추론에 투입하는 자원이 증가하면 성능이 크게 향상되는 모습을 보였습니다. 특히 영국 AI 안전 연구소의 사이버 보안 평가에 따르면, GPT 5.5와 같은 첨단 모델은 1억 개의 토큰을 생성한 뒤에도 성능 향상이 지속되었습니다. 브라운 부사장은 AI 성능 평가가 단일 점수 비교에 머물러서는 안 되며, 모델이 답을 내는 데 사용한 토큰 수, 비용, 시간 등 추론 자원을 함께 반영해야 한다고 주장했습니다. 이는 고비용 환경에서 모델의 잠재 역량을 예측하고 안전성을 제대로 판단하기 위함입니다.
이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다.
AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)
소셜데이터 분석
기사 댓글이 많은 언론사를 기준으로 분석했어요
본 기사는 AI 기술을 활용하여 뉴스를 요약/분석한 정보로, 원문 기사의 내용과 일부 차이가 있을 수 있습니다.
제공되는 정보는 투자 및 법률적 조언이 아니며, 이에 따른 책임은 뉴스보이가 지지 않습니다.
appstore logoplaystore logo

고객센터

운영시간 : 평일 오전 10시 ~ 오후 5시

서비스 이용문의 : support@curved-road.com

제휴 문의 : support@curved-road.com

주식회사 커브길에서

footer text logo

대표 : 최재형, 안세현

서울시 서대문구 성산로 512-42, 307호

사업자 등록 번호 : 237-86-03199

전화번호 : 1688-4564

발행인・편집인・청소년보호책임자 : 최재형

제호 : 뉴스보이

등록번호 : 서울 아 56429

등록・발행일자 : 2026-03-10