KT가 고려대학교와 공동 개발한 한국 문화 특화 인공지능(AI) 안전성 평가 벤치마크 'KSAFE MM'을 16일 공개했습니다. 국내 최대 규모의 한국어 기반 멀티모달 안전성 평가 데이터셋으로, 한국 사회와 문화적 맥락을 반영한 AI 안전성 평가 체계입니다.
KSAFE MM은 텍스트, 이미지, 음성 등 다양한 정보를 처리하는 멀티모달 대형언어모델(MLLM)의 안전성을 평가하도록 설계되었습니다. 전세 사기, 독도 분쟁 등 국내 고유 이슈를 반영한 'KSAFE MM C'와 글로벌 공통 위험 요소를 한국 문화 맥락으로 바꾼 'KSAFE MM G'로 구성되며, 총 1만4135개의 평가 샘플을 포함합니다.
KT와 고려대 연구진은 민감 주제 수집부터 질문 생성, 합성 이미지 생성, 탈옥 쿼리 생성까지 4단계 자동화 파이프라인을 구현했습니다. 이를 통해 기존 수동 검수 방식보다 구축 효율을 높였으며, 구글 젬마와 네이버 하이퍼클로바X 등 12개 글로벌 멀티모달 모델의 안전성을 검증했습니다.
이번 벤치마크는 AI 서비스 출시 전 안전성 검증, 레드팀 테스트, 가드레일 모델 평가 등에 활용될 것으로 기대됩니다. 박재형 KT AX미래기술원 Frontier AI Lab장 상무는 KSAFE MM이 한국어 및 한국 문화 환경에서 AI 안전성을 평가하는 대표 기준으로 자리 잡기를 기대한다고 밝혔습니다.
이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다.
AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)
• 이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다.
• AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)