IT/과학
5위
MS, 음성·이미지 AI 모델 출시…"최첨단 AI 자립 이룰 것"
뉴스보이
2026.04.03. 07:24
뉴스보이
2026.04.03. 07:24

간단 요약
간단 요약
음성 전사, 음성 생성, 이미지 생성 특화 AI 모델 3종을 개발자용으로 공개했습니다.
MAI 트랜스크라이브 1은 25개 언어 인식과 낮은 오류율을 보이며, MAI 보이스 1은 맞춤형 음성 생성이 가능합니다.
이 기사는 5개 언론사의 보도를 교차 검증하여 작성되었습니다.
이 기사는 5개 언론사의 보도를 교차 검증하여 작성되었습니다.
마이크로소프트(MS)가 음성 전사, 음성 생성, 이미지 생성 특화 인공지능(AI) 모델 3종을 개발자용으로 공개했습니다.
사티아 나델라 MS 최고경영자(CEO)는 2일(현지시간) 링크트인을 통해 음성 전사 모델 MAI 트랜스크라이브 1, 음성 생성 모델 MAI 보이스 1, 이미지 생성 모델 MAI 이미지 2를 소개했습니다.
MAI 트랜스크라이브 1은 영어와 한국어를 포함한 25개 언어를 인식하며, 업계 표준 성능지표인 플뢰르에서 가장 낮은 오류율을 보였습니다. MAI 보이스 1은 몇 초 길이의 음성 데이터만으로 맞춤형 음성을 생성하며, MAI 이미지 2는 높은 성능과 가격 대비 성능비를 강점으로 내세웠습니다.
MS는 딥마인드 공동창업자 출신인 무스타파 술레이만 MAI 부문 CEO에게 초지능 연구·개발을 맡겼습니다. 술레이만 CEO는 블룸버그 통신에 2027년까지 최고 수준의 기술에 도달하는 것이 목표라고 밝혔습니다.
이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다. AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)
• 이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다.
• AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)