경제

#엑사원 4.5

#LG AI연구원

#멀티모달 AI

#허깅페이스

LG, "텍스트·이미지 동시 추론" 멀티모달 AI '엑사원 4.5' 공개

logo

뉴스보이

2026.04.09. 10:21

LG, "텍스트·이미지 동시 추론" 멀티모달 AI '엑사원 4.5' 공개

간단 요약

엑사원 4.5는 계약서, 기술 도면 등 산업 현장 복합 문서를 정확히 이해하고 추론합니다.

경쟁 모델을 앞선 STEM 성능을 보이며, 허깅페이스에 연구·학술 목적으로 공개했습니다.

이 기사는 18개 언론사의 보도를 교차 검증하여 작성되었습니다.

LG AI연구원은 9일 텍스트와 이미지를 동시에 이해하고 추론하는 멀티모달 AI 모델 ‘엑사원 4.5’를 공개했습니다. 엑사원 4.5는 자체 개발한 비전 인코더와 거대언어모델(LLM)을 통합한 비전 언어 모델(VLM)입니다. 이 모델은 계약서, 기술 도면 등 산업 현장의 복합 문서를 정확하게 읽고 추론하는 능력에 강점을 보입니다. LG AI연구원은 엑사원 4.5가 STEM 성능 5개 지표에서 평균 77.3점을 기록하여 경쟁 모델들을 앞섰다고 밝혔습니다. 엑사원 4.5는 330억 개 파라미터 규모로 K 엑사원보다 작지만, 텍스트 이해 및 추론 영역에서 동등한 성능을 달성했습니다. LG AI연구원은 엑사원 4.5를 글로벌 오픈소스 플랫폼 허깅페이스에 연구·학술·교육 목적으로 공개했습니다. 이진식 LG AI연구원 엑사원랩장은 엑사원 4.5가 LG AI의 멀티모달 시대 진입을 보여주는 모델이라고 설명했습니다. LG AI연구원은 엑사원을 한국의 역사와 문화, 사회적 맥락까지 깊이 이해하는 AI로 발전시키기 위해 노력하고 있습니다.
이 콘텐츠는 뉴스보이의 AI 저널리즘 엔진으로 생성 되었으며, 중립성과 사실성을 준수합니다.
AI가 작성한 초안을 바탕으로 뉴스보이 에디터들이 최종검수하였습니다. (오류신고 : support@curved-road.com)
소셜데이터 분석
기사 댓글이 많은 언론사를 기준으로 분석했어요
전자신문
1개의 댓글
best 1
2026.4.9 01:30
소버린 AI, AI주권의 선봉!
thumb-up
0
thumb-down
0
본 기사는 AI 기술을 활용하여 뉴스를 요약/분석한 정보로, 원문 기사의 내용과 일부 차이가 있을 수 있습니다.
제공되는 정보는 투자 및 법률적 조언이 아니며, 이에 따른 책임은 뉴스보이가 지지 않습니다.
appstore logoplaystore logo

고객센터

운영시간 : 평일 오전 10시 ~ 오후 5시

서비스 이용문의 : support@curved-road.com

제휴 문의 : support@curved-road.com

주식회사 커브길에서

footer text logo

대표 : 최재형, 안세현

서울시 서대문구 성산로 512-42, 307호

사업자 등록 번호 : 237-86-03199

전화번호 : 1688-4564

발행인・편집인・청소년보호책임자 : 최재형

제호 : 뉴스보이

등록번호 : 서울 아 56429

등록・발행일자 : 2026-03-10