마이크로소프트, 고급 추론 위한 AI 모델 ‘파이-4’ 공개
컨텐츠 정보
- 조회 854
본문
마이크로소프트가 140억 개의 매개변수를 가진 새로운 AI 모델 ‘파이-4(Phi-4)’를 발표했다. 이 모델은 수학을 포함한 복잡한 추론 작업을 위해 설계됐으며, STEM(science, technology, engineering, and mathematics) 분야의 질문 응답과 고급 문제 해결 능력에서 뛰어난 성능을 보인다. 마이크로소프트는 파이-4가 유사한 모델을 능가하는 성과를 기록했다고 밝혔다.
파이-4는 파이 SLM(small language models)의 일부로, 현재 마이크로소프트 리서치 라이선스 계약에 따라 애저 AI 파운드리(Azure AI Foundry)에서 사용할 수 있다. 허깅 페이스에서도 출시될 예정이다.
LLM인 챗GPT 4나 구글 제미나이 울트라(Google Gemini Ultra)와 같은 모델이 수천억 개의 매개변수를 사용하는 것에 비해 파이-4는 상대적으로 작은 규모다. 마이크로소프트는 블로그를 통해 파이-4의 설계가 정확도 향상을 목표로 한 고도화된 훈련과 데이터 관리에 중점을 두고 있다고 강조했다.
마이크로소프트는 발표에서 “파이-4는 수학 추론 같은 작업에서 비슷한 수준의 모델뿐 아니라 더 큰 모델도 능가한다. 합성 데이터셋, 선별된 오가닉 데이터, 혁신적인 후속 훈련 기법을 결합한 훈련 과정 덕분이다”라고 설명했다.
경쟁 모델과의 비교
파이-4는 다중 에이전트 프롬프트 워크플로와 데이터 기반 혁신을 통합한 새로운 훈련 방식을 활용해 추론 효율성을 높였다. 마이크로소프트는 기술 보고서에서 파이-4가 성능과 크기 사이의 균형을 유지하며 더 큰 모델을 우선시하는 업계 표준에 도전하고 있음을 강조했다. 마이크로소프트 연구팀은 “파이-4의 목표는 작은 모델의 효율성을 탐구하면서도 정확성을 유지하는 데 있다”라고 밝혔다.
파이-4는 오픈AI의 GPT-4o 미니(GPT-4o Mini), 앤트로픽의 클로드 3 하이쿠(Claude 3 Haiku), 구글의 제미나이 1.5 플래시(Gemini 1.5 Flash)와 같은 모델과 직접 경쟁한다. 각각의 모델은 SLM 시장에서 특정 응용 분야를 겨냥해 설계됐다.
예를 들어, GPT-4o 미니는 대규모 컨텍스트 윈도우가 필요한 고객 지원 및 운영 비용을 줄이는 데 중점을 두고 있다. 클로드 3 하이쿠는 복잡한 법률 문서나 비정형 데이터에서 통찰을 도출하고 요약하는 데 강점을 보인다. 제미나이 1.5 플래시는 동영상, 오디오, 방대한 텍스트 데이터셋을 분석하는 데 뛰어난 멀티모달 응용 성능을 제공한다.
기술 보고서에 따르면, 파이-4는 MATH 벤치마크에서 80.4점을 기록하며 문제 해결 및 추론 평가에서 다른 시스템을 능가했다. 따라서 파이-4는 과학적 계산이나 고급 STEM 문제 해결과 같은 정밀도가 요구되는 특정 분야에 적합하다.
책임감 있는 AI 개발에 초점
마이크로소프트는 파이-4에 고급 안전 기능을 통합해 윤리적인 AI 개발에 대한 의지를 강조했다. 이 모델은 애저 AI 콘텐츠 안전(Azure AI Content Safety) 기능을 활용한다. 여기에는 프롬프트 보호, 민감한 자료 감지, 실시간 애플리케이션 모니터링이 포함된다. 마이크로소프트는 이런 기능이 AI 배포 중 발생할 수 있는 적대적 프롬프트 및 데이터 보안 위협 같은 위험을 해결하는 데 도움을 준다고 설명했다.
또한, 파이-4를 호스팅하는 애저 AI 파운드리 플랫폼은 AI 위험을 측정하고 완화할 수 있는 도구를 제공한다. 이 플랫폼을 사용하는 개발자는 내장된 메트릭과 맞춤형 안전 평가를 통해 모델을 평가하고 개선할 수 있다.
더 넓은 의미의 시사점
파이-4의 효율성과 추론 능력은 모델 크기와 성능 간 관계를 재고하도록 만들 수 있다. 이 모델은 과학적 계산에서 기업 자동화에 이르기까지 정밀한 추론이 요구되는 응용 분야를 발전시키는 데 중요한 역할을 할 것으로 기대된다.
마이크로소프트는 파이-4를 통해 AI 제품군을 계속 발전시키는 동시에 강력한 보호 장치를 통해 책임 있는 사용을 촉진하고 있다. 추론과 보안이 중요한 분야에서 이런 접근이 어떻게 수용되는지 업계의 관심이 집중될 전망이다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음





