News Feed

엔비디아, 온프레미스 겨냥한 새로운 서버와 AI 소프트웨어 발표

컨텐츠 정보

  • 조회 480

본문

엔비디아는 RTX PRO 6000 블랙웰 서버 에디션 GPU를 발표하며 이전보다 슬림한 디자인을 적용해 중형 온프레미스 데이터센터를 겨냥했다고 밝혔다. 새로운 디자인은 캐나다 밴쿠버에서 열린 SIGGRAPH 컨퍼런스에서 공개됐다.

이번 신제품에서 주목할 점은 RTX PRO 6000 서버가 2U 랙마운트 디자인을 갖췄으며, RTX GPU가 해당 폼팩터로 제공되는 것은 이번이 처음이라는 점이다. 이전에는 4U~8U 디자인으로만 제공됐다.

이를 기반으로 시스코, 델, HPE, 레노버, 슈퍼마이크로 등 엔비디아 파트너가 다양한 구성의 x86 기반 서버에 RTX PRO 6000 블랙웰 GPU 두 대를 탑재해 제공할 예정이다. 예를 들어 델은 델 파워엣지 R7725 2U를 발표했는데, 엔비디아 AI 데이터 플랫폼과 결합된 RTX PRO 6000 GPU 두 대를 탑재했다.

델의 2U 서버는 RTX PRO 서버 라인업의 일부로, 엔비디아 하드웨어를 이용한 AI 가속에 필요한 모든 기능을 제공한다. 이들 서버에는 엔비디아의 블루필드‑3 DPU와 커넥트X‑8 수퍼NIC가 완전 통합돼 탑재됐다. 또한, 데이터 분석, 시뮬레이션, 영상 처리, 그래픽 렌더링 등 기존 CPU 기반 워크로드에도 GPU 가속 성능을 제공한다.

엔비디아는 이번 RTX PRO 서버가 CPU 전용 2U 시스템과 비교해 최대 45배 높은 성능과 18배 높은 에너지 효율을 제공할 것이라고 주장하는데, 이는 GPU 가속의 핵심 목표다. 엔비디아는 온프레미스 CPU 전용 AI 시스템에 맞서 RTX PRO 서버를 통합 기반 솔루션으로 제안하고 있다.

한편, 이번 SIGGRAPH 행사에서는 에이전틱 AI용 LLM 네모트론(Nemotron)의 새로운 모델도 공개됐다. 엔비디아는 AI 에이전트를 더욱 똑똑하게 구축할 수 있도록 향상된 추론 능력을 제공하는 네모트론 나노 2와 라마 네모트론 슈퍼 1.5를 발표했다.

네모트론은 정교한 추론, 명령어 준수, 코딩, 도구 활용 및 멀티모달(텍스트+시각) 이해를 요구하는 작업을 위해 AI 에이전트를 강화하도록 설계된 엔터프라이즈급 개방형 LLM이다. 엔비디아에 따르면, 이들 모델은 과학적 추론, 코딩, 도구 사용, 명령어 준수, 챗 분야에서 동일 크기 범주 내 높은 정확도를 제공한다. 특히, AI 에이전트에 더 깊은 인지 능력을 부여하고, AI 시스템이 선택지를 탐색하고 결정을 저울질하며 정의된 제약 내에서 결과를 도출할 수 있다.

엔비디아는 오픈형, 사용자 정의형 70억 개 매개변수 추론 시각 언어 모델인 코스모스 리즌을 발표했다. VLM은 로봇 및 비전 에이전트가 인간처럼 자신이 본 것을 사고할 수 있게 해준다. 지금까지 로봇은 “보는” 능력은 있었지만, 본 것에 대한 반응은 극히 제한적이었다. VLM은 로봇이 자신의 행동을 사고할 수 있는 능력을 제공한다.

이외에도 엔비디아는 두 가지 새로운 전문가용 GPU인 RTX PRO 4000 소형 폼 팩터와 RTX PRO 2000도 발표했다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.