챗 GPT 다운로드 추월한 딥시크, 비용 절감과 오픈소스가 특징
컨텐츠 정보
- 조회 725
본문
중국 신생업체 딥시크의 훈련 및 생성형 AI 모델 기술은 새로운 AI 기업의 진입 장벽을 낮춰 전체 산업을 민주화할 수 있다.
딥시크의 챗봇이 애플과 구글 앱스토어에서 챗GPT 다운로드 수를 추월하면서 딥시크는 이번 주에 큰 파장을 일으켰다. 오픈소스인 딥시크의 영향력은 컴퓨팅 및 메모리 자원을 더 효율적으로 사용하고 미국의 선도적 모델의 성능을 훨씬 낮은 비용으로 구현할 수 있다는 데 있다.
딥시크는 ‘중국의 챗GPT’ 그 이상이다. 포레스터 리서치에 따르면, 딥시크는 모델 구축을 더 저렴하고, 더 빠르고, 더 쉽게 만들어 글로벌 AI의 발전을 위한 중요한 발걸음을 내디뎠다. 대형 언어 모델(LLM)이 고급 AI로 가는 유일한 길은 아니지만, 딥시크의 혁신은 “AI 발전의 이정표로 기념되어야 한다”고 포레스터 리서치는 말했다.
딥시크의 AI 방법론의 효율성은 실행에 필요한 컴퓨팅 용량을 크게 줄임을 의미한다. 대규모 데이터센터를 구축하는 기업이 GPU와 AI 가속기 하드웨어를 대량 구매하는 추세를 타고 있는 칩 산업에도 영향을 미칠 수 있음을 의미한다.
예를 들어, 메타는 맨해튼만큼 큰 면적을 차지하는 데이터센터를 구축하는 데 650억 달러를 지출할 계획이다. 올해 말에 온라인으로 전환될 것으로 예상되는 이 데이터센터는 페이스북과 다른 메타 벤처 업체가 사용하는 AI 기술에 전력을 공급하기 위해 130만 개의 GPU를 수용할 것이다.
가트너 리서치의 분석 담당 부사장 리타 살람은 “현재 선도적인 업체의 비용과 그로 인한 가격 책정 모델은 혁신과 LLM 개발, 훈련, 운영에 드는 높은 비용을 전가하고 있으며, 그 결과 가장 큰 규모의 자금력을 갖춘 기업만이 LLM을 개발할 수 있게 되었다”라고 말했다.
살람은 높은 비용 때문에 생성형 AI의 도입이 어려워져, 많은 조직의 대규모 사용례에 대한 투자 수익률이 마이너스로 돌아섰다고 지적했다. 그 결과, 업체 보조금 지원이 있더라도 혁신이 저해되고 있다. 또한, 딥시크의 접근 방식은 하드웨어와 계산 비용을 절감해 소규모 회사가 LLM 개발 분야에서 경쟁하고 새로운 생성형 AI 혁신을 추진할 수 있도록 지원한다고 말했다.
딥시크의 기술이 알려지면서, 리더를 포함한 다른 모델 빌더가 빠르게 뒤를 이을 것이고, 단기 및 중기적으로 LLM 비용을 절감할 수 있을 것이다. 그러나 강력한 프로세서와 가속기는 여전히 고급 모델의 높은 R&D 및 컴퓨팅 비용을 유발할 것이며, 이 비용은 얼리 어답터에게 전가될 것이다. 살람은 초기 비용 절감으로 더 광범위한 생성형 AI 채택과 혁신이 촉발할 것이라고 내다봤다.
뉴저지에 있는 스티븐스 공과대학의 교수이자 AI 전문가인 브렌던 잉글롯딜 딥시크의 모델이 오픈소스라는 사실도 다른 AI 스타트업이 대기업과 경쟁하는 데 도움이 될 것이라고 말했다. 딥시크의 기술은 오픈소스 소프트웨어의 도움으로 파괴적이고 혁신적인 새로운 도구를 더 빨리 구축할 수 있는 방법을 보여주는 훌륭한 예라고 스티븐스 인공지능 연구소(SIAI)의 디렉터이기도 한 잉글롯은 말했다.
딥시크의 등장으로 GPU를 선도하는 공급업체인 엔비디아의 주가가 폭락했다. 투자자들이 더 효율적인 프로세스가 AI 프로세서와 가속기 판매에 미칠 영향을 깨달았기 때문이다.
딥시크 AI 챗봇의 기능인 ‘딥싱크’는 R1 모델을 활용해 향상된 추론 기능을 제공하며, 고급 기술을 사용해 복잡한 쿼리를 관리하기 쉬운 작은 작업으로 분해한다.
이러한 최적화 덕분에 딥싱크(R1)의 훈련 비용은 약 550만 달러에 불과해 유사한 모델보다 수천만 달러나 저렴하다. 포레스터 리서치는 엔비디아의 단기 수요가 줄어들 수 있지만, 비용이 낮아지면 더 많은 신생업체와 대기업이 모델을 만들게 되어 장기적으로 수요가 증가할 것이라고 말했다.
포레스터는 딥씽크로 AI 모델 훈련 비용이 크게 감소했지만, 추론 지원 비용은 여전히 상당한 컴퓨팅 및 스토리지를 필요로 할 것이라고 내다봤다. 포레스터는 연구 노트에서 “이러한 변화는 핵심 AI 모델 업체만으로는 충분하지 않다는 것을 보여 주며, AI 시장을 더욱 개방할 것”이라고 말했다. 또한 아직 엔비디아와 하이퍼스케일러의 하락을 의미하지는 않으며 인텔이 다시 관련성을 회복할 수 있는 기회가 있을 것이라고 예측했다.
잉글롯은 현재 유용한 인공지능 소프트웨어와 하드웨어를 생산하기 위한 경쟁과 투자가 활발하게 이루어지고 있으며 “가까운 미래에 더 많은 돌파구가 마련될 것”이라고 말며 동의했다.
딥시크의 기반 기술은 선구적인 것이 아니다. 오히려, 최근에 발표된 이 회사의 연구 논문에 따르면 메타의 라마와 알리바바의 콴 모델이 딥시크-R1과 딥시크-R1-제로(딥시크의 첫 두 모델) 개발의 핵심이었다.
사실, 잉글롯은 딥시크의 발전이 이번 주 주가 하락이 시사하는 것만큼 반도체 산업에 큰 위협이 된다고 생각하지 않다. 생성형 AI 도구는 여전히 GPU에 의존할 것이고, 딥시크의 돌파구는 일부 컴퓨팅 작업이 더 효율적으로 수행될 수 있다는 것을 보여줄 뿐이다.
잉글롯은 AI 기술의 모든 개발자가 활용할 수 있는 좋은 소식이라며 ”강력한 언어 모델을 훈련하고 배포하는 데 필요한 컴퓨팅 하드웨어가 당초 예상보다 적다는 것이 알려졌다. 이를 통해 AI 혁신가는 멀티모달 AI와 챗봇을 넘어선 고급 응용 프로그램에 필요한 리소스에 더 많은 관심을 기울일 수 있다.”
신생업체 코포라.ai(Corpora.ai)의 CEO 멜 모리스는 딥시크의 경제성과 오픈소스 모델 덕분에 개발자들이 저렴하고 자유롭게 커스터마이징하고 혁신할 수 있게 되었다고 말했다. 또한, 딥시크는 경쟁 구도에 도전장을 내밀고 챗GPT의 개발자인 오픈AI와 같은 주요 업체가 빠르게 적응하도록 만들 것이라고 말했다.
모리스는 “경쟁이 혁신을 촉진하는 전형적인 사례다. 딥시크의 존재는 AI 기술의 더 빠른 발전을 촉진해 증가하는 수요를 충족하는 더 효율적이고 접근 가능한 솔루션으로 이어질 가능성이 높기 때문”이라고 말했다. 오픈소스 모델은 개발자가 시스템을 미세 조정하고 실험할 수 있도록 지원해 더 큰 유연성과 혁신을 촉진한다.
포레스터는 딥시크의 개인정보 보호정책에 따르면, 딥시크가 “사용자의 텍스트 또는 오디오 입력, 프롬프트, 업로드된 파일, 피드백, 채팅 기록 또는 기타 콘텐츠”를 수집할 수 있으며, 훈련 목적으로 사용할 수 있다고 명시하고 있다고 경고했다. 또한, 딥시크는 이 정보를 법 집행 기관 및 공공 기관과 재량에 따라 공유할 수 있다고 명시하고 있다.
이러한 주의 사항은 생성형 AI 도구를 서둘러 도입했지만, 특히 민감한 기업 정보가 포함된 경우 데이터 프라이버시에 대해 우려하는 기업에 문제가 될 수 있다.
포레스터는 “이 기술을 사용하고 개인 및 회사 정보를 입력할 때의 결과에 대해 직원에게 교육하고 알려야 한다”라고 말했다. 또한 개발자가 이 기술을 실험해야 하는지, 그리고 제품이 더 엄격한 개인 정보 보호 요구 사항 없이 기술 구현을 지원해야 하는지에 대해 제품 리더와 합의해야 한다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






