News Feed

딥시크가 일깨운 2가지 교훈

컨텐츠 정보

  • 조회 785

본문

지난 2주 동안 딥시크(DeepSeek)는 LLM을 확장하는 훨씬 더 효율적인 방법을 도입함으로써 생성형 AI에 대한 실리콘밸리의 기존 인식을 뒤흔들었다. 엔비디아 GPU를 대량 구매할 수십억 달러의 벤처 자금이 없었던 딥시크는 제한된 자원 속에서 해결책을 찾아야 했다. 리플렉시비티(Reflexivity) 사장 주세페 세테는 “딥시크는 각 쿼리마다 가장 관련성 높은 부분만 활성화하는 방식을 익혔다”라고 설명했다.

얼마 지나지 않아, 업체들은 딥시크의 성과를 자신들의 입장에서 해석하기 시작했다. 폐쇄형 모델을 개발하는 업체는 데이터 도용 문제에 대해 불만을 토로했다. (하지만 정작 이런 업체들도 자신들의 훈련 데이터 상당 부분을 외부에서 가져왔다는 점에서 아이러니한 지적이다.) 반면, 오픈소스 제공자들은 딥시크를 오픈소스의 우월성이 입증된 사례로 받아들였다. (하지만 오픈소스와 기술 분야의 성공 사이에는 상관관계가 없다.)

이런 확증 편향 속에서 2가지 중요한 사실이 간과됐다. 하나는 긍정적인 것이고, 다른 하나는 부정적인 것이다.

첫째, AI는 더 이상 억만장자 클럽의 전유물이 아니다. 딥시크가 AI를 완전히 민주화한 것은 아니지만, AI 개발에 진입하려면 반드시 수천억 원 규모의 초기 투자 자금이 필요하다는 기존 인식을 깨뜨렸다. 둘째, AI에 대한 개방적인 접근 방식이 반드시 성공하리라는 보장은 없지만, 오픈AI의 극도로 폐쇄적인 전략은 고객 중심적이지 않기 때문에 결국 실패할 가능성이 높다는 점이 분명해졌다. AI 시장에서의 승패는 개방과 폐쇄의 문제가 아니라 고객 신뢰의 문제다.

오픈AI의 극단적인 ‘테크노 봉건주의’

딥시크의 접근 방식이 재무적으로 어떤 영향을 미칠지에 대해서는 덧붙일 말이 없다. 하지만 딥러닝.AI(DeepLearning.AI) 창립자 앤드류 응이 지적했듯이 LLM의 토큰 가격이 빠르게 하락하고 있으며, 공개 가중치가 이런 추세를 가속화해 개발자에게 더 많은 선택지를 제공하고 있다는 점은 분명하다. 딥시크는 컴퓨팅 및 메모리 활용 최적화를 통해 이 흐름을 한 단계 더 발전시켰다. 오픈AI의 o1 모델은 100만 개의 출력 토큰당 60달러가 소요되지만, 딥시크 R1은 단 2.19달러에 불과하다. 응은 “AI 비용이 저렴해지면 인류 그리고 개발자는 AI를 더 많이 활용하게 될 것”이라고 전망했다.

하지만 그렇다면, 누가 이 AI 기반 지능을 활용할 도구를 만들 것인가? 여기서부터가 흥미로운 지점이다.

오픈AI와 기타 LLM 개발사가 훈련 데이터 도용 문제를 서로 비난하는 광경은 흥미롭다. 특히 이들 기업이 자신들의 모델을 훈련하는 데 엄청난 양의 타인의 데이터를 ‘차용’해 왔다는 점을 고려하면 훨씬 더 심각한 문제는 따로 있다.

미앤치(Me & Qi) 공동 창립자 아르노 버트랑은 “오픈AI가 일부 경우에서 자사 모델의 출력물을 소유할 수 있다고 시사하는 점이다. 이는 극단적인 테크노 봉건주의(techno-feudalism)이다. LLM 소유자가 AI가 생성한 모든 콘텐츠에 대한 소유권을 주장할 수 있는 세상이 올 위험이 있다”라고 지적했다.

이 문제는 단순히 오픈소스 대 폐쇄형 소프트웨어의 논쟁이 아니다. 일반적인 폐쇄형 소프트웨어는 사용자가 다루는 데이터에 대한 소유권을 주장하지 않는다. 하지만 오픈AI의 접근 방식은 그 이상이다. 오픈AI는 사용자가 프롬프트를 통해 생성한 출력물의 소유권은 사용자에게 있다고 명시하고 있지만, 그 출력을 활용해 경쟁 모델을 훈련하는 것을 금지하고 있다. 이는 오픈AI의 이용약관에 위배되는 행위로 간주된다. 메타의 라마는 오픈소스로 제공되지만, 대규모 경쟁 모델을 구축하는 용도로는 사용할 수 없도록 제한이 걸려 있다. 결국 완전한 개방성을 주장하면서도 경쟁을 차단하는 전략이 공통적으로 적용되고 있는 셈이다.

오픈AI는 훈련 데이터(입력 데이터)가 개방적이고 자유롭게 활용되어야 한다고 주장하면서도, 경쟁 LLM이 오픈AI의 데이터를 재활용하는 것은 제한할 수 있다는 입장을 보인다. 이처럼 모호하고 불분명한 기준은 기업 고객에 혼란을 초래할 수 있다. 만약 출력 데이터가 벤더 소유로 간주될 가능성이 조금이라도 있다면 AI 도입을 주저하게 만들 것이다. 결국 이 문제의 핵심은 오픈소스 대 폐쇄형 소프트웨어의 문제가 아니라, 고객 신뢰와 데이터 통제권에 달려 있다.

기업 고객의 불신 심화

레드몽크(RedMonk) 공동 창립자인 스티브 오그레이디는 기업이 AI에 대해 우려하는 문제를 “기업은 AI의 혜택을 최대한 활용하려면 내부 데이터에 대한 접근을 허용해야 한다는 점을 알고 있다. 그러나 LLM 벤더를 신뢰하지 않기 때문에 이를 대규모로 실행하는 데 주저”하고 있다”라고 정리했다.

오픈AI는 불신을 더욱 악화시켰다. 결국 AI 시장에서 승자가 될 업체는 고객의 신뢰를 얻는 업체가 될 것이다. 오픈소스가 도움이 될 수 있지만, 궁극적으로 기업은 라이선스에 관심이 없다. 그들은 LLM 제공업체가 데이터를 어떻게 다루는지에 더 관심을 둔다. 이런 이유로 AWS와 마이크로소프트는 클라우드 시장을 선점하며 급성장할 수 있었다. 기업 고객은 민감 데이터 처리에 있어 그들을 신뢰했다.

AI 시장에서 ‘황금’을 차지하려는 초기 경쟁에서 업계는 파운데이션 모델에 지나치게 집착한 나머지 가장 큰 시장이 아직 등장하지 않았다는 사실을 간과하고 있다. 또한, 이 시장에서 승리하려면 신뢰가 핵심이라는 점도 잊고 있다. 오라일리 미디어(O’Reilly Media) CEO 팀 오라일리는 AI 기업 경영진과 투자자들이 “독점적 권력을 추구하거나 유지하는 것, 그리고 이를 통해 막대한 수익을 올리는 데만 집착하고 있다”라고 지적한 바 있다.

오라일리의 말처럼 “훌륭한 기업 대부분은 처음부터 단단히 틀어쥐려 하지 않으며, 실험과 시장 확장 과정을 거친 후에야 비로소 탄생한다”라는 사실을 망각하고 있다. 현재 기업은 시장이 성숙하기도 전에 너무 이른 시점부터 수익 극대화를 시도하고 있다. 그러나 모델의 결과물을 통제하려는 노력은 고객 채택을 제한할 수 있으며, 시장 확장에 도움이 되지 않는다.

요약하자면, 현재의 AI 시장은 너무 빠르게 변화해 기업 고객이 안정감을 느끼기 어려운 상황이다. 이런 환경에서 신뢰를 구축할 방법을 신중하게 고민해야 한다. 오픈AI처럼 출력 데이터에 대한 불분명한 소유권을 주장하는 것은 신뢰 형성에는 전혀 도움이 되지 않는다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank