News Feed

AI 시대에도 ‘개방성’이 힘을 가질까?

컨텐츠 정보

  • 조회 361

본문

우리는 종종 기술사의 흐름을 잘못 이해하곤 한다. 예를 들어 리눅스가 결국 유닉스 전쟁을 종결짓고, 아파치와 쿠버네티스가 웹의 표준 인프라로 자리 잡았다는 사실만으로 ‘개방성’이 마치 자연 법칙처럼 필연적으로 승리한다고 여기는 경향이 있다. 이런 서사는 듣기에는 좋지만, 실제로는 대부분 틀린 해석에 가깝다.

적어도 오픈소스 옹호자가 흔히 말하는 방식으로는 온전히 맞는 설명이 아니다.

오픈소스가 승리하는 이유는 도덕적으로 우월하기 때문도 아니고, “보는 눈이 많으면 버그는 쉽게 드러난다”라는 리누스의 법칙이 절대적 진리여서도 아니다. 특정 기술이 모두에게 필요한 인프라가 되지만 그 누구도 그 영역에서 직접 경쟁하고 싶어 하지 않을 때 오픈소스가 지배력을 갖는다.

서버 운영체제 시장을 보자. 리눅스가 승리한 이유는 운영체제가 ‘상품(commodity)’이 됐기 때문이다. 더 나은 독점 커널을 만드는 일이 경쟁 우위를 가져다주지 못했고, 가치는 애플리케이션 계층으로 이동했다. 이에 구글, 페이스북, 아마존 같은 기업은 리눅스에 대규모 자원을 투입해 재미없지만 필수적인 기반 비용을 공동으로 부담하고, 데이터와 규모가 핵심 경쟁력이 되는 검색·소셜 그래프·클라우드 서비스 같은 영역에서 경쟁했다.

이 흐름은 AI로 이어진다. 오픈소스 지지자들은 메타의 라마(Llama) 같은 ‘오픈 웨이트(open weights)’ 모델의 급격한 확산이나, 딥시크(DeepSeek)의 인상적인 오픈소스 효율성을 근거로, 오픈AI와 구글이 주도하던 폐쇄형 시대가 이미 끝났다고 주장한다. 그러나 실제 자금 흐름을 자세히 보면 전혀 다른, 훨씬 흥미로운 이야기가 드러난다. 그리고 그 서사는 오픈소스와 폐쇄형 기술이 계속 얽혀 있는 복합적인 양상을 보여준다.

잃어버린 25억 달러는 어디로?

최근 하버드대와 리눅스 재단에 소속된 프랭크 네이글이 발표한 흥미로운 보고서 ‘AI 경제에서 오픈 모델이 수행하는 잠재적 역할(The Latent Role of Open Models in the AI Economy)’은 이런 불일치를 수치로 설명하려는 시도를 담고 있다. 네이글 연구팀은 오픈라우터(OpenRouter)의 데이터를 분석해 시장 내 비효율이 얼마나 심각한지 드러냈다. 현재 오픈 모델은 폐쇄형 모델 성능의 90% 이상을 안정적으로 달성하면서도 실행 비용은 약 1/6 수준에 불과하다. 순수하게 경제적 판단만 고려한다면, 기업은 GPT-4 대신 대거 라마3로 이동해야 정상이다.

네이글은 기업이 여전히 비용이 높은 폐쇄형 모델을 고수함으로써 전 세계적으로 매년 약 24.8억 달러를 허공에 버리고 있다고 추산했다. 네이글은 이 상황이 “정보 비대칭” 또는 “브랜드 신뢰”가 만들어낸 결과이며 일시적인 시장 실패라고 해석했다. 즉 CIO가 자신이 과금 구조에서 손해를 보고 있다는 사실을 깨닫는 순간 오픈소스로 이동하게 되고, 독점적 모델의 영향력은 급격히 약화될 것이라는 주장이다.

하지만 이렇게 단순하게 볼 일은 아니다.

기업이 왜 기꺼이 24.8억 달러를 ‘낭비’하고 있는지, 그리고 왜 AI가 앞으로도 오픈소스 코드와 폐쇄형 서비스가 공존하는 하이브리드 구조로 남게 될 가능성이 큰지를 이해하려면, AI를 1990년대식 소프트웨어 개발 관점에서 바라보는 방식을 버려야 한다. 필자가 여러 차례 언급했듯, 오픈소스는 AI를 구하지 못한다. AI의 물리학은 기존 소프트웨어의 물리학과 근본적으로 다르기 때문이다.

편의를 위한 프리미엄

2010년대 초반 클라우드 컴퓨팅이 부상할 때도 비슷한 ‘비효율성’ 논쟁이 있었다. 당시 AWS가 제공하던 마이SQL, 리눅스, 아파치 같은 오픈소스 소프트웨어는 누구나 그대로 내려받아 공짜로 운영할 수 있었다. 그럼에도 개발자와 기업은 클라우드로 몰려갔고, 소프트웨어를 직접 관리하지 않아도 되는 편의를 위해 상당한 비용을 지불했다.

편의성은 코드의 자유보다 강력하다. 언제나 그렇다.

네이글이 말한 24.8억 달러의 ‘손실’은 낭비가 아니다. 편의성, 면책성, 신뢰성 구매 비용이다. 기업이 오픈AI나 앤트로픽에 돈을 지불하는 것은 단순히 토큰 생성 기능을 사는 것이 아니다. 서비스 수준 협약(SLA)을 사고, 안전 필터를 사고, 모델이 허위 정보를 만들어 명예훼손을 일으켰을 때 책임을 물을 수 있는 구조를 함께 구매하는 것이다.

깃허브 리포지토리를 상대로 소송을 제기할 수는 없다.

이 지점에서 ‘개방성이 승리한다’는 주장은 현실과 충돌한다. AI 기술 스택에서 모델 가중치(weight)는 점점 ‘차별화되지 않은 반복 작업’, 즉 모두가 필요하지만 누구도 직접 관리하고 싶어 하지 않는 지루한 인프라로 바뀌고 있다. 진짜 가치가 형성되는 곳은 그 위에 있는 서비스 계층이다. 추론 루프, 통합 기능, 법적 보호 장치 같은 부분이 여기에 해당한다. 그리고 이 계층은 앞으로도 폐쇄형 상태를 유지할 가능성이 크다.

AI에는 ‘커뮤니티’가 존재할 수 없다

‘AI의 리눅스’을 기대하는 비유에는 더 근본적인 구조적 문제가 있다. 리눅스가 승리한 이유는 방대하고 분산된 기여자 커뮤니티의 힘을 끌어냈기 때문이다. 그러나 LLM에 기여하기 위한 진입 장벽은 훨씬 높다. 리눅스 커널의 버그는 개인 노트북에서도 고칠 수 있지만, 700억 개 파라미터를 가진 모델의 환각 현상을 수정하려면 원본 학습 데이터와 막대한 연산 자원이 필요하다. 일반 개발자가 감당할 수준의 비용이 아니다. 일론 머스크나 빌 게이츠가 아니라면 접근하기조차 어렵다.

여기에는 인재 구조의 역전이라는 현상도 작용한다. 리눅스 시대에는 뛰어난 개발자가 여러 곳에 흩어져 있었고, 오픈소스는 그들이 협력하기에 최적의 방식이었다. 반면 AI 시대에는 수학적 기반까지 이해하는 희소 인재들이 구글, 오픈AI 같은 거대 기업의 폐쇄적 연구 조직 안으로 빨려 들어가고 있다.

이런 변화는 ‘개방성’의 의미 자체를 바꿔놓는다. 메타의 라마에 적용되는 라이선스가 무엇이든, 그 모델을 대규모로 실행하고 시험하기 위한 장벽이 너무 높기 때문에 본질적인 의미는 크지 않다. 메타는 사용자에게 다음 버전을 함께 만들자고 초대하는 것이 아니다. 이는 어디까지나 ‘오픈소스 개발’이 아니라 ‘소스 공개(source available)’에 가깝다. 라이선스와 무관하게 AI 모델의 기여 구조는 이미 무너져 있다. ‘커뮤니티’가 수백만 달러 규모의 하드웨어 없이는 모델을 효과적으로 패치하거나 학습시키거나 포크할 수 없다면, 그 모델은 장기적 지속 가능성을 좌우하는 진정한 의미의 개방형이라고 보기 어렵다.

그렇다면 메타, 미스트랄, 딥시크는 왜 강력한 모델을 무료로 공개하는 것일까? 필자가 여러 해 동안 강조해 온 것처럼, 오픈소스는 본질적으로 이기적이다. 기업이 오픈소스에 기여하는 이유는 자선 활동이 아니다. 경쟁사의 제품을 상품화해 가치를 떨어뜨리는 동시에, 자신이 가진 독점 기술에 더 많은 투자를 집중하기 위한 전략적 판단이다. 인텔리전스가 무료가 되면, 가치는 그 인텔리전스를 활용하는 독점 플랫폼으로 이동한다. 메타는 페이스북, 인스타그램, 왓츠앱 같은 플랫폼을 상당수 보유하고 있다.

‘오픈’과 ‘폐쇄’의 분리

현재 AI 시장은 혼란스러운 하이브리드 미래로 향하고 있다. 지금까지 존재했던 ‘오픈 vs. 독점’이라는 이분법은 무너지고, 오픈 웨이트(open weights), 드물게 공개되는 데이터, 그리고 완전히 폐쇄된 서비스까지 다양한 스펙트럼으로 재편되는 중이다. 필자가 보기에 AI 스택은 다음과 같은 형태로 재정렬될 것이다.

우선 파운데이션 모델은 오픈 형태로 남게 될 가능성이 높다. 기업의 대부분 업무에서는 이미 GPT-4와 라마3의 성능 차이가 미미하다. 네이글의 데이터가 보여주듯, 오픈 모델의 추격 속도는 더 빨라지고 있다. TCP/IP 스택에 비용을 지불하지 않는 것처럼, 머지않아 ‘순수 토큰 생성’ 자체에는 비용을 내지 않게 될 것이다. 이 영역은 메타나 딥시크처럼 생태계 혼란에서 이익을 얻는 기업이 주도할 것으로 보인다.

반면 진짜 돈이 흐르는 지점은 데이터 계층이며, 이 부분은 계속 폐쇄적으로 유지될 것이다. 모델을 갖고 있다고 해도, 의료 진단·법률 검토·공급망 최적화 같은 특수 작업을 위해 미세 조정할 독점 데이터를 보유하지 못하면 모델은 그저 ‘장난감’에 불과하다. 기업은 소스 코드보다 훨씬 높은 강도로 데이터 세트를 보호하려 할 것이다.

추론·에이전트 계층도 폐쇄적으로 남을 것이며, 고수익 모델은 이 영역에서 형성될 가능성이 크다. 앞으로 중요한 것은 텍스트를 생성하는 능력이 아니라 실제로 일을 수행하는 능력이다. 세일즈포스 환경을 자율적으로 탐색하거나, 계약을 협상하거나, ERP 시스템을 갱신할 수 있는 에이전트는 복잡한 통합 작업과 책임 문제를 포함하기 때문에 필연적으로 독점 구조를 띠게 된다.

또한 기업은 자사 지식재산이 외부로 유출되거나 혐오 발언이 생성되지 않도록 보장하는 도구에도 비용을 지불하게 될 것이다. 옵저버빌리티, 안전성, 거버넌스 같은 영역이 여기에 해당한다. 모델은 무료일 수 있지만, 그 모델을 안전하게 운용하기 위한 가드레일에는 비용이 붙는다.

돈이 몰리는 곳은 따로 있다

네이글의 보고서는 오픈 모델이 기술적으로 경쟁력이 있을 뿐 아니라 경제적으로도 더 우위에 있다는 점을 정확히 짚어낸다. 그러나 비즈니스는 진공 상태에서 이뤄지지 않는다. 실제 의사결정이 내려지는 공간은 이사회 회의실이고, 그곳에서는 위험, 편의성, 속도가 판단을 좌우한다.

오픈소스의 역사는 완전한 개방으로 나아가는 직선이 아니다. 코드는 무료가 되고, 서비스는 비싸지는 울퉁불퉁한 흐름의 반복이다. AI도 다르지 않을 것이다. AI의 미래 역시 동일한 패턴으로 흘러갈 가능성이 크다. 오픈 구성 요소가 폐쇄형 서비스를 뒷받침하는 구조다.

승자는 이념적 순수주의자가 아니다. 무료로 제공되는 오픈 모델에 독점 데이터와 안전 프로토콜을 덧입혀 이를 기업에 프리미엄 가격으로 되파는 실용주의자들이 승자가 될 것이다. 그리고 AI의 ‘라스트 마일’을 해결한 기업이 네이글이 말한 ‘24.8억 달러’를 가져가게 될 것이다. 이 ‘라스트 마일’은 오픈소스가 많은 장점을 갖고 있음에도 좀처럼 풀지 못한 문제이기도 하다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank