오픈AI, 스케일AI와 결별…데이터 파트너십 재편 불가피
컨텐츠 정보
- 조회 432
본문
오픈AI가 GPT-4 등 핵심 모델의 고난도 데이터 라벨링을 지원해온 스케일AI와의 장기 파트너십을 종료했다. 오픈AI 대변인은 블룸버그를 통해 이 사실을 공식 확인했으며, 이번 결정은 메타가 스케일AI 지분 49%를 확보하며 143억 달러(약 19조 6,000억 원)를 투자한 직후에 이뤄졌다. 업계 분석가들은 이번 조치가 AI 패권 경쟁의 지형을 바꾸는 계기가 될 것으로 보고 있다.
메타는 이번 투자를 통해 스케일AI 설립자인 알렉산더 왕을 자사 AI 부문 책임자로 영입했다. 이에 대해 IDC 아시아·태평양 지역의 BDA 및 AI 리서치 담당 부사장 디피카 기리는 “기초 모델의 핵심 계층에서 데이터 중립성에 대한 심대한 위협이 시작됐다”라고 진단하며, “세계는 업체 중립형 생태계로 이동 중이고, 데이터 보안과 개방형 플랫폼이 점점 더 중요해지고 있다”라고 강조했다. 하지만 현재는 초대형 클라우드 기업이 핵심 파이프라인을 장악하고 있어, 그 중립성은 전례 없는 압박을 받고 있다.
AI 데이터와 인재를 둘러싼 고조된 전쟁
메타가 스케일AI를 290억 달러(약 40조 원)로 평가한 것은, 데이터 인프라 확보와 최고급 인재 유치라는 이중 전략을 명확히 보여준다. 이번 투자는 Llama 4 모델의 경쟁력 확보를 위한 것이지만, 동시에 메타는 오픈AI 직원을 대상으로 최대 1억 달러(약 1,370억 원) 규모의 보상 패키지를 제안하며 인재 유치에 나섰다. 샘 알트먼 오픈AI CEO가 팟캐스트 ‘언캡드(Uncapped)’에서 직접 언급한 사실이다. 그러나 멘로벤처스의 한 투자자는 X(구 트위터)에 “여전히 많은 인재가 오픈AI나 앤트로픽을 선택하고 있다”라고 전했다.
오픈AI의 이탈과 메타의 투자는 2032년까지 292억 달러(약 41조 원) 규모로 성장할 것으로 예상되는 데이터 라벨링 산업 전반에 파급 효과를 일으킬 전망이다. 스케일AI의 임시 CEO 제이슨 드로지는 블로그 게시글을 통해 “스케일AI의 데이터 거버넌스는 여전히 독립적으로 운영된다”라며 “고객 데이터 보호에 대한 우리의 약속은 변함없다”라고 주장했다.
하지만 이러한 해명은 이미 신뢰를 잃고 있는 상황이다. 블룸버그에 따르면, 오픈AI는 수개월 전부터 스케일AI의 서비스 사용을 줄여왔으며, 그 이유로 더 전문화된 데이터의 필요성을 들었다.
AI 데이터 생태계를 다시 그리는 오픈AI의 이탈
스케일AI는 인도, 베네수엘라 등지의 글로벌 계약 인력을 기반으로 시작한 데이터 라벨링 선구 기업으로, 2024년 기준 매출은 8억 7,000만 달러(약 1조 1,900억 원)에 달한다. 그러나 구글이 지난해에만 1억 5,000만 달러(약 2,000억 원)를 지출한 주요 고객이라는 점에서 향후 전망은 불투명하다.
경쟁사 핸드셰이크의 CEO는 타임지 인터뷰에서 “메타 투자 이후 자사 서비스 수요가 하루 만에 세 배로 증가했다”라고 밝혔다. 이는 메타 경쟁사들이 자사의 기밀 데이터와 연구 로드맵이 스케일AI를 통해 유출될 가능성을 우려한 결과로 해석된다.
이번 판도 변화는 기업의 AI 계약 구조가 가진 사각지대도 드러냈다. 대부분의 계약에는 지배권 변경 조항이나 업체 충돌 방지 장치가 미흡하며, 파트너사가 경쟁사와 손잡을 경우 기업은 그대로 노출될 수밖에 없다. QKS 그룹의 애널리스트 입시타 차크라바르티는 “많은 계약이 여전히 정적 정확도 지표에 의존하고 있으며, 현실 데이터의 변동성에는 무력하다”라고 분석하며, “결국 지능은 외주 주면서, 실패 책임은 기업이 지게 되는 상황이 올 수 있다”라고 경고했다.
그러나 스케일AI의 강점은 여전히 고급 훈련자 네트워크에 있다. 역사학자, 과학자, 박사급 전문가들이 단위당 수십~수백 달러에 이르는 고도화된 태스크를 처리하고 있기 때문이다. 메타의 비의결권 지분은 자동 반독점 심사를 피했지만, 당국이 영향력과 지배권 사이의 경계를 들여다볼 가능성은 여전히 남아 있다. 규제 심사, 업체 이전, 내부 감사 등으로 인해 AI 데이터 공급망이 재편되기까지는 수개월 이상이 걸릴 것으로 보인다.
AI 개발의 새로운 현실
현재 구글 등은 데이터 라벨링을 내재화하는 데 속도를 내고 있으며, 업계는 2010~2015년 클라우드 통합 시대의 실수를 반복할 것인지, 아니면 한층 더 개방적인 길을 택할 것인지의 갈림길에 서 있다.
가트너의 수석 애널리스트 아누슈리 베르마는 “역사는 반복된다”라며 “AI 경쟁이 업체 분열을 일으키고 있지만, 결국엔 통합이 불가피하다”라고 말했다. 클라우드 기업들이 그랬듯, AI 대기업도 수직 통합을 밀어붙이고 있어, 기업은 단일 플랫폼에 종속될 위험이 커지고 있다는 것이다. 베르마는 CIO에게 “민첩하고 상호운용 가능한 솔루션을 우선시하라”라고 권고했다.
앞서 IDC가 제시한 ‘업체 중립 생태계’ 전략과도 맞닿은 이야기다. 데이터 보안, 규제 준수, 개방형 플랫폼 중심의 설계가 필요하다는 철학은 현재 업계의 폐쇄형 구조와 충돌하고 있다.
입시타 차크라바르티는 “AI 도입이 성공하려면 구매 목록을 넘어선 접근이 필요하며, 초기부터 변화 관리, 결정 추적 가능성, 인간-AI 상호작용 설계까지 반영해야 한다”라고 강조했다.
이제 과제는 단순한 규제 준수를 넘어선다. 클라우드나 반도체 보안처럼 AI 생태계를 사전 점검하고 압박 테스트하는 노력이 필요하다.
IDC의 디피카 기리는 “가장 현명한 접근은 스택 전체에 걸친 깊은 통합을 피하고, 개별 기능을 독립적으로 평가하는 것”이라며 통합 시스템은 향후 변화에 대응할 유연성이 부족할 수 있다고 조언했다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






