News Feed

오픈AI, 데이터 상주 정책 8개국 확대…규제 산업 AI 도입 장벽 낮춘다

컨텐츠 정보

  • 조회 417

본문

오픈AI가 자사 기업용 서비스인 챗GPT 엔터프라이즈(ChatGPT Enterprise), 챗GPT 에듀(ChatGPT Edu), 그리고 API 이용자를 대상으로 데이터 상주(data residency) 옵션을 확대했다. 업계 전문가들은 이번 조치를 통해 기업이 오픈AI의 LLM 스택을 대규모로 도입하는 데 큰 걸림돌이었던 요소를 해소할 것으로 보고 있다.

HFS리서치(HFS Research)의 리서치 부문 리더 아크샤트 티야기는 “이번 변화로 기업은 자국의 데이터 보관 규정을 위반하지 않고 소규모 파일럿 단계에서 본격적인 대규모 운영으로 전환할 수 있게 됐다. 과거 보안·컴플라이언스팀이 생성형 AI를 거부한 이유는 모델 설계 때문이 아니었다. 데이터가 미국이나 유럽에 저장되면서 GDPR, 인도의 DPDPA, UAE의 연방 규정, PCI-DSS 같은 업종별 기준과 충돌했기 때문”이라고 설명했다.

티야기는 이번 데이터 상주 확대 조치로 상황이 근본적으로 달라질 것이라고 분석했다. “이제 기업은 규제 대상이거나 민감한 데이터를 포함한 워크플로우를 각 지역 정책에 맞춰 지정된 지역 내에서 저장하고 처리할 수 있다. 이는 금융기관, 보험사, 병원, 공공기관 등 규제를 많이 받는 산업에 직접적인 혜택을 줄 것”이라고 말했다.

운영 효율 측면에서도 긍정적인 효과가 예상된다. 티야기는 “개발팀은 규정을 지키기 위해 데이터를 삭제하거나 익명화할 필요가 없어지고, 조달팀은 현지화 요건에 부합하는 저장 구조 덕분에 승인 절차를 빠르게 진행할 수 있을 것이다. 특히 인도, UAE, 호주 등 신흥 시장에서 그 효과가 클 것”이라고 덧붙였다.

기존 워크스페이스엔 미적용…저장 데이터만 상주 대상

오픈AI는 미국과 유럽에 한정돼 있던 데이터 상주 정책을 영국, 캐나다, 일본, 한국, 싱가포르, 인도, 호주, UAE 등으로 확대한다고 발표했다. 다만 이번 조치에는 몇 가지 제한 사항이 포함된다.

우선 챗GPT 엔터프라이즈와 에듀 고객의 경우, 데이터 상주는 신규로 생성되는 워크스페이스에만 적용된다. 또한 이번 확장은 저장된 데이터(data at rest)에만 해당되며, 모델이 추론 과정에서 활용하는 실시간 데이터(inference data)는 포함되지 않는다. 추론 데이터의 기본 처리 위치는 여전히 미국으로 유지된다.

HFS리서치의 티야기는 “기업은 데이터를 ‘어디에 저장하느냐’와 ‘어디에서 처리하느냐’라는 두 가지 관점에서 구분해 봐야 한다. 이번 업데이트는 전자, 즉 저장 데이터에 중점을 둔 조치다. 이제 고객 지역 내에 저장된 데이터는 상주 상태로 유지될 수 있지만, 사용자가 모델과 상호작용하는 순간 입력 프롬프트는 일시적으로 미국 기반 인프라에서 처리된 뒤 결과가 다시 사용자에게 전달되는 구조다”라고 설명했다.

컴플라이언스 회색지대의 대안은 API 플랫폼

티야기는 “오픈AI의 미국 내 추론 데이터 상주 정책이 여전히 복잡한 규제 문제를 안고 있지만, 이번 데이터 상주 확대는 기업에 상당한 실질적 도움을 줄 것”이라고 말했다.

티야기에 따르면, 많은 상업 기업이 데이터가 자국 외부에 저장돼 있다는 이유로 프로젝트를 중단하곤 한다. 따라서 이번 조치가 제대로 배포되고 운영된다면, 규제를 받는 기업이 겪던 컴플라이언스 마찰의 70~80%는 이 조치 하나로 해소될 것으로 보인다. 티야기는 “대부분 상업 규제 산업은 일시적인 처리 경로보다는 데이터가 실제 어디에 저장되는지를 더 중요하게 본다”라고 설명했다.

하지만 일부 조직, 특히 국방이나 정부 기관 등은 여전히 신중한 입장을 유지할 수 있다. 티야기는 “이런 기관의 경우, 데이터가 일시적으로라도 미국으로 전송되는 것은 여전히 국경 간 데이터 이동으로 간주된다. 오픈AI가 아직 그 수준의 완전한 데이터 분리 환경을 제공하고 있지는 않다”라고 지적했다.

이어 “이처럼 컴플라이언스 회색지대를 피하고자 하는 기업은 오픈AI의 API 플랫폼(API Platform)을 선택할 수 있다. 이 플랫폼은 이제 지역별 데이터 상주 옵션을 확대한 형태로 운영된다”라고 덧붙였다.

미국 외 지역의 기업에 오픈AI의 API 정책은 매우 단순하다. API를 통해 전송한 모든 데이터는 전적으로 고객의 소유로 유지되며, 오픈AI는 이를 모델 학습에 사용하지 않고 장기적으로도 자체 서버에 저장하지 않는다.

티야기는 “이 플랫폼은 실제 기업의 요구와 기대에 부합한다. 기업은 AI를 자사 시스템에 직접 통합해 워크플로우를 자동화하고, 모든 입력과 출력을 기존 보안 및 거버넌스 체계 안에서 관리하길 원한다. API 플랫폼은 이런 운영 환경에 자연스럽게 맞물리는 구조”라고 말했다.

다만 API 플랫폼 사용자에게도 일부 유의해야 할 제한 사항이 존재한다.

오픈AI는 자사 블로그를 통해 “고급 데이터 제어(Advanced Data Controls) 권한을 승인받은 엔터프라이즈 고객은 API 플랫폼 대시보드에서 새 프로젝트를 생성하고 원하는 지역을 선택함으로써 지역별 데이터 상주를 활성화할 수 있다. 이런 프로젝트를 통해 전송되는 요청은 선택된 지역 내에서 처리되며, 모델 요청 및 응답 데이터는 오픈AI 서버에 저장되지 않는다”라고 설명했다.

대형 클라우드 서비스 업체와 격차 좁히는 첫걸음

티야기는 “오픈AI는 최소한 데이터 상주 영역에서만큼은 AWS, 마이크로소프트, 구글과 같은 대형 클라우드 서비스 업체와의 경쟁 구도를 형성할 수 있는 중요한 출발점이 될 것”이라고 말했다.

티야기는 “AWS, 구글, 마이크로소프트는 이미 지역 내 저장(in-region storage), 주권 클라우드(sovereign cloud), 그리고 IAM(Identity and Access Management)·인증 연동 기능 등 훨씬 깊은 수준의 통합 서비스를 제공한다. 현재 오픈AI는 아직 이들과 같은 수준의 인프라를 갖추진 못했지만, 저장 데이터 상주는 분명 그 스택의 첫 단계”라고 분석했다.

이번 조치가 오픈AI에 주권을 확보한 컴퓨팅 인프라를 제공하는 것은 아니지만, 티야기는 기업이 클라우드 공급자와 같은 기준으로 AI 서비스를 평가할 때 요구하는 보안·인프라 설계 수준에 한층 가까워졌다는 점에서 의미가 크다고 봤다.

한편, 클로드를 서비스하는 앤트로픽 역시 미국 내에서만 저장 데이터 상주 기능을 제공하고 있는 것으로 알려졌다. 앤트로픽은 인도 시장에서도 해당 기능을 제공하기 위한 방안을 검토 중이며, 추론 데이터는 미국 외 지역에서 처리되고 있는 것으로 전해졌다.

오픈AI는 앞으로 데이터 상주 지역을 추가로 확대할 계획이라고 밝혔다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank