News Feed

애플이 AI 개선과 개인정보 보호를 동시에 실현하는 방법

컨텐츠 정보

  • 조회 783

본문

시리 개선 지연, 부정확한 뉴스 알림 요약, 기대에 못 미치는 이미지 생성 기능 등 애플 인텔리전스(Apple Intelligence)를 둘러싼 여러 문제가 제기되면서 애플이 이 상황을 어떻게 수습하고 반전을 꾀할지 관심이 쏠리고 있다.

새로운 모델 개발과 성능 향상, 그리고 더 많은 학습은 분명 매우 중요하다. 하지만 애플은 다른 AI 기업과 비교해 훨씬 더 엄격한 개인정보 보호 정책을 적용하고 있어, 이런 작업을 수행하는 데 특히 큰 어려움을 겪고 있다.

애플은 최근 자사 머신러닝 리서치 사이트에 게시한 새로운 글에서 사용자의 개인 데이터를 학습에 활용하지 않고도 AI의 정확도와 활용도를 높이기 위한 기술을 소개했다.

사용 데이터를 수집하면서 개인정보 보호하기

애플의 설명에 따르면, 차등 개인정보 보호(Differential Privacy)는 “애플 사용자의 행동에 대한 인사이트를 얻으면서도 개별 사용자의 프라이버시를 보호하는 방식”이다.

기본적으로 애플이 이런 시스템에서 데이터를 수집할 때는 먼저 기기 ID, IP 주소 같은 식별 정보를 제거한 뒤 수집된 데이터에 약간의 변형을 가한다. 수백만 명의 사용자가 데이터를 제공하면 이처럼 인위적으로 삽입된 ‘노이즈’는 전체적으로 상쇄된다. 이것이 바로 차등 개인정보 보호다. 식별 정보를 제거하고 무작위 노이즈를 더한 데이터를 충분히 많이 수집하면, 어떤 정보도 특정 사용자와 연결할 수 없게 된다.

이 방식은 어떤 이모지를 가장 자주 선택하는지, 특정 오타 이후 어떤 자동 수정 단어를 가장 많이 사용하는지에 대한 통계를 확보하는 데 유용하다. 사용자 선호도를 파악하기 위한 데이터를 수집하면서도, 어떤 데이터로도 특정 사용자를 추적할 수 없도록 설계돼 있다. 추적을 하고 싶어도 불가능하다.

애플은 사용자가 자주 활용하는 프롬프트 유형을 바탕으로 ‘합성 텍스트’를 생성한 뒤, 차등 개인정보 보호 기술을 적용해 사용자가 어떤 합성 텍스트를 가장 자주 선택하는지 파악할 수 있다. 또는 젠모지(Genmoji) 프롬프트에서 어떤 단어나 문구가 자주 사용되고, 어떤 결과를 사용자가 가장 많이 선택하는지도 같은 방식으로 분석할 수 있다.

예를 들어 AI 시스템이 이메일에 자주 사용되는 문장을 생성한 뒤, 이를 여러 가지 형태로 변형해 사용자에게 제공한다. 그런 다음, 차등 개인정보 보호 기술을 활용해 애플은 어떤 문장이 가장 자주 선택되는지 파악한다. 이 과정에서도 개별 사용자가 어떤 선택을 했는지는 알 수 없도록 설계돼 있다.

애플은 이미 수년 전부터 이 기술을 퀵타입(QuickType) 입력 제안, 이모지 추천 등 다양한 기능을 개선하는 데 활용해 왔다. 이 방식은 철저하게 익명성을 보장하지만 옵트인 방식으로 운영된다. 사용자가 ‘기기 분석’ 수집을 명시적으로 허용하지 않는 이상, 애플은 이런 유형의 데이터를 수집하지 않는다.

현재 기술은 이미 젠모지 개선에 활용되고 있으며, 곧 있을 업데이트에서는 이미지 생성, 이미지 완드(Image Wand), 추억 동영상 생성하기(Memories Creation), 글쓰기 도구(Writing Tools), 비주얼 인텔리전스(Visual Intelligence) 등에도 적용될 예정이다. 블룸버그 보도에 따르면, 이 새로운 시스템은 iOS 18.5, 아이패드OS 18.5, 맥OS 18.5의 베타 업데이트를 통해 제공되며, 최근 두 번째 베타 버전이 배포됐다.

물론 이는 어디까지나 데이터 수집 단계의 이야기다. 애플 인텔리전스 기능이 눈에 띄게 향상되려면 몇 주에서 몇 달간의 데이터 수집과 재학습 과정을 거쳐야 할 것이다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank