챗GPT, 그록 기반 AI 백과사전 ‘그로키피디아’ 인덱싱 논란
컨텐츠 정보
- 조회 512
본문
웹에는 LLM이 생성한 텍스트와 이미지, 나아가 영상과 음악이 점점 더 많이 쌓이고 있다. 이 문제는 겉으로 보이는 것보다 훨씬 크다. 웹 전반을 수집해 LLM을 구축한 AI 시스템이 이제 AI가 만들어낸 출력물까지 다시 인덱싱하고 있기 때문이다. 생성형 AI가 만들어낸 오류 콘텐츠가 스스로를 먹어치우며 증식하는, 일종의 ‘우로보로스(Ouroboros)’ 구조가 형성되고 있다. 그리고 현재 가장 대중적인 LLM으로 꼽히는 챗GPT마저 그로키피디아(Grokipedia)를 인덱싱하고 있다.
그로키피디아는 일론 머스크의 AI 기업 xAI가 2025년 만든 AI 생성 백과사전이다. 콘텐츠 대부분은 그록(Grok) LLM로 자동 생성됐으며, 이 그록 모델은 xAI가 2025년 3월 인수한 소셜 미디어 플랫폼 X(구 트위터)에도 통합돼 있다. 머스크가 위키피디아를 ‘각성(woke)’과 ‘선전’의 산물로 보고 있는 만큼, 그로키피디아는 보수 성향의 대안 백과를 표방하고 있다.
그로키피디아에는 부정확한 정보와 AI 환각이 다수 포함돼 있다. 그 오류 발생 빈도는 일반적인 LLM보다도 더 높은 수준으로 보이는데, 이는 그록 자체가 머스크의 지침에 부합하도록 의도적으로 조정됐기 때문이다. 실제로 이 시스템이 음모론을 비롯해 단순한 망상 수준을 넘어 실제로 해를 끼칠 수 있는 내용을 생성하거나 노출하는 사례가 나타나고 있다.
이제 오픈AI의 챗GPT가 일부 이용자의 질의에 답하기 위해 그로키피디아를 인덱싱하고 있는 것으로 보인다. 가디언의 조사에 따르면, 챗GPT 5.2는 그로키피디아에서 가져온 정보를 활용하는 방식에 있어 선택적인 태도를 보였다. HIV와 에이즈 관련 허위 정보처럼 잘 알려지고 충분히 검증된 오류에 대해서는 그록이 생성한 답변을 즉각 제공하지는 않았다. 그러나 이란 정부를 둘러싼 논란이나 홀로코스트 부정론자인 데이비드 어빙과 관련한 구체적인 설명을 요구했을 때는 그록이 생성한 페이지에서 취합한 정보를 실제로 반환한 사례가 확인됐다.
LLM이 쏟아내는 방대한 텍스트의 양도 문제로 떠오르고 있다. 2025년 말 기준으로 새로 발행되는 기사 가운데 절반 이상이 LLM이 생성한 콘텐츠라는 추정까지 나온다. 이 과정에서 발생한 ‘AI 오류’, 이른바 환각이 확산되고 복제되며 기존에 축적된 지식을 단순한 복사 오류로 덮어써 버릴 위험이 제기된다. LLM이 본질적으로 반복 학습 구조를 갖고 있다는 점 역시 악용될 수 있는 요소로 지적된다. 실제로 구글의 제미나이 AI는 중국 공산당의 공식 입장에 부합하는 방식으로 자국의 인권 침해 문제를 서술하거나, 아예 문제가 없다는 취지의 내용을 반복해 온 사례가 관측됐다. 일부 보안 연구자는 러시아가 다른 LLM에 통합되는 것을 목표로, LLM이 생성한 선전용 텍스트를 대량으로 유포하고 있다고 보고 있다.
그록 자체에서도 노골적인 혐오 표현을 반복한 사례가 관측됐다. 해당 챗봇이 스스로를 ‘메카히틀러(MechaHitler)’라고 지칭한 경우가 대표적이다. 또 2025년 12월부터 X에서 접근 가능한 도구를 통해 미성년자를 성적으로 묘사한 AI 생성 이미지 수백만 장을 만들어낸 사실도 드러났다. 이 도구는 이달 초 무료 이용자를 대상으로 비활성화됐으며, 이후 X에서는 노출이 심한 복장을 한 실제 인물에 적용되지 않도록 제한됐다. 이 사건 이후 여러 국가가 각종 법률 위반 가능성을 이유로 그록과 X에 대한 조사에 착수했다. 인도네시아와 말레이시아는 그록에 대한 접근을 전면 차단했다.
오픈AI가 왜 경쟁사이자 라이벌 제품인 그록의 출력을 챗GPT에 통합했는지는 분명하지 않다. 자동 생성된 텍스트를 수집하는 데 그치지 않고, 경쟁사의 산출물을 자사 시스템 학습에까지 활용한 배경은 명확히 설명되지 않고 있다. 다만 새로운 입력을 지속적으로 필요로 하며 반복적으로 적응하고 변화하는 LLM 특성상, 오픈AI가 학습 데이터 선택에 있어 충분히 선별적인 태도를 유지하기 어려웠을 가능성이 제기된다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






