News Feed

“GPT-4 옴니 테스트 단 일주일” 오픈AI의 테스트 기간 단축 논란

컨텐츠 정보

  • 조회 747

본문

GPT 시리즈, 코덱(Codec), 달리(Dall-E), 위스퍼(Whisper) 등 인기 AI 프로젝트를 보유한 오픈AI가 적절한 보호 조치 없이 배포를 서두른다는 지적이 있다.

파이낸셜 타임스(Financial Times)는 오픈AI가 직원과 서드파티 그룹이 최신 대형 언어 모델의 위험성과 성능을 평가하는 기간을 수개월에서 수일로 줄였다고 보도했다. 모델 출시 속도를 높이고 단순한 모델 훈련이 아닌 추론(새로운 데이터 생성)에 집중하는 것이 목적이다.

파레크 컨설팅의 CEO 파레크 제인은 “모든 기술 업체가 숨가쁜 속도로 자체 모델을 출시하면서 AI는 매우 경쟁적인 분야가 됐다. 오픈AI의 강점은 AI 경쟁에서 일찍 출발한 선수였다는 점이고, 테스트 기간을 줄임으로써 생산을 가속화하기를 원할 것”이라고 말했다.

과거 테스트 기간은 길어

파이낸셜 타임스는 오픈AI의 테스트 과정에 익숙한 8명의 인사를 인용해 오픈AI가 안전성 테스트에 투입하는 자원과 시간을 줄여 위험 평가에 집중한다고 보도했다.

오픈AI의 향후 o3 모델을 테스트하는 한 소식통은 대형 언어 모델 기술을 언급하면서 “중요성이 낮으면 안전성 테스트를 더 철저하게 진행했다”라고 말했다.

오픈AI의 GPT 모델 안전성 테스트 방식은 시간이 지남에 따라 다양해졌다. GPT-4의 경우, 회사는 공개 전에 6개월 이상 안전성 평가에 전념했다. 그러나 GPT-4 옴니 모델의 경우, 오픈AI는 2024년 5월 출시 기한을 맞추기 위해 테스트 단계를 단 1주로 줄였다.

테스트 단축은 모델 무결성을 좌우

여러 전문가는 안전성 테스트 시간을 줄이면 출시 모델의 품질에 심각한 영향을 미칠 수 있다고 경고했다.

제인은 모델의 결과로 인해 환각이나 피해 사례가 발생한다면, 오픈AI는 사람들의 신뢰를 잃을 것이라고 덧붙였다. 이미 오픈AI는 비영리 기업에서 영리 기업으로 전환하면서 이미지 문제가 발생했다. 나쁜 사건이 발생하면, 영리 추구를 위해 책임 있는 테스트를 희생하고 있다는 이미지를 더 손상시킬 수 있다는 의견이다.

테스트 시간 단축을 “무모한 시도”이자 “재앙의 지름길”이라고 부르는 사람도 있었다. GPT-4 테스트에 참여한 또 다른 소식통은 테스트를 시작한 지 두 달 만에 몇 가지 위험한 신호가 발견되었다고 말했다.

오픈AI는 논평 요청에 즉각적으로 응답하지 않았으나, 2024년 9월 유사한 비판에 대응하기 위해 오픈AI는 안전 및 보안 위원회를 독립적인 “이사회 감독 위원회”로 전환하고 안전 문제를 이유로 모델 출시를 지연시킬 권한을 부여했다.

개선된 AI빠른 테스트 추진

에스컬레이션 테스트가 모델 무결성에 위험하다고 지적하는 사람은 거의 없지만, 제인은 오픈AI가 보안을 손상시키지 않으면서 테스트 속도를 높일 수 있을 가능성을 시사했다.

제인은 “오픈AI도 내부 프로세스에서 많은 AI를 사용하고 있을 것이다. 아마도 AI를 사용하면 빠른 테스트가 가능하다는 것을 세상에 알리기 위해 축배를 들고 있을 것이다. 오픈 AI가 AI를 더 많이 사용해 모델 출시를 가속화하려는 것이라면 의심이 필요하다”라고 지적했다. 2024년 12월 오픈AI가 AI로 테스트 모델이 더 많은 기능을 빠르게 갖출 것이라고 발표한 것이 근거다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank