“중학교 수학에 흥분하던 시절은 끝났다”…AI의 다음 도약
컨텐츠 정보
- 조회 467
본문
“3~4년 전만 해도 AI 모델이 중학교 수준의 수학 문제를 풀면 엄청나게 흥분했다.” 지난주 엔비디아 GTC 개발자 행사 패널 토론에서 구글 딥마인드·구글 리서치 수석 과학자 제프 딘이 한 말이다.
지난해 구글의 제미나이는 국제 수학 올림피아드에서 금메달 수준에 도달했고, 이후 다양한 코딩 대회에서도 우승을 거뒀다.
AI가 세상을 뒤흔든 속도를 보여주는 단적인 사례다. AI는 기업을 장악하고, 경제 구조를 바꾸고, 취업 시장과 직업 세계를 빠르게 재편하고 있으며, 어쩌면 인류의 미래까지 바꿀지 모른다.
기술 업계 전문가는 AI를 전기나 인터넷보다 더 혁명적인 기술로 평가한다. 잘못된 손에 들어갔을 때 엄청난 피해를 줄 수 있다는 점에서 핵무기보다 위험하다는 시각도 있다.
수년간의 빠른 진화 끝에, AI의 다음 행보는 무엇일까. 딘과 엔비디아 수석 과학자 빌 댈리가 GTC 패널 토론에서 몇 가지 구상을 공유했다. 대규모 언어 모델과 에이전트 AI에 대한 전망을 정리했다.
자율 모델 : 인간 개입 없는 완전 자율 에이전트
올해 초 등장한 오픈클로는 AI 에이전트가 사람의 개입 없이 독립적으로 작업을 완수할 수 있음을 보여줬다. 그러나 칩, 전력 요구사항, 통신, 비용을 포함한 현재의 컴퓨팅 파이프라인은 아직 뒤처져 있다. 딘은 이 같은 미래형 에이전트를 실현하려면 더 빠른 속도가 필요하다고 강조했다.
엔비디아는 광 네트워킹 기술을 활용한 데이터 전송 기술 등을 통해 에이전트 속도를 높이는 작업을 진행 중이다. 댈리는 이런 속도를 ‘빛의 속도’라고 부른다고 말했다.
자가 진화하는 에이전트
다소 섬뜩한 전망도 나왔다. 에이전트가 스스로의 다음 버전을 만들거나, 적어도 최신 대규모 언어 모델과 생성형 AI 도구를 구동할 수 있는 업데이트 버전을 생성할 수 있다는 것이다.
아직 현실화된 것은 아니지만 징후는 이미 나타나고 있다고 딘은 전했다. AI 에이전트가 아이디어를 수용하거나 기각하는 방식으로 이미 자가 진화가 가능하다는 설명이다.
역사적 맥락도 있다. 2017년 AI 연구자들은 실험과 문제 해결에 가장 적합한 모델을 AI가 스스로 탐색하는 ‘메타 학습’ 개념을 제시했다. 딘은 당시 탐색 매개변수가 대부분 코드로 지정됐지만, 이제는 자연어로 처리할 수 있다고 설명했다.
자연어 상호작용 덕분에 에이전트는 새로운 정보, 특정 알고리즘, 증류 메커니즘 등을 찾아 스스로 개선하기가 훨씬 쉬워졌다. AI는 연구자들이 새로운 아이디어를 구상하는 데 집중할 수 있도록 해주는 성과 증폭기로 볼 수 있다. 딘은 “탁월한 역량을 갖춘 연구자와 탁월한 역량을 갖춘 에이전트 간의 파트너십”이라고 표현했다.
더욱 상호작용적인 대규모 언어 모델
AI 기술이 발전하면서 대규모 언어 모델은 실제 세계와 더 긴밀하게 상호작용하며, 실시간으로 스스로 재학습하고 업데이트하고 새로운 지식을 바탕으로 행동을 취하는 방향으로 진화할 수 있다.
딘은 오늘날의 대규모 언어 모델이 기본적으로 인터넷 데이터를 통해 학습된 후 세상에 공개되는 구조로, 결과물이 대부분 사전에 결정돼 있다고 설명했다.
반면, 미래의 모델은 물리적 정보와 디지털 정보를 실시간으로 결합해 즉석에서 학습하게 된다. 이를 통해 대규모 언어 모델은 로봇 동작을 더 정확하게 지시하고 질문에 대한 답변을 더 잘 예측할 수 있게 된다.
사후 학습 단계에서는 이미 이뤄지고 있지만, 사전 학습 단계에서의 결합이 더 효과적이다. 딘은 “현재는 다소 인위적인 구분이 존재하는데, 장기적으로는 없어져야 할 것”이라고 말했다.
딘은 고정된 매개변수 없이 매개변수를 유기적으로 늘리고 가지치기하고 압축하는 지속 학습 모델도 이미 등장하고 있다고 전했다.
마스터 에이전트
엔비디아와 구글은 이미 칩 설계에 AI를 활용하고 있다. 다음 단계는 칩 설계자와 개발자가 다른 업무에 집중할 수 있도록 이 과정을 자동화하는 방법을 찾는 것이다.
온칩 기능 구현이나 버그 수정에 특화된 하위 에이전트를 ‘마스터’ 에이전트가 호출하는 방식이 될 가능성이 크다. 하위 에이전트들은 칩 개선 방안을 협의하고, 결과가 만족스럽지 않으면 반복 작업을 거쳐야 한다.
댈리는 “사람이 하는 것과 똑같은 회의를 에이전트들끼리 하게 될 것”이라고 말했다.
머신 속도 에이전트
AI 개발 도구는 사람의 속도에 맞게 설계돼 있지만, 머신 속도로 작동해야 한다는 지적도 나왔다. 에이전트는 사람보다 훨씬 빠르게 추론하고 결정하고 행동하기 때문에, 느리게 로딩되는 C++ 컴파일러 같은 기존 도구가 빠른 진전을 가로막는다.
딘은 “모델이 사용하는 도구를 재설계하기 시작해야 할 것”이라고 강조했다.
코딩 도구와 문서 처리 분야에서는 이미 이런 변화가 일어나고 있다. 기존에는 사람의 속도로 정보를 추출하던 방식에서 벗어나고 있다. 딘은 간단히 말해 “새로운 형태의 도구가 필요하다”고 정리했다.
보안 전문가는 머신 속도로 작동하는 AI 에이전트가 사이버 공격에 대응하는 능력도 주목했다. 에이전트 AI 기반 공격에는 사람의 대응 속도가 너무 느릴 수 있기 때문이다.
더 나은 교육 도구
패널 연사들은 교실에서 AI 사용을 제한한 대학들을 비판했다. 스탠퍼드대학교 컴퓨터공학과 교수 출신인 댈리는 교육자들이 AI를 적극 활용해 학습을 가속화해야 한다고 주문했다.
딘은 AI 모델이 머지않아 답을 직접 알려주는 대신 개념 학습을 효율적으로 이끄는 개인 맞춤형 튜터 역할을 하게 될 것이라고 내다봤다. 계산기가 수학 학습의 병목을 제거해 학생들이 더 높은 수준으로 빠르게 나아갈 수 있게 해준 것과 같은 맥락이다.
딘은 “차라리 지금 일을 그만두고 직접 뛰어들고 싶다”고 말해 웃음을 자아냈다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음





