생성형 AI 도구를 사용하는 개발자, 오히려 더 느려졌다
컨텐츠 정보
- 조회 456
본문
엔비디아의 CEO 젠슨 황은 생성형 AI 덕분에 “세상은 더욱 생산적이 될 것이고, GDP는 더 높아질 것이다. 더 많은 일자리가 생기며, 모든 직무는 AI로 보완될 것”이라고 전망했다. 미국 국방부의 생성형 AI 최고 책임자 더그 매티 역시 생성형 AI 프로그램 그록(Grok)이 “적국에 대한 방어를 돕고, 전략적 우위를 유지하는 데 기여할 수 있다”라고 강조했다.
그러나 현장의 분위기는 사뭇 다르다.
엔비디아는 4조 달러 규모의 기업 가치를 달성하며 생성형 AI 붐의 최대 수혜자가 됐고, 그록은 최근 논란 이후에도 2억 달러 규모의 계약을 따냈다. 반면, 실제로 이 AI 도구들을 활용해 업무를 수행해야 하는 이들에게는 상황이 그리 낙관적이지 않다.
예컨대, 프로그래밍은 AI가 특히 강점을 보인다고 평가받는 분야 중 하나다. 마이크로소프트 CEO 사티아 나델라는 “코파일럿이 개발자 경험을 혁신하고 있으며, 현재 마이크로소프트 코드베이스의 30% 이상에 기여하고 있다”라고 자신했다.
하지만 현실은 다르다. 비영리 AI 연구 단체 METR가 발표한 ‘2025년 초 생성형 AI가 오픈소스 숙련 개발자 생산성에 미친 영향 측정’ 보고서에 따르면, 생성형 AI는 오히려 숙련된 개발자의 업무 효율을 떨어뜨렸다. 이 연구는 평균 경력 10년 이상의 오픈소스 숙련 개발자 16명을 대상으로 진행됐으며, 이들은 익숙한 코드 저장소에서 버그 수정, 기능 추가 등 실제 업무와 동일한 작업을 수행했다.
참여자는 커서 프로(Cursor Pro), 클로드 3.5/3.7 소네트 등 생성형 AI 도구를 활용해 작업 시간을 24% 단축할 것으로 기대했고, 연구 종료 후에도 20% 단축되었다고 믿었다. 그러나 실제로는 AI를 활용하지 않은 그룹보다 작업 시간이 19% 더 오래 걸렸다. 특히 6시간 이하의 작업일수록 AI 보조로 인한 지연이 더 두드러졌다.
원인은 여러 가지다. 우선, AI에게 코드를 지시하기 위한 프롬프트 작성에 많은 시간을 소모했다. 많은 찬사를 받는 AI 기술도, 정교한 프로그래밍 프롬프트를 작성하는 일은 결코 쉽지 않다. 구글 크롬 개발자이자 jsdom 유지 관리자인 도메닉 데니콜라는 연구에 참여한 후 “웹 표준을 구현하는 데 있어 AI 모델이 이렇게 형편없을 줄은 몰랐다”라고 언급했다.
또한, 생성된 코드를 검토하고 오류를 수정하는 데 예상보다 많은 시간이 소요됐다. 보안 취약점까지 포함된 경우도 있었다.
생성형 AI가 업무 속도를 높인다고 단정할 수 없는 이유는 여기에 있다. AI 기업은 생산성과 효율성을 판매하고 있으며, 이들이 더 빠르고 더 효율적으로 보일수록 소비자는 기술을 더 많이 도입한다. 그러나 연구진은 “기존의 코딩/에이전트 벤치마크는 AI의 역량을 이해하는 데 유용하지만, 현실성을 희생해 규모와 효율에 집중하는 경향이 있다”라고 지적했다. 반면 이번 연구는 실제 업무에 초점을 맞췄다.
이와 유사한 결과는 이전에도 있었다. 구글의 2024 데브옵스 연구 평가(DORA)에 따르면, 생성형 AI 코딩 도구는 코드 리뷰 속도를 높였지만, 실제 배포 가능한 품질에는 미치지 못했다. 해당 기술을 도입한 팀은 오류 발생률이 높았으며, 결국 개발자가 AI가 남긴 혼란을 수습하는 데 더 많은 시간을 들였다.
레딧의 /programming 커뮤니티에서도 이러한 결과는 전혀 놀랍지 않다는 반응이다. 인기 게시글 중 하나는 “경험상 AI는 몇 분 만에 80% 정도의 코드는 만들어낸다. 하지만 중복 코드 제거, 엉망인 시스템 설계 정리, 버그 수정에 엄청난 시간이 걸린다. 결국 마지막 20%를 제대로 구현하는 데 집중할 수 있는 건 AI 없이일 때가 더 빠르다”라고 설명했다.
즉, 급히 만들어야 하는 임시 코드 수준이라면 생성형 AI가 활용될 수 있다. 그러나 실제로 작동하는 소프트웨어를 위해서는 그 정도로는 부족하다.
이는 초보 개발자에게도 마찬가지다. 기술 작가 카우스투브 사이니는 최근 바이브 코딩의 실패 사례를 다루며 “바이브 코딩의 핵심 문제는, 코드 생성은 가능하지만 이해, 디버깅, 유지보수가 불가능한 개발자를 양산한다는 점이다. AI 생성 코드에 오류가 생기면 이들은 손을 쓸 수 없다”라고 분석했다.
다른 분야도 사정은 마찬가지다. 다만 그 심각성이 명확하게 드러나지 않을 뿐이다.
글쓰기 분야에서는 이미 뚜렷한 변화가 보인다. 오류투성이 문장과 엉성한 기사들이 점점 늘고 있다. 현재로서는 일부 기업이나 2류 출판사는 생성형 AI로 작성된 조악한 콘텐츠를 그대로 내보내고 있다. 대부분의 독자가 오류를 인식하지 못하고, 얼핏 읽기에는 그럴듯해 보이기 때문이다.
이러한 문제는 아마도 필자의 업계뿐 아니라, 독자가 일하는 분야에서도 유사하게 나타나고 있을 것이다. 요컨대 생성형 AI는 최선의 경우, 단지 업무를 보조하는 수단일 뿐이다. 절대 전문 역량을 대체할 수는 없다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음





