구글, ‘제미나이 3’ 맞춤형 API 대폭 개선…추론·비전·에이전트 기능 강화
컨텐츠 정보
- 조회 356
본문
구글이 최근 공개한 AI 모델 제미나이 3(Gemini 3)을 지원하기 위해 제미나이 API를 전면 업그레이드했다. 이번 업데이트에는 사고 제어를 간소화한 기능, 멀티모달 비전 처리의 정밀 제어 옵션, 그리고 함수 호출과 이미지 생성 성능을 높이는 ‘사고 서명(Thought Signatures)’ 기능이 포함됐다. 이들 개선 사항은 제미나이 3이 지닌 추론 능력, 자율 코딩 성능, 멀티모달 이해력, 에이전트 역량을 강화하기 위해 설계됐다.
구글은 블로그를 통해 이번 제미나이 API 개선 내용을 공개하며 “사용자가 모델의 추론 과정과 미디어 처리, 외부 세계와의 상호작용 방식을 보다 세밀하게 제어할 수 있도록 설계했다”라고 설명했다. 제미나이 3은 지난 18일 공식 출시됐다.
제미나이 API의 주요 개선 사항은 사고 제어를 단순화한 새로운 파라미터 ‘사고 레벨(thinking_level)’의 도입이다. 이 파라미터는 모델이 응답을 생성하기 전 내부적으로 수행하는 추론의 최대 깊이를 조정하는 역할을 한다. 개발자는 작업의 복잡도에 따라 이 값을 조정할 수 있다. 예를 들어 전략적 비즈니스 분석과 같은 복잡한 업무에는 ‘높음’으로 설정해 더 깊은 사고 과정을 유도할 수 있으며, 지연 시간이나 비용이 중요한 애플리케이션의 경우에는 ‘낮음’으로 설정해 효율성을 높일 수 있다.
이번 업데이트를 통해 제미나이 API는 멀티모달 비전 처리에 대한 제어 기능을 한층 세분화했다. 새로운 ‘미디어 해상도(media_resolution)’ 파라미터를 통해 이미지, 동영상, 문서 입력 시 사용되는 토큰 수를 조정할 수 있게 된 것이다. 이를 통해 개발자는 시각적 정밀도와 토큰 사용량 간의 균형을 맞출 수 있다. 해상도 설정은 ‘저해상도(media_resolution_low)’, ‘중간 해상도(media_resolution_medium)’, ‘고해상도(media_resolution_high)’ 세 가지 옵션으로 구성된다. 구글은 “해상도를 높이면 모델이 작은 글씨나 세부 요소를 읽고 식별하는 능력이 향상된다”라고 설명했다.
또한 제미나이 3부터는 함수 호출과 이미지 생성 성능을 개선하기 위해 ‘사고 서명(Thought Signatures)’ 기능이 다시 도입됐다. 사고 서명은 모델의 내부 사고 과정을 암호화한 데이터 표현으로, 이를 이후의 API 호출 시 모델에 다시 전달하면 제미나이 3이 대화 전반에서 추론의 연속성을 유지할 수 있다. 구글은 “이는 복잡하고 다단계로 구성된 에이전트 워크플로우에서 단순한 결과뿐 아니라 그 결정의 이유를 함께 보존하는 데 중요한 역할을 한다”라고 밝혔다.
또한 개발자는 이제 구조화된 출력을 구글이 호스팅하는 도구와 결합해 활용할 수 있다. 특히 ‘구글 검색 연동(Grounding with Google Search)’과 ‘URL 컨텍스트(URL Context)’ 기능을 함께 사용할 수 있게 됐다. 구글은 “이 기능은 웹이나 특정 웹페이지에서 실시간 정보를 가져와 데이터를 JSON 형식으로 추출해야 하는 에이전트를 구축할 때 특히 유용하다”라고 설명했다. 즉, 에이전트가 웹 데이터를 실시간으로 수집·정리·활용하는 복합형 작업을 보다 정교하게 수행할 수 있도록 지원하는 기능이다.
이와 함께 구글은 구글 검색 연동 기능의 요금 체계도 조정했다. 기존에는 1,000건의 프롬프트당 35달러의 정액 요금제가 적용됐으나, 이제는 검색 쿼리 1,000건당 14달러의 사용량 기반 요금제로 변경됐다. 구글은 이번 개편이 “에이전트형 워크플로우를 보다 유연하게 지원하기 위한 조치”라고 밝혔다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






