앤트로픽 ‘클로드 오퍼스 4.5’ 출시…가격 인하로 엔터프라이즈 시장 정조준

작성자 Keiminem쪽지보내기 자기소개 아이디로 검색 전체게시물
작성일 2025.11.26 11:07

조회 1,610

앤트로픽이 플래그십 모델 ‘클로드 오퍼스(Claude Opus) 4.5’를 공개하며 가격을 67% 인하했다. 이번 조정으로 해당 모델은 그동안 ‘부티크형’ 고가 제품으로 여겨지던 위치에서 실제 기업 운영 환경에 바로 투입할 수 있는 엔터프라이즈용 도구로 재정비됐다.

새 가격은 입력 토큰 100만 개당 5달러, 출력 토큰 100만 개당 25달러로, 기존 15달러와 75달러에서 크게 낮아졌다. 조정을 통해 앤트로픽은 오픈AI와 구글에 한층 가까운 가격대를 형성하면서도 프리미엄 모델이라는 포지션은 유지했다.

이번 출시 소식은 구글이 ‘제미나이 3’를 공개한 지 일주일, 오픈AI가 ‘GPT-5.1’을 발표한 지 보름도 지나지 않은 시점에 나왔다. 엔터프라이즈 AI 시장에서 경쟁 속도가 얼마나 빠르게 가속하고 있는지를 보여준다. 참고로 오픈AI GPT-5.1의 이용료는 입력 토큰 100만 개당 1.25달러, 출력 토큰 100만 개당 10달러이며, 구글 제미나이 3 프로는 입력 토큰 기준 100만 개당 2~4달러 수준이다.

앤트로픽은 홈페이지에서 “오퍼스 4.5는 AI 시스템이 할 수 있는 일을 한 단계 끌어올린 모델”이라고 설명했다.

벤치마크 논쟁

앤트로픽은 오퍼스 4.5가 ‘소프트웨어 엔지니어링 벤치마크 베리파이드(Software Engineering Benchmark Verified)’에서 80.9%를 기록해 오픈AI GPT-5.1-코덱스-맥스(77.9%), 구글 제미나이 3 프로(76.2%), 자사 소네트 4.5(77.2%)보다 더 높은 성능을 보였다고 밝혔다. 또한 내부에서 실시한 2시간 분량의 엔지니어링 성능 평가에서도 지금까지 시험을 치른 어떤 인간 지원자보다 높은 점수를 받았다고 주장했다.

그러나 애널리스트들은 벤치마크 점수가 전부는 아니라며 주의를 당부했다. 그레이하운드리서치(Greyhound Research) 최고애널리스트 산치트 비르 고기아는 “벤치마크 점수는 겉보기에는 인상적이지만, 실제 운영 환경에 투입되면 의미가 크게 달라진다. 벤치마크는 깨끗하고 단순하며, 고립된 조건에서 실행된다. 반면 엔터프라이즈 시스템 대부분은 레거시 소프트웨어, 불규칙한 워크플로우, 규제 요건이 층층이 얽혀 있다”라고 말했다.

포레스터 수석애널리스트 레슬리 조셉은 앤트로픽의 우위가 통계적으로 의미 있는 수준이라는 점은 인정하면서도 “모델 간 격차가 이제 너무 좁아져서, 승자 독식식 비교 지표보다 각 기업 아키텍처에 얼마나 잘 맞는지가 더 중요해졌다”라고 설명했다.

또한 고기아는 기업이 실제로 평가하는 기준은 전혀 다르다며 “모델이 기업의 레거시 툴과 제대로 호환되는지, 긴 시퀀스에서도 정확도를 유지하는지, 높은 부하에서도 안정적으로 동작하는지가 관건이다. 공개 리더보드 점수보다 이런 요소가 훨씬 중요하다”라고 말했다.

전략적 가격 조정

성능 발표를 넘어, 앤트로픽의 가격 전략은 모델의 위치를 근본적으로 재정의하는 변화로 평가된다. 이번 가격 인하는 단순한 비용 경쟁 이상의 의미를 갖기 때문이다. 조셉은 “그동안 오퍼스 라인은 일반 자동화 워크플로우에 적용하기에는 지나치게 비싸 ‘부티크형’ 모델로 여겨졌다. 가격 인하는 경쟁사가 내놓는 특화형 엔터프라이즈 모델보다 가격 우위를 확보하려는 조치로, 이제 ‘프런티어 인텔리전스’가 더 이상 희소한 자원이 아니라는 신호”라고 말했다.

앤트로픽은 프롬프트 캐싱 기능을 통해 비용을 최대 90% 절감할 수 있으며, 배치 처리 시에는 50%의 절감 효과가 있다고 설명했다. 이런 최적화 기능은 비용 예측 가능성과 자원 관리가 도입 결정의 핵심 요소로 작용하는 엔터프라이즈 환경에서 특히 중요한 요인으로 꼽힌다.

고기아는 이번 가격 조정의 방향을 두고 “앤트로픽의 새 가격 정책은 값싸게 경쟁하려는 ‘바닥 경쟁’에 참여하겠다는 의미가 아니다. 새 요금은 클로드를 경쟁사와 가까운 수준으로 맞추지만, 가치 제안은 분명하다. 이 모델은 토큰 사용량보다 안정성과 신뢰를 우선하는 엔터프라이즈를 위해 설계됐다”라고 말했다.

오퍼스 4.5는 약 20만 토큰(약 15만 단어)의 컨텍스트 창을 제공하며, 앤트로픽 API, AWS 베드록, 구글 클라우드 버텍스 AI, 마이크로소프트 파운드리를 통해 사용할 수 있다. 발표에 따르면 이 모델은 전문 소프트웨어 엔지니어링, 복잡한 에이전틱 워크플로우, 고위험 기업 업무를 처리하도록 설계됐다.

기업 워크플로우에서의 활용

앤트로픽 내부 테스트 결과에 따르면, 오퍼스 4.5는 소네트 4.5가 어려움을 보였던 작업을 수행했으며, 모호한 요구사항도 별도의 상세 지침 없이 처리했다고 한다. 물론 앤트로픽은 자체 엔지니어링 성능 테스트가 협업 능력, 커뮤니케이션, 경험을 통해 축적되는 전문적 판단 등까지는 측정하지 않는다는 점도 인정했다.

전문가들은 이 모델이 기업의 실제 요구와 맞물리는 영역을 구체적으로 지목했다. 포레스터의 조셉은 “에이전틱 코딩과 안정적인 문서 생성 성능이 강화된 만큼, 소프트웨어 엔지니어링뿐 아니라 법무나 컴플라이언스처럼 문서 기반 업무가 많은 조직에서 효과가 클 것”이라고 말했다.

그레이하운드리서치의 고기아는 이 모델이 특히 정밀도가 요구되는 역할에 적합하다며 “법무팀, 소프트웨어 아키텍트, 정책 작성자, 컴플라이언스 담당자가 가장 큰 변화를 체감할 것이다. 이런 분야는 속도보다 정확성이 훨씬 중요한 영역”이라고 설명했다.

IDC 아시아·퍼시픽의 빅데이터·AI 리서치 책임자 디피카 기리는 경쟁력 있는 가격과 효율성의 조합은 기업의 도입을 가속화한다며 “고급 안전 기능과 감사 가능성을 갖춘 앤트로픽 모델은 컴플라이언스 중심 산업이나 규제가 많은 환경에 특히 잘 맞는 선택지”라고 말했다.

개발자 도구와 통합 기능

핵심 모델 개선과 별도로, 앤트로픽은 개발자 도구도 확대했다. 회사는 터미널 기반 개발 환경인 ‘클로드 코드(Claude Code)’에 강화된 플랜 모드를 추가했다고 밝혔다. 앤트로픽은 발표에서 “플랜 모드는 이제 더 정교한 실행 계획을 수립하고 더 철저하게 수행한다. 클로드는 먼저 필요한 사항을 명확히 하기 위해 질문을 던지고, 이후 실행 전에 사용자가 편집할 수 있는 plan.md 파일을 생성한다”라고 설명했다.

해당 도구는 앤트로픽 데스크톱 애플리케이션에서도 이용할 수 있다. 깃허브의 체인지로그에 따르면 오퍼스 4.5는 깃허브 코파일럿 프로, 프로 플러스, 비즈니스, 엔터프라이즈 사용자에게도 제공된다.

앤트로픽은 발표에서 “유료 사용자는 더 이상 긴 대화가 중단되는 문제가 없다. 클로드가 필요할 때 앞선 맥락을 자동으로 요약해 대화를 계속 이어갈 수 있다”라고 설명했다. 브라우저 탭 전반에서 동작하는 크롬용 클로드는 이제 맥스(Max) 구독자 모두에게 제공되며, 엑셀용 클로드는 맥스, 팀, 엔터프라이즈 사용자 대상으로 정식 서비스로 전환됐다.

기업이 고려해야 할 요소

AI 플랫폼을 검토하는 기업에는 토큰당 가격 이상의 판단 기준이 필요하다. 조셉은 “조달팀은 생태계 적합성을 반드시 따져야 한다. 예를 들어 구글 워크스페이스에 깊게 통합된 회사라면, 코딩 점수가 약간 낮더라도 제미나이의 멀티모달 기능이 더 실용적일 수 있다”라고 설명했다.

고기아는 규제 산업에서의 비용 구조는 일반 API 비용 계산과 다르다고 지적하며 “규제 산업에서는 작은 실수 하나가 컴플라이언스 문제나 후속 재작업으로 이어질 수 있다. 진짜 비용은 API 청구서가 아니라 후처리 과정이다. 이런 기업에는 문제를 줄이기 위해 더 높은 비용을 지불하는 선택이 합리적일 수 있다”라고 강조했다.

이번 출시는 앤트로픽이 두 달 사이에 세 번째로 내놓은 주요 모델 업데이트다. 지난 9월 소네트 4.5, 10월에는 하이쿠 4.5를 공개했다.
dl-itworldkorea@foundryco.com