News Feed

멀티클라우드 복잡성, 생성형 AI로 돌파하는 7가지 방법

컨텐츠 정보

  • 조회 524

본문

단일 클라우드 인프라를 표준으로 삼는 것은 멀티클라우드 전략을 추진하는 것보다 훨씬 수월하다. 단일 클라우드 환경에서는 IT 리더가 인력 역량을 최적화하고 데이터를 보다 쉽게 중앙화할 수 있으며, 적은 수의 도구로 인프라를 보호하는 등 다양한 운영상 이점을 누릴 수 있다. 그럼에도 기업 89%는 멀티클라우드 도입으로 방향을 전환하고 있다고 답했다. 여러 클라우드를 동시에 운영하는 이유로는 리스크 완화, 서비스 중단 최소화, 특정 업체에 대한 종속 회피 등이 꼽힌다.

업체들은 멀티클라우드의 복잡성에 대응해 여러 클라우드 사업자를 아우르는 ‘단일 창(single pane of glass)’ 도구를 선보이고 있다. 예를 들어 AI옵스(AIOps) 플랫폼은 관측성과 데이터 모니터링을 중앙에서 통합 관리할 수 있으며, 다수의 데이터 보안 태세 관리(DSPM) 플랫폼도 멀티클라우드를 지원한다. 플랫폼 엔지니어링 체계를 확립하고, 아키텍처 핵심 원칙으로 핀옵스(finops)를 설계 초기 단계에 반영하며, CI/CD 배포를 자동화하는 전략도 데브옵스팀이 멀티클라우드 관리 부담을 줄이는 방법이다.

AI 코파일럿과 AI 에이전트를 포함한 생성형 AI 도구 역시 빠르게 핵심 도구로 자리 잡고 있다. 선도적인 IT 조직은 생성형 AI를 활용해 애자일 요구사항을 작성하고, 소프트웨어를 개발하며, 테스트를 자동화하고, 문서를 지속적으로 관리한다.

필자는 IT 책임자들에게 생성형 AI를 멀티클라우드 아키텍처에 어떻게 적용해 효율성을 높이고 복잡성 관리를 단순화하는지 물었다.

1. 클라우드 서비스와 코드 이식성 평가

아키텍트는 독점 클라우드 서비스와 멀티클라우드 플랫폼 사이의 트레이드오프를 면밀히 따져야 한다. 예를 들어 개발자가 데이터 파이프라인을 구축할 때 AWS에서는 AWS 글루, 애저에서는 애저 데이터 팩토리, 구글 클라우드에서는 데이터 퓨전을 각각 활용할지, 아니면 여러 클라우드에서 공통으로 사용할 수 있는 데이터 통합 플랫폼을 도입할지 결정해야 한다.

생성형 AI는 코드 생성과 변환에서 세 번째 선택지를 제시한다. 개발 단계에서 한 클라우드 환경에 맞춰 ETL(extract, transform, load) 코드를 작성한 뒤, 아키텍처 변경으로 다른 클라우드 사업자로 전환해야 하는 상황을 가정해보자. 생성형 AI는 코드 변환과 재작성 과정을 지원해 이식성을 높일 수 있다.

플루이드클라우드(FluidCloud) 공동창업자 겸 CTO 하싯 오마르는 “멀티클라우드를 관리하는 일은 AWS, 애저, 오라클 등 각기 다른 언어를 배우는 것과 같다”라며 “여러 환경을 유연하고 효과적으로 오갈 수 있는 팀은 드물다. 특히 IaaS를 넘어서는 클라우드 네이티브 PaaS 서비스에서는 개념과 서비스가 클라우드 간에 쉽게 이식되지 않는다”라고 말했다.

이 문제를 완화하는 방법 중 하나는 플랫폼 선택을 지원하는 AI 에이전트를 개발자나 아키텍트에 배치하는 것이다. AI 에이전트가 내부 표준과 의사결정 기준, 요구사항을 검토해 적합한 솔루션을 제안하고 트레이드오프를 정리한다.

오마르는 “생성형 AI는 사용자의 의도와 설계 선호도를 이해하는 데브옵스 코파일럿처럼 작동해 비용, 성능, 보안 가운데 무엇을 최적화할지에 따라 적절한 인프라 패턴을 자동으로 생성할 수 있다”라며 “팀은 멀티클라우드 전문가를 찾는 데 시간을 쓰기보다 인프라 업데이트를 실행하고, 비즈니스에 가장 적합한 환경으로 워크로드를 최적화하는 데 집중할 수 있다”라고 설명했다.

실무 팁 : 단순한 구성과 구현이라면 클라우드 간 이식이 보다 현실적인 선택지가 될 수 있다. 클라우드 아키텍처 에이전트와 코드 변환 AI 도구를 활용하면 멀티클라우드 이식성을 높이는 데 도움이 된다.

2. 코딩에서 운영 탄력성 강화로 전환

생성형 AI 도구 덕분에 API와 애플리케이션, 데이터 파이프라인 개발이 한층 수월해졌다. ‘2025년 AI 코드 품질 보고서(The 2025 State of AI Code Quality)’에 따르면 개발자의 82%가 AI 코딩 도구를 매일 또는 매주 사용하며, 70%는 코드 품질이 개선됐다고 답했다. 자동화가 IT 조직의 시프트 레프트(shift left) 전략을 가속해 고객 경험과 데이터 품질 개선에 집중하도록 했다면, 코드 생성 도구는 시프트 라이트(shift right)를 통해 운영 탄력성을 높이는 데 기여할 수 있다.

앱파이어(Appfire) CTO 에드 프레데리치는 “생성형 AI는 지식 근로자가 프롬프트와 명세를 통해 코드를 작성하고, 클라우드별 세부 구현은 AI가 처리하는 새로운 역량 모델을 만들고 있다”라며 “앞으로의 성과 기준은 단순한 비용 절감이 아니라, 탄탄한 복원력과 강화된 거버넌스, 그리고 각 클라우드의 세부 차이가 아니라 AI를 도구로 이해하는 팀 역량이 될 것”이라고 말했다. 프레데리치는 이런 변화가 팀이 더 큰 자신감과 영향력을 갖고 일하도록 돕는다고 덧붙였다.

실무 팁 : 생성형 AI를 활용해 거버넌스 정책을 클라우드별 구현 코드로 변환하면 운영 탄력성을 높일 수 있다.

3. 표준 요구사항으로 멀티클라우드 구성 생성

서로 다른 클라우드 전반에서 인프라와 서비스 구성을 표준화하려면 각기 다른 명명 규칙과 아키텍처, 도구, API, 운영 방식에 대한 전문성이 필요하다. 요구사항을 템플릿화할 수 있는 조직이라면 생성형 AI를 번역기처럼 활용해 구성 작업을 간소화할 수 있다.

데이터이쿠(Dataiku) AI 아키텍처 총괄 제드 도허티는 여러 클라우드를 관리하는 일이 좌절을 낳기 쉽다고 지적했다. 각 클라우드마다 보안, 접근 통제, 과금 체계, 서비스 구조가 달라서다. 도허티는 생성형 AI가 이러한 번역 과정을 단순화할 것으로 내다봤다. 도허티는 “복잡한 AWS IAM 역할을 애저 역할 정의로 자동 변환하거나, AWS 클라우드포메이션 템플릿(AWS CloudFormation)을 구글 디플로이먼트 매니저(Google Deployment Manager) 구성으로 자동 변환하는 모습을 떠올리면 쉽게 이해할 수 있을 것”이라고 덧붙였다.

실무 팁 : 단일 요구사항 세트를 기반으로 자동화와 클라우드 구성을 생성하고, 이를 각 클라우드에 맞는 구현으로 변환하는 생성형 AI 도구를 검토하라.

4. 운영과 자동화 단순화

CI/CD, IaC(infrastructure-as-code), 프로세스 자동화는 특히 여러 클라우드 환경에 걸친 작업에서 효율성을 높이는 핵심 도구다. 다만 이들 도구 상당수는 기본적인 흐름과 규칙에 기반해 작업을 간소화하거나 운영을 오케스트레이션하기 때문에, 경계 상황에서 프로세스를 멈추게 하는 오류가 발생하기도 한다. 자동화 체계에 생성형 AI를 결합하면 자동화 수준을 한층 끌어올리고 적용 범위도 넓힐 수 있다.

헥사웨어(Hexaware) AI 글로벌 총괄 겸 수석부사장 메흐디 구다르지는 “멀티클라우드 환경 관리는 오케스트레이션, 컴플라이언스, 비용 통제를 위해 여러 도구를 필요로 해 복잡성이 높았다”라며 “생성형 AI는 자동화와 맥락 기반 인사이트, 지능형 거버넌스를 도입해 이러한 환경을 바꾸고 있다”라고 말했다.

그는 “생성형 AI는 가시성을 단순화하고, 성능과 보안 문제를 사전에 식별하며, 여러 클라우드 사업자에 걸쳐 워크로드를 원활하게 오케스트레이션한다”며 “이 같은 진화는 멀티클라우드를 자원 소모적인 필수 요소에서 민첩성과 복원력, 비즈니스 성장을 촉진하는 강력한 수단으로 전환한다”고 설명했다.

실무 팁 : 자동화 흐름과 오류 처리 과정에서 권장 조치를 제시하는 생성형 AI 기능을 검토하라. 데브옵스 팀은 각 조치에 대한 리스크와 정확도 점수를 산출해 자동화 여부와 사람의 개입 필요성을 판단할 수 있다.

5. 생성형 AI 기반 관측성으로 문제 해결 역량 강화

사이트 신뢰성 엔지니어(SRE)는 장애나 성능 저하 상황에서 즉각 대응해야 한다. 하지만 이들은 문제가 발생한 뒤 수습하는 역할보다, 시스템 성능을 점검하고 사전에 개선 사항을 개발팀에 제안하는 업무를 더 선호한다. 애플리케이션 관측성 향상은 SRE 업무에 도움이 됐지만, 동시에 방대한 데이터 관리라는 새로운 과제를 안겼다.

서리얼DB(SurrealDB) 공동창업자 겸 CEO 토비 모건 히치콕은 “멀티클라우드의 혼란은 본질적으로 데이터 문제이며, 생성형 AI의 강점은 설정값과 로그, 스키마, 데이터 계보를 아우르는 통합 의미 계층을 구축하는 데 있다. 자연어 기반 SRE 코파일럿은 토폴로지와 데이터 중력, 컴플라이언스, 비용 요소를 추론해 워크로드 배치를 제안하고, 런북을 생성하며, 클라우드 전반에서 발생하는 구성 드리프트를 지속적으로 교정할 것”이라고 설명했다.

표준화되지 않고 일관성이 떨어지는 관측성 데이터는 오탐과 오진으로 이어질 수 있다. 그렇다고 개발팀에 데이터 표준과 명명 규칙 준수를 요구하면 추가 비용과 시간이 필요하다.

클라우드볼트(CloudBolt) CPTO 카일 캄포스에 따르면, 오늘날 멀티클라우드 운영은 서로 연결되지 않은 과도한 경고로 팀을 압도하고, 정작 핵심 이슈를 가려버린다. 생성형 AI는 복잡한 크로스 클라우드 텔레메트리를 해석해 맥락을 갖춘 고가치 인시던트와 최적화 기회만을 선별해 제시한다. 캄포스는 “그 결과 경고 피로도가 줄고 문제 해결 속도가 빨라지며, 운영 2단계(day-two operations)에서 측정 가능한 개선 효과가 나타난다”라며 “이는 기업이 클라우드 전반에서 구축·운영·지속적 최적화를 수행하는 방식의 중요한 전환점”이라고 덧붙였다.

실무 팁 : SRE는 애플리케이션 성능 개선을 위해 관측성 데이터를 보다 신속하고 효율적으로 활용할 수 있도록 AI 에이전트와 생성형 AI 기능을 적극적으로 테스트하고 검증할 필요가 있다.

6. 정책과 컴플라이언스 간 격차 축소

각 클라우드 사업자는 정책을 구현하고 컴플라이언스를 점검하기 위한 자체 도구를 제공한다. 정책이 변경될 때마다 보안팀과 운영팀은 각 클라우드 환경에서 이를 개별적으로 수정해야 하며, 이 과정은 비효율적이다.

컴볼트(Commvault) 최고기술·AI 책임자 프라네이 알라왓은 “기업은 AWS, 애저, GCP의 서로 다른 스택을 이어 붙여 운영하면서 복잡성이 높아지고, 클라우드 간 통합은 취약해지며, 데이터 중력과 이그레스 비용, 숙련 인력 부족으로 비용 부담이 커진다”라고 지적했다. 알라왓의 설명에 따르면, 생성형 AI는 의도를 네이티브 통제 수단으로 변환하는 이식 가능한 IaC와 정책을 자동 생성하고 클라우드 전반에서 발생하는 구성 드리프트를 교정해 컴플라이언스 수준과 비용 효율성을 동시에 개선할 수 있다.

실무 팁 : 규제를 받는 기업이라면 정책을 한 번 정의하면 여러 클라우드 환경에 배포하고 보고까지 지원하는 컴플라이언스·보안 도구를 검토하라. 이러한 도구에서 보고와 구성 관리를 지원하는 생성형 AI 기능을 확인하는 것이 좋다.

7. 지속적인 핀옵스 모니터링 체계 구축

클라우드 비용 보고서는 각 클라우드 사업자의 기본 리포팅 도구와 관련 데이터를 통합하는 전용 핀옵스 도구에서 제공한다. 그러나 특히 AI 프로그램을 확장하면서 변동 비용이 크게 늘어나는 조직이라면, 단순 보고서만으로는 비용과 워크로드를 지속적으로 최적화하기에 부족하다.

벌트르(Vultr) CMO 케빈 코크런은 “기업은 여러 API와 도구, 과금 체계를 동시에 다루면서 멀티클라우드 전반의 워크로드를 모니터링하고 프로비저닝하며 최적화하는 데 어려움을 겪어왔다”라며 “생성형 AI는 지능형 권고, 예측 기반 스케일링, 환경 전반에 걸친 자동 정책 집행을 통해 이러한 복잡성을 단순화한다”라고 말했다. 결과적으로 팀은 운영 오버헤드를 줄이고 구성 오류를 최소화할 수 있으며, 워크로드를 효율적이고 비용 효과적으로 운영할 수 있다. 코크런은 “팀은 복잡한 관리 업무 대신 AI 혁신에 집중할 수 있다”라고 설명했다.

실무 팁 : 규모가 작은 기업이라면 애저 어드바이저(Azure Advisor), 구글 클라우드 리커멘더(Google Cloud Recommender), AWS 코스트 익스플로러(AWS Cost Explorer) 같은 기본 도구에 클라우드 비용 검토 책임을 명확히 부여하라. 규모가 큰 기업이라면 재무와 엔지니어링 사용자를 모두 고려해 설계된 핀옵스 도구의 생성형 AI 기능을 면밀히 검토할 필요가 있다.

생성형 AI가 멀티클라우드 복잡성을 완전히 해결할 수 있을까?

생성형 AI는 현재 개발과 운영 도구 전반에 빠르게 통합되고 있지만, 만능 해결책은 아니다. 멀티클라우드와 관련해 컴볼트의 알라왓은 생성형 AI가 데이터 중력이나 지연 시간, 계약상 의무, 숙련 인력 부족 같은 구조적 제약까지 없애지는 못한다며 “조직은 여전히 강력한 가드레일과 플랫폼 엔지니어링 체계를 갖춰 전체 운영 복잡성을 관리해야 한다”라고 말했다.

또한 주요 퍼블릭 클라우드 사업자가 차별화된 기능을 계속 선보일 가능성이 큰 만큼, 생성형 AI 기반 도구가 현재의 과제를 단순화하더라도 새로운 복잡성이 다시 등장할 수 있다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.