“성능이 최우선일 때” 베어메탈 클라우드가 존재하는 이유
컨텐츠 정보
- 조회 716
본문
필자는 지난 주에 한동안 하지 않았던 일을 했는데, 고객에게 베어메탈(Bare Metal) 클라우드 서비스를 추천한 것이다. 고객은 구체적인 목적이 있었고, 베어메탈 클라우드가 문제를 해결하는 데 적합한 기술이었기 때문이다.
일반적인 퍼블릭 클라우드 환경에서 대부분의 사용자는 물리 하드웨어 위에서 실행되는 운영체제의 인스턴스인 가상머신과 상호작용한다. 가상머신은 하이퍼바이저를 통해 서로 분리되어, 여러 사용자가 동일한 하드웨어를 안전하고 효율적으로 공유할 수 있도록 한다. 그러나 이런 추상화는 성능 오버헤드를 발생시키고 서버의 물리 자원에 대한 사용자의 통제도 제한적이다.
반면에 베어메탈 클라우드 서비스는 사용자에게 기본 물리 서버 하드웨어에 대한 독점적인 액세스를 제공한다. 하이퍼바이저, 가상머신, 추가적인 추상화 없이 말이다. 이런 순수성은 가상화로 인한 지연이나 제약 없이 CPU, GPU, 메모리 자원과 같은 기반 컴퓨팅 성능을 온전히 이용할 수 있다는 것을 의미한다. 본질적으로 베어메탈 클라우드는 클라우드 컴퓨팅의 유연성과 전용 온프레미스 서버의 강력한 성능 사이의 간극을 메워 준다.
이런 독특한 자리매김 덕분에 베어메탈 클라우드는 구체적인 성능 요구 사항이 있는 산업, 특히 인공지능과 고성능 컴퓨팅, 전용 하드웨어나 저지연 환경이 필요한 워크로드와 관련된 산업에서 점점 더 중요해지고 있다.
베어메탈의 사용례
베어메탈 클라우드는 모든 사람에게 적합한 것은 아니지만, 특정 상황에서는 빛을 발한다. 고성능을 추구하며 단기적인 워크로드의 비용 최적화를 추구하며 맞춤 설정을 위해 서버 하드웨어에 직접 액세스해야 하는 기업이 대상 고객이다. 베어메탈 클라우드가 장점을 발휘하는 몇 가지 중요한 사용례는 다음과 같다.
- AI/ML 모델 훈련. 이 집약적인 작업에는 엄청난 연산 성능이 필요하다. 가상화 오버헤드 없이 베어메탈 클라우드가 제공하는 GPU와 기타 전용 가속기는 이런 워크로드를 효율적으로 관리하는 데 필수적인 경우가 많다. 많은 기업이 주기적으로 AI 모델을 훈련하기 때문에, 베어메탈 클라우드는 대부분의 시간 동안 사용하지 않는 온프레미스 하드웨어를 구입하는 것보다 더 매력적인 선택지다.
- 고성능 컴퓨팅 애플리케이션. 시뮬레이션, 데이터 모델링, 연구 분석은 짧은 지연 시간과 하드웨어 자원을 온전히 활용할 수 있는 환경에서 번창한다. 앞서 설명한 것처럼 가상화는 성능 제약을 유발할 수 있지만, 베어메탈은 클라우드에서 이런 비효율을 제거할 수 있기 때문에 성능 중심 워크로드에 이상적이다.
- 특수 워크로드. 어떤 애플리케이션은 표준 x86 프로세서 외에 ARM이나 IBM의 Z 메인프레임 아키텍처가 더 유리할 수 있다. 베어메탈 클라우드를 사용하면 사용자는 이런 비표준 아키텍처에 맞게 설계된 워크로드를 테스트하거나 실행할 수 있다. 전통적인 가상 환경이 미치지 못하는 또 다른 영역이다.
- 규제가 엄격한 산업. 정부, 금융, 의료 및 기타 규제 산업은 규제 또는 규정 준수 의무를 충족하기 위해 전용 서버가 필요할 수 있다. 베어메탈 클라우드는 클라우드 배포의 유연성을 유지하면서 필요한 격리를 제공한다.
베어메탈 클라우드를 선도하는 서비스 업체
모든 클라우드 서비스 업체가 베어메탈 서비스를 제공하는 것은 아니지만, 기업이 베어메탈 클라우드의 고유한 이점을 실현할 수 있도록 다양한 선택지를 제공한다. 다음은 이 분야에서 인기 있는 서비스 업체의 알파벳 순서이다.
- 아마존 EC2 베어메탈 인스턴스. AWS의 하위 집합으로, 일반 EC2 VM과 유사하게 작동하므로 기존 AWS 사용자가 전환하기 쉽다. 그러나 아마존의 베어메탈 서비스는 전문 업체에 비해 일부 통제 기능이 제한된다.
- 애저 베어메탈 인프라. 마이크로소프트의 애저 플랫폼은 강력한 베어메탈 하드웨어와 다양한 구성을 제공하지만, 전 세계 모든 지역에서 이용할 수는 없다.
- 디지털오션 베어메탈 GPU. AI/ML용 인프라가 필요한 중소 규모 사용자를 대상으로 하는 디지털오션은 GPU로 강화된 베어메탈 서버를 제공한다.
- 에퀴닉스 메탈. 에퀴닉스의 글로벌 데이터센터와 인프라를 통해 넓은 서비스 범위를 확보하고 있지만, 2026년에는 중단될 예정이다.
- IBM 클라우드. IBM의 베어메탈 서비스는 표준 x86 서버 외에 Z 메인프레임과 리눅스원 등의 아키텍처를 포함하고 있다는 점이 차별점이다.
- 오픈메탈(OpenMetal). 베어메탈 제품에 특화된 오픈메탈은 오픈스택 도구를 관리에 활용한다. 전 세계적으로 데이터센터의 수가 적지만, 포괄적인 관리 옵션을 제공한다는 점에서 강력한 경쟁자이다.
- 피닉스NAP. IaC(Infrastructure as Code) 기능으로 잘 알려진 피닉스NAP은 API, CLI 도구 등을 통해 베어메탈 자원을 관리할 수 있는 유연한 방법을 제공한다. 그러나 서비스 지역이 상대적으로 제한적이다.
- 랙스페이스(Rackspace). 클라우드 서비스 분야의 베테랑인 랙스페이스는 광범위한 구성 옵션과 강력한 지원으로 기업 고객을 위한 베어메탈 서비스를 제공한다.
- 벌처(Vultr). 더욱 저렴한 선택지인 벌처는 전 세계 24개 데이터센터에서 베어메탈 서버를 제공하지만, GPU 지원 옵션은 제공하지 않는다.
베어메탈의 단점
그렇다면 왜 베어메탈 옵션이 많이 사용되지 않는 것일까? 기업은 이 아키텍처를 도입하기 전에 장단점을 신중하게 고려해야 한다.
- 높은 비용. 베어메탈 자원은 일반적으로 VM 기반 클라우드 제품에 비해 가격이 비싸다. 베어메탈은 더 나은 성능을 제공하지만, 이런 환경이 꼭 필요하지 않은 애플리케이션이라면 비용 효율적이지 않다.
- 제한된 애플리케이션 이동성. 가상 환경용으로 작성됐거나 특정 퍼블릭 클라우드의 기능에 맞춰진 애플리케이션은 베어메탈 클라우드에서 최적의 상태로 안전하게 실행되기 위해 상당한 재작업이 필요할 수 있다. 또한, 베어메탈 호스팅 서비스에는 VM 기반 서비스에 내장된 확장 및 로드밸런싱 기능이 없다.
- 지리적 한계. 오픈메탈이나 피닉스NAP와 같은 업체는 데이터센터가 적은 지역에서 운영되기 때문에, 글로벌 지연 문제가 있는 기업에는 적합하지 않다.
- 유연성 감소. 베어메탈 하드웨어를 사용하면 물리적으로 사용 가능한 것 이상으로 프로비저닝할 여지가 거의 없다. 추가적인 메모리나 하드웨어 확장을 동적으로 수행할 수 없다. 기업은 클라우드 컴퓨팅의 유연성 일부를 성능과 제어 기능으로 맞바꿔야 한다.
모든 의미 있는 기술 결정과 마찬가지로, 베어메탈 클라우드를 선택하는 것은 인프라 요구 사항과 비즈니스 전략을 일치시켜야 한다. 전략적으로 사용될 때, 베어메탈 클라우드는 막대한 가치를 창출할 수 있지만, 명확하게 정의된 목적을 달성할 때만 가능하다. 지금까지 필자가 경험한 베어메탈 클라우드가 딱 맞는 상황이 많지 않았다는 점을 고려할 때, 앞으로도 베어메탈 클라우드를 자주 추천하지 않을 것 같다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






