News Feed

마이크로소프트 패브릭으로 구현하는 디지털 트윈

컨텐츠 정보

  • 조회 808

본문

디지털 트윈은 현대 제어 시스템의 중요한 부분으로, 실제 시스템을 본뜬 모델을 만들어 시뮬레이션과 예측을 수행할 수 있게 해준다. 디지털 트윈은 실시간 데이터를 사용해 시스템의 입출력을 모델링해서 “실제 세계”와 동일한 상태를 유지한다.

디지털 트윈을 만들기는 쉽지 않다. 특히 대규모의 복잡한 시스템을 모델링하는 경우에는 더욱 어렵다. 초기의 트윈은 단순했으며 입출력 규모도 작았지만 지금은 산업 공정 또는 에너지 발전 시스템 전체를 모델링한다. 예전에는 툴로 디바이스 한 대를 다루는 정도였지만 지금은 전 세계에서 가장 큰 수준의 인프라를 지원해야 한다.

복잡한 대규모 시스템 모델링하기

복잡한 시스템은 물리적 객체와 동적 프로세스를 다루기 때문에 모델링하기 어렵다. 예를 들어 용광로의 디지털 트윈에는 용광로 가동에 필요한 코크스를 공급하는 공급망까지 포함해야 한다. 용광로 내의 잔유물이 유리질 상태가 되지 않도록 얼마큼의 코크스를 연소해야 하는지 제어하기 위해서다. 이 부분을 제어하지 못해 잔유물이 유리질 상태가 되면 몇 개월 동안 작업과 수백만 달러의 비용이 들게 되고 그 사이 생산은 중단된다.

이런 대규모 모델에는 많은 데이터가 필요하다. 디지털 트윈을 만들기 위해서, 그리고 모델을 최신 상태로 유지하는 데이터를 스트리밍하기 위해서도 대량의 데이터가 필요하다. 데이터가 확보되면 디지털 트윈을 제어 시스템의 한 부분으로 사용하거나 머신러닝과 함께 사용해 잠재적인 오류 조건을 파악하고 고장을 사전에 예측할 수 있다. 즉, 고장이 실제로 발생하기 전에 선제적으로 정비할 수 있다.

대규모 디지털 트윈을 구축하기 위해서는 필요한 충실도를 제공하는 대규모 시계열 스토리지 환경이 필요하다. 이 환경은 다양한 소스의 많은 데이터 유형을 처리하는 동시에 클라우드 규모로 모델을 실행하기 위한 공통적인 쿼리 인터페이스 집합도 지원해야 한다. 이 시스템은 모델링 대상 시스템보다 더 복잡할 수도 있는 규제 프레임워크 내에서, 단편화된 데이터를 가지고도 작동할 수 있어야 한다.

패브릭의 디지털 트윈 빌더 소개

마이크로소프트는 빌드 2025 행사에서 패브릭(Fabric) 데이터 플랫폼을 위한 새로운 디지털 트윈 기능을 발표했다. 실시간 및 시계열 데이터를 포함한 여러 데이터 유형을 기반으로 대규모 데이터 레이크에서 작동하면서 분석을 제공하는 기능이다.

디지털 트윈 빌더는 패브릭의 실시간 인텔리전스 툴의 한 부분이다. 패브릭의 분석 서비스 대부분이 그렇듯이 이 툴 역시 로우코드 개발 플랫폼으로 설계됐으므로 이해관계자와 주제 전문가가 전통적인 개발자와 협력해 자신에게 필요한 툴을 빌드할 수 있다. 패브릭 플랫폼의 핵심은 디지털 트윈 모델에 필요한 주요 개념을 온톨로지로 정의할 수 있게 해주는 일련의 툴이다.

이 온톨로지는 대시보드에 매핑되면서 디지털 트윈에서 발생하는 상황을 시각화해 보여주고 빠른 의사 결정이 필요한 작업자는 이를 통해 정보를 얻는다. 현대 디지털 트윈은 전체 환경에 중심을 두고 설계된다. 예를 들어 해상 풍력 발전소의 기상 조건을 관리하거나 과부하를 방지하도록 블레이드 속도를 제어하고, 하드웨어와 터빈 주변의 야생 동물을 모두 보호하는 데 도움이 될 수 있다.

새로운 툴은 패브릭 내부에서 실시간 인텔리전스 모듈 위에 위치하므로 내장된 데이터 커넥터에 액세스할 수 있다. 또한 패브릭의 원레이크(OneLake) 스토어에 대한 액세스 권한을 가진 다른 애플리케이션도 데이터에 액세스할 수 있다.

패브릭을 사용해 디지털 트윈 만들기

대부분 패브릭 애플리케이션과 마찬가지로 디지털 트윈 빌더 역시 모든 데이터를 레이크하우스에 저장해야 한다. 패브릭 툴은 실제 시스템과 디지털 트윈이 모델링할 공정에 데이터를 매핑하는 온톨로지를 정의한다. 여기서 중요한 점은 패브릭이 다양한 많은 데이터 소스와 스트림을 가져올 때 사용하는 용어집을 구축할 때 전문가가 개입하는 것이다. 모델이 사용하는 필수 엔티티를 정의하고 쿼리로 이들을 불러오고 의미 관계를 정의하는 데 있어 이 매핑 프로세스가 핵심이다.

엔티티란 특정 장비, 프로세스, 입력과 출력, 그리고 이를 둘러싼 사람과 시스템이다. 엔티티는 관련된 패브릭의 다양한 엔티티를 래핑할 수 있게 해주는 데이터와 시맨틱 계층 구조로 연결된다.

이 데이터 맵을 확보하고 나면 다른 패브릭 툴을 사용해 데이터를 탐색 및 분석하고 모델링 대상 시스템과 프로세스에 연결할 수 있다. 더 많은 인사이트를 위해 이 작업을 AI 툴까지 확장해서 데이터에서 이상값을 찾거나 시각화를 제공할 수도 있다. API는 이 데이터를 코드와 함께 사용해서 제어 시스템의 디지털 트윈과 물리적 하드웨어 모델에 연결할 수 있게 해준다. 파워 BI(Power BI)와 같은 친숙한 툴에 시각화를 구축할 수도 있고, 데이터를 전달할 수도 있다.

이 데이터가 있으면 머신러닝 시스템을 통해 학습과 테스트를 수행할 수 있다. 입력과 설정을 기반으로 고장을 예측하거나 제품 품질에 대한 인사이트를 제공하는 모델을 구축함으로써 운영을 최적화하기 위한 툴을 확보하게 된다.

새로운 서비스를 시작하려면 패브릭 관리 포털에서 서비스를 활성화하고 사용자 데스크톱에 최신 파워 BI를 설치해야 한다. 중요한 점은 무턱대고 디지털 트윈을 구축할 수는 없다는 것이다. 사용할 데이터 소스, 그리고 이런 데이터 소스가 모델링 대상 시스템과 어떻게 관련되는지를 파악하고 이해하기 위해 많은 노력이 필요하다.

시스템의 주요 요소와 이 요소들의 연결 방식, 다양한 데이터 소스와 컨트롤 지점의 위치를 보여주는 다이어그램을 두면 도움이 된다. 이렇게 하면 제어 행위가 정보에 미치는 영향을 신속하게 파악할 수 있다. 예를 들어 파이프의 밸브를 조정하면 화학 처리 설비 전반에 위치하는 여러 지점의 유량에 어떤 영향을 미치게 될지를 확인할 수 있다. 이와 같은 다이어그램을 파워 BI 대시보드의 기반으로 사용할 수도 있다.

이 다이어그램은 패브릭에서 데이터를 분류하는 데 사용할 온톨로지를 정의하는 데 도움이 된다. 데이터는 여러 소스에서 다양한 형식으로 유입된다. 마이크로소프트가 패브릭을 사용하는 이유가 여기에 있다. 데이터를 정규화하기 위해 값비싸고 복잡한 ETL 프로세스를 적용할 필요 없이 자체 네이티브 형식으로 저장할 수 있으며, 쿼리는 이렇게 만들어진 데이터 레이크 전반에서 작동한다. 사물 인터넷 시스템의 시계열 운영 데이터, SAP와 같은 툴의 ERP 데이터, 기존 하드웨어 인벤토리에서 사용되는 장비에 대한 세부정보, 그리고 기타 여러 관련 데이터를 혼합할 수 있다. 이 모든 것은 디지털 트윈으로 모델링하는 공정을 중심으로 구성된다.

시맨틱 캔버스에서 작업하기

이 과정의 핵심은 새로운 툴인 시맨틱 캔버스다. 온톨로지의 엔티티를 생성 및 관리하고 다른 엔티티와의 관계를 추가하고 데이터를 매핑하는 작업을 모두 시맨틱 캔버스에서 하게 된다. 패브릭에 사용되는 온톨로지 모델은 계층적이다. 즉, 엔티티를 네임스페이스 그룹으로 묶고 유형을 추가하고 여러 인스턴스를 둘 수 있다. 예를 들어 특정 센서 유형에 대한 엔티티를 생성한다면 물리적 설비에서 해당 센서의 각 구현에 대한 인스턴스를 둘 수 있다. 데이터는 디지털 트윈을 위해 패브릭 레이크하우스에 로드된 다음 시맨틱 캔버스의 엔티티 인스턴스에 매핑된다. 이 디지털 트윈 툴은 데이터가 어떻게 처리되는지에 대한 제어 방법을 비롯해 다양한 데이터 유형에 대한 다양한 매핑을 제공한다

엔티티와 매핑을 구축했다면 이제부터 디지털 트윈을 사용할 수 있다. 파워 BI를 사용해 보고서를 보고 패브릭 실시간 대시보드에 엔티티를 포함하면 된다. 다른 툴은 데이터를 기반으로 알림을 생성한다. 온톨로지 데이터를 머신 러닝 예측 모델과 함께 사용해 원시 센서 데이터에 컨텍스트를 추가할 수 있다. 애저의 오토ML(AutoML) 툴을 사용해 자동으로 모델을 선택 및 튜닝하거나, 자체 맞춤형 모델을 사용하면 된다.

비즈니스에는 산업용 사물 인터넷의 센서 데이터와 함께 사용할 수 있는 데이터가 많다. 데이터 레이크 플랫폼을 두면 이 데이터를 대규모로 가져와서 훨씬 더 복잡한 디지털 트윈을 더 쉽게 구축할 수 있다. 더 높은 충실도로 더 많은 데이터를 확보할수록 모델이 개선되고 제어의 정확성도 높아진다. 대규모 소프트웨어 개발 리소스가 없어도 시스템을 효율적으로, 안전하게 운영할 수 있다.

패브릭에서 디지털 트윈을 구축하면 로우코드 개발 모델로 이런 규모를 확보할 수 있다. 애저를 기반으로 한다는 것은 실시간 분석과 예측 머신 러닝, 두 가지를 모두 지원하는 처리 성능이 확보된다는 의미다. 산업 공정에서 일어나는 일을 파악하면 그 공정이 속한 더 큰 규모의 비즈니스 프로세스에 공정을 연결할 수 있으며, 동시에 다운타임을 최소화하기 위해 정비해야 할 시점을 선택하거나 수요 변화에 대응해 자재와 장비를 조정해야 할 시점을 파악할 수 있게 된다.
dl-itworldkorea@foundryco.com

관련자료

댓글 0
등록된 댓글이 없습니다.
Member Rank