데이터 보안의 판도를 바꾸는 최첨단 암호화 기술 7가지
컨텐츠 정보
- 조회 680
본문
비밀 코드는 몇 백 년 전부터 존재했다. 해적부터 외교관까지, 모두가 다른 사람들이 메시지를 엿보지 못하게 하는 용도로 비밀 코드를 사용해왔다. 최근 몇 년 동안 수학자는 해독하기 어려운 더욱 강력한 알고리즘을 구축했다.
이 과정에서 수학자는 알고리즘이 단순히 메시지를 보호하거나 보물의 위치가 알려지지 않도록 지키는 이상의 역할을 할 수 있다는 사실도 발견했다. 알고리즘은 복잡한 규칙을 강제하고 작업에 참여하는 사람들을 조율할 수도 있다.
이제 우수한 알고리즘은 단순히 메시지 보호에 그치지 않고 많은 역할을 수행한다. 속임수를 차단하는 알고리즘도 있고, 공정한 의사 결정을 보장하고 팀의 합의에 이르도록 돕는 알고리즘도 있다. 편향성 없는 중립적인 의사 결정자를 제공하기도 한다. 같은 기본 알고리즘을 위한 새로운 사용례가 수시로 등장한다.
이러한 알고리즘은 모든 분야의 워크플로우를 바꿀 수 있다. 이 기사에서는 더 우수하고 안전한 기업 IT 인프라를 촉진하기 위해 데이터 스트림 전체의 보안과 공정성, 효율성을 개선하는 가장 유망한 7가지 접근 방식을 소개한다. 각 접근 방식은 미래 세대에 예상치 못한 이점을 제공할 수도 있다.
블록체인
블록체인이라는 단어는 암호화폐와 동의어로 사용되는 경우가 많지만 개념 자체는 암호화폐보다 훨씬 더 넓다. 블록체인은 경쟁자들이 합의에 도달하도록 하는 일반적인 해결책이다. 암호화폐 발행자는 누가 어떤 코인을 소유하고 있는지에 대한 원장을 추적하는 용도로 사용하지만 다른 자산이나 의사 결정을 추적하는 용도로도 블록체인을 사용할 수 있다.
강력한 체인은 모든 사람이 계산을 감사할 수 있도록 허용하는 공유 공개 시스템에서 임의의 복잡한 알고리즘을 실행할 수 있다. 이러한 체인은 머클(Merkle) 트리 또는 타원 곡선 디지털 서명 알고리즘(ECDSA)과 같은 암호화 알고리즘을 사용해서 모든 거래를 강력하게 규제되는 프로세스를 통해 처리한다. 동료부터 경쟁자까지 모든 사람이 결과가 공개적이고 정직하게 도출되었음을 확신할 수 있다.
IT 수학자는 이러한 알고리즘을 바탕으로 의심스러운 사용자 간에 신뢰를 구축해야 하는 모든 시나리오에서 체인을 업데이트할 수 있다. 이벤트에 집중하는 경우도 있고 대출 기관, 보험 중개업체, 소유권 등록 대행업체와 같은 여러 당사자의 조율이 필요한 자동차 구매와 같은 복잡한 거래를 간소화하는 데 목적을 두는 경우도 있다.
이더리움과 같은 유명한 체인을 사용하는 데는 상당한 비용이 따를 수 있지만 지금은 아비트럼(Arbitrum)과 같이 훨씬 더 낮은 가격으로 거의 동일한 보안을 제공하는 좋은 2차 또는 3차 체인이 많이 나와 있다. 주목할 만한 옵션으로는 솔라나(Solana), 아비트럼, 그노시스(Gnosis), 스케일(Skale) 등이 있고 그 외에도 여기서 모두 나열할 수 없을 만큼 많다.
비공개 정보 검색
데이터베이스 보안은 간단하지만 사용자의 개인 정보를 보호하기는 조금 더 어렵다. 비공개 정보 검색 알고리즘은 데이터베이스 소유자에게 너무 많은 정보를 공개하지 않고도 데이터베이스에서 특정 데이터 블록을 검색할 수 있게 해준다.
이러한 부가적인 보호 계층은 대량의 데이터 블록을 복잡하고 불가해한 수학 덩어리(blob)로 뒤섞는다. 적법한 사용자만 보고자 하는 특정 블록을 풀 수 있다. 덩어리에 포함된 비트가 너무 많기 때문에 데이터베이스는 어떤 특정 비트가 요청되었는지 추적할 수 없다.
이 알고리즘은 데이터베이스 쿼리만으로도 너무 많은 정보가 노출될 수 있는 분야에서 유용하다. 예를 들어 주식 거래 부서라면 내부자 거래를 방지하기 위해 데이터베이스 유지보수를 담당하는 백 오피스가 조사 내용을 볼 수 없도록 할 수 있다. 보안이 강화된 정부 기관은 공통 인프라에 저장된 구획화된 정보를 보호할 수 있다.
비공개 정보 검색 서비스를 제공하기 위해 통합할 수 있는 라이브러리로의 예를 들면 SealPIR, MuchPIR, FrodoPIR이 있다.
스나크(Snark)
디지털 서명은 현대 암호화 수학에서 잘 알려진 기능이다. 비밀 키를 알고 있는 사람은 키를 사용해 일부 비트 컬렉션을 인증한다. 인증되는 비트 컬렉션으로는 소프트웨어 설치, 데이터베이스 트랜잭션, DNS 항목 등이 있고 그 외에도 많다.
ZK-스나크(ZK-Snark)는 정보를 공개하지 않으면서 그 정보를 인증하는 더 강력한 방법을 제공한다. 이 용어는 “지식 없는 간결한 비대화형 지식 증명(Zero-Knowledge Succinct Non-Interactive Arguments of Knowledge)”의 약어다. 디지털 ID의 스나크는 예컨대 어떤 사람의 정확한 나이를 공개하지 않으면서도 술을 마실 수 있는 나이임을 보장할 수 있다.
가장 명확한 사용례는 디지털 계약에서 볼 수 있다. 계약의 한 당사자는 민감하거나 개인적인 정보를 공개하지 않고도 특정 요소를 보증할 수 있다. 디지털 투표 시스템은 특정인의 투표 정보를 공개하지 않으면서 감사가 가능한 방식으로 선택을 도표화할 수 있다.
이 알고리즘은 일반적으로 매우 빠르다. 데이터 보호보다 속도를 이유로 이러한 알고리즘을 이용하는 애플리케이션도 있다. 트랜잭션에 대한 ZK-스나크를 확인하는 것이 트랜잭션의 모든 데이터를 일일이 살펴보는 것보다 훨씬 더 효율적일 수 있다.
구현의 예를 들면 libsnark, DIZK 또는 ZoKrates 등이 있다.
양자 후 암호화
충분한 크기의 양자 컴퓨터가 등장하면 기존의 공개 키 암호화 알고리즘은 쉽게 깨지게 된다. 현재 사용되고 있는 시스템을 무력화할 수 있는 기계가 얼마나 진전됐는지 공개적으로 발표된 바는 아직 없지만, 몇몇 연구자들은 그 순간에 대비하기 위해 오랜 시간 노력해왔다. 이들은 즉각 해독하기 어려운 다른 구조의 새로운 알고리즘을 만들고 있다.
미국 국립표준기술원은 우수 알고리즘을 개발하기 위한 대회를 개최하고 있는데, 이미 이 가운데 몇 가지 가능한 방법을 파악했다. 이러한 방법은 고성능 양자 컴퓨터의 등장을 우려할 이유가 있는 기업에 좋은 토대가 될 것이다.
이 같은 알고리즘은 과거 알고리즘과 상당히 다르고 여러 장점을 제공하므로 양자 컴퓨팅에 대해 그다지 우려하지 않는 사람이라 해도 살펴볼 만한 가치는 있다. 예를 들어 SPHINCS+는 잘 연구된 기본 해시 함수를 이용한다. 일부 칩에는 해시 함수가 반도체에 구현돼 있다.
NIST의 작업은 좋은 출발 지점이다. 웹사이트에서 초안 표준, 토론, 참조 구현을 찾아볼 수 있다.
암호화를 적용한 연합 학습
AI 알고리즘 학습에서 중대한 과제 중 하나는 모든 데이터를 한 곳에 수집해야 한다는 점이다. 많은 비용이 들뿐만 아니라, 대용량 머신보다 데이터 집합의 크기가 훨씬 더 큰 경우가 많아 비현실적이기도 하다. 또한 모든 정보를 한 곳에 저장할 경우 데이터 도둑 역시 한 곳에서 모두 훔칠 수 있으므로 개인정보 보호 측면에서도 위험성이 있다.
몇몇 AI 과학자는 데이터를 모을 필요가 없도록 학습 작업을 여러 개별적인 위치로 분할하는 방법을 모색하고 있다. 또한 부가적인 개인정보 보호 기능을 위해 암호화 계층도 혼합하고 있다.
최근 발전된 부분은 현재 활발한 연구가 진행되고 있는 IBM FL, OpenFL, PySyft, NVFlare를 비롯한 여러 프로젝트에서 찾아볼 수 있다.
차등 개인정보 보호
차등 개인정보 보호 알고리즘은 단순히 데이터를 뒤섞는 데 그치지 않고 무작위적 왜곡과 노이즈를 추가해 기밀성을 확보한다. 이렇게 하면 통계적으로 원본과 유사하지만 명확한 개인 식별 정보는 없는 데이터 집합이 생성된다.
예를 들어 암 환자 데이터베이스의 경우 환자가 거주하는 도로명은 나오지만 정확한 주소는 저장되지 않도록 할 수 있다. 또는 개인정보 보호 요소(그리스 문자 엡실론으로 표현) 값이 높아지면 도로명도 근처의 다른 도로명으로 대체될 수 있다. 데이터 과학자는 여전히 결과를 연구할 수 있지만 신원을 도용하는 이들에게는 별 가치가 없는 데이터가 된다.
구글과 IBM은 데이터 변환을 위한 라이브러리를 배포한다. MIT 프레스(MIT Press)는 필수 지식(Essential Knowledge) 시리즈에서 이를 주제로 한 신간을 출판했다.
완전 동형 암호화(FHE)
전통적으로 암호화된 정보는 완전히 불가해하다. 애초에 암호화의 목표가 키가 없으면 암호화된 패킷의 내용을 알 수 없도록 하는 데 있기 때문이다. 그러나 최근 몇몇 수학자는 두 가지 이점을 동시에 얻는 방법을 찾아내고 있다. (필자의 책 ‘반투명 데이터베이스(Translucent Databases)’에도 초기 기술에 관한 내용이 나온다.)
지금은 암호를 해독하지 않고도 데이터를 추론할 수 있는 방법이 많고, 이를 통해 기업의 보안을 강화할 수 있다. 특정 데이터베이스 레코드를 검색할 수 있는 알고리즘도 있고 기본적인 산술을 할 수 있는 알고리즘도 있다.
가장 주된 목표는 암호화된 데이터를 복호화하지 않고도 임의의 튜링 완전(Turing-complete) 계산을 허용하는 완전 동형 암호화(FHE) 알고리즘을 만드는 것이다. 이 기능을 제공하는 뛰어난 알고리즘이 몇 개 있지만 효율성이 아직 많이 떨어진다.
dl-itworldkorea@foundryco.com
관련자료
-
링크
-
이전
-
다음






