4차 산업혁명과 관련해 의료기관별 존재하는 상이한 데이터들을 '표준화'하는 작업이 필요하며, 이를 통해 의료기관 간 데이터들의 공유와 협력, 개방 및 소통이 원활히 이뤄질 수 있음이 강조되고 있다.
23일 오전 9시 분당서울대학교병원 헬스케어혁신파크 대강당에서 '제11회 병원 의료정보화 발전 포럼'이 개최됐다. 이날 아주대학교병원 의료정보학과 한현욱 교수가 '4차 산업혁명, 헬스케어 빅데이터를 만나다' 주제로 특강을 맡았다.
4차 산업혁명이란 빅데이터, IoT, AI 등의 기술을 통해 사람과 사물, 사물과 사물이 초연결되고 막대한 데이터를 분석해 패턴을 발견하는 초지능화된 사회를 말한다.
한 교수는 "4차 산업혁명에서 중요 키워드는 ▲공유, ▲협력, ▲개방, ▲소통이다. 4차 산업혁명에서는 모든 것이 공유되며, 데이터를 공유하며 일어나는 파장들이 크기 때문에 핵심 키워드이다. 두 번째는 협력이다. 모든 것을 혼자 잘할 수 없기 때문에, 사람들과 협력해 시너지 효과를 극대화한다. 그다음은 개방이다. 데이터를 자신만 갖고 있다면 제대로 활용할 수 없다. 자기 것을 과감하게 개방해, 개방형 생태계를 이루는 게 중요하다. 마지막으로 소통이다. 커뮤니케이션을 통해 좋은 솔루션을 만들어야 한다."라고 설명했다.
전문가들은 4차 산업혁명으로 인해 다양한 직업이 탄생하며, 클라우드 컴퓨팅과 같은 정보통신 인프라 기술이 중요 도구로 사용되리라 예측한다.
한 교수는 "3차 산업혁명은 ICT 인프라 중심 사회였고 하드웨어 · 소프트웨어 산업이 주목받았다. 4차 산업혁명은 데이터 중심 사회이다. 데이터에 따라서 인프라 자체가 설계되는 현상들이 일어나고, 지식정보산업이 추구된다. 즉, 4차 산업혁명은 데이터 혁명이다. 데이터가 이루는 사회가 핵심키워드이다."라고 강조했다.
한편, 지난해 1월, 뉴잉글랜드의학저널 'NEJM'의 수석 편집장인 제프리 드라젠(Jeffrey M. Drazen)과 댄 롱고(Dan L. Longo)는 Data sharing을 제출하고, 빅데이터를 통한 연구 행위에 대해 "다른 사람이 이미 출판한 데이터를 활용해 연구를 하는 것은 그것이 어떻게 수집된 것인지 전혀 알지 못하기 때문에 해석 과정에서 오류를 범할 수 있을 뿐만 아니라, 이는 자료를 수집한 이들의 생산성을 빼앗는 행위"라고 일갈하며, 빅데이터를 이용해 연구한 사람들을 '연구기생충'이라고 격하했다.
이에 데이터 과학자들은 "연구자료의 공유를 통해 연구의 타당성을 밝히는 것이 연구를 활성화할 수 있는 가장 좋은 방법"이라고 반박했다. 한동안 '나는 연구기생충이다(#IamResearchParasite)' 해시 태그가 활성화되기도 했다.

한 교수는 "헬스케어 빅데이터에서 4차 산업혁명을 어떻게 준비하고 있고, 어떠한 방향으로 발전하고 있는지를 살펴봐야 한다."라면서, "헬스케어 데이터는 'Clinical Date', 'Genomic Data', 'Lifelog Data'로 구분된다. 확장된 개념으로 최근 'Clinical Date', 'Genomic Data', 'Claim Data', 'Research Data', 'PGHD(Patient Generated Health Data)', 'SDH(Social Determinant of health)' 등 6가지 카테고리로 나누고 있다."라고 설명했다.
의료 IT 발전 단계를 살펴보면, 2000~2005년에 의료정보가 도입됐고, 2005~2010년에 전략경영이 활용됐다. 2010년부터는 의료정보 고도화가 진행 중이며 빅테이터 이슈가 본격적으로 등장했다.
한 교수는 "과거에 도입됐던 EMR(Electronic Medical Record), OCS(Order Communication System), PACS(Picture archiving communication system) 등의 개별시스템에서 나오는 임상데이터가 있는데, 이러한 임상데이터들을 연구하기 위해 CDW(Clinical Data Warehouse)를 최근 많이 도입한다."라면서, "이들을 이용해 IoT, VR, AI 등의 기술 발전을 꾀하고 있다."라고 말했다.
또한, "최근 Research Data, Genomics Data, Signal Data 등 많은 데이터가 들어오고 있다. 미래에는 이러한 데이터들이 따로 존재해 공유, 협력, 개방, 소통이 어려워질 것이다."라면서, "이러한 데이터들을 '표준화'하는 작업이 필요하며, 여기에 투자를 아끼지 말아야 한다."라고 말했다.
표준화는 4차 산업혁명의 핵심 키워드이다.
현재 의료기관들은 각각의 표준화는 가지고 있으나, 의료기관 간 데이터 공유 · 협력 · 개방 · 소통이 어려워 통합 표준화는 이뤄지지 않고 있다.
한 교수는 "표준화는 많은 고민을 통해 이뤄져야 한다. 각 병원 데이터를 표준화하는 전략이 필요하며, IT 인프라, 서식, 용어까지도 표준화해야 한다."라면서, "이러한 기지 아래 만들어진 것이 분산연구망이다. 분산연구망이 작동하려면 데이터가 CDM(Common Data Model)으로 변환돼야 한다. 이렇게 함으로써 민감한 개인정보 유출이 사라지고, 다기관 데이터의 통합 분석이 가능해지며, EMR 자료 연계와 공통 분석코드 이용이 가능하다."라고 설명했다.
CDM은 각각의 기관에 존재하는 상이한 데이터들을 공통된 형태로 만들어주는 데이터 모델이다.
CDM 컨소시엄 현황을 살펴보면, OHDSI, Sentinel, Pcornet, K-CDM 등이 존재한다. 이 중 OHDSI에 아주대병원, 서울아산병원, 가천대길병원이 합류돼 있다. Sentinel과 Pcornet에 가입한 의료기관은 국내에 없다. K-CDM은 식품의약품안전처가 준비하는 CDM 컨소시엄으로, 여기에 서울대병원을 비롯해 국내 4개 병원이 참여 중이다.
OMOP(Observational Medical Outcomes Partnership)-CDM은 관찰연구 기반의 CDM으로, 임상데이터, 병원데이터, 원무 데이터, 용어 데이터, 추출요소 등으로 구성돼 있다.
한 교수는 "OMOP-CDM과 관련해 아킬레스(Achilles)라는 시각화 도구가 있는데, 무료 소프트웨어이다. 이것을 다운받아 컴퓨터에 설치하면 병원 전체 상황을 한눈에 볼 수 있다. 특정 질환에 대해서 혹은 성별 · 연령별로 어떻게 분포됐는지 살펴볼 수 있다."라면서, "무엇보다도 소통을 위한 창구가 중요한데, Github에서 공개된 소스코드와 알고리즘, 데이터 등이 공유되고 있다. 데이터를 다운로드해서 사용할 수 있으며 전부 무료이다."라고 말했다.
한 교수는 "임상데이터들을 상호 운영할 수 있게 활발히 연구돼야 한다. 한편, 데이터가 의료기관 밖으로 나갈 수 없는데, 법률적 문제를 어떻게 해결하고 다른 데이터들과 어떻게 연계시킬 수 있는지에 대한 고민이 필요하다. 또한, 실시간 분석이 안 되는 문제, 비정형화된 데이터의 표준화 문제 등을 어떻게 해결해야 할지가 향후 과제이다."라고 말했다.
또한, "헬스케어 데이터는 병원에서 보관하지만, 그 주체는 여러분 자신의 것이다. 병원에서는 연구 윤리만 잘 지키면 환자 데이터를 자유롭게 사용할 수 있다. 그런데 만일 이러한 상황이 수면 위로 올라왔을 때 여러 문제가 발생하므로 많은 고민을 해야 한다."라고 말했다.
최근 PHR(Personal Healthcare Records)이 이슈가 되고 있다. PHR은 자신의 헬스데이터를 휴대폰에 갖고 다니면서 스스로 관리하는 개인건강기록부이다. 한 교수는 "본인의 데이터를 연구자에게 제공할 경우 적절한 보상을 받아야 한다. 이게 현재까지는 없었다."라고 주장했다.
또한, Blockchain 기술도 주목받고 있다. 이는 비트코인에서 데이터 비용을 어떻게 유통할 것인지에 대한 고민으로 생겨난 개념으로, 헬스케어에서 다양한 문제점을 해결할 기술로 각광받고 있다. 한 교수는 "환자중심 의료서비스는 Blockchain 기술로 일어날 것이다."라고 강조했다.
끝으로 한 교수는 "좋은 데이터가 많이 생산되고, 시스템 구축을 다 했음에도 불구하고 이를 활용할 수 없는 사람들이 너무 많다. 제대로 활용할 수 없다면 단순한 데이터 제공자 역할만 할 뿐이다. 제대로 활용화할 수 있는 전문 조직이 필요하다."라고 말했다.