기사 공유하기

사전적으로 ‘헬스케어(healthcare)’와 기존 ‘의료서비스’ 개념 간에 차이점을 굳이 꼽자면, 헬스케어에는 질병에 대한 예방 개념이 포함되어 있다는 점일 것이다. ‘현재의 징후를 통해 제시할 수 있는 병의 치료법’과 더불어 ‘향후 발생할 수 있는 질병을 예측하고 건강유지를 위해 지속적 관리를 도모한다’는 개념이 포함되어 있다.

질병의 예측을 위해서는 결국 데이터가 필요하다. 오늘날 컴퓨팅 기술과 미디어 플랫폼, 기기 등이 폭발적으로 진보하게 되면서 이를 통해 축적되는, 이른바 빅데이터는 헬스케어 분야에서도 매우 중요한 재료로 활용되고 있다. 이번 원고에서는 헬스케어 분야에서 활용되는 빅데이터와 이를 통해 진보하고 있는 헬스케어 서비스 분야의 몇 가지 사례에 대해 살펴보고자 한다.

활용되는 빅데이터의 구분

맥킨지앤컴퍼니(McKinsey & Company)가 2013년 발표한 보고서 “헬스케어 분야에서의 ‘빅데이터’ 혁명(The ‘Big data’ revolution in healthcare)”에 따르면, 헬스케어 분야에서 활용 가능한 빅데이터 종류는 크게 네 가지로 구분할 수 있다.

헬스케어 분야에서의 ‘빅데이터’ 혁명

  1. 서비스를 이용하는데 드는 비용을 청구하는 과정에서 발생하는 데이터
  2. 문서, 사진, 동영상 등의 전자화된 진료기록
  3. 의약품 연구개발 과정에서 축적된 데이터
  4. 환자의 행동과 감정/정서 등과 관련한 데이터

각각의 빅데이터군은 헬스케어 서비스를 제공받는 일련의 과정에서 생산되는 데이터로 설명할 수 있다. 환자가 서비스를 제공받기 위해 비용을 지불하는 단계에서 시작해 진단을 받고 난 이후, 특정 질병의 해결을 위해 연구개발이 수행되고, 다시 환자가 이러한 연구개발 결과물을 이용하는 단계들에서 각 데이터가 생산되는 것이다. 보고서에서는 무엇보다 이러한 빅데이터가 효과적으로 통합되어 활용될 때 중요한 기회들이 창출될 수 있다고 보았다.

헬스케어 분야의 빅데이터 혁명을 이끌고 있는 주요 데이터군 (출처: 맥킨지앤컴퍼니)
헬스케어 분야의 빅데이터 혁명을 이끌고 있는 주요 데이터군 (출처: 맥킨지앤컴퍼니)

즉 헬스케어 분야에서도 여타 빅데이터가 활용되고 있는 산업 영역들과 마찬가지로 데이터의 폭발적인 생산력이 서비스나 산업을 진보시키는 데 이제는 그리 큰 변수가 아닌 것이다. ‘헬스케어 빅데이터’라고 하면 논의의 대부분이 데이터를 분석하는 방법론 쪽에 치우쳐 있을 것으로 생각하기 쉽다. 하지만 이와 더불어 산재한 디지털 정보들을 어떻게 인덱싱할 것인가, 어떻게 데이터군을 통합시킬 것인가, 이를 위해 의료계 인력의 교육은 어떻게 할 것인가가 매우 중요한 이슈들로 부각되고 있다.

의료계에서도 이미 디지털화된 데이터를 축적하는 기술력과 기초적인 IT 인프라는 갖춰지고 있으므로, 이렇게 수집된 데이터를 어떻게 통합ㆍ관리하고 해석하느냐에 더 큰 관심이 쏠리고 있는 것이다. 이것이 해결되지 않으면 빅데이터는 헬스케어 분야에서도 무용지물이다.

빅데이터를 활용하는 방식은 어떠한가

기술전문 작가인 제니퍼 그레고리(Jennifer Gregory)는 IBM의 “빅데이터와 애널리틱스 허브” 블로그에서 예측 분석 방법을 활용한 헬스케어 시스템 사례들을 나열했다. 이들 사례로는 다음의 것들이 있다.

  1. 메인 헬스인포넷(Maine HealthInfoNet)
  2. 캐롤라이나스 헬스케어 시스템(Carolinas HealthCare System)
  3. 아이오와 대학 병원 및 클리닉(University of Iowa Hospitals and Clinics)

[box type=”info”]
메인 헬스인포넷

‘메인 헬스인포넷’은 미국 주 단위 전자건강기록(Electronic Health Record. 이하 EHR)을 고위험군이나 질병에 걸린 환자를 확인하였을 경우 이를 환자에게 알려주는 시스템이다. 이 시스템은 자신의 의료 기록물에 별다른 관심이 없는 환자들에게 응급실에 가야 함을 알려주거나, 위급한 상황의 예방법을 알려준다. 해당 시스템으로 기존 데이터를 분석한 결과 실제 고위험군에 속하는 환자의 74%는 결국 응급실 방문을 했다고 한다.

캐롤라이나스 헬스케어 시스템

‘캐롤라이나스 헬스케어 시스템’은 환자들의 라이프스타일 습관 분석을 위해 기존 데이터를 활용하는 시스템으로 노스 캐롤라이나와 사우스 캐롤라이나에 있는 900여 개 케어센터들에서 생산되는 자료를 확보하고 있다. 그리고 이 자료들에 예측 분석 방법을 적용해 환자들의 위험요인들을 추출한다. 분석에 활용되는 데이터에는 담배 구매, 꽃가루가 많은 지역에서의 생활, 체육관 멤버십, 정크 푸드 구입 등 다종의 라이프스타일·습관 데이터가 포함되어 있으며 이를 활용해 치명적인 질병에 노출될 위험이 있는 환자들을 걸러낸다.

아이오와 대학 병원 및 클리닉

‘아이오와 대학 병원 및 클리닉’에서는 고위험군 환자를 미리 확인해 수술 이후 혹여 발생할 수 있는 감염에 대해 예방해주는 시스템을 갖추고 있다. 이 대학은 수술 이후에 환자들의 병력, 건강상태, 수술 중 생체 신호 등을 분석해 합병증 발병 가능성을 예측한다. 그 결과 실제로 대장 수술 환자의 감염 비율이 58%까지 감소했다고 한다.
[/box]

이상의 사례들이 기관들에서 생산된 환자 정보의 예측 방법론에 초점을 맞추고 있다면, 하버드 의과 대학 조교수인 레오 셀리(Leo Celi)는 빅데이터 정보를 어떻게 효율적으로 공유할 것인가에 중점을 둬 시스템을 개발한 경우다. 레오 셀리는 MIT 연구자들과 함께 사나(Sana)라는 조직을 꾸려 임상의, 기술자, 정책 전문가, 공중보건, 사업 전문가 등 다양한 학문 분야의 전문가들이 함께 혁신적인 아이디어를 개진할 수 있도록 시스템을 구축했다.

레오 셀리는 사나라는 다국적 커뮤니티를 통해 헬스케어에 대한 기초 자원이 제한적인 국가에 거주하고 있는 인재들과 전문가들을 연결해 정보를 공유하고 전문성 공유의 장을 만들고 있다. 커뮤니티로 구성된 헬스 관련 전문가들과 임상의들이 각자의 데이터를 업로드하여 서로에 필요한 데이터를 전달받고 공유하는 방식이다.

이 과정에서 셀룰러 기술을 활용해 외곽에 있는 빈곤한 지역에까지 정보전달이 쉽게 했다. 전달되는 데이터 종류에는 신장, 혹은 체중과 같이 단순한 신체정보 이외에 뇌와 심장 사진, 엑스레이, 초음파 비디오, 전기 신호 같은 데이터도 포함되어 있어 활용도를 높였다. 무엇보다 다양한 지역의 전문가들이 필요한 정보를 공유하고 실시간으로 대화할 수 있는 네트워크를 구축했다는 차원에서 의미를 둘 수 있어, 정보의 불평등을 막고 ‘빅데이터 분석의 민주화(Democratizing big data analytics)’를 견인했다고 자평하고 있다.

MIT 사나와 레오 셀리가 구상한 헬스케어 정보공유 체계 (출처: 테크리퍼블릭)
MIT 사나와 레오 셀리가 구상한 헬스케어 정보공유 체계 (출처: 테크리퍼블릭)

의료 관련 빅데이터를 더 쉽고 간편하게 공유시키려는 노력은 또 발견된다. 백악관의 암 퇴치 태스크포스(White House’s Cancer Moonshot Taskforce)의 전무이사인 그렉 시몬(Greg Simon)은 ‘아직도 활용할 수 있는 의료 정보가 터무니없이 부족하다’는 점에 주목하며 거의 모든 의료 데이터를 누구나, 무료로, 자유롭게 활용할 수 있도록 하는 데이터베이스를 지난 6월 구축했다.

‘게노믹 데이터 커먼스(Genomic Data Commons)’라 불리는 이 데이터베이스에서는 연구원들이 언제든 게놈과 임상 데이터를 도출해 분석할 수 있다. 데이터베이스에는 14,000~32,000명분에 이르는 암 유전체 지도(The Cancer Genome Atlas)를 보유하고 있으며, 2016년 6월 오픈 이후 5개월 만에 50억 회의 접속 수가 기록되었다고 한다. 이처럼 그렉 시몬은 데이터 공유 문화의 변화가 곧 빅데이터를 활용한 암 퇴치의 시작으로 보고 더 많은 데이터가 더 많은 이용자에게 활용될 수 있도록 관련 업무를 추진하고 있다.

오늘날 쟁점은 무엇인가

오늘날 전 세계적으로 16,000개의 대형 병원에서 환자 관련 데이터를 수집하고 있고, 490만 환자가 원거리 자가 모니터링 디바이스를 사용하고 있다고 한다. 이 숫자들은 향후 더욱 증가할 것으로 보인다. 따라서 데이터의 종류와 숫자, 용량도 기하급수적 증가가 예상된다. 그러면 헬스케어 분야에서 빅데이터의 효용에 대한 의심의 여지는 없을까. 그렇지는 않다. 빅데이터를 활용한 많은 산업에서 나타나듯이 빅데이터 무용론과 비관론은 헬스케어 분야에서도 나타난다. 대용량의 데이터가 과연 그 크기만큼이나 기능을 하는 것인지에 대한 의구심은 인간의 생활과 직결되는 헬스케어 분야에서는 더욱 큰 논란을 빚게 된다.

헬스케어 분야의 빅데이터 관련 수치들 (출처: IBM 빅데이터와 애널리틱스 허브)
헬스케어 분야의 빅데이터 관련 수치들 (출처: IBM 빅데이터와 애널리틱스 허브)

빅데이터의 효용에 대해서는 앞서 소개한 레오 셀리 교수의 의견을 곱씹어볼 필요가 있다. 그는 헬스케어 분야에서 빅데이터를 활용하는 데 있어 일종의 불확실성이 존재한다고 했다. 그 이유는 이렇다.

  • 일단, 의사는 환자를 돕기에도 바쁘다. 그래서 책과 온라인에서 해당 정보를 찾아 소화하는데 시간이 부족하다.
  • 만일 많은 정보를 처리할 시간이 있다고 해도, 나는 실제 환자나 상황에 정확히 적용할만한 데이터가 부족하다는 것을 느낀다.
  • 아직도 상당수의 건강 관련 기록들은 여전히 ​​종이 기반으로 작성된다. 따라서 중요한 진단 정보를 공유하기가 어렵다.

이와 같은 견해를 가진 레오 셀리 교수가 결국 선택한 길은 앞서 설명하였던, 다양한 학문 분야의 전문가들과 협업할 수 있도록 하는 시스템이었으며, 교육 프로그램 개발과 협업 네트워크 등이었다. 이는 모두 결국에는 대규모 정보의 양은 그에 걸맞은 다양한 학습과 협업 인프라 없이는 활용되기 힘들다는 판단 때문이었을 것이다.

아직 헬스케어 빅데이터에 대한 정보보호 정책 체계나 사회적 인식이 완벽히 자리 잡지 못한 문제도 있다. 개인정보로 치자면 의학이나 건강 관련 정보만큼 큰 중요도를 지니는 정보도 없다. 신체정보가 포함되어 있을 뿐만 아니라 금융정보, 행동정보, 정신ㆍ의식과 관련한 정보들이 모두 포함되어 있기 때문에 이를 활용하는 과정에서의 엄격한 관리체계가 요구되는 것이 사실이다.

빅데이터와 헬스케어

하지만 헬스케어 관련 정보의 기준과 범위에 대한 사회적 논의가 아직 완성되지 않았으며 규제를 정립시키기 위한 철학이나 이념적 체계도 합의된 것이 없다. 이러한 상황에서 헬스케어의 산업 및 기술적 진보만을 목적으로 정보보호의 문제를 묵과할 수만은 없는 일일 것이다.

앞서 살펴본 바와 같이 빅데이터는 제대로 된 통합과 관리, 분석방법 없이는 그 자체로만은 무용지물이다. 이는 여는 산업에서나 마찬가지 현상이며 그간 많은 산업 영역에서 빅데이터의 무용론과 비관론을 제기해 온 상태이다. 하물며 인간에게 치명적인 영향을 초래할 사업적 아이템이 대부분인 헬스케어 영역에서 빅데이터 긍정론이 득세할 리는 만무하다. 정신없이 빠르게 흘러가는 ICT 발전과 진보의 시대, 헬스케어 분야에서 활용도가 높아지고 있는 빅데이터에 대해 이제는 정책적으로도 관심을 가져야 할 때가 아닌가 한다.

참고 자료

[divide style=”2″]

KISA 리포트

관련 글