2024.04.16 (화)

  • 구름많음동두천 20.9℃
  • 구름조금강릉 22.7℃
  • 흐림서울 21.7℃
  • 맑음대전 24.6℃
  • 맑음대구 25.7℃
  • 구름조금울산 23.8℃
  • 맑음광주 23.4℃
  • 구름조금부산 25.1℃
  • 맑음고창 23.7℃
  • 구름많음제주 23.0℃
  • 구름많음강화 21.1℃
  • 구름조금보은 22.0℃
  • 맑음금산 23.5℃
  • 구름조금강진군 24.4℃
  • 구름조금경주시 25.0℃
  • 구름조금거제 24.9℃
기상청 제공

기자수첩

한국의 미션,'4차산업혁명시대의 강 흐르게 하라'

인공지능(AI)이 제약분야 쾌속선 역할을 할 수 있을까


가능성은 여러 차례 확인됐다. AI신약개발 벤처 Insilico Medicine은 섬유증 치료제 후보물질 발굴에 21일이 소요됐다고 밝혔다. 후보물질 검증까지 걸린 기간은 46, 들어간 비용은 15만 달러( 18000만원) 수준이었. 정통적인 방법은 같은 과정에 8년이란 기간과 수백만 달러의 비용이 투입된 것으로 나타났다.


BenevolentAI사는 루게릭병 치료제 후보물질을 3주만에 발견하기도 했다. Atomwise사의 인공지능 Atomnet은 하루 100만 분자에 대한 스크리닝 및 1000만 분자 합성이 가능하다. 일반 랩탑 컴퓨터 활용 시 1만년이 걸리는 작업이다.


이런 강력한 알고리즘은 신약개발 후발국에게 청사진을 제시한다. , AI라는 배를 띄울 강이 있다는 전제 하에 얻을 수 있는 그림이다.


다케다 제약 신현진 박사는 데이터를 4차산업혁명시대의 강으로 표현했다. 강 주변으로 기술과 전문가가 모이면서 생태계가 조성된다는 견해다


무엇보다 수량이 풍부하고 수질이 좋아야 배의 활용도가 높아진다. 먼저 딥러닝은 충분한 데이터를 통해 학습하지 않으면, 문제를 외우는 경향을 보인다. 비현실적인 솔루션(overfitting)을 내놓을 확률은 덩달아 상승한다. AI 모델의 복잡성이 더해질수록 큰 물에서 놀아야 제 기량이 나온다는 사실도 확인됐다. 


데이터의 질은 양과 밀접한 관계가 있다. 질이 나쁘면 씻어내야 할 요소가 많아지고, 결국 데이터 규모는 줄어든다. 데이터의 수준이 낮으면 AI 모델의 불확실성 역시 올라간다.


국내 제약업계도 데이터의 중요성에 동의하고 있다. 한미약품 연구센터 최창주 R&D정보관리팀장은 '좋은 알고리즘이 나올 경우 바꾸면 되지만, 데이터가 없으면 할 수 있는 일이 제한적’이라고 밝혔다. 대웅제약 김일환 인공지능개발팀장은 ‘AI 신약개발 분야에서 필수적인 3가지는 사람∙데이터∙알고리즘, 다만 데이터가 부정확하면 알고리즘도 쓸모가 없다’고 설명했다.


한국은 누구나 부러워하는 큰 강을 가지고 있다전국민의 인구학적 정보와 의료이용 기록을 담은 건강보험자료를 필두로 병원 EMR자료레지스트리 자료까지 수량만은 풍부하다. 다만 흐르질 않는다기관별로 데이터가 분산돼 있거나, 제도적 문제로 접근에 한계가 있다.


정부의 사업은 수문을 여는 열쇠가 될 것으로 보인다. 특히 'CDM 기반 정밀의료데이터 통합플랫폼 기술개발 사업'과 '의료데이터 보호활용 기술개발 사업'이 기대된다. 데이터 표준화와 개인정보보호 등 빅데이터 활용과 관련한 가장 큰 이슈에 답을 구하는 도전이다. 이 밖에도 '형질분석연구', '헬스케어 빅데이터 쇼케이스', '보건의료생물자원종합관리' 등의 사업도 헬스케어 데이터 구축을 목표로 시행된다.  


일련의 과정이 열매를 맺는다면, 국내제약계의 미래는 한층 밝아질 전망이다. 누구보다 큰 강을 가질 수 있기 때문이다. 강은 기술과 인력을 불러모아 또 다른 혁신을 창조할 수 있다. 이런 점을 고려할 때, 4차산업혁명시대를 맞이하는 한국의 미션은 명확하다.