2024.04.19 (금)

  • 구름많음동두천 20.9℃
  • 구름조금강릉 22.7℃
  • 흐림서울 21.7℃
  • 맑음대전 24.6℃
  • 맑음대구 25.7℃
  • 구름조금울산 23.8℃
  • 맑음광주 23.4℃
  • 구름조금부산 25.1℃
  • 맑음고창 23.7℃
  • 구름많음제주 23.0℃
  • 구름많음강화 21.1℃
  • 구름조금보은 22.0℃
  • 맑음금산 23.5℃
  • 구름조금강진군 24.4℃
  • 구름조금경주시 25.0℃
  • 구름조금거제 24.9℃
기상청 제공

학술/학회

딥러닝 암 연구에서 어떻게 활용될까?

암 세포 배양 방식의 어려움 극복할 방식으로 제시돼

암 세포에서 취약성(vulnerabilities)이 있는 유전자를 딥러닝 기법을 이용해 찾아내는 연구내용이 발표됐다. 

최정균 카이스트 교수는 21일 서울 롯데호텔에서 열린 대한암학회 학술대회에서 ‘Deep learning for predicting cancer vulnerabilities in clinical samples’을 주제로 발표했다. 

암세포(cancer cell)는 정상세포(normal cell)에 비해 취약성이 높다. 가령 암 세포의 성장에 영향을 주지만, 정상 세포의 성장에는 영향을 미치지 않는 특정 유전자를 ‘gene B’라고 가정해 보자. 이 때 우리는 gene B를 암 세포에 대해 취약성(vulnerability)가 있다고 표현한다. 이와 같은 표현으로 암 세포가 gene B에 자신의 생존을 의존(dependency)한다고도 표현한다. 




◆기존 암 유전자 연구, in vitro 수준에 머물러 임상에 적용하기 힘들어 

▲shRNA knock-down screening ▲CRISPR-Cas9 knock-out screening ▲ high-throughput screening 등 유전자 검사 방법이 발전하면서 각각의 유전자가 암 세포의 성장에 어떤 영향을 미치는지 알아보는 연구가 활발히 진행되고 있다. 대표적으로 하버드대학교와 노바티스는 세포주(cell line) 400-500개를 대상으로 연구를 진행해 암 세포가 의존적인 유전자 지도 ‘caner dependency map’을 발표했다.   



그러나 이러한 연구는 모두 in vitro(시험관 내)에서 세포 배양(culture) 과정을 통해 일일이 유전자를 찾아내야 한다는 한계를 가지고 있다. 

임상 샘플이 주어졌을 경우 해당 암 세포의 세포 주(cell line)을 만들거나, 환자유래 암조직 이종이식기술 (patient-derived xenograft; PDX) 을 활용한 쥐를 이용해야 한다. 실제로 환자의 암세포를 이식한 쥐를 제작하는 데만 6개월 이상이 소요된다. 또한 암 세포와 관련된 돌연변이(mutation)는 다양한 유전자의 상호작용에 의해 일어나므로 여러 유전자와의 네트워크를 살펴봐야 한다. 

◆딥러닝을 이용해 이미 알려진 암 유전자와 세포주 교차시키는 연구 진행 

암과 관련된 주어진 세포주 데이터와 유전자 데이터를 딥러닝 기법을 통해 결합하는 것이 최 교수 연구의 핵심이다. 

이와 관련해 최 교수는 “예를 들어 1번 세포주에서 1번 유전자가 암세포에 취약성이 있다고 가정해 보자. 전체 유전체 중 1번 유전자와 나머지 다른 유전자의 비율을 머신러닝 기법을 적용한다. 이러한 과정을 통해 머신러닝은 세포주와 유전자 데이터를 학습하게 된다. 이러한 머신러닝은 학습을 통해 환자의 샘플 데이터가 주어졌을 때 정상 세포와 암 세포의 유전자 발현 프로파일을 우리에게 제공할 수 있다”고 설명했다. 



딥러닝이 정확한 유전자 발현 프로파일을 제공하기 위해선 ‘조절 네트워크’ 구성이 관건이다. 조절 네트워크는 암 세포에 영향을 미치는 유전자들을 시뮬레이션으로 조절해서 유전자 발현 프로파일의 정확성을 높이는 것이다. 

이와 관련해 최 교수는 “우리가 사용하는 딥러닝이 만약 유방암 데이터로 학습을 하고 있는 상황에서 간암 관련 데이터를 적용한다면 당연히 딥러닝의 수행성능이 떨어지는 것을 확인할 수 있었다”고 덧붙였다. 

◆TCGA 유방암 환자 113명의 RNA 데이터를 통해 머신러닝 효용성 입증 

신약개발 측면에서 머신러닝을 활용하는 방법으로는 다수의 환자에서 공통적으로 나타나는 취약성이 무엇인지 파악하는 것이다. 

이와 관련해 최 교수는 “각 유전자 별로 많은 환자에서 공통적으로 나타는 취약성이 무엇인지 살펴봤을 때 가장 빈도가 높은 것이 Ran(유전자 명)였다. 약 30% 이상의 환자에서 Ran 유전자가 암 세포의 취약성이 높은 것으로 나타났다”고 설명했다. 

덧붙여 “Ran 유전자의 발현을 억제(suppression)해 주면 암 세포 성장에 지대한 영향을 미친다. 따라서 아무리 암 세포 내로 신호(signal)이 들어와도 암 세포가 성장을 멈추는 상황이 될 것이다”고 예측했다.