빅데이터분석

클라우드 유전체 분석 뜬구름 다 잡았다.

hongiiv 2014. 10. 17. 10:27
반응형
혹자는 유전체 연구에 있어서 클라우드 컴퓨팅을 뜬구름이라 했다. 혹자는 클라우드를 네어버 N 드라이브쯤으로 알고 있다. 뭐 어쨌듯 간에... 일찍이 미국이나 한국에서 클라우드 기반의 유전체 분석 사업자들이 3년전 세상에 나타났고 다행인지 불행인지 몇몇 업체들은 소리 소문없이 생겼다가 사라지는가를 반복했다. 그나마 지금까지 그 명맥을 유지하고 있는 몇몇 업체들의 그동안 막힌 숨통이 터지는 소식이 얼마전부터 속속 나오기 시작했다. NCI와 Genomics England를 시작으로...

Cancer Genomics Cloud

NIH의 NCI (National Cancer Insitute)에서 올해초 Cancer Genomics Cloud라는 사업에 대한 공모를 했고 그 결과가 이제 나온것이다. Cancer Genomics Cloud Pilot이라 불리는 이번 과제는 Broad Institute, Institute for System Biology (ISB)와 Seven Bridges Genomics (SBG)가 수행한다. ISB는 Google과 SRA International과 함께 그룹을 만들어 진행한다. 

Google & ISB

마더를 서는 ISB는 이번 과제로 인해 2년동안 $650만 (약 70억)을 클라우드 기반의 oncology 데이터를 저장하고 분석할 수 있는 플랫폼을 구글과 함께 만들게 되었다. 이로써 엄청낭 The Cancer Genome Atlas (TCGA)의 유전체 데이터는 이제 구글 플랫폼으로 들어가게 되며 암연구자들은 대형 로컬 컴퓨팅 클러스터에 액세스가 필요없이 유전체 데이터를 탐색할 수 있게 되면서 클라우드 환경에서 공통 데이터 셋을 가지고 프로젝트를 수행하면서 공동연구를 활성화하는 계기가 된다. 

Seven Bridge Genomics

총 $2천만 (210억원) 규모로 진행되는 사업으로 ISB가 70억규모이니 나머지 Broad와 SBG 또한 비슷한 70억 규모로 해당 과제를 진행할 것으로 예상된다. SBG는 홈페이지에 별도의 메뉴를 만들어서 해당 사업을 홍보하고 있다. 

Eagele Genomcis와  Genomics England

SBG는 또한 Eagle Genomics와 함께 Genomics England의 데이터를 분석하는데에도 참여하게 된다. Eagle Genomics는 160만 파운드 (27억) 규모의 과제를 수행하며 추후 second phase의 800만 파운드 (136억)에도 참여가 가능하게 된다. 본 과제는 인간 유전체 데이터 분석 및 해석을 지원하기 위한 새로운 생명정보학 도구의 개발을 지원하게 된다.

SBG는 일찍이 미국의 Cambridge와 영국의 London에 각각 사무소가 존재하는데 아마도 이번 NCI와 영국의 과제에 모두 참여하는것이 가능하게 한 원동력?이라고 할 수 있다. 물론 클라우드는 영국이던 미국이던  아마존을 사용한다. 물론 아마존도 세계 각국에 데이터센터가 존재한다.

클라우드로 향하는 유전체 사업

미국과 영국의 대형 유전체 관련 프로젝트는 그동안 로컬 컴퓨팅을 통한 연구에서 이제 그 한계를 벗어나 클라우드로 이동하고 있다. 아울러 그동안 죽지않고 이시장을 노려온 SBG와 이제 막 유전체 분야에 뛰어드는 구글의 행보가 기대된다. 이제 국내도 이런 움직임이 있으려나? 아직 멀었다. 그저 클라우드건 뭐건 이번 다부처유전체사업이 잘 되기만을 바란다.

 
반응형