유전자정보분석

Cloud computing in genomics and bioinformatics 워크샵

hongiiv 2010. 12. 12. 19:39
반응형
지난 10월  BMC의 Genome Biology에서 'Beyond the Genome' 이라는 주제의 컨퍼런스에서 클라우드 컴퓨팅과 지노믹스라는 주제의 워크샵이 있었습니다. BioMed Central Blog에서는 이 워크샵에 대한 내용을 잠깐 언급하고 있는데, 실제 가보지는 않았지만 제목이나 연사들을 보면서 현재 외국에서 어떠한 방향으로 genome과 클라우드를 언급하고 있는지 살펴볼 수 있는 좋은 기회일듯 싶어 간단히 언급하려고 합니다.


High Throughput (고효율) 기술 중 단연 NGS는 데이터의 생산량이나 시간면에서 다른 어떤것들 보다 현재 이슈화 되있는게 현실입니다. 하지만 NGS 이전에도 많은 Bio 데이터가 생산되었고 이에 따른 컴퓨팅 리소스나 스토리지 리소스 또한 대두되었던것은 사실이지만, NGS와 Personal Genome이 만나면서 그 인기는 절정에 달하고 실제 일반인들에게도 피부에 와 닿는것 또한 사실입니다. 그러나 NGS는 수 많은 Bio Technology 중 하나일 뿐이라는 점을 명심해 두어야 할 듯합니다. 현재 진행하고 있는 연구에서 하나의 도구일 뿐이지 NGS가 모든것을 다 해주는 것은 아니라는 점입니다. 뭐 암튼 Next generation sequencing technologies지가 계기가 되어 Bio 분야에 클라우드 컴퓨팅이 잘 자리잡을 수 있는 계기가 되었으면 하는 바램입니다.

개인적으로 국내외에서 NGS와 클라우드 컴퓨팅에 대한 내용이 많이 나오고 있는데, 실제 NGS를 통해 생산된 데이터를 만져 보면서 컴퓨팅 리소스에 대한 문제가 심각해 질 것이라는 것이라는 점과 그를 해결할 수 있는 클라우드 컴퓨팅에 대해서는 누구도 이의를 제기하지 않을 듯 합니다. 비단 NGS가 아니라 앞으로 생산될 Bio 분야의 High Throughput 기술들이 점차 늘어나면서 클라우드는 Bio 분야에서 하나의 필수적인 부분이 될 것이라고 감히 확언합니다. 그럼 이번 10월에 열린 워크샵에서 누가 어떠한 주제를 가지고 Genome과 클라우드에 대해서 이야기 했는지 살펴보도록 하겠습니다. 이번 워크샵의 좌장은 시카고 대학의 Folker Meyer (Argonne National Lab)가 맡았습니다.

The novel cloud platform (새로운 클라우드 플랫폼)
The cloud platform - a purely technology perspective. Paradigm, security, data transfer, limitations
Narayan Desai, Argonne National Lab
상용 클라우드 컴퓨팅을 사용하는데에 있어서의 이점에 대한 내용을 발표했는데요. Biology 분야는 "분석의 한계"에 도달했고 이에 대한 해결은 컴퓨팅 파워를 제공하는 클라우드가 해결할 것이라고 말하며 이러한 클라우드의 비용은 이미 값싸게 제공되고 있으며, 향후 더욱더 싼 가격에 이루어질 것이라고 언급했다고 합니다.

Using commercial clouds for bioinformatics
Chris Dagdigian, Bioteam
미국의 Bio와 HPC 관련 솔루션을 제공하는 업체로 Mike (SNPedia)가 근무했던 곳이기도 합니다. 당신이 일하는 IT 부서를 통하지 않고 클라우드 컴퓨팅을 통하여 노트북을 통한 대용량의 분석을 클라우드 컴퓨팅을 통해 가능할 것이라고 언급했습니다. security에 대한 부분이 해결된다면 (기술적인면 뿐만 아니라 행정적인면에서도 -.-;;) 정말 이렇게 분석하는 날이 왔으면 좋겠습니다.

Private clouds
Bob Grossmann, Open Cloud Consortium
상용의 클라우드가 아닌 오픈 클라우드 컨소시엄과 Bionimbus라는 커뮤니티 클라우드에 대한 내용을 언급했는데요. Bionumbus는 클라우드 기반의 지노믹 데이터를 분석하고 공유하기 위한 시스템이라고 하는군요. 이 Bionimbus를 오픈 클라우드 뿐만 아니라 아마존의 클라우드 환경에서도 사용이 가능합니다.

Real-world examples
Assembly in the cloud
Michael Schatz,CSHL
이분은 Searching for SNPs with cloud computing이라는 논문을 통해 Biwtie와 SOAPsnp를 이용하여 alignment와 SNP calling을 클라우드에서 수행해는 Crowwbow를 만든 분으로 클라우드에서 genome assembling에 대한 내용을 언급

The Galaxy workflow system
James Taylor, Emory University
galaxy에 대한 전반적인 가상의 투어를 제공

The Argonne Workflow Engine (AWE): scaling applications inside the cloud
Narayan Desai, Argonne National Lab

Applying Cloud Computing to Community Genome Analysis & Distribution
Lincoln Stein, Ontario Institute for Cancer Research
이분은 CGI.pm과 GD 모듈을 개발하신 분이시죠. 이완버니와 함께 닮고 싶은분 중 하나인... Bionimbus를 이용한 modEncode 데이터 분석에 대해 언급

라우드 기반의 비용이나 보안 데이터 전송에 대한 문제가 있지만, 클라우드 컴퓨팅은 매력적인 대안으로 이 중에서 대용량 데이터의 전송은 큰 장애물 중 하나이다. 또한 개인 정보 보호에 대한 개인 게놈 데이터에 대한 기밀 유지에 대한 사회적인 문제 또한 해결해야 할 과제 중 하나이다.

BMC에서는 이번 컨퍼런스에 대한 리포트를 제공 "Beyond the Genome: genomics research ten years after the human genome sequence"  하고 있으며, 클라우드 컴퓨팅에 대한 BMC의 논문들을 별도로 모아 "Cloud computing tools and analysis" 특별판을 제공하고 있다.

반응형