유전자정보분석

클라우드 컴퓨팅과 Genome

hongiiv 2010. 11. 29. 14:28
반응형
클라우드 컴퓨팅과 Genome/Bioinformatics 관련 리뷰 논문
Lincoln D Stein, 2010, The case for cloud computing in genome informatics
Eric E. Schadt et.al, 2010, Computational solutions to large-scale data management and analysis
Joel T Dudley et.al, 2010, In Silico research in the era of cloud computing

클라우드 컴퓨팅 관련 Genome/Bioinformatics 관련 소프트웨어
Galaxy: Amazon EC2 서비스에 포팅해서 사용 가능한 Biology(NGS/SNP GWAS) 웹 기반 워크플로우 소프트웨어
Crossbow: Bowtie라는 Alignment 소프트웨어와 SoapSNP이라는 variation calling 소프트웨어를 Hadoop 기반으로 가능하게 해주는 whole genome resequencing 분석 파이프라인 소프트웨어
CloudBurst: MapReuce 기반으로 Alignment 소프트웨어

위의 소프트웨어들은 Amazon EC2의 AMI(Amazon Machine Image)나 Amazon Elastic MapReduce를 통해서 실행이 가능하다.

클라우드 기반의 NGS 분석 지원 회사
아마존의 EC2나 Elastics MapReduce, S3 서비스를 통해서도 NGS 분석을 위한 컴퓨팅/스토리지를 구축하는 것이 가능하지만, 여기에 NGS 머신에서 나오는 raw 데이터와 통합이나 보다 특화된 genome 분석을 가능하게 해주는 한마디로 "Amazon 서비스의 NGS 특화 버전" 이라고 말할 수 있다.

이 부분은 굉장히 유용한 부분이며, 향후 국내에서도 클라우드 컴퓨팅 자원은 대기업에서 제공하는 서비스를 사용하고, 여기에 시퀀싱 플랫폼과 연계한 LIMS와 분석을 위한 컴퓨팅 및 소프트웨어를 개발하고 컨설팅해주는 전문 기업이 생겨날 것 같은 예감 ^^;;

DNANEXUS: Illumina, SOLiD, Complete genomics 사 등의 시퀀싱 플랫폼을 지원하며, 시퀀싱 센터에서 생산된 데이터를 바로 클라우드로 보내고 클라우드 상에서 이를 분석하는 컴퓨팅 파워와 여러 분석을 소프트웨어를 결합한 서비스를 제공 
SeqCentral: 클라우드 상에서 alignment를 지원
SPIRAL GENETICS: 시퀀스 분석 지원 아직 베타 기간

다음번에는 진짜 직접 Amazone의 EC2서비스들을 이용한 분석 글을 제공할 것임 -.-;; ㅋㅋㅋ 그럼 오늘은 이만... 대충 정리 끝. 이외에 아시는 것들이 있다면 댓글 부탁드립니다.

반응형