컬럼

Galaxy RNA-Seq Analysis: Tuxedo Protocol

hongiiv 2013. 12. 29. 09:08
반응형
Tuxedo Protocol을 Galaxy를 이용하여 구현하여 RNA-Seq 데이터를 분석하는 방법에 관한 내용입니다. 분석 결과를 IGV와 Galaxy의  visualization을 이용하여 시각화하는 방법과 CummeRbund를 이용하는 방법에 관한 내용입니다.

Galaxy를 이용하는 방법은 Galaxy Main 페이지를 통해 무료로 사용 가능합니다만, 계정당 250 GB의 제한과 최대 동시 수행할 수 있는 job의 갯수가 8개로 제한되어 있습니다. 또한 사용자가 많아지면 job 대기 시간도 길어지며 업로드에도 많은 시간이 걸린다는 단점이 있어 실제 대용량의 데이터를 분석하는데에는 어려움이 있는것이 사실입니다. 그 대안으로는 로컬 클러스터에 직접 설치하거나 Amazon의 컴퓨팅을 이용하는 방법이 있습니다만 이는 IT에 대한 지식없이는 제대로 설치하여 활용하는데 어려움이 따르는 것이 사실입니다.

그래서 상용으로 Galaxy를 사용할 수 있는 것들이 등장하기 시작했는데, 아예  Galaxy가 pre-install된 하드웨어 (약 2천만원 가량)를 구입하는 방법 - SlipStream Galaxy -과 KT의 클라우드 서비스를 사용하는 방법입니다. Amazon에 비해 바로 데이터 분석에 사용할 수 있도록 레퍼런스와 software, workflow(ReSequencing, RNA-Seq) 등이 설정되어 있을 뿐만 아니라 클러스터링 된 하드웨어를 기반으로 대량의 데이터 분석에도 용이하도록 설정되어 있습니다. 또한 Amazon 대비 가격도 저렴합니다.

또한 한국어 지원 서비스?도 충실하기 때문에 원하는 툴이나 레퍼런스 워크플로우 작성에 대해서 기본적인 support가 가능하다는 점은 국내 연구자들에게 가장 큰 장점이 될 수 있을 것입니다. 연구실에서 단기간의 분석이나 교육 등에 활용하기 편리하며, 필요하시다면 Galaxy에 대한 교육 또한 가능합니다. ^^;;



반응형