갤럭시 3

Genomics & Cloud (1) - Galaxy를 이용한 SNP 분석

오늘은 클라우드 컴퓨팅과 지노믹스 첫 번째 시간으로 Galaxy라는 웹 기반의 Genomic 데이터 분석 툴을 가지고 SNP 분석에 대해서 알아본 후 두 번째 시간에는 아마존의 EC2 서비스를 통해서 Galaxy를 아마존에 EC2 클러스터에서 사용하는 방법에 대해서 알아보겠습니다. 우선 Galaxy (스마트폰 아님 -.-;;)에서는 많은 기능을 제공하고 있는데 여기서는 SNP 데이터를 기반으로 작업하도록 하겠습니다. 오늘 분석은 Exon 상에 존재하는 이미 알려진 SNP을 찾아내고 많은 수의 SNP 을 가지고 있는 Exon 순으로 소팅하도록 하겠습니다. Galaxy를 통해서 UCSC의 Exon 데이터 가져오기 UCSC Browser는 브라우저상에 보여지는 내용을 Galaxy로 내보내는 기능 (UCSC T..

Galaxy를 이용한 Genome Sequence 알아내기

Galaxy를 보고 있자면 몇 해전 국내에서 선풍적인? 인기를 몰았던 Biopipe나 Bioworks가 생각난다. 그네들(workflow 도구들)이 조금만 다듬어졌었더라면, 그리고 너무 WebServices에 얽매여 있었던 것 같다는 느낌이 강하다. WebServices가 분명 많은 잇점이 있기는 하지만 역시나 어려운건 사실이기 때문이다. 요즘 NGS 데이터가 늘어나면서 Galaxy를 자주 찾게 된다. 비단 NGS 데이터의 align이나 variation을 찾는것 외에도 분석하느데 있어서 잡다한 일들을 비교적 손쉽게 할 수 있기 때문이다. 시간이 허락된다면, 간단히 실제 Galaxy를 사용하는 방법에 대해서 포스팅하려고하는데, 오늘은 첫 번째로 Reference 시퀀스를 가져오는 방법에 대해서 써보려고 ..

갤럭시 - Genome 분석 플랫폼

UCSC, NCBI MapViewer, Ensembl과 같은 많은 Genome Browser들을 통해서 생물학 실험자들은 고급?의 프로그래밍 경험 없이도 genomic 영역을 시각화할 수 있지만 이들만을 가지고는 부족하기 때문에 여전히 프로그래밍과 데이터베이스를 다룰 줄 알아야 한다. 그러나 어느 정도까지는 프로그래밍 경험이 부족한 실험자들에게 서열데이터, 서열 정렬, 기능에 대한 주석등을 다룰 수 있도록 여러가지 방법을 통해 사용자들이 기존에 존재하는 소스로 부터 데이터를 모으고 간단한 인터페이스를 통해서 데이터를 결합, 계산, 원하는 것만 추출, 시각화, 서열 정렬, 결합, 삽입, 추출 등의 작업을 할 수 있게 해 줄 수 있도록 한다면 어떨까? genome browser 및 기타 데이터 소스로 부터 ..

blogging 2008.12.02