2013/12 3

Galaxy RNA-Seq Analysis: Tuxedo Protocol

Tuxedo Protocol을 Galaxy를 이용하여 구현하여 RNA-Seq 데이터를 분석하는 방법에 관한 내용입니다. 분석 결과를 IGV와 Galaxy의 visualization을 이용하여 시각화하는 방법과 CummeRbund를 이용하는 방법에 관한 내용입니다. Galaxy를 이용하는 방법은 Galaxy Main 페이지를 통해 무료로 사용 가능합니다만, 계정당 250 GB의 제한과 최대 동시 수행할 수 있는 job의 갯수가 8개로 제한되어 있습니다. 또한 사용자가 많아지면 job 대기 시간도 길어지며 업로드에도 많은 시간이 걸린다는 단점이 있어 실제 대용량의 데이터를 분석하는데에는 어려움이 있는것이 사실입니다. 그 대안으로는 로컬 클러스터에 직접 설치하거나 Amazon의 컴퓨팅을 이용하는 방법이 있습니..

컬럼 2013.12.29

How to make multi-thread support galaxy cluster using grid engine and DRMAA

1개의 마스터 노드와 2개의 worker 노드로 구성된 클러스터를 qhost 명령을 통해 현재 노드들의 상태를 확인 할 수 있습니다. 각 노드당 CPU의 갯수(NCPU)는 4개이며 노드당 메모리는 7.8G(MEMTOT)임을 확인 할 수 있습니다. root@biomaster:/BIO# qhost HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS ------------------------------------------------------------------------------- global - - - - - - - bioworker1 linux-x64 4 0.01 7.8G 174.4M 929.0M 8.1M bioworker2 linux-x64 4 0.01 ..

내맘대로 비교/소개하기 - Bioinformatics Big Data

제맘대로 업체선정에서 비교까지 지극히 객관적인 사실이 아닌 주관적으로 비교해 보려고 합니다. 오늘은 그 첫번째 시간으로 Big Data의 관점에서 Bio데이터에 접근하고 그 솔루션을 제공하는 업체 2개를 선택하여 비교하도록 하겠습니다. 우선 선정된 업체 박수로 맞이 하도록 하겠습니다. 두 업체는 국내/국외 업체로 InfiniBio(인피니바이오, 인피니밴드 아닙니다.)와 BioDatomics(바이오데이토믹스)입니다. 둘다 생소한 업체인데요. 아마 다른분들도 다 생소하실거라 생각됩니다. BioDatomics - The Next Generation in Bioinformatics Tools B사는 BioDT라는 툴을 통해 사용자가 NGS 데이터를 핸들링 하도록 하고 있습니다. BioDT는 라이센스 및 사용방법..