유전자정보분석

내맘대로 비교/소개하기 - Bioinformatics Big Data

hongiiv 2013. 12. 3. 11:10
반응형
제맘대로 업체선정에서 비교까지 지극히 객관적인 사실이 아닌 주관적으로 비교해 보려고 합니다. 오늘은 그 첫번째 시간으로 Big Data의 관점에서 Bio데이터에 접근하고 그 솔루션을 제공하는 업체 2개를 선택하여 비교하도록 하겠습니다. 우선 선정된 업체 박수로 맞이 하도록 하겠습니다. 두 업체는 국내/국외 업체로 InfiniBio(인피니바이오, 인피니밴드 아닙니다.)와 BioDatomics(바이오데이토믹스)입니다. 둘다 생소한 업체인데요. 아마 다른분들도 다 생소하실거라 생각됩니다.

BioDatomics - The Next Generation in Bioinformatics Tools

B사는 BioDT라는 툴을 통해 사용자가 NGS 데이터를 핸들링 하도록 하고 있습니다. BioDT는 라이센스 및 사용방법에 따라 BioDT SaaS, BioDT Pro, BioDT Community로 나누어져 있으며, 필요에 따라 직접 Workflow(pipeline)을 만들어 주기도 합니다. BioDT는 그럼 무어냐? 워크플로우를 생성하고 수정하기 위해 컴맨드라인의 프로그래밍 스킬 없이 직관적인 UI를 통해 결과데이터의 시각화, 드래그 앤 드랍의 인터페이스, 실시간 협력 및 원한다면 이를 public or private 클라우드상에서 빠르게 분석해주도록 지원해 줍니다. 잠깐 살펴본 느낌은 Galaxy를 그대로 옮겨 놓은 듯한 느낌입니다. 그네들이 무얼 어떻게 하는지는 모르겠지만 진보된 기술력으로 100배 빠른 분석을 지원한다고 합니다.  



Galaxy를  Eclipse의 RCP(Rich Client Platform)를 이용하여 데스크탑에 옮겨 놓고 실제 분석을 위한 컴퓨팅은 클라우드를 사용했고 100X의 속도 향상이 도대체 어떻게 이루어진것인지 궁금하다. 근데 정작 웹 기반인지 데스크탑 어플리케이션인지 모르겠다는게 함정

InfiniBio - Big Data Solution for Bioinformatics

실시간 압축을 지원하는 클라우드 스토리지 기술 (ICS)과 In-Memory Map/Reduce 기반의 병령 데이터처리 환경(IPP)을 기반으로 Genome 데이터에 특화된 연관관계분석 솔루션(IGS)와 관리 솔루션(IGM)을 제공
 
Infini Genome Studio
Infini Cloud Storage와 Parallel Platform 기반의 대량 유전체 분석 솔루션으로 클러스터의 노드 추가를 통해 유동적으로 성능을 결정하고 association 분석을 위한 내장 함수와 R과도 연동

Infini Genome Manager
웹 기반으로 유전체 데이터를 관리 (저장/공유/인증/추출/시각화) 


두 회사 제품 모두 클라우드 기반의 유전체 데이터에 특화된 솔루션을 제공하고 있습니다. 두 서비스 모두 직접 사용해보지도 못했고 단순히 홈페이지의 정보만으로 한번 비교해보려 했지만, 역부족입니다. 그래서 그냥 소개하는 걸로 끝.
 
반응형