Follow the Data라는 블로그의 "What can big data (read Hadoop) do for genomics?"라는 흥미로운 글이 있어서 소개해 보려고 한다. Hadoop이 빅데이터의 관점에서 genomics에 어떻게 응용되고 있고 앞으로 어떻게 응용될지에 대한 글로 최근 임상에서의 빅데이터에 대한 관심이 모아지는 가운데에 임상중에서도 genomics에 포커싱된 글로서 간단히 다음과 같이 요약할 수 있다. 1) 지금까지 read mapping 부분에 하둡 적용이 두드러짐 (Crossbow, MyRNA) 2) 하둡을 인프라로 사용하기 시작함 (SeqPig, Hadoop-BAM) 3) 하둡을 다양한 데이터간의 통계적인 연관성을 보기 위한 빅데이터 처리에 활용 (NextBio, Google..
Amazon이 AWS를 통해서 IaaS를 제공하고 있는 상황에서 그동안 IaaS가 빠진 클라우드 서비스만 제공하던 Google 역시 이번 Google I/O 2012를 통해서 Google Compute Engine이라는 이름으로 IaaS 서비스를 내놓았다. Google은 사용자가 원했기 때문이라고 했고, 간단한 웹서버 호스팅을 위한 IaaS가 아닌( (단순 웹 호스팅은 Google App Engine을 쓰면 되니까 ^^), batch processing, data processing, high performacne computing에 focusing된 IaaS 서비스이다. 그들이 Google I/O의 키노트를 통해 Compute Engine을 소개하면서 내놓은 demo가 바로 cancer genome 데..
생명 과학 분야에서 그리드를 이용한(e-Science라고 불러도 되겠죠 ^_^) 본격적인 응용이 개발되고 있습니다. 이전까지 기반 기술에 대한 연구가 어느 정도 된 상태이기 때문에 이젠 본격적으로 이러한 그리드 기반 기술을 이용한 다양한 응용이 이루어지는 원년이라고 봐도 될것같습니다. 이제 몇년 후에는 신기술이 아니라, 우리가 인터넷으로 메일을 보내는 것처럼 자신의 분야에 맞는 그리드를 이용한 연구가 자연스러워질 거라고 확신하고 있습니다. 지금까지 제가 알아 본 생명 과학 분야의 그리드 응용은 다음과 같습니다. KISTI의 e-Science 사업단(http://escience.or.kr/ , 단장 변옥환)의 응용연구팀에서 "BT/NT분야 응용연구"를 수행 중 대전 한국정보통신대학교의 ITRC Grid M..