Bioblogs

Bioinformatics 연구자를 위한 컴퓨팅 환경 제공

hongiiv 2008. 2. 26. 11:40
반응형
이전에 국내 바이오인포매틱스 관련 오픈소스 현황이라는 주제의 글에서 대용량 데이터 분석 환경 지원 부분에서 연구를 위해서 단순하게 슈퍼컴퓨터나 cluster 컴퓨터의 기본적인 환경만을 제공하는 것이 아니라 이러한 환경에 + 유틸리티를  덧붙여 제공해야 한다고 언급했었습니다. 그 일례로 Yahoo에서는  학교나 일반 기업에서 구비하기 힘든 Hadoop기반의 클러스터 컴퓨팅 자원에 대해서 학술 연구 목적으로 지원을 하고 있다고 했었죠.

슈퍼컴퓨팅 자원 + 이를 좀더 유연하게 활용할 수 있는 utility(야후에서는 Hadoop)

Google의 official 블로그에서도 Supporting cluster computing in the research community이라는 글이 올라왔습니다. 역시나 Google에서도 Google's file system 과 MapReduce programming model을 기반(?)으로 하는 Apache Hadoop을 연구자들을 위해 제공한다고 합니다. 이제 클러스터 컴퓨팅에서의 Hadoop은 MPI와 같이 일반화된 표준으로 작용되어 가고 있습니다. 여기서 Bioinformatics 연구자들도 대용량의 컴퓨팅 자원을 이용할때에도 Hadoop을 활용할 수 있도록 차근차근 배워 나아가야 하지 않을까? 라는 생각을 해본다. 곧 이러한 환경을 손쉽게 만날 수 있을테니까요 ^^;;

일전에 비누인형님이 대용량 컴퓨팅환경을 써보고 싶으시다는 말을 언급하셨는데, KISTI의 슈퍼컴퓨터뿐만 아니라 우리나라에서도 Yahoo나 Google처럼 손쉽고, 좀더 유연하게 연구자들이 대용량 자원에 접근하는 날이 왔으면 하네요. 그래서 이를 활용한 우수한 paper(?)들도 나와 주었으면 하는 바램입니다.

마지막 포스팅으로부터 일주일이 더 지났네요,, 짧다면 짧은 시간안에 저에게 너무 많은 일들이 일어났습니다. 물론 좋지 않은 측면에서요 ㅜㅜ 이유는 묻지 마시고 힘내라고 한마디 부탁드립니다. 그럼 아무리 힘들어도 포스팅 쭉쭉 올라갑니다.


반응형