Bioblogs

Embarrassingly parallel and BLAST

hongiiv 2008. 6. 5. 09:48
반응형
Embarrassingly parallel: 완전하게 독립되어 각각의 프로세서에 나누어 실행될 수 있는 병렬화의 하나~ 각 sub task와의 커뮤니케이션이 필요없는,,, 아래 그림에서 coarse-grained parallelism이 여기에 속할 수 있겠다. Grid Computing의 응용의 하나인 SETI@home이나 MapReduce도 Embarrassingly parallel쪽의 병렬화라고 볼 수 있겠다. ^^


parallel
Coarse-Grain, Fine-Grain Parallel

Picture 7
embarrassingly parallel: disconnected computational

Picture 8
embarrassingly parallel: master-slave approach

요 몇일 Hadoop 예제를 돌려보면서, 이 예제들을 BLAST와 같은 서열 유사성 검색에 사용하면 꽤나 재미있을것 같다는 생각이 들었다. wikipedia에서 언급한 것과 같이 Embarrassingly의 예에  BLAST searches in Bioinformatics가 있는 것처럼 오래전부터 sequence search 부분에서는 이미 많은 병렬화에 관한 논문과 mpiBLAST와 같은 프로젝트들이 나와 있다. 이것저것 신경쓸거 없이 그냥 HDFS에 서열파일들을 몽땅 넣어고서는 MapReduce로 처리해 버리면 꽤나 심플?할것 같은데,,, ^^


반응형