grid engine 2

DRM을 이용한 대량의 데이터 분석을 손쉽게

본 문서는 Grid Engine의 "Simple-Job-Array-Howto" 문서를 기반으로 만들어졌으며, 이전에 포스팅한 "스케줄러 - 기본으로 돌아가기"와 밀접한 관계가 있습니다. ^^ DRM에서의 Serial 프로그램 실행하기 많은 수의 job들을 실행하기 위해서는 어떻게 해야 할까? 1,000개의 데이터셋이 있고, 이것을 하나의 프로그램이 실행한다고 한다면, 모두 1,000개의 Shell 스크립트를 작성해서 queue에 넣어야 할것이다. 바로 이러한 자잘한? 문제를 해결하기 위해서 Grid Engine에서는 Array job이라는 해결책을 제시해 주고 있다. -i 옵션의 인자를 입력으로 받고, -o 인자의 파일에 program의 수행결과를 쓰는 프로그램을 Grid Engine을 통해 제출한다고 ..

Bioblogs 2008.07.07

Job Scheduler로 보는 맞춤형 의료 서비스

민간 우주 여행, 로봇의 달탐사, 10일 안에 100명의 Genome 염기서열 분석 모두 꿈 같은 이야기이지만, 그 꿈같은 이야기들이 X PRIZE 재단에 의해서 커다란 상금을 걸고 진행중이거나 이미 끝난 대회이다. 2006년 개인의 맞춤형 의료 서비스의 진입을 위하여 X PRIZE에서는 민간에서 10일 안에 100명의 Genome을 해석할 수 있다면, 그것도 Genome 당 $10,000 이상의 비용이 들어가지 않도록 해낸다면, $1,000만 우승 상금을 얻게 된다. 이것이 바로 Archon X PRIZE for Genomics 이다. 그럼 이러한 일을 가능하게 하는데 중요한 역할을 하는 것이 무엇일까? 바로 Grid 컴퓨팅이나 클러스터 컴퓨팅의 Job Scheduler, DRM(Distributed ..

Bioblogs 2008.07.07