유전자정보분석

Galaxy와 Amazon web services 요금

hongiiv 2011. 1. 4. 12:50
반응형
Galaxy는 기본적으로 3가지 방법을 통해서 사용이 가능하다. 1) http://usegalaxy.org 웹사이트를 통해서 제공되는 클러스터를 사용하는 방법 2) 자신의 로컬 머신에 직접 설치해서 사용하는 방법 3) 아마존의 AWS를 통해서 사용하는 방법이다.

우선 첫번째 방법은 가장 접하기 쉬운 방법으로 별도의 설치나 머신이 없어도 가능한 방법이지만, Galaxy에서 제공하는 서버리소스를 사용하기 때문에 사용자가 많거나 커스터마이즈에 한계가 있다. 또한 현재 런닝하고 있는 작업에 대한 세밀한 정보 등이 제공되지 않는다는 단점이 있다. 

우선 이들이 Galaxy를 서비스하기 위해서 어떠한 리소스를 사용하고 있는지 살펴보면, 헤드 노드(사용자들이 제출한 작업을 받아들이고 이를 잡을 수행하는 컴퓨터 노드에 분배하는 역할)는 8코어의 32GB 메모리를 사용하며, 일반적인 작업을 수행하기 위해서 128코어의 4GB(코어당)를 사용하며, NGS 메뉴의 작업들을 수행하기 위해서 별도의 128코어를 할당하고 있다. NGS 작업을 위해서는 한번에 8개의 코어가 할당되며 이때 24GB 또는 48GB의 메모리를 사용하는 노드가 할당된다. 즉, Galaxy를 위해서 256코어의 클러스터를 활용하고 있다. 상당히 많은 숫자임은 분명하지만, 이를 전세계 사람들이 사용하고 있다는 점에서 그리 충분해 보이지는 않는다.

세번째 방법은 자신이 사용할 수 있는 머신이 없는 경우 사용한 시간당 비용을 지불하면서 자신이 원하는 사양으로 꾸밀 수 있다는 장점이 있지만, 클라우드 컴퓨팅을 사용하면서 비용이 발생한다는 단점이 있다. 지난달 Galaxy와 몇 개의 MapReduce작업을 위해서 Amazon의 클라우드 서비스를 사용했는데, 지난달 해외 학외와 나름 헤헤~거리면서 놀다가 그만 쓰지도 않는데 켜 놓아 $337라는 요금을 떠안게 되었다. ㅜㅜ

가장 타격이 컸던것이 가장 비싼 m1.large 인스턴스를 무려 896시간 동안 사용한 것이다. 시간당 $0.34인것만 보고 아무 생각이 없었는데 896시간이나 사용했더니 300달러 ㅜㅜ

S3 스토리지 사용에 따른 요금 부과 내역

MapReduce 작업 4시간 사용 이건 그래도 시간당 $0.015가 드는 m1.small 인스턴스를 사용해서 그나마 다행

데이터의 이동에 따른 요금 부과 내역

이상 간단히 지난달 제가 사용한 Amazon의 서비스 내역과 요금 부과 내역입니다. 필요할 때만 간간히 쓰시고 쓰신 후 꼭 인스턴스를 날려주세요~~~ 갤럭시를 클라우드에서 사용하실분은 참고하시길...
반응형