computer system

KT의 ucloud CS를 통한 클라우드 컴퓨팅 맛보기

hongiiv 2010. 12. 15. 23:35
반응형
오늘 KT의 클라우드 컴퓨팅 서버인 ucloud CS Public 서비스를 신청했다. Amazon의 AWS Management Console의 역활을 담당하는 클라우드 콘솔을 통해서 다음과 같이 서비스를 신청했다. 운영체제는 CentOS 5.4 64-bit로 아직까지 베타서비스인 관계로 ubuntu와 같은 다른 리눅스 배포판이나 아마존과 같이 커스터마이즈된 OS 이미지를 설치할 수는 없다. 각각 4코어와 2코어 8/2GB의 서비스를 신청했으며, 신청과 동시에 계정에 SSH를 통해 접속 가능한 암호를 메일로 보내 주는데 첫번째 신청한 4코어짜리 서버는 메일이 오지 않아 접속을 할 수가 없었다. -.-;;


이것저것 해 볼 것도 없이 장점과 단점을 바로 기술해 보도록 하겠다. 우선 내가 원하는 용도의 클라우드 컴퓨터는 다음과 같으며, 이와 같은 용도에 있어서 KT의 클라우드 컴퓨팅에 대한 장/단점을 기술할 것이다.

내가 원하는 클라우드 컴퓨팅
일반적으로 클라우드 컴퓨팅을 사용하는 목적은 다음 중 하나 또는 하나 이상의 조합이 될것이다. 이 중에서 내가 원하는 용도는 바로  High Performance Computing과 Storage 부분이다.  

Application Hosting
Backup & Storage
Content Delivery
Databases
E-Commerce
Enterprise IT
High Performance Computing
On-Demand Workforce
Media Hosting
Search Engines
Web Hosting

High Performance
우선 아무리 성능이 좋은 단일 노드인 경우라도 KT에서 제공하는 것은 8코어의 16GB가 최고 성능이다. 그렇기 때문에 아니 그보다도 높은 성능의 단일노드라도 여러대를 클러스터링해서 사용해야 하기 때문에 클러스터링을 위한 기본적인 클러스터 솔루션이 있어야 한다. 이부분은 스케줄러/Message Passing Interface 혹은 Hadoop의 MapReduce와 같은 솔루션이 필요로 한다. Amazon의 경우 기본적으로 MapReduce를 제공하며 EC2에서 바로 적용이 가능하다. 또한 스케줄러나  MPI같은 경우도 해당 솔루션을 적용한 OS 이미지 (공개된 수 많은 AWS 인스턴스)를 사용하면 되지만, KT는 453개의 기본 패키지만 설치된 CentOS만 제공하기 때문에 별도의 설치 과정을 필요로 한다. 이부분은 앞으로 KT 자체적으로나 사용자가 만든 이미지를 적용할 수 있도록 해야만 할 것이다.

또한 기본적인 클러스터링 환경과 더불어 수많은 Genome또는 Bio관련 소프트웨어를 설치해야 하는데, 역시 Amazon에서는 이러한 소프트웨어를 적용한 이미지를 제공하기 때문에 사용자는 공개된 수많은 이미지 중에서 자신이 원하는 이미지를 사용하면 된다. 이는 기본적인 클러스터링환경+Bio 소프트웨어를 설치하고 설정하는 번거로움이 불필요한 Amazon서비스와 큰 차이다. 이런한 것이 빨리 적용되지 않는다면, 단순히 컴퓨팅 환경만 제공한다면 나와 같은 사용자는 KT의 클라우드 서비스는 별 볼일 없는 클라우드 서비스가 될 수 있다.

내가 Amazon의 서비를 사용하는 이유가 바로 이러한 풍부한 서비스를 제공하기 때문이다. 오죽했으면 일반 생물학 연구자들이 손쉽게 Genome관련 소프트웨어의 설치가 불필요한 별도의 리눅스 배포판을 만들었겠는가? 

Storage
단순히 자신이 원하는 만큼의 스토리지만을 제공한다. 어찌보면 당연한 것일 수 있겠지만, Bio 분야는 자신의 데이터외에도 자신의 데이터를 분석하기 위해 수많은 공개된 데이터를 함께 사용한다. 오죽하면 Galaxy에서는 UCSC의 공개된 데이터를 바로 가져와서 사용할 수 있는 import 모듈이 별도로 존재하겠느냐 말이다. Amazon은 public data라는 이름으로 수많은 Bio관련 데이터를 제공하며 있으며, 이는 바로 자신의 서비스에 붙여서 사용이 가능하다. 

얼마전 내가 일하는 센터에서 스토리지의 일부를 공개된 1000 Genome 데이터를 넣어두자는 의견이 나왔다. 하지만 가뜩이나 부족한 스토리지 용량에 1000 Genome 데이터까지 항시 넣어두고 또한 다운로드에 걸리는 시간 때문에 무리가 따른다는 의견이 있어 당분간 보류하기로 했다. 하지만 Amazon에서 7.3TB에 달하는1000 Genome 데이터를 제공하고 있어 별도의 다운로드 시간없이 바로 EC2나 MapReduce에서 바로 사용이 가능하다.

하지만, 아직까지 베타 서비스 중인 KT의 클라우드에서는 이러한 데이터를 제공하지 않기 때문에 이부분 또한 해결해 나야가야할 부분이다.

장/단점
결론을 말하자면 분명 아직 베타 서비스 기간이며, KT 또한 위에서 언급한 내용들에 대해서 어느정도 기술적이나 컨텐츠적인 측면에서 해결해 놓은 상태일 것이다. 이것이 언제 사용자들에게 어떻게 언제 전달될지는 앞으로 지켜봐야 할 부분이다.

단점의 경우 아직까지 KT의 클라우드 서비스는 걸음마 단계이기 때문에 위에서 언급한 내용들이 적용되지 않아 바로 실무에 사용하려면 여러가지 설정을 거쳐야만 한다. 하지만 이미 성숙한 Amazon의 경우 내가 원하는 만큼의 리소스와 함께 내가 원하는 분석을 손쉽게 할 수 있다.

이러한 단점에도 불구하고 콘솔 접속시 국내에서 서버가 존재하기 때문에 접속이 빠르다. 콘솔 작업시에는 매우 만족할 만한 속도를 보여주고 있으며, 이는 아무리 Amazon이 아시아 지역에 데이터센터를 통해서 서비스를 한다고 할지라도 국내의 그것도 최고의 네트워크를 자랑하는 KT에는 비할 바가 아니다. 국내의 연구자들에게는 바로 이부분이 가장 큰 매력이지 않을 수 없다. 단순히 국내 사용자들이 빠르게 접속이 가능하다는 것뿐만 아니라 빠른 네트워크를 기반으로 하는 뭔가를 국내 연구자들에게 제공한다면 더할 나위 없이 좋을 것이다.

만족할 만한 수준의 컴퓨팅 리소스와 네트워크 환경은 기본이다. 이와 더불어 Amazon과 같은 수 많은 컨텐츠로 무장을 해야만 KT의 클라우드가 진정한 클라우드  서비스가 되지 않을까 한다. 진정 돈을 지불해도 아깝지 않은...

반응형