r-package 2

DRM을 이용한 대량의 데이터 분석을 손쉽게

본 문서는 Grid Engine의 "Simple-Job-Array-Howto" 문서를 기반으로 만들어졌으며, 이전에 포스팅한 "스케줄러 - 기본으로 돌아가기"와 밀접한 관계가 있습니다. ^^ DRM에서의 Serial 프로그램 실행하기 많은 수의 job들을 실행하기 위해서는 어떻게 해야 할까? 1,000개의 데이터셋이 있고, 이것을 하나의 프로그램이 실행한다고 한다면, 모두 1,000개의 Shell 스크립트를 작성해서 queue에 넣어야 할것이다. 바로 이러한 자잘한? 문제를 해결하기 위해서 Grid Engine에서는 Array job이라는 해결책을 제시해 주고 있다. -i 옵션의 인자를 입력으로 받고, -o 인자의 파일에 program의 수행결과를 쓰는 프로그램을 Grid Engine을 통해 제출한다고 ..

Bioblogs 2008.07.07

R-package 컴파일 하기

모든 생물정보학을 하시는 분들의 제일 첫 질문은 R 설치되어 있습니까? 라는 질문이다. 가장 많이들 사용하시는 프로그램(?) 중 하나인데, 일반 X86에서는 문제가 없지만, Intel Itanium2나 IBM PowerPC의 64bit machine에서는 잘 컴파일된 것 같지만, 막상 테스트를 해보면 어이없게도 에러가 발생하곤 한다. PPC64에서 rnorm(10^9)을 계산해보면 바로 메모리 관련 에러를 뱉으면서 계산하기 싫다는 에러를 내곤 계산을 포기하는 현상이 발생해 버렸다(cannot allocate vector length XXXXXKB). 여태 모르고 있었다니..ㅜㅜ 음~ 역시 구글링을 통해 R 메일링 리스트를 검색해보니 답이 나와 있더군요 ^^ It has been reported that ..

R 2007.12.06