본문 바로가기

R5

R을 이용한 3차원 PCA plot 그리기 3차원의 scatter plot을 그리기 주성분분석(PCA)에서는 1,2주성분에 대해서 각각 x,y의 2차원상에서 plot을 그려서 보여준다. 그런데 어느 논문에서 각 개체의 1부터 7까지 주성분을 모두([1,2주성분],[3,4주성분],[5,6주성분],[7,8주성분] - 총 4개의 그래프를 죄다 보여주는)보여주는 것을 보고는 저럴 필요가지 있을까라는 생각이 들긴 했지만, 그렇다면 개체의 1,2,3 주성분(x,y,z축으로)을 3차원으로 보여주는 것도 괜찮을 것 같다는 생각이 들었다. 우선 R의 rgl패키지의 plot3d()를 이용할것이므로 rgl 패키지를 설치한다. >library(rgl) >datap1=prcomp(data,scale=TRUE) >p2plot3d(p2[,1:3]) 또는 prcomp() 대.. 2009. 6. 25.
PCA(Principal Components Analysis) - Using R 각 라면에 대하여 면발, 라면 그릇의 모양(크기), 국물맛에 대한 점수가 있다고 한다면, 3개의 변수(면, 그릇, 국물)를 가지고 PCA 분석을 해보자. 1. 데이터를 read.table()을 이용해서 로드한다. 2. 이제 각 변수를 표준화하고, 이에 대한 상관행렬을 구한다. 3. EigenValue, EigenVector 값을 구한다. 첫번째 주성분(PC1)의 기여율은 Cumulative Proportion이 0.524 즉, 52%의 기여율을 보인다. 이것은 PC1이 분석대상의 데이터가 가지고 있던 정보가 PC1 주성분에 어느정도 집약 되어 있는지에 대한 대략적인 크기가 된다. 4. 각각에 대한 제1주성분, 제2주성분 점수를 구한다. 5. 제1주성분 점수와 제2주성분 점수를 토대로 그래프 작성 생성된 .. 2009. 6. 23.
R-package 컴파일 하기 모든 생물정보학을 하시는 분들의 제일 첫 질문은 R 설치되어 있습니까? 라는 질문이다. 가장 많이들 사용하시는 프로그램(?) 중 하나인데, 일반 X86에서는 문제가 없지만, Intel Itanium2나 IBM PowerPC의 64bit machine에서는 잘 컴파일된 것 같지만, 막상 테스트를 해보면 어이없게도 에러가 발생하곤 한다. PPC64에서 rnorm(10^9)을 계산해보면 바로 메모리 관련 에러를 뱉으면서 계산하기 싫다는 에러를 내곤 계산을 포기하는 현상이 발생해 버렸다(cannot allocate vector length XXXXXKB). 여태 모르고 있었다니..ㅜㅜ 음~ 역시 구글링을 통해 R 메일링 리스트를 검색해보니 답이 나와 있더군요 ^^ It has been reported that .. 2007. 12. 6.
R 과 Rserve를 이용한 Taverna 프로그래밍 향후 Bioworks의 경우 각종 스크립트 언어를 추가하여 사용자가 워크플로우내에서 프로그래밍을 통하여 필요한 기능을 추가할 수 있도록 할 계획에 있다고 한다. Taverna의 경우는 BeanShell이라는 Java 언어를 통하여 사용자가 워크플로우내에 프로그래밍 로직을 작성할 수 있도록 해주고 있다. 기타 Perl, python, Ruby등의 다른 스크립트 언어에 익숙한 사용자에게는 다소 불편함이 있을 수도 있다. 어쨌든 이러한 프로그램 언어의 사용과 더불어 Taverna에서는 통계 언어인 R(Bioinformatics에 관련된 라이브러리도 상당히 많이 존재하죠 ^ㅇ^)을 사용할 수 있도록 하고 있는데, 바로 RShell을 통해서다. Taverna의 RShell은 R을 TCP/IP 기반으로 원격에서도 .. 2007. 11. 16.