pca 3

Day4 - 보다 자세한 Ancestry 정보

Day3에 이어서 Interpretome을 이용하여 자신의 genome을 분석하는 시간이다. 이번에는 Clinical과 Ancestry 기능으로 우선 Ancestry 기능을 위주로 살펴보도록하겠다. Ancestry Ancestry는 Similarity, PCA, Painting의 메뉴로 구성되어 자신의 genome 데이터를 가지고 다양한 방법을 통해 자신의 조상 정보를 표시해 준다. 그럼 하나씩 하나씩 어떠한 원리로 자신의 genome 정보를 표시하는지 간단한 이론과 함께 살펴보도록 하자. Similarity 인간은 누구가 부모에게서 하나씩 받은 총 23개의 염색체로 구성되어 있다. 물론 어떤게 아버지에게 어머니에게 받은 건지는 확실하게 알 수는 없다. 이 부분에 대해서는 이전 글에서 언급했었으니 참고하..

유전자로 알아본 선조 결과에 발끈?

이번에는 genome unzipped에 공개된 유전체(SNP) 데이터를 기반으로 ancestry를 분석한것에 대해서 이야기해보려고 한다. 특히 다니엘과 조에 포커스가 맞추어져 있으니 사진을 잘 보고 이 글을 읽어 나간다면 더욱 흥미로울 것이다. 북서/남동 유럽의 지리적 위치 이들의 유전체 데이터가 공개되자 제일 먼저 Dienekes' Anthropology 블로그를 통해 이들의 선조에 대한 정보를 분석한 결과가 공개되었다. 유럽인이라면 23andMe나 deCODEme의 유전자 검사 데이터를 EURO-DNA-CALC이라는 프로그램에 입력하면 NW (북서) 유럽인, SE (남동) 유럽인, 중동부 유럽 유대인의 후손인 아슈케나이지 유대인의 3가지의 분류로 자신의 선조 정보를 표시해준다. 대부분 서양인들이 한국..

PCA(Principal Components Analysis) - Using R

각 라면에 대하여 면발, 라면 그릇의 모양(크기), 국물맛에 대한 점수가 있다고 한다면, 3개의 변수(면, 그릇, 국물)를 가지고 PCA 분석을 해보자. 1. 데이터를 read.table()을 이용해서 로드한다. 2. 이제 각 변수를 표준화하고, 이에 대한 상관행렬을 구한다. 3. EigenValue, EigenVector 값을 구한다. 첫번째 주성분(PC1)의 기여율은 Cumulative Proportion이 0.524 즉, 52%의 기여율을 보인다. 이것은 PC1이 분석대상의 데이터가 가지고 있던 정보가 PC1 주성분에 어느정도 집약 되어 있는지에 대한 대략적인 크기가 된다. 4. 각각에 대한 제1주성분, 제2주성분 점수를 구한다. 5. 제1주성분 점수와 제2주성분 점수를 토대로 그래프 작성 생성된 ..

R 2009.06.23