Genomeics & Cloud의 두 번째 시간이 왔습니다. 바로 클라우드 컴퓨팅쪽으로 가려고 했지만 galaxy를 이용한 genome 분석에 대해서 하나만 더 이야기 하고 Amazon의 클라우드로 넘어가려고 합니다. 저번 시간에는 기본적인 galaxy의 사용에 초점을 맞추어 진행했는데 오늘도 저번과 galaxy의 기능에서는 추가되는 내용은 없지만 실제 아프리카의 부시맨 데이터를 가지고 진행을 하도록 하겠습니다. - 마찬가지로 galaxy 홈페이지에 Screencast에 있는 내용입니다. 1980년 개봉된 영화 부시맨, 주인공 니카우씨는 2003년 07월 돌아가셨네요. 이번 분석에 사용된 부시맨들은 니카우씨 연배의 분들입니다. 아프리카 남부의 부시맨 올해초 아프리카 남부의 부시맨(Khoisan, 코이산종..
오늘은 클라우드 컴퓨팅과 지노믹스 첫 번째 시간으로 Galaxy라는 웹 기반의 Genomic 데이터 분석 툴을 가지고 SNP 분석에 대해서 알아본 후 두 번째 시간에는 아마존의 EC2 서비스를 통해서 Galaxy를 아마존에 EC2 클러스터에서 사용하는 방법에 대해서 알아보겠습니다. 우선 Galaxy (스마트폰 아님 -.-;;)에서는 많은 기능을 제공하고 있는데 여기서는 SNP 데이터를 기반으로 작업하도록 하겠습니다. 오늘 분석은 Exon 상에 존재하는 이미 알려진 SNP을 찾아내고 많은 수의 SNP 을 가지고 있는 Exon 순으로 소팅하도록 하겠습니다. Galaxy를 통해서 UCSC의 Exon 데이터 가져오기 UCSC Browser는 브라우저상에 보여지는 내용을 Galaxy로 내보내는 기능 (UCSC T..
The World's Top 11 annotated man(2009/06/26 Now ^^) 순위 이름 Annotation 비고 1 NA07022_whole 5906 Whole 2 YanHuang_whole 5495 Whole 3 David Ewing Duncan_pooled 5351 pooled 4 Timothy Richard Gall_pooled 4858 pooled 5 JerryEmanuelson_pooled 4767 pooled 6 Ngnomics_pooled 4756 pooled 7 Kim Seong-jin_whole 4413 Whole 8 Dichro_pooled_2 4328 pooled 9 David Ewing Duncan_23andme 4307 23andMe 10 Dichro_23andme..
일년전 23andMe에서는 릴리 멘델이라는(이름만 본다면 여성이겠죠) 인간의 유전자를 공개하고 그 사람에 대해서 잘 스케치하는 사람에 대해서 공짜로 23andMe의 서비스를 해주는 "Pictures of Lilly: Introducing the 23andMe Win Your Genome Contest"라는 콘테스트를 했고, 우승자는 Mike Cariaso가 차지했습니다. 콘테트스는 릴리라는 인간의 SNP 정보가 있는 파일을 다운로드해서 얼마나 릴리에 대해서 잘 묘사하는지를 평가하는 방법이었습니다. 일전에 포스팅에서도 잠깐 언급했습니다만, Mike가 서울에 왔을때 그는 나에 대해서 이미 많은걸 알고 있었습니다. 심지어는 술먹으면 얼굴이 빨개진다는 것까지도 말입니다. ^^;; 이 처자가 릴리멘델?? 사진 출..
인간의 30억개의 염기서열의 99.9%는 동일하지만, 0.1%에 해당하는 약 300만개는 사람마다 차이가 난다. 이런 개인별 염기서열의 차이의 90%는 한 염기가 다른 염기로 바뀐 단일염기다형성(SNP)에 의한 것이다. 그간 뉴스 자료에 의하면, 김성진 박사의 경우 323만개의 차이가 있고, 이 중 한국인에게 특이적으로 발견된 SNP는 약 182만개라고 한다. 이 182만개에서 기존의 데이터베이스와 비교해 본 결과 알려지지 않은 SNP은 약 158만개 라고 한다. 이는 전체 30억개 중 0.06%를 차지하고 있다. 한마디로, 한국인만 갖는 고유한 염기는 만개당 6개 꼴이 된다. 이 323만개의 SNP에 대해서 질병과 신체적 특징에 관련한 SNP 1600건에 대해서 성인병 관련 질환, 습관성 질환, 신체적..