개인유전체분석 34

Day3 - 네안데르탈인과 나의 Genome 비교

데이터도 얻었고 public domain에 등록도 해보았다. 그렇다면 이제부터 내 Genome을 내스스로 한번 분석해 보도록하자. 하지만 이미 많은 연구자들이 personal genome 데이터를 해석해주는 다양한 툴들을 만들어 놓았으니 우선 이것들을 활용해서 분석하는 것 부터 시작해보도록 하자. Interpretome Interpretome은 웹기반의 툴로서 스탠포드 대학의 유전학 강의를 듣는 학생들이 만든 것이다. Genome 데이터로부터 할 수 있는 다양한 분석을 웹상에 구현해 놓았으니 당신은 클릭만 하면 된다. 자신의 23andMe 포맷의 데이터를 업로드하면 서버상에서 분석해서 그 결과를 보여준다. Interpretome을 사용하기 위해서는 우선 23andMe 파일을 선택한 후 자신의 인종을 선택..

Day2 - 내 데이터 공개하기

자신의 genotype 데이터가 준비되었고, 또한 DTC 회사에서 제공하는 정보외에 다양한 정보를 얻기를 원할 것이다. 이러한 정보들을 얻기 이전에 과학계의 발전을 위해서 내 데이터가 쓰여지길 원하고 더불어 몇몇 유용한 정보를 더 얻기를 원한다면 다음의 서비스들은 당신에게 커다란 보람을 줄것이다. openSNP openSNP은 최근에 만들어진 사이트로 자신의 결과를 다른사람들과 공유할 수 있도록 만들어진 웹 기반 시스템이다. 23andMe나 deCOMEme 사용들은 자신의 raw data를 업로드하고 다양한 방법으로 확인할 수 있다. Phenotypes 머리카락색, 눈색 등의 이미 다른 사용자가 만들어진 phenotype 정보에 자신의 phenotype을 적거나, 없는 phenotype의 경우 자신이 직..

STRUCTURE 프로그램을 이용한 Population Structure 분석

STRUCTURE라는 프로그램과 SNP 데이터를 이용해서 population structure를 분석하는 방법입니다. 예전에 128개의 SNP으로 분석하는 방법에 대한 글은 이곳을 클릭하시기 바랍니다. 윈도우용 프로그램을 다운로드 하셔서 위의 링크의 예제 파일을 다운로드하신 후 분석하시면 됩니다. 한국인의 infomative한 SNP 마커 발굴에 관한 논문은 다음의 논문을 참고하시면 됩니다. Int J Legal Med (2010) 124:125–131 DOI 10.1007/s00414-009-0389-9 Development of SNP-based human identification system View more presentations from Hong ChangBum

23andMe는 상업 회사가 아니라 연구기관이다??

얼마전부터 사람들이 23andMe 가격 정책이 바뀌었다는데요? 라고 물어보는데, 23andMe 서비스에 접속해 본지도 오래된지라 아는척을 하지 못하고 머뭇거리고만 있었다. 그리고 마침내 오늘에서야 이 질문에 답해 보려고 한다. 23andMe의 현재까지 수익은 얼마나 될까? 현재까지 공식적으로 밝혀진 것은 23andMe의 고객은 75,000명 (23andMe의 CEO가 언급, 10th Systems Biology & P4 Medicine) 이라고 말하고 있다. 고객당 평균 $300의 비용을 들여 서비스를 받았다고 할 경우 수학정석에 나와 있는 공식에 의해 75000*300= $22,500,000 = 24,592,500,000 원 (오늘환율 1,093원 적용시) 즉 현재까지 2백4십억여원의 수입이 발생한걸로..

CEOmics: 경영진들이 자신의 genome 정보를 공개하는 이유는?

얼마전 Wired로 블로그 (Genetic Future) 를 옮긴 다니엘의 글에 CEOmics라는 단어가 나왔다. "-ome" 은 세트라는 의미를 가지고 있으며, "-ics"는 ~~학(수학,과학처럼)이라는 의미를 지니고 있는데 이것이 합쳐저서서 "-omics"라는 단어가 만들어졌다. 이 단어는 생물학 분야에서 처음 사용되기 시작했는데 일정 수준의 생물학적 정보의 집합체를 나타내는 접미어로서 genomics, proteomics 등 전체 유전자의 군, 전체 단백질 군을 연구하는 학문이라는 의미를 가지게 된다. 바로 이 omics (오믹스)와 CEO (최고경영자)가 합쳐진 CEOmics라는 단어가 만들어지게 되었다. 그럼 왜 이 단어가 탄생했는지 한번 들여다 보기로 하자. 자신의 유전정보를 공개하는 것이 이..

personal genomic 관련 프로그램과 웹사이트

SNPedia/Web page: 위키 기반으로 SNP과 연관된 trait(질병포함) 정보를 제공하고 있으며, 여러 사람들의 협업을 통해 자료가 업데이트되고 있지만, 주로 관리자가 NCBI의 rss 데이터를 주기적으로 받아 정리하고 있다. Promethease/Mac, Windows program: 자유롭게 다운로드 받아 사용할 수 있으며, 23andMe, deCODEme, Navigenics의 raw data를 넣으면 SNPedia로 부터 데이터를 가져와 SNP과 trait 정보를 보여준다. DIYgenomics/iPhone, Android app: 20여가지의 SNP과 관련된 trait 정보를 보여주는데, 23andMe, deCODEme, Navigenics에서 각각 trait에 사용된 SNP을 비교해..

소비자직접거래 방식의 유전자 검사 서비스 과연 문제는?

물론 가장 큰 문제는 윤리적인(ethical) 문제가 있을 수 있겠다. 여기에서는 이러한 유전자 검사가 대중적으로 이루어짐으로서 개인이나 사회가 떠안게 될 윤리적인 문제를 배제하고 과학적인(scientific)면에서 과연 이러한 개인 유전자 검사 서비스가 안고 있는 문제를 짚어 보려고 한다. 지난번 포스팅에서도 언급했던 5명의 동일한 사람에 대해서 두개의 소비자직접거래 방식의 유전자 검사 서비스에 의뢰했더니 그 결과가 서로 상이했다는 내용이었다. 사람이 가진 유전정보는 같을텐데 그것을 해석하는데에 있어서 두 회사가 서로 다른 방법을 취하고 있기 때문에 이러한 결과를 초래하게 된것이다. 그럼 어떠한 부분에서 어떠한 차이가 존재하길래 이처럼 서로 다른 결과를 보여주는지에 대해서 한번 알아보자 유전자 검사 결..

소비자가 참여하는 논문 - 23andMe의 GWAS

23andMe와 columbia 대학은 PLoS Genetics에 얼마전 공동으로 23andMe의 GWAS(전장유전체연관분석)를 통한 연구 결과를 발표하였다. 연구원들은 23andMe의 검사 서비스를 통해 모은 약 9,000명의 개인 유전정보를 바탕으로 20여개의 형질(trait)에 대하여 유전적인 연관성을 조사하였다. 5개의 형질에 대해서는 기존의 연구 결과를 재확인하였고, 4개의 형질(곱슬머리, 코골이, 주근깨, 소변에서 asparagus 대사물질의 냄새 확인)과 연관된 새로운 유전변이를 발굴하였다. 23andMe의 공동설립자이자 대표인 Anne Wojcicki(구글의 창업자 아내)는 사용자가 자발적으로 제공하는 자료들이 기존의 역학 연구방법에 의해 수집된 자료에 맞먹는 가치를 지니게 될 것이라고 언..

미 FDA, 유전자 검사(DTC) 실시하는 기관에 문제 제기

미국 FDA(Food and Drug Administration)는 최근 소비자에게 직접 유전자 검사의뢰를 받는 23andMe를 비롯한 소비자직접거래방시의 회사들에 대한 단속을 시행하였다. 이들 회사는 소비자로부터 시료를 받아 유전체전장에 걸치 스캔을 진행한 뒤 그 분석 결과를 이용하여 개인별로 특정 유전변이를 가지는 여부에 따라 암이나 당뇨와 같은 질환에 걸릴 위험이 높은지 낮은지 판단해 주는 일을 상업적으로 진행하고 있는 중이다. FDA측은 이들의 유전자 검사 서비스는 질병 유발 가능성을 가늠하는 진단용으로 사용될 뿐만 아니라, 윤리적인 문제 또한 제기되기 때문에 FDA의 승인을 받아야한다고 주장하고 있다. 이를 지지하는 유전체 연구자들은 이러한 서비스가 실제 임상적인 결정에 이용될 가능성이 높기 때..

엄마껀지 아빠건지 알아내기 - phase on your genome

일반적으로 23andMe와 같은 유전자 검사 서비스를 받게 되면 당신의 특정영역(RS번호라고 불리는)의 유전정보(지노타입)을 ATGC를 가지고 보여주게 된다. 예를 들자면 "rs671 AG" 이건 인간의 12번째 염색체의 110726148번째의 염기서열이 각각 A, G라는 것을 의미한다. A,G 이렇개 2개인 이유는 인간의 염색체는 1쌍으로 각각 엄마, 아빠에게 하나씩 물려 받았기 때문이다. 따라서 엄마에게서 받은 1개, 아빠에게서 받은 1개 이렇게 2개가 된다. 그런데 문제는 과연 A를 엄마에게서 받은것인지, 아님 G를 엄마에게서 받은것이지 도통 모른다. 자~ 이렇게 섞여있는 상태를 가르켜 unphased 된 데이터라고 하며, 엄마/아빠에게서 받은 것이 어떤건지 알아내서 쪽 정렬한것을 phased라고 ..