유전자정보분석

지난 10년간의 genome과 질병에 대한 연구

hongiiv 2010. 12. 13. 10:59
반응형
Population sequencing of two endocannabinoid metabolic genes identifies rare and common regulatory variants associated with extreme obesity and metabolite level - population 기반의 candidate gene의 ngs를 이용한 sequence 기반의 association 연구

논문 Backgroud의 첫 문장은 다음과 같이 시작한다. "During the past decade, the search for the underlying genetic of complex traits and diseases in human has been focused on common DNA variants with a minor allele frequency (MAF) >0.05.지난 10여년간 complex traits/disease에 대한 유전적인 연구는 minor allele frequency (MAF) > 0.05의 common한 DNA variants에 촛점이 맞추어 연구되어왔다.

자! 이 한문장에 지난 10년간의 질병과 SNP에 대한 모든 내용이 담겨져 있다. 이 한 문장만 이해 한다면 지금까지의 genome 연구에 대한 방향이나 앞으로의 방향에 대한 모든것이 들어있다.  그럼 오늘은 이 한문장에 담긴 의미를 하나씩 짚어 보도록 하겠다.

during the past decade - 지난 10년, 이것은 human genome project가 시작되어 그 결과를 발표한지 10년째 되는 해이다. genome에 대한 대규모의 연구는 바로 이 시점을 시작으로 해서 딱 10년간 이루어진 성과들인 것이다.

search for the underlying genetic of complex traits and disease in human - 질병에 대해서 이야기 할때 흔히들 유전적인요소+환경적인요소, 인구집단에서 흔히 발병되는/드물게 발병되는가에 대해서 이야기한다. 유전병과 같은 경우 환경적인 요소보다는 유전적인 요소가 강하지만, 흔히 일반인들에게 나타나는 질병 (common disease, trait)인 당뇨, 비반은 유전이 미치는 영향이 있기는 하지만 그 영향은 미비하다. common disease는 일반적으로 흔히들 걸리는 질병을 의미하며, complex disease는 유전적인요소와 환경적인 요소가 복합되어 나타나는 질병을 의미하며, 당뇨같은 경우 common complex disease라고 흔히 말한다.

focused on common DNA variants with a minor allele frequency >0.05 - 이와 관련해서는 common disease-common variant이라는 가설, 흔환질환 (common disease)을 일으키는 요인 (allele)이 이 질환을 가진 모든 사람들에서 흔히 나타난다는 가설로, GWAS는 바로 일반인들에게서 흔히 발생되는 질병 (common diseas) 들은 그 사람들이 흔히 가지고 있는 유전변이 (common variatnts)에 의해 발생된다는 점(CD-CV 가설)을 기반으로 하고 있으며, minor allele frequency가 0.05 (5%) 이상이라는 것은 인구집단에서 흔히 발견되는 (common) 변이라는 의미로 인구집단에서의 유전변이의 100명중 5명 이상은 가지고 있어야 한다는 것이다. 이를 coomon variant라고 지정한 것이다. 반대로 인구집단에서 보기 드문 유전변이를 rare variants라고 하며 이는 인구집단에서 0.05 - 0.5%로 발견되는 유전변이를 말한다.

HapMap project 논문에서의 유전변이의 frequency에 따른 분류

바로 이러한 일반인구집단에서 흔히 갖고 있는 변이와 일반적으로 흔히 발생되는 질병과의 연관성 연구가 지금까지의 질병과 유전과의 관계를 설명하기 위한 연구였다. 바로 이러한 연구가 가능하게 된것은 CD-CV 가설에 기반을 둔 GWAS 연구에 의해서 가능하게 되었는데, 이러한 GWAS 연구는 인구 집단에서 SNP 이라는 유전변이를 발굴하는 기술이 발전하면서 가능했으며, complex trait에 관련된 400개가 넘는 유전변이가 현재 밝혀졌다.

하지만, 이러한 common한 질환에서의 common한 유전변이가 실제 질환에 미치는 영향은 극히 적으며, 이러한 common한 유전변이가 질환에 대해서 설명할 수 없는 부분을 일컬어 missing heritability (잃어버린 유전성) 이라고 부르며, 이러한 common한 질환에서의 common 한 유전변이들의 영향 이외의 잃어버린 유전성에 대해서 설명하려는 시도가 바로 rare variants로 지금까지의 GWAS의 genotyping 기술과 분석 전략으로는 이를 찾아내기가 힘든 상황이었지만,  ngs를 통한 비교적? 값싼 방법을 통해서 사람들이 가진 common한 유전변이외에 rare한 유전변이를 대규모 인구집단에서 찾는 것이 가능해지면서 여러가지 잃어버린 유전성을 찾기 위한 접근들이 이루어지고 있다.

실제로 10년전에는 한명의 사람에 대한 whole genome 분석을 한다면 인간의 모든것을 알 수 있을거라고 생각했고Human Genome Project가 이루어졌지만, 사람이나 인종마다의 genome이 다르기 때문에 HapMap 프로젝트 (genotypeing 기반)가 수행되었던 것이었다. 이에 NGS 가격이 낮아지면서 좀 더 자세한 카타로그를 작성하기 위한 1000 Genome Project (ngs 기반)가 진행된 것이다. 개개인으로 보자면 더욱더 많은 유전변이들이 개인마다 나타나며 이는 앞으로 personal genome이나 genome에서 질병과의 관계를 규명하기 위한 앞으로 많은 할일이 남아있다는것을 의미한다. HapMap이 genotyping기반의 common 유전변이를 인종마다 발굴하기 위한 것이라면, 1000 genome은 ngs기반의 common+rare한 변이를 인종마다 발굴하기 위한 것이며, personal genome은 이러한 것들을 기반으로 개인의 변이를 발굴하고 연구하기 위한 것이다.

바로 이 논문이 그 첫번째 삽을 뜨는 방법에 대한 내용을 다루고 있다는 점에서 그리고 현재 우리가 진행하고 있는 연구와 관련되어 있다. 우선은 첫번째 문장을 읽고 잠시 접어 둔 상태로 읽고나서 다시 이야기를 진행하기로 하자. ㅋ

반응형