blogging

나는 엄마 닮았어 아빠 닮았어?

hongiiv 2008. 8. 6. 23:09
반응형
Picture 4
아빠 vs. 딸

Picture 5
엄마 vs. 딸

위의 그림은 일전에 서울대에서 발표했던 내용 중에서 23andMe에서 제공하는 서비스 중 자신의 가족들간의 Genome유사성을 비교해주는 서비스의 일부분이다. 물론 돈을 지불해야만 자신의 Genome 데이터를 볼 수 있지만, 샘플데이터로 Mendel가족(영국의 실제 가족이라고 한다. 물론 그들의 동의를 얻어서 공개하는 것이고,,,)의 엄마,아빠와 딸을 각각 Genome-Wide로 비교한 결과이다.

단순 수치로 보자면 딸은 아빠보다는 엄마를 더 닮았다. 그럼 이 결과는 어떻게 나온것인지 살짝 살펴보고 이것이 의미하는 바를 한번 짚어 보자. 23andMe에서는 자신의 구강에서 DNA를 채취해서(CSI를 보신분이라면 ^^) 약 600,000개의 SNP을 찾아낸다. 바로 이 SNP이 어느 정도 서로 일치하는냐에 따라서 유사도를 매긴것이 바로 Genome-Wide Comparison이다.

이러한 약 60만개의 SNP 정보가 담긴 raw data는 아래와 같이 식별자(rsid), 염색체 번호(chromosome), 염색체 상에서의 위치(position), 유전자형(genotype)으로 이러한 row가 약 60만개가 존재한다.

rsid    chromosome    position    genotype
rs3094315    1    742429    AG
rs12562034    1    758311    GG
rs3934834    1    995669    CC
....

rs3094315가 AG 라는것은 이 사람은 인간의 유전체 서열중 1번 염색체의 742,429번째가 A 또는 G가 나온다는 의미로 다른 사람들과 다른 부분은 일치하지만 이부분 만큼은 A,G로 다른사람과 다르다는 것이다. (더 깊게 들어가면 복잡하니까 이정도로만 알아두도록하자 ^^) 그리고 이것을 가르켜 SNP이라고 부른다. 바로 이 SNP에 의해서 각각 사람마다 얼굴 생김새나 각종 질병에 대한 민감도 등등이 서로 차이를 보인다.

이런 SNP정보를 엄마와 딸을 서로 대조해보면 rs3094315부분에서 아빠는 AA, 딸도 AA라면 100%, 아빠가 AA, 딸이 AG로 하나만 일치한다면 50%, AA-GG라면 0%를 주고 60만개에 대한 total을 해주면 위와 같이 엄마/딸, 아빠/딸에 대한 유사도를 수치화 해서 보여줄수 있게 된다.

23andMe에서는 엄마와 아빠의 데이터에 대해서 제공하는 raw data를 가지고 python을 이용해서 계산한 값이다. 엄마와 아빠의 총 554,339개의 SNP을 비교해본 결과, 30,315개가 정확히 일치하고 214,468개가 반만 일치하여 74%의 유사도를 보이고 있다.

Genome-Wide Comparison
직접 계산한값

Genome-Wide Comparison23andMe에서 제공하는 값

그외에도 가족끼리 어떠한 질병이나 특징에 대해서 어느정도 유사한지에 대한 정보나 어느 인종과 유사한지에 대한 흥미 유발용?? 결과들이 더 존재한다. 돈까지 지불해가면서 서비스를 받을 만한 가치가 있을까?라는 생각이 들기도 하지만, 뭐~~~

좀 더 시간이 지나면 천식 관련 SNP이 AA인경우 천식에 강하기 때문에 100점, AG인 경우 50점, GG인 경우 0점을 주고, 사람간에 유전정보를 가지고 순위를 매기는 서비스가 나오지는 않을까?? 그리고 사람들은 자신의 유전적 우월성에 대해서 야후의 블로그 뱃지처럼 자신의 블로그에 난 몇 등짜리 사람이라고 떡하니 뱃지가 달리지 않을까라는 생각을 해본다. ^^ 대학시절 여학우들에 대해서 남학생들이 모여서 점수를 매긴 데이터가 유출되어 남학생들이 죽을 고비를 넘긴적이 있는데,,, 갑자기 생각났다. ^^


반응형