티스토리 뷰
이번에는 genome unzipped에 공개된 유전체(SNP) 데이터를 기반으로 ancestry를 분석한것에 대해서 이야기해보려고 한다. 특히 다니엘과 조에 포커스가 맞추어져 있으니 사진을 잘 보고 이 글을 읽어 나간다면 더욱 흥미로울 것이다.
북서/남동 유럽의 지리적 위치
이들의 유전체 데이터가 공개되자 제일 먼저 Dienekes' Anthropology 블로그를 통해 이들의 선조에 대한 정보를 분석한 결과가 공개되었다. 유럽인이라면 23andMe나 deCODEme의 유전자 검사 데이터를 EURO-DNA-CALC이라는 프로그램에 입력하면 NW (북서) 유럽인, SE (남동) 유럽인, 중동부 유럽 유대인의 후손인 아슈케나이지 유대인의 3가지의 분류로 자신의 선조 정보를 표시해준다. 대부분 서양인들이 한국인지 일본인지 중국인인지 또는 한/중/일이 지리상 어디에 붙어 있는지 별관심도 없고 정보도 없는것과 마찬가지로 나또한 북서/남동 유럽이 당췌 어디가 어디인지 모르기에 잠깐 살펴보면, 지도상에서 보면 대충 붉은색이 북서 유럽 (영국, 프랑스, 독일 네덜란드, 덴마크, 핀란드, 스위스 등) 과 녹색의 남동 유럽 (발칸반도 부근의 그리스, 알바니아, 불가리아, 터키) 에 해당 된다고 하겠다.
각 멤버들의 선조 정보
자! 그러면 위의 12명이 과연 선조가 어떻게 되는지 EURO-DNA-CALC을 통해 분석된 결과를 우선 보도 EURO-DNA-CALC의 원리에 대해서 이야기해보도록 하겠다. 우선 사진의 첫번째부터 각각 선조 정보는 다음의 표와 같으며, 다니엘/케이트/제프/잰/캐롤/일란 6명이 북서유럽에 가깝게 보여지며, 루크/캐롤린/콘라드가 각각 북서/남동 유럽인이 비슷한 비율을 보이며, 댄이 유대인에 가깝고 빈센트/조 가 북서유럽과 유대인조상이 나타난것을 볼 수 있다. 각 선조별 구성으로 클러스터링한 사진은 클러스터링 알고리즘 중 내맘대로 클러스터링 알고리즘을 사용한 것으로 북서유럽을 시작으로 유대인까지의 비율에 따라 클러스터링한 것이다. 참고로 SNPedia를 운영하는 마이클 카리아소는 9/91/0으로 구성되어 있으며, 자신의 말로는 조상이 이탈리아라고 한다.
EURO-DNA-CALC는 어떻게 유전자 정보로 선조를 구분하나?
EURO-DNA-CALC은 약 300개의 SNP에 대한 frequency 정보를 기반으로 움직이고, 간단히 A라는 SNP의 'AA' 타입이 북서/남동유럽인이 각각 80%, 20% 'BB' 타입이 20%, 80%인 경우 '홍길동'이 A SNP의 타입이 'AA'라고 나왔다면 이 사람은 북서유럽인에 가깝다는 결론을 내려주는 것이다. 즉 각 지리적 위치에 따른 사람들을 대표하는 300개의 SNP을 선별해서 각 SNP의 타입을 조합해서 기존의 연구결과에 붙여 어느 정도의 분포를 가지는지를 보여주는 프로그램인것이다. EURO-DNA-CALC에서 사용하는 SNP중에서 23andMe에서 제공하는 SNP은 약 150개 즉 반 정도만을 이용해서 계산된 것이다. 이 결과를 두고 조(Joe)가 자신의 유대인 선조에 대한 비율은 남유럽인의 정보가 없고 단지 북서/남동/유대인의 세분류만을 사용했기 때문에 자신에게서 유대인의 %가 나온것이라고 이야기하고 있다.
다른 분석에서도 마찬가지이겠지만, 레퍼런스를 어떤것을 사용했느냐에 따라서 그 결과는 달라지게 된다. 만약 레퍼런스에 한국인의 데이터가 들어갔다면, 분명 이들 중 한국인이 선조라는 정보가 들어갔을테니 말이다. ^^'' 따라서 이런건 정말 조심히 잘 해야 한다.