유전자정보분석

아웃라이어로 보는 한국인의 유전적 배경

hongiiv 2010. 8. 16. 14:00
반응형
얼마전 한반도와 그 주변국간의 유전자 흐름(Gene Flow between the Korean Peninsula and Its Neighboring Countries, PLoS ONE 5(7): e11855. doi:10.1371/journal.pone.0011855)이라는 제목의 논문이 나왔습니다.

이 논문은 한반도와 주변국의 320명의 샘플을 가지고 SNP을 통해서 분석한 결과를 제시하고 있다. 또한 분석에 있어서 한국을 역사적인 배경을 가지고 크게 3지역으로 구분하여 분석을 했다. 이 논문을 보면서 몇가지 이해가 되지 않는 부분을 언급하려고 한다.

한반도 3개지역 구분과 해당 지역들
South East(SE) Korean: 경주(GU), 고령(GR), 울산(US)
Middle West(MW) Korean: 제천(JC), 연천(JC), 천안(CA), 평창(PC)
South West(SW) Korean: 김제(GJ), 나주(NJ), 제주(JJ)

참고적으로 외국의 블로거들이 본 논문을 가지고 블로깅한 글들로 전체적으로 한반도와 주변국가와의 관계를 주로 설명하고있다. 하지만 논문제목과는 달리 실제 논문에서는 주로 이 3개의 지역과 역사와 관련한 내용이 주를 이루고 있다.
Koreans, not quite the purest race?
Koreans in genomic context

문제제기1)
한반도의 남서쪽이 다른 두 지역에 비해 몽골과 가까운것으로 유전지도에서 나타난다.(the populations in Model 1 (SW Korea) are closer to Mongolians than are the other two regions in the genome map(Fig. 2B))

첫번째 그림을 보면 한국은 로 표시되어 있고, 몽골은 로 표시되어 있다. 한국을 중심으로 왼편에 몽골이 있으며, 오른편에 한국이 5명, 몽골 1명이 아웃라이어로 존재하고 있다. 그러나 그림 어디에서도 남서쪽이 몽골과 가깝다는 정보는 없다??

그럼다면 한국인을 지역별로 구분한 두번째 그림을 보고 남서쪽이 몽골과 가깝다는 내용을 찾아보자. 한국인 남서쪽은 으로 한국에서 고르게 퍼져있다. 따라서 위에서 이야기한  모델1(남서쪽)이 몽골과 가깝다는 것은 어떤식으로도 말할 수 없다. 아니 논문의 그림만으로 판단하기에 너무너무 애매하다.


문제제기2에 대한 논문 내용)
북방계의 시베리아나 몽골의 유전적 흔적이 한반도의 남동쪽과 서쪽지역에 나타난다.(the Korean Peninsula from its neighboring countries indicated that some genetic signals from Northern population such as the Siberians and Mongolians still remain in the South East and West regions, while few signals remain from the early southern lineages)

한반도의 남동지역은
경주(GU)와 고베(KB)의 아웃라이어에 보듯이 시베리안 혈통과 관련이 있다.  (SE Korea region has some connections with Siberian lineages, with respect to grave patterns and culture, it is possible that the outliers in the GU and Kobe(KB) population could be of Siberian lineage)

그렇다면 과연 어떤 이유로 두번째 그림에서의 경주(두번째 그림의 ●)와 고베(두번째 그림의 ▲)의 아웃라이어를 보고 시베리아와 관련이 있다고 한것이냐? 이젠 역사로 들어간다. 고구려가 백제로 BC18-22 이동하고 이 지역이 일본인과 연관되어 있다는 것이다. 모델2의 아웃라이어인 남동쪽(두번째 그림의 ●, 여기서는 이미 앞서 남동쪽의 아웃라이어 5개를 경주라고 말함)의 사람들이 일본 고베(두번째 그림의▲)가 서로 가까이 존재한다는 이유에서이다.

결론적으로 논문에서는 남동쪽의 아웃라이어인 경주5명이 일본고베 1명과 가까이 위치해있다. 이건 북방계의 고구려가 백제(왜 백제인데, 신라인 경주와 연관되어 있는지 암튼) 로 왔고 이건 일본 고베로 넘어갔다. 이건 앞서 말한 MDS에서  아웃라이어인 경주와 고베가 가까이 존재하기 때문에 북방계다라고 말하고 있다. 이건 역사와 맞추었는데 아웃라이어인 경주는 신라인데 왜 백제가 나오고 아 안맞는다. -.-;;

아 이쯤에서 욕나온다. 당췌 논문의 그림과 논문내용과 어떻게 연결하려해도 답이 안나온다. 위에서 이 논문을 언급한 블로그에 이런 부분이 보인다. "it is a clear example of the intersection of science and culture"  이 논문이 과학과 문화의 교차에 대한 명확한 예제라고 했는데, 문화 즉 역사를 통해서 과학적인 부분을 두리뭉실 풀어나갔다는 생각이 드는건 왜일까?

두 블로그에서는 정작 이 논문에서 이야기하려는 부분에 대해서는 회피하고 있다. 그네들이 한국의 역사나 지리적인 부분에 대해서 잘 모르기 때문에 회피하고 있는 것이다. 그냥 전반적으로 한반도와 주변국에 대해서만 언급하고 있다. 하지만 조금만 본다면 지리적/역사적인 부분과는 상관없이 논문과 그림들이 잘 매칭이 안된다는걸 알 수 있을 것이다.

기본적으로 저런 분석에서 아웃라이어는 버리야 하지 않을까 생각한다. 아니면 적어도 이 논문에서처럼 아웃라이어를 끝까지 붙잡고 논문에서도 아웃라이어라고 해놓고 지속적으로 아웃라이어를 가지고 이야기를 끌어가는데 그건 뭔가 좀 아닌것 같다.  혹여나 아웃라이어들이 QC 과정에서 떨어져 나가야할 것들이라는 생각은 안해봤는지 (-.-;;) MDS plot에서 dimenstion 1의 설명력은 90%인데, 2는 1% 이건 또 뭔지? 그래 아무리 아웃라이어라 하더라도 그것이 역사와 맛물려서 잘 맞아 떨어진다면 그 누가 뭐라하겠느냐마는 아웃라이어와 역사와 맞춘 부분이 너무 두리뭉실하게 넘어가 버렸다. 적어도 내가 논문을 이해한 것이 맞는다면...

혹시라도 이글을 읽으신 분들중에 제가 논문을 잘못 이해했다거나 부가적인 설명을 주실분을 간절히 찾고 있습니다. 제발 plz... (^.^;;)


반응형