개인유전체분석

엄마껀지 아빠건지 알아내기 - phase on your genome

hongiiv 2010. 4. 8. 16:55
반응형
일반적으로 23andMe와 같은 유전자 검사 서비스를 받게 되면 당신의 특정영역(RS번호라고 불리는)의 유전정보(지노타입)을 ATGC를 가지고 보여주게 된다.

예를 들자면 "rs671 AG" 이건 인간의 12번째 염색체의 110726148번째의 염기서열이 각각 A, G라는 것을 의미한다. A,G 이렇개 2개인 이유는 인간의 염색체는 1쌍으로 각각 엄마, 아빠에게 하나씩 물려 받았기 때문이다. 따라서 엄마에게서 받은 1개, 아빠에게서 받은 1개 이렇게 2개가 된다.

그런데 문제는 과연 A를 엄마에게서 받은것인지, 아님 G를 엄마에게서 받은것이지 도통 모른다. 자~ 이렇게 섞여있는 상태를 가르켜 unphased 된 데이터라고 하며, 엄마/아빠에게서 받은 것이 어떤건지 알아내서 쪽 정렬한것을 phased라고 부른다. 그럼 어떤걸 엄마에게 받은건지, 어떤걸 아빠에게 받은건지 알아낼 수 있는 것인가? 그리고 부모로 부터 뭘 받았는지가 뭐 중요한가? 그리고 마지막으로 그럼 왜 따로따로 누구에게 받은건지 왜 모르냐? 라는 질문이 올 수 있겠다. 우선 마지막 질문의 경우는 아직까지 기술의 한계로 정확하게 나누어 알아낼 수 없는 상황이니 그렇게 알아두자!!

예를 들어 rs671이 IQ에 관련하고 있으며 A를 가진 경우 IQ가 높고, G를 가진 경우 IQ가 낮다라고 할 경우에 내가 AA인 경우 부모님 두 분에게서 좋은?것만 물려 받은것이지만, AG라고 하는 경우 누구에게서 G를 물려 받았는지? 그래야 누굴 닮아서 공부를 못하는지 정확하게 따져 말할 수 있기 때문이다. - 여기까지는 농담...-.-;;

Phased
(b)의 그림은 각 영역의 2개씩의 염기서열이 엄마/아빠, 아빠/엄마 막 섞여있는 상태다. 
첫번째 나온게 엄마, 두번째 나온게 아빠 이런게 아니라 알파벳 순서로 걍 놓은거다.
(c)의 그림은 엄마/아빠에게서 받은것을 잘 정리해 놓은 것이다.

그럼 다시 진지하게 본론으로 들어가서 

1. 누구에게 받은건지 알아내는 방법
많은 방법이 있지만, 가장 간단하면서도 정확한 방법은 엄마/아빠/자식 이렇게 3명에 대한 검사 결과가 있으면 어떤걸 누구에게서 물려 받았는지 알아 낼 수 있다.  엄마가 AA, 아빠가 AG, 자식이 AG라면 초등학생도 자식의 A는 엄마, G는 아빠라는 걸 알 수 있게다. 각각 1개씩만 받으니 자식의 G는 당근 아빠꺼고 자식의 A는 엄마꺼일 수 밖에 없는 거다. 이런식으로 하나씩 하나씩 누구에게 물려받았는지를 알아내면 끝이다.
haplotype
이렇게 부모로 부터 내 정보를 알아낼 수 있게 되며,
엄마/아빠에게 받은 것을 구분해서 죽 늘어 놓은 것을 Haplotype이라고 한다. 
가끔 엄마도 AG(hetero), 아빠도 AG, 나도 AG인 경우 어떤게 누구에게서 물려받게 된건지 알 수 없기도 하다. :-)

2. 이렇게 구분된게 왜? 필요한건가?
각각의 부위는 아무렇게나 자식에게 전달되는 것이 아니라 서로 연관되어 하나의 블록 단위로 자식에게 전달되며, SNP과 마찬가지로 이렇게 각 개인이 가진 두 개의 Haplotype은 다양한 조합으로 구성되어 각 개인을 구별 할 수 있는 정보력 있는 마커로 쓰일 수 있기 때문이다.

일반적으로 한 집단의 구성원들은 동일한 Haplotype 패턴을 공유하고 있으며, 이러한 Haplotype간의 유사성을 비교함으로써 각 개인의 유전적인 근원이나 자연선택, 인간의 진화, 혈통, 종(species)과 종을 이해하는데 정보를 제공한다. 즉, 오래된 선조의 특정 지역의 Haplotype이 "AAAA" 였는데 어떤 집단의 경우 "AABB" 형태를 보인다고 할때 이 부분에서 특정 형태가 자주 발견되는 것을 민족/집단의 이동, 자연선택 등에 이해에 활용할 수 있게 된다.

따라서 각 인종(지역)마다 Haplotype을 찾아내는 International HapMap이라는 프로젝트가 있으며, 한국인에서도 이러한 Haplotype을 만드는 것 또한 우리 민족을 이해하는데 중요한 열쇠이다.

또한 위에서 농담으로 언급했지만, IQ가 아니라 어떠한 질병인 경우 해당 질병을 이해하는데에도 phased된 데이터와 이를 통한 Haplotype의 구성은 큰 도움을 주고 있다.


반응형