blogging

생물학 데이터와 구글맵

hongiiv 2009. 5. 29. 20:08
반응형
HGDP-CEPH Human Genome Diversity Cell Line Panel에서는 총 1,050명의 51개 인종에 대한 LCLs(lymphoblastoid cell lines)를 보유하고 있다. 즉 전 세계의 거의 모든 인종에 대한 DNA를 보유하고 있다고 볼 수 있다.

이 유전자원을 가지고  스탠포드 대학에서 Illumina 650Y 칩을 가지고 50개 인종 968명에 대해서 총 650,000개의 SNPs을 genotyping을 수행하였다.

이러한 Allele정보는 인류학에서도 유용하게 사용될 수 있을 뿐만 아니라 인종간의 유전적 거리를 측정하는데 사용될 수 있는 중요한 자료이다. 이미 23andMe에서도 HGDP 정보를 기반으로 나의 유전자와 어느 인종과 가까운지 또는 멀리 떨어져 있는지를 2차원 평면 상에서 보여주는데 사용하고 있다.

rs2342747.frqs

이것은 Allfred인 데, 전세계적으로 genotyping한 결과를 전부 끌어 모아서 인종별로 보여주고 있다. 따라서 SNP의 전체갯수도 미약하고, 존재하지 않는 인종도 있지만, 꾸준히 논문들과 데이터가 공개됨에 따라 점점 인종간의 Allele를 보는데 유용할 거라는 생각이 든다. 이것 역시 지도상에 표현해주는데 구글맵과 구글어스를 통해서 미리 생성된  KML 파일을 읽어와 보여준다.

ALFRED
Alfred

첫번째 hgdp selection browser는 미리 작성된 데이터를 가지고 정적인 이미지를 통해 정보를 보여주고 있으며, 두번째 Alfred 역시 미리 작성된 데이터를 가지고 KML 파일을 읽어와 지도상에 표시하게 된다.

그럼 실시간으로 사용자의 입력을 받고 이를 반영하는 Wiki상에서는 어떻게 할까? 그래서 사용자가 각 인종별로 Allele 정보를 입력하면 그 즉시 지도상에 반영되도록 Allele Map을 한번 만들어봤다. mediawiki를 통해서 사용자는 자신이 데이터를 작성하면 바로 Wiki의 구글맵에 보여주도록 만들었다. 이로서 얻는 장점은 실시간 협업과 데이터에 대한 자유로운 수정과 즉각적인 비주얼이 가능하다는 것이다.

Picture 3
Wiki and Allele Map
반응형