유전자정보분석

한국인 게놈 표준 지도

hongiiv 2012. 8. 29. 20:30
반응형
게놈에서의 표준이라는 것을 논하기 전에 표준이라는 사전적 의미를 보면 "일반적인 것 또는 평균적인것"이라는 의미가 있다. 이러한 표준의 예문 중 하나를 보자면 "그사람 정도의 키면 한국 남자의 표준은 된다" 한국인 남자의 표준 키가 있기에 우리는 그사람의 키를 가늠할 수 있을 뿐만 아니라 이 표준을 가지고 옷을 만들거나 버스 천정의 높이를 정한다거나 등 여러가지로 활용이 가능하다.

가령 미국인의 표준에 맞추어진 버스를 우리가 탄다면 대부분의 한국인은 높은 곳에 손잡이가 위치해 있어 불편할 것이다. 그러기에 한국인 표준이라는 것이 있으면 좋다. 물론 없으면 좀 불편하겠지만 말이다. 그럼 한국인 게놈 표준이라는 것은 뭘까?를 고민하기 전에 우리가 유전체를 통해 현재 하고 있는 일에서 불편한 점을 생각해 본다면 한국인 게놈 표준은 무엇인지에 대한 답이 나올것이다.

1) NCBI의 레퍼런스 게놈처럼 FASTQ 파일 하나 만드는것? 
2) 한국인이 평균적으로 가진 유전변이에 대한 정보를 제공하는 것?
3) 한국인의 NGS 데이터 및 validation을 위한 sanger, chip 데이터를 제공하는것?

보는 관점에 따라 다르겠지만 위의 것들을 모두 포함한것을 한국인 게놈 표준 지도가 아닐까? 생각해 본다. 표준이라는 의미와 지도라는 의미를 살펴볼때 지도는 우리가 모르는 장소를 찾을때 유용하게 사용되어진다. 즉 한국인게놈표준 지도 또한 한국인의 게놈을 연구할때 즉 원하는 것을 찾으려고 할때 유용하면 된다.

지금까지 연구에서 질병관련 유전변이를 찾을때 흔히들 가진 이미 알려진 유전변이는 제외한다. 이때 1000 genome 프로젝트나 dbSNP의 데이터가 사용된다. 극단적인 예로 이렇게 이미 알려진 유전변이를 제외한 유전변이가 유럽인에서는 드물게 나타나는 것이지만 한국인에서는 흔히 나타나는 유전변이였다면 어떨까? 그렇다면 제대로 찾은게 아닌게 된다. 따라서 한국인에서 흔한 유전변이를 제공하는 것 또한 무시할 부분은 아니다.

부디 왜 표준이 필요한지를 실제 유전체 연구자 입장에서 다시 한번 곰곰히 생각해보고 어떤 것이 연구자들을 위한 것인지 한번 생각해 봐야할것이다. 게놈게놈 여기저기서 떠드는데 한국인 데이터라고 공개되어 쓸 수 있는 데이터부터 있는지? 맨날 연구를 위한 1000 genomes 데이터만 다운로드해야 하는건지? 그리고 왜 우리는 1000 genomes 데이터처럼 공개되어 자유롭게 쓸 수 있는 데이터 하나 없는지?

얼마전 아마존 클라우드 스토리지에 1000 genomes의 데이터가 공개되었다. 누가 될지 모르겠지만 국내에도 이런 데이터 공개하면 내가 자비를 털어서라도 클라우드에 올려줄테닷. 물론 공개할 놈도 없고 왜 그걸 지 서버가 아닌 다른곳에 올려 놓는지에 대해서 전혀 이해를 못하겠지만 말이다. ㅋ

어찌어찌 하다보니 이야기가 샜구나. 암튼 아는 형님과 이야기를 하다가 걍 잊어버릴까봐 몇자 적는 의미에서 글을 남긴다.
반응형