유전자정보분석

Hack Your Genome

hongiiv 2010. 4. 9. 10:40
반응형
자신을 구성하고 있는 수십억개의 정보들이 어떻게 배열되어 있는지 확인하는것은 분명 흥미진진한 일이다. 이러한 유전정보는 결정적인것이 아니며, 설령 특정 질병에 걸릴 위험이 높은것으로 나타나더라도 아무일도 생기지 않거나 얼마든지 뒤바뀔 수 있으니 이를 의학적 진단으로 간주하지 말아야 할 것이다.

hacks

유전정보가 일반적인 질병에 대한 개인적 확률을 예상하거나 결론 짓기에는 과학적인 증거가 불충분하지만 개인 맞춤 식이요법이나 라이프 스타일을 제공하는데에 어느정도 기여는 할 수 있다고 생각한다.

인간의 유전자 프로필과 데이터베이스에 저장된 자료들과의 상관관계를 비교 분석해 기업들[각주:1]은 그 사람이 결장암에 걸릴 확률이 30% 이상이라거나 백내장에 걸릴 확률이 20% 이하라는 식의 계산이 가능해졌지만(어느정도 과학적인 방법으로...) 누군가 젖은 귀지를 만드는 유전자를 가지고 있다는 사실을 아는것은 매우 흥미로울 수도 있겠지만 심각한 병에 걸릴 확률이 62%라고 말해 준다면 도대체 그게 그사람에게 무슨 의미를 가질 수 있겠는가?

하지만 앞서 언급했듯이 이러한 정보는 자신이 보유하고 있는 극히 개인적인 정보로 그 배열을 아는 것만으로도(어떤 의미를 가지는지 아직 확실하진 않지만) 흥미로울 수 있으며, 자신의 유전정보는 자가 발견을 돕는 동시에 새로운 형식의 사회연결망의 역할을 할 수 있다고 본다.자신의 유전정보에 대한 세부적인 정보를 배우고 다른 사람과 공유(그냥 무턱대고 공유하는것이 아닌)하면서 우리의 생활은 점점 풍요로워 질것이다. 풍요롭다기보단 재미있어 질 것이다. :-)

처음 컴퓨터가 세상에 나왔을 때 그 쓰임새는 일부 제한된 연구에 활용되었다. 포탄의 거리를 계산하거나 하는 식의 하지만 이제는 많은 분야에서 사용되어지며, 요즘 웹2.0에 맞추어 많은 사람들은 이제는 인터넷상의 여러가지 분야의 오픈 데이터를 기반으로 예전에는 전혀 엄두도 못내던 것들에 대해서 활용하고 있다. WWW의 창시자인 팀 버너스리는 TED2010 6분 토크에서 "오픈데이터가 세계에 퍼진해"라는 주제[각주:2]로 정부, 기관, 학계는 로데이터를 온라인에 공개하고 이를 통해 다양한 작업들이 가능하도록 해야 한다라는 말을 했다. 어떻게 보면 정부 기관을 비롯한 다양한 곳에서 생산된 데이터는 어쩔 수 없는 흐름으로 오픈될테고 오픈 로우데이터는 아마 생물학 분야의 데이터가 엄청 날것이라고 생각한다.

게놈 데이터 역시 많은 공개된 데이터가 존재하며, 일부 사람이긴 하지만 단지 몇 십달러에 자신만의 게놈 데이터를 가지고 있는 사람들도 늘어나고 있다.(예, SNPedia의 공개된 게놈정보) 혹자는 웹2.0에 빗대어 Genome 2.0, Genetics 2.0[각주:3] 이라는 단어를 사용하고 있다.

많은 사람들이 흔하게 이러한 게놈 데이터를 보게 되는 시점에서 우리가 "집단지성프로그래밍[각주:4]"이란 책에서 보듯이 여러 재미난 데이터를 유용한 정보로 만들듯이 아직까지는 연구자의 전유물로 여겨지고 있지만, 현재는 몇몇이긴 하지만 자신의 게놈정보를 직접 분석하는 그러한 시대가 올것이다.
future

이러한 움직임에 한 몫을 하는것은 물론 점점 고사양화되어가는 PC에도 있다. 한 인간의 30억 배열 정보를 다루기에 충분한 컴퓨팅 환경과 Hadoop, 아마존의 클라우드 컴퓨팅을 통해 이제는 일부 사람들만 쓰던 슈퍼컴퓨터의 능력을 이제 손쉽게 사용할 수 있다는 점이다.

물론 컴퓨터를 이용해서 금융데이터를 다루려면 금융에 대한 기본 지식이 있어야 한다. 마찬가지로 자신의 게놈 데이터를 취미 혹은 그 이상을 위해서 다루고자 한다면 분명 이에 대한 기본 지식은 있어야 한다. 우리나라 같은 경우 고학력의(중/고등학교 시절의 생물 지식 정도) 꽤 수준 높은 인력들이 많은 상황에서 이러한 게놈 데이터를 다루는 사람들에게 많은 활용이 기대된다.



  1. 23andMe, DecodeMe, Navigentics 등등 [본문으로]
  2. http://www.ted.com/talks/lang/eng/tim_berners_lee_the_year_open_data_went_worldwide.html [본문으로]
  3. http://www.chromosomechronicles.com/genetics-20/ [본문으로]
  4. 오라일리에서 나온책으로 이책은 바이오인포매틱스를 하던 토비세가란이 인터넷상의 데이터를 가지고 여러 의미를 뽑아내는 방법에 대해서 설명하고 있다. [본문으로]
반응형