java-programming

Bioinformatics or Computational Biology와 Web 2.0

hongiiv 2007. 5. 10. 10:43
반응형
인간의 약 30억개(base)가 되는 염기서열을 해석한다는 것은 , 30억 베이스 중에서 어느 특정부분이 어떻게 단백질로 되어서, 세포내외에서 특정 역할을 어떻게 수행하는지를 밝히는 것이다.

이러한 해석 과정을 연구하기 위한 수많은 연구 분야가 있다. 간단하게 이러한 연구를 수많은 연구를 분야를 통틀어 Bioinformatics라고 한다면, 주로 바이오 데이터를 이용한 분석보다는 이러한 분석에 대한 연구를 진행하는데에 있어 기초적인 자료를 제공하는 바이오데이터 즉, 염기서열 정보, 유전자 해석정보등을 제공하는 바이오 데이터베이스와 Web 2.0과의 결합(?), 접목(?)에 대해서 논하고자 한다.

위에서 언급한 바이오데이터는 Genome Browser 형태로 제공되는데 바이오 데이터에 대한 정보는 상당히 복잡하게 얽혀 있기 때문에 이러한 정보를 한눈에 볼 수 있는 Genome Browser는 연구자들에게 많은 편의를 제공하고 있으며, 생물학 연구에 있어서 중요한 기초 요소중의 하나이다.

현재 연구자들이 많이 사용하고 있는 바이오 데이터베이스(이 안에 Genome Browser를 포함)는 NCBI, Ensembl, UCSC등이 있으며, 모두 사용자의 시각적 편의를 위해 데이터베이스를 Genome Browser 형태로 제공하고 있다. 인터넷상의 정보들이 HTML이라는 마크업 언어를 통해 서버에 저장되어 있다. 이러한 HTML은 인터넷익스플로러등의 웹 브라우저를 통해 볼 때 그림이나 문자를 통해 사용자들의 볼 수 있다. 바이오 데이터가 HTML이라면 Genome Browser는 인터넷익스플로러쯤...^^;

각각의 Genome Browser는 바이오 데이터를 시각적으로 표현한다는 공통점을 가지고 있지만, 나름대로의 특징을 가지고 있다. 많은 전문적인 나름대로의 특징이 존재하지만 가장 큰 특징은 NCBI와 Ensemble은 생물학자가, UCSC genome browser는 전산학자가 설계했다는 특징이 있다. 그래서인지 데이터베이스의 설계 효율성이나 시스템 스루풋 등은 UCSC가 다소 앞서지만, 시각적인 것은 NCBI, Ensemble이 다소 앞선 느낌이다.
012


각설하고 지금 말하고자 하는것은 이러한 Genome Browser를 만들어 보겠다는 것이다. 왜 이미 존재하는 것을 또 만들까? 라고 생각할 수 있겠지만, 어디 야후있다고 네이버나 구글이 생기지 않았더란 말이냐!!

그럼 어떻게 만들거냐? 답은 간단하게 like a Google!! 구글처럼, 구글맵 API처럼 사용자가 입맛대로 Genome Browser를 만들 수 있도록 API를 만들어 공개하는 거다.

그럼 뭐가 좋단 말인가? 어디 이를 통해 얻어지는 것이 한두개겠는가??
<시나리오 a>
나는 소프트웨어 개발회사의 개발자입니다. 요번 프로젝트는 제약회사에서 수주한 프로젝트인데, 쥐의 유전자 정보를 가공1 and 가공2 and 가공3 해서 이렇게 해서 보여주는 프로그램을 만들라고 합니다. 가공1, 가공2,가공3은 생물학을 전공한 연구자들이 알고리즘을 내고 제 동료가 프로그래밍합니다. 저는 이 결과를 시각적으로 보여줘야하는데 ㅜㅜ

네, 이런때 사용해도 될테고....

<시나리오 b>
나는 실험을 하는 연구자입니다. 프로그래밍은 조금 배웠는데... HTML ^^;;;; 제가 실험한 데이터와 공개된 바이오데이터와 비교하고 싶은데 모눈종이에다 일일이 그려가면서 하려고 하니 너무 시간이 오래걸리네요....

네, HTML만 안다고요. 좀 힘들겠지만. 이런때 사용해도 되겠죠 ^^;;

이상 혼자 생각이었습니다.

반응형