Bioblogs 62

익숙한것에 익숙해져 버리다.

Genome Browser를 만들면서 한가지 고민에 빠지게 되었다. 이걸 왜 만들고 있는지에 대한 원초적인 질문에 답을 찾지 못하고 있다는 것이다. 왜 이걸 지금에야 생각하고 있는건지... 그동안 생물학자들은 여러가지 Genome Browser를 사용하고 있었지만, 그 생김새나 기능들은 그닥 큰 차이가 없기 때문에 별 어려움이 없이 사용하고 있다. 좀 불편하더라도 그 불편함을 모르고 그냥... 거기에다가 GMOD(Generic Model Organism Database project)에서도 GBrowse라는 브라우저를 제공하고 있다. 아마 이 브라우저가 가장 보편적인 Genome Browser의 표준(?)일 것이다. 그런데 이러한 기존 방식의 Genome Browser가 아닌 Google Map API를..

Bioblogs 2008.02.27

대용량 컴퓨팅 환경과 Genome Browser

바로 이전 글에서 대용량 컴퓨팅 즉 클러스터 컴퓨팅환경을 Yaohoo와 Google에서 연구자들에게 제공한다고 했었다. 대용량 컴퓨팅환경, 좀 더 세분화한다면 여러대의 컴퓨터를 묶어서 사용하는 클러스터 환경과 Bioinformatics 연구를 한번 짚고 넘어가 보려고 한다. 클러스터 컴퓨팅환경을 사용하는 가장 일반적인 예는 바로 처리하고자 하는 일을 나누어서 하는 것이 가장 손쉬운 클러스터 컴퓨터를 이용하는 방법이다. 24개의 chromosome에 대응하는 어떠한 데이터가 있다고 가정할 때 한 대의 컴퓨터로 24개의 chromosome 데이터를 처리할때에 24시간의 시간이 걸린다고 한다면 24대의 컴퓨터에 이러한 작업(job)을 분배한다면 1시간에 끝마칠 수 있다. 바로 linear하게 속도를 향상 시킬..

Bioblogs 2008.02.26

Bioinformatics 연구자를 위한 컴퓨팅 환경 제공

이전에 국내 바이오인포매틱스 관련 오픈소스 현황이라는 주제의 글에서 대용량 데이터 분석 환경 지원 부분에서 연구를 위해서 단순하게 슈퍼컴퓨터나 cluster 컴퓨터의 기본적인 환경만을 제공하는 것이 아니라 이러한 환경에 + 유틸리티를 덧붙여 제공해야 한다고 언급했었습니다. 그 일례로 Yahoo에서는 학교나 일반 기업에서 구비하기 힘든 Hadoop기반의 클러스터 컴퓨팅 자원에 대해서 학술 연구 목적으로 지원을 하고 있다고 했었죠. 슈퍼컴퓨팅 자원 + 이를 좀더 유연하게 활용할 수 있는 utility(야후에서는 Hadoop) Google의 official 블로그에서도 Supporting cluster computing in the research community이라는 글이 올라왔습니다. 역시나 Google..

Bioblogs 2008.02.26

Genome Browser의 그래픽 요소 정리

Genome Browser를 만들면서 기술적으로 가능한지에 대한 타당성에 대해서 검토를 대충 마쳤다. 따라서 이제는 세부 사항들에 대해서 정의를 하려고 한다. ^^ 그럼 제일 중요한 Brower의 요소인 그래픽 요소들에 대해서 하나씩 정리를 하고 이를 구현해보려고 한다. Genome Brower의 그래픽 요소 Brower에서 사용자가 정보를 얻는 제일 첫번째는 Genome 정보를 그래픽으로 표현한 그래픽 요소들로 부터 1차적으로 정보를 얻는다. Genome Browser의 목적 중 하나가 바로 Genome 정보를 사용자가 그래픽 요소들을 툥해 한눈에 쉽게 알아볼 수 있도록 하는 것이기 때문에 이러한 그래픽 요소의 정의가 충분이 이루어져야 사용자가 원하는, 사용자가 맘에 드는 Browser를 만드는 첫 단..

Bioblogs 2008.02.18

Genome Browser 만들기 시작~

google maps api를 이용한 Genome Browser 입니다. 현재까지는 1번 염색체의 줌레벨도 1단계만 지원하고 있습니다. 수많은 눈금들은 dbsnp에서 snp정보를 읽어와 염색체 위에다가 표시한 것입니다. 이제 확대할 경우 좀더 자세히 볼 수 있겠죠 ^^;; 클릭하면 해당 snp의 정보도 보여줄 예정입니다. 이거 막상하다 보니깐 여기저기 고려해야 할것들이 너무 많네요 ^^;;

Bioblogs 2008.02.05

BioBlogRSS가 이제 모양을 갖췄습니다.

단순하게 Bioinformatics관련 블로그의 글들을 모아서 보여주고 레몬펜으로 자신의 생각을 적을 수 있도록 만든 BioBlogRSS 사이트가 가장 기본적인 기능이면서 핵심기능을 모두 갖추게 되었습니다. BioBlogRSS는 국내외 Bioinformatics관련 블로거들의 블로그 총 13개에서(각 블로그의 목록은 OPML 형태로 제공되고 있습니다.) 수집된 232개의 글중에서 총 111개의 글을 보여주고 있습니다. 어디로 접속해야 하나요? BioBlogRSS의 공식적인 주소?는 http://www.hongiiv.com/bioblogrss/bioblog.html 입니다. 참고로 제 블로그 왼쪽의 PAGES부분에도 링크를 걸어두었습니다. 왜 13개의 블로그인가요? 현재까지 제가 파악하고 있는 적어도 제가..

Bioblogs 2008.01.29

Bio Blog RSS 제공 사이트 진행 현황

위선 위의 그림과 같이 UI쪽은 대충 마무리 되었습니다. 많은 부분을 모 홈페이지의 디자인을 상당 베낀 모습입니다. 추후 변경될 예정입니다. ^^;; 그림을 클릭해서 보시면 확대 가능합니다. 우선 작업을 진행하면서 이것저것 고려해보았습니다. 사용자 스토리 즉 기능분석 작업은 아래와 같습니다. 1, Bioinformatics 관련 블로그의 RSS를 읽어와 화면에 표시해야한다. 2, 화면에 표시된 RSS의 글에는 해당 블로그의 이름, 링크, 날짜, 간단한 내용이 포함되어야 한다. 3, 표시된 RSS글에 대해서 레몬펜으로 메모를 추가할 수 있어야 한다. 4, 현재까지 수집된 RSS에 통계정보를 표시해야 한다. 5, 오래된 글과 레몬펜 메모도 확인 가능해야 한다.(이부분이 좀 ^^, 어쩔수 없이 DB를 사용해야..

Bioblogs 2008.01.28

RSS를 이용한 Bio Blog 리더기?

저는 아침에 출근해서 제일 먼저 하는 일이 관심있는 블로그들을 한번 주욱 둘러보는것입니다. 그리고 퇴근전에 다이어를 정리하고는 다시 한번 블로그를 둘러보고는 퇴근을 합니다. 처음에는 firefox의 탭을 주욱 늘어 놓고는 일일이 블로그들을 돌아다녔었는데,, 이것도 만만치 않은 일이더군요. 그래서 RSS 리더를 이용해서 블로그들의 RSS를 등록해서 사용하고 있습니다. 그런데 이게 내가 관심있는 블로그라고 해도 내가 관심있는 글이 꼭 올라오지는 않습니다. 제목을 보고는 글을 읽을건지를 선택하거나, 글을 읽다가 "어 이건 별로" 하곤 하죠 ^^;; 그런데 문제는 한글로 된 블로그는 그나마 읽을 글을 선택하고 읽는데는 별 어려움이 없지만,,, 영어로 된 블로그들은 글을 선택하거나 글의 포인트를 찾는데(논문이나 ..

Bioblogs 2008.01.25

OpenSource로 생물정보학 분석 도구(시스템) 개발하기 - Ohloh.net

생물정보학을 통해서 어떠한 분석이나, 분석을 시스템을 만드는 경우 우리는 오픈소스로 소프트웨어를 활용게 된다. 마이크로어레이 분석 시스템이나, genome 브라우저 등을 만들때도 있고 아니면 비교적 스크립트 몇줄로 이루어진 분석 도구를 만들때도 있다. 이런 경우 무턱대고 처음부터 끝까지 자신이 직접 코드를 작성하진 않을 것이다. 자신이 원하는 기능을 같은 라이브러리(Bioperl, Biojava, Biopyton)나 소프트웨어(R-project, svm light, ensembl, blast)등을 이용할 것이다. 이러한 작업에 있어서 우선 처음으로 생각해봐야 할것은 어떠한 오픈소스라이브러리나 소프트웨어를 사용하는가 이다. 나에게 필요한 오픈소스 소프트웨어가 무엇인지를 찾아보는 Ohloh.net의 Stac..

Bioblogs 2008.01.23

빌드 자동화 - 꼭 프로그래머만의 몫일까요?

빌드란 간단히 말하자면 프로그램 소스로 부터 실행 가능한 프로그램을 만들기까지의 일련의 과정이다. 당신이 바이오인포매틱스 연구자라면 configure, make, make install을 통해서 바이오인포매틱스 툴을 한번쯤 설치해봤을 것이다. 여기서 make가 바로 빌드를 자동화 해주는 툴이다. 사용자는 복잡한 과정을 거치지 않고서도 프로그래머가 만들어 놓은 일련의 과정대로 빌드를 make 명령 하나로 자동화 할 수 있는 것이다. 저는 만들어진 프로그램만 가져다 쓰기 때문에 빌드 툴에 대해서는 몰라도 돼요? 또는 제가 만드는 프로그램은 간단하기 때문에 직접 gcc -o ~~~ 이렇게 해서 설치하면 돼요~ 라고 한다면야 뭐 할말없다. 요즘 만들어지는 오픈소스 프로그램들이 대부분 빌드를 자동화해서 즉, ma..

Bioblogs 2008.01.21