Bioinformatics 39

UCSC의 DBSNP 데이터를 단 2줄로 내 컴퓨터로 가져오기

Pierre Lindenbaum(Blog : YOKOFAKUN) 이 분은 프랑스분이신거 같은데 프로필에 보면 바이러스학을 전공하시는걸로 되어있는데,,, Nature Network의 Bioinformatics그룹이나 MyExperiment에서 봤던(?)분이다. 이것저것 참 재미있는 내용이 많은 블로그이고, BioBlogRSS에도 등록되어 구독되고 있는 바로 그 블로그인데,, 여기의 My fNotebook: Apache Tomcat / Bioinformatics의 글에서 누구나가 쉽게 리눅스에서 웹서버를 설치하고 활용하는 방법에 대해서 적어 주셨다. 이 글에서 UCSC의 dbsnp를 가져오는 부분만 발췌해서 보면 다음과 같다. 1. snp 정보가 들어갈 데이터베이스를 생성한다. mysql -u root -p..

howto 2008.03.03

Genome Browser - 미흡한 기능들 추가

데이터베이스에서 정보를 읽어와 그림파일(Google Map의 Tile)로 저장하는 기능은 완료된 상태이다. 이제부터는 자신이 원하는 정보를 보여주기 위한 세세한 기능들을 추가하는 기능을 하나씩 만들어 가고 있다. 여기서 잠깐 기본적으로 미흡하나마 지금까지 추가된 기능들을 하나씩 소개하는 시간을 가지도록 하겠다. ^^ 주메뉴 살펴보기 주메뉴의 모습 View Data by Chromosome Genome Browser는 chromosome 하나씩 보여줄 수 있기 때문에 자신이 원하는 chromosome을 Select Box를 통해서 선택할 수 있다. 또한 자신이 원하는 chromosome의 특정 영역으로 빠르게 소환(?)할 수 있도록 [genome-wide view]를 선택하면 아래 그림과 같은 창이 뜨고 ..

Bioblogs 2008.03.03

Genome Browser 진행 상황

만들어봐야겠다라고 생각하고 시작한지로부터 이제 거의 3주가 다 되어가네요 ^^;; 우선 오늘 추가된 부분은 제 블로그의 왼쪽 상단에 PAGES 부분에 Genome Browser Dev라는 링크를 만들었구요, Browser의 정보를 보여주는 왼쪽 상단의 붉은 박스의 내용을 좀 수정했습니다. 기본적으로 CSS에서 맑은 고딕 폰트를 보여주도록 바꾸었습니다. 줌인과 아웃시에 enableContinuousZoom() 메소드를 추가해서 부드럽게 줌 인/아웃이 되도록 했습니다. 현재 보여주는 정보는 1번 Chromosome의 첫부분 약 400,000bp 정도이며, CNV 정보를 보여주고 있습니다. 해당 CNV 정보는 Database of Genomic Variants의 정보를 기반으로 하고 있습니다. 이상!!!!

Bioblogs 2008.02.28

익숙한것에 익숙해져 버리다.

Genome Browser를 만들면서 한가지 고민에 빠지게 되었다. 이걸 왜 만들고 있는지에 대한 원초적인 질문에 답을 찾지 못하고 있다는 것이다. 왜 이걸 지금에야 생각하고 있는건지... 그동안 생물학자들은 여러가지 Genome Browser를 사용하고 있었지만, 그 생김새나 기능들은 그닥 큰 차이가 없기 때문에 별 어려움이 없이 사용하고 있다. 좀 불편하더라도 그 불편함을 모르고 그냥... 거기에다가 GMOD(Generic Model Organism Database project)에서도 GBrowse라는 브라우저를 제공하고 있다. 아마 이 브라우저가 가장 보편적인 Genome Browser의 표준(?)일 것이다. 그런데 이러한 기존 방식의 Genome Browser가 아닌 Google Map API를..

Bioblogs 2008.02.27

대용량 컴퓨팅 환경과 Genome Browser

바로 이전 글에서 대용량 컴퓨팅 즉 클러스터 컴퓨팅환경을 Yaohoo와 Google에서 연구자들에게 제공한다고 했었다. 대용량 컴퓨팅환경, 좀 더 세분화한다면 여러대의 컴퓨터를 묶어서 사용하는 클러스터 환경과 Bioinformatics 연구를 한번 짚고 넘어가 보려고 한다. 클러스터 컴퓨팅환경을 사용하는 가장 일반적인 예는 바로 처리하고자 하는 일을 나누어서 하는 것이 가장 손쉬운 클러스터 컴퓨터를 이용하는 방법이다. 24개의 chromosome에 대응하는 어떠한 데이터가 있다고 가정할 때 한 대의 컴퓨터로 24개의 chromosome 데이터를 처리할때에 24시간의 시간이 걸린다고 한다면 24대의 컴퓨터에 이러한 작업(job)을 분배한다면 1시간에 끝마칠 수 있다. 바로 linear하게 속도를 향상 시킬..

Bioblogs 2008.02.26

Bioinformatics 연구자를 위한 컴퓨팅 환경 제공

이전에 국내 바이오인포매틱스 관련 오픈소스 현황이라는 주제의 글에서 대용량 데이터 분석 환경 지원 부분에서 연구를 위해서 단순하게 슈퍼컴퓨터나 cluster 컴퓨터의 기본적인 환경만을 제공하는 것이 아니라 이러한 환경에 + 유틸리티를 덧붙여 제공해야 한다고 언급했었습니다. 그 일례로 Yahoo에서는 학교나 일반 기업에서 구비하기 힘든 Hadoop기반의 클러스터 컴퓨팅 자원에 대해서 학술 연구 목적으로 지원을 하고 있다고 했었죠. 슈퍼컴퓨팅 자원 + 이를 좀더 유연하게 활용할 수 있는 utility(야후에서는 Hadoop) Google의 official 블로그에서도 Supporting cluster computing in the research community이라는 글이 올라왔습니다. 역시나 Google..

Bioblogs 2008.02.26

Genome Browser의 그래픽 요소 정리

Genome Browser를 만들면서 기술적으로 가능한지에 대한 타당성에 대해서 검토를 대충 마쳤다. 따라서 이제는 세부 사항들에 대해서 정의를 하려고 한다. ^^ 그럼 제일 중요한 Brower의 요소인 그래픽 요소들에 대해서 하나씩 정리를 하고 이를 구현해보려고 한다. Genome Brower의 그래픽 요소 Brower에서 사용자가 정보를 얻는 제일 첫번째는 Genome 정보를 그래픽으로 표현한 그래픽 요소들로 부터 1차적으로 정보를 얻는다. Genome Browser의 목적 중 하나가 바로 Genome 정보를 사용자가 그래픽 요소들을 툥해 한눈에 쉽게 알아볼 수 있도록 하는 것이기 때문에 이러한 그래픽 요소의 정의가 충분이 이루어져야 사용자가 원하는, 사용자가 맘에 드는 Browser를 만드는 첫 단..

Bioblogs 2008.02.18

Genome Browser 만들기 시작~

google maps api를 이용한 Genome Browser 입니다. 현재까지는 1번 염색체의 줌레벨도 1단계만 지원하고 있습니다. 수많은 눈금들은 dbsnp에서 snp정보를 읽어와 염색체 위에다가 표시한 것입니다. 이제 확대할 경우 좀더 자세히 볼 수 있겠죠 ^^;; 클릭하면 해당 snp의 정보도 보여줄 예정입니다. 이거 막상하다 보니깐 여기저기 고려해야 할것들이 너무 많네요 ^^;;

Bioblogs 2008.02.05

BioBlogRSS가 이제 모양을 갖췄습니다.

단순하게 Bioinformatics관련 블로그의 글들을 모아서 보여주고 레몬펜으로 자신의 생각을 적을 수 있도록 만든 BioBlogRSS 사이트가 가장 기본적인 기능이면서 핵심기능을 모두 갖추게 되었습니다. BioBlogRSS는 국내외 Bioinformatics관련 블로거들의 블로그 총 13개에서(각 블로그의 목록은 OPML 형태로 제공되고 있습니다.) 수집된 232개의 글중에서 총 111개의 글을 보여주고 있습니다. 어디로 접속해야 하나요? BioBlogRSS의 공식적인 주소?는 http://www.hongiiv.com/bioblogrss/bioblog.html 입니다. 참고로 제 블로그 왼쪽의 PAGES부분에도 링크를 걸어두었습니다. 왜 13개의 블로그인가요? 현재까지 제가 파악하고 있는 적어도 제가..

Bioblogs 2008.01.29

Bio Blog RSS 제공 사이트 진행 현황

위선 위의 그림과 같이 UI쪽은 대충 마무리 되었습니다. 많은 부분을 모 홈페이지의 디자인을 상당 베낀 모습입니다. 추후 변경될 예정입니다. ^^;; 그림을 클릭해서 보시면 확대 가능합니다. 우선 작업을 진행하면서 이것저것 고려해보았습니다. 사용자 스토리 즉 기능분석 작업은 아래와 같습니다. 1, Bioinformatics 관련 블로그의 RSS를 읽어와 화면에 표시해야한다. 2, 화면에 표시된 RSS의 글에는 해당 블로그의 이름, 링크, 날짜, 간단한 내용이 포함되어야 한다. 3, 표시된 RSS글에 대해서 레몬펜으로 메모를 추가할 수 있어야 한다. 4, 현재까지 수집된 RSS에 통계정보를 표시해야 한다. 5, 오래된 글과 레몬펜 메모도 확인 가능해야 한다.(이부분이 좀 ^^, 어쩔수 없이 DB를 사용해야..

Bioblogs 2008.01.28