분류 전체보기 749

생물학의 공개된 데이터를 가져다 쓰기-OpenAPI, Mashup, Open Source

생물학 분야만큼이나 공개된 데이터가 많은 과학분야가 또 있을까?? 기존에는 연구소나 정부기관들이 컨소시엄등을 구성하여 연구한 데이터를 공개하는 경우가 대부분이었다. 여기서 더불어 단지 공개만 하는것이 아니라,, 다른 연구자들이 이를 손쉽게 가져가서 사용할 수 있도록 Open API(거의 대부분이 웹서비스방식이며, DDBJ에서 REST 방식으로 최근 정보를 제공)를 제공하고 있는 추세이다. 지난 포스팅들에서 이러한 공개된 데이터를 가져다 사용하는 방법에 대해서 여러번 언급했으므로 패스,, 그런데 이러한 데이터의 공개는 이제 일반 회사에서도 이루어지고 있다. 특히나 일반 회사들이 이러한 공개를 한다는 것은 정말이지 쉽지 만은 않은 일이었을거다. Forbes지에 Biology Gose Open Source라는..

Bioblogs 2008.03.04

사기, 스팸 전화에 대처하는 우리의 자세

요즘 전화로 사기 치는거 많죠.. 저도 한두번 정도 받았는데,, 이거 뭐 어느 통신사입니다. 라면서 전화를 하는데 믿을 수가 있어야죠,, 더군다나 요즘 중국에서 사기 전화도 큰 이슈가 되고 있고,, 금융기관을 사칭한 ... 이러한 전화를 막는 방법으로 우리가 인터넷 뱅킹시 사용하는 인증서 같은걸 전화에 도입하면 어떨까? 생각해 봅니다. 말이 되는지 모르겠지만 ^^;; 아 왜 딴짓거리를 하고 있는건지...

blogging 2008.03.03

UCSC의 DBSNP 데이터를 단 2줄로 내 컴퓨터로 가져오기

Pierre Lindenbaum(Blog : YOKOFAKUN) 이 분은 프랑스분이신거 같은데 프로필에 보면 바이러스학을 전공하시는걸로 되어있는데,,, Nature Network의 Bioinformatics그룹이나 MyExperiment에서 봤던(?)분이다. 이것저것 참 재미있는 내용이 많은 블로그이고, BioBlogRSS에도 등록되어 구독되고 있는 바로 그 블로그인데,, 여기의 My fNotebook: Apache Tomcat / Bioinformatics의 글에서 누구나가 쉽게 리눅스에서 웹서버를 설치하고 활용하는 방법에 대해서 적어 주셨다. 이 글에서 UCSC의 dbsnp를 가져오는 부분만 발췌해서 보면 다음과 같다. 1. snp 정보가 들어갈 데이터베이스를 생성한다. mysql -u root -p..

howto 2008.03.03

Genome Browser - 미흡한 기능들 추가

데이터베이스에서 정보를 읽어와 그림파일(Google Map의 Tile)로 저장하는 기능은 완료된 상태이다. 이제부터는 자신이 원하는 정보를 보여주기 위한 세세한 기능들을 추가하는 기능을 하나씩 만들어 가고 있다. 여기서 잠깐 기본적으로 미흡하나마 지금까지 추가된 기능들을 하나씩 소개하는 시간을 가지도록 하겠다. ^^ 주메뉴 살펴보기 주메뉴의 모습 View Data by Chromosome Genome Browser는 chromosome 하나씩 보여줄 수 있기 때문에 자신이 원하는 chromosome을 Select Box를 통해서 선택할 수 있다. 또한 자신이 원하는 chromosome의 특정 영역으로 빠르게 소환(?)할 수 있도록 [genome-wide view]를 선택하면 아래 그림과 같은 창이 뜨고 ..

Bioblogs 2008.03.03

Genome Browser 진행 상황

만들어봐야겠다라고 생각하고 시작한지로부터 이제 거의 3주가 다 되어가네요 ^^;; 우선 오늘 추가된 부분은 제 블로그의 왼쪽 상단에 PAGES 부분에 Genome Browser Dev라는 링크를 만들었구요, Browser의 정보를 보여주는 왼쪽 상단의 붉은 박스의 내용을 좀 수정했습니다. 기본적으로 CSS에서 맑은 고딕 폰트를 보여주도록 바꾸었습니다. 줌인과 아웃시에 enableContinuousZoom() 메소드를 추가해서 부드럽게 줌 인/아웃이 되도록 했습니다. 현재 보여주는 정보는 1번 Chromosome의 첫부분 약 400,000bp 정도이며, CNV 정보를 보여주고 있습니다. 해당 CNV 정보는 Database of Genomic Variants의 정보를 기반으로 하고 있습니다. 이상!!!!

Bioblogs 2008.02.28

익숙한것에 익숙해져 버리다.

Genome Browser를 만들면서 한가지 고민에 빠지게 되었다. 이걸 왜 만들고 있는지에 대한 원초적인 질문에 답을 찾지 못하고 있다는 것이다. 왜 이걸 지금에야 생각하고 있는건지... 그동안 생물학자들은 여러가지 Genome Browser를 사용하고 있었지만, 그 생김새나 기능들은 그닥 큰 차이가 없기 때문에 별 어려움이 없이 사용하고 있다. 좀 불편하더라도 그 불편함을 모르고 그냥... 거기에다가 GMOD(Generic Model Organism Database project)에서도 GBrowse라는 브라우저를 제공하고 있다. 아마 이 브라우저가 가장 보편적인 Genome Browser의 표준(?)일 것이다. 그런데 이러한 기존 방식의 Genome Browser가 아닌 Google Map API를..

Bioblogs 2008.02.27

대용량 컴퓨팅 환경과 Genome Browser

바로 이전 글에서 대용량 컴퓨팅 즉 클러스터 컴퓨팅환경을 Yaohoo와 Google에서 연구자들에게 제공한다고 했었다. 대용량 컴퓨팅환경, 좀 더 세분화한다면 여러대의 컴퓨터를 묶어서 사용하는 클러스터 환경과 Bioinformatics 연구를 한번 짚고 넘어가 보려고 한다. 클러스터 컴퓨팅환경을 사용하는 가장 일반적인 예는 바로 처리하고자 하는 일을 나누어서 하는 것이 가장 손쉬운 클러스터 컴퓨터를 이용하는 방법이다. 24개의 chromosome에 대응하는 어떠한 데이터가 있다고 가정할 때 한 대의 컴퓨터로 24개의 chromosome 데이터를 처리할때에 24시간의 시간이 걸린다고 한다면 24대의 컴퓨터에 이러한 작업(job)을 분배한다면 1시간에 끝마칠 수 있다. 바로 linear하게 속도를 향상 시킬..

Bioblogs 2008.02.26