blogging 277

Genomes on Rails

가끔 제 블로그에 언급되는 것이 Ruby인데, 사실 루비를 아직까지 실무에서 써보거나 실제 루비를 이용한 프로그램을 작성해 본 적은 없다. 뭐 레일스 3분짜리 예제 하나 돌려본것이 전부 : ) 우연히 RailsConf Europe 08의 스케줄에서 Genomes on Rails란 제목을 보고는 허걱~ 생거센터의 스퀀싱 인포매틱스 팀을 맞고 계신 Matt Wood씨의 발표였다. 덧붙여 Green is Good이라는 블로그도 운영중이다. 여기 RailsConf의 발표 자료를 첨부~ 나도 얼른 이런 자료 하나 만들어야겠다는 생각이 문득... BioBlogRSS에도 등록! View SlideShare presentation or Upload your own. (tags: bioinformatics ruby) 슬..

blogging 2008.11.10

4대 Genome Browser에 대한 설명

4대 지놈 브라우저(Genome Browser) UCSC, Ensembl, NCBI MapView, Gbrowse에 대한 소개 및 특히 Gbrowser에 대한 내용입니다. DAS를 통한 분산 주석 처리와 Genome의 특정 Region의 빠른 검색을 위한 R-Tree 알고리즘과 그 성능에 대한 간단한 자료입니다. 별 내용은 없음,,,(가끔 오타도 있는데 수정하기가,, ^^;;) View SlideShare presentation or Upload your own. (tags: ucsc ncbi)

blogging 2008.11.06

대량의 R 코드를 클러스터에 분산하기

수백개의 R 코드를 돌려야 할 일이 있다면, 한대의 컴퓨터에서는 100일이 걸릴일이라면 100대의 컴퓨터라면 100일 + 알파,, 요 알파는 각 컴퓨터에 로그인하고 R 코드를 옮기고, 명령어를 통해서 실행하고, 그결과를 취합하고,,, 여간 알파에 드는 시간이 많이 드는것이 아니다. 그래서 클러스터와 job 매니지먼트가 있다. 여기서는 리눅스 기반의 클러스터에 효율적으로 R 코드를 수백대의 컴퓨터에 실행하고 그 결과를 손쉽게 얻는 방법을 소개한다. 기본적으로 R의 경우에는 Interaction 프로그램으로 사용자와의 대화 형식으로 코드를 작성하게 된다. 명령->응답->명령->응답,,,의 형식 따라서 R 코드를 Bash에서 사용하기 위해서는 --quite, --no-save의 옵션을 통해서 처음 나오는 R에..

blogging 2008.11.06

Landscape of Parallel computing Research

13 난쟁이 Berkeley에서 발표한 The Landscape of Parallel Computing Research: A View from Berkeley를 보면 난쟁이(Dwarf)라는 개념을 이용해서 병렬 컴퓨팅 환경에서 어플리케이션들을 집합을 가지고 통신 및 전산 공통 패턴에 대해서 정리하고 있다. 핵심적인 것은 17p~19p에 걸쳐서 총 13개의 Dwarfs와 각각의 Dwarfs들이 Embedded Computing, General Purpose Computing, Machine Learning, Graphics/Games/Databases에서 어떠한 형태로 발현? 되는지를 요약하고 있다. 또한 2008년도 자신의 연구에 대한 문서를 보면 각 Dwarfs(Motif라는 표현)와 컴퓨팅분야, 자신..

blogging 2008.11.04

넌 할아버지랑 똑같다.

지금까지 살아오면서, 부모님께서 넌 하는짓이 할아버지랑 똑같냐,,, 라는 말은 자주 들었다. 내 동생에게 그런 말씀을 하시는건 한번도 보지 못했는데 말이다. 유독 형제중에 왜 나만 그런 소리를 자주 듣게 되는지 여기 그 증거?중 하나가 있다. 바로 23andMe... 할어버지인 Fred, 그리고 아버지인 Greg, 그리고 그의 두 아들 lan, Alan 이들의 유사성을 비교한 그림을 보면 큰아들 lan(첫번째 있으니까 큰 아들인것 같다 ^^)이 작은 아들보다 할아버지와 더 유사하다. ^^;; 나도 할아버지의 데이터가 있다면,,, 나중에 후손을 위해서라도 내 유전정보를 남겨야 하는것인가?? Mendel 가족

blogging 2008.10.24

즐거운 모니터링 - 두번째 이야기

오늘도 모니터링에 대한 이야기인데요, 모니터링 대상이 조금 바뀌었습니다. 바로 질병입니다. 예전에 HealthMap(Global Dsease Alert Map)이라는 서비스에 대해서 언급한적이 있는데요, 이 서비스는 ProMED Mail, WHO, Google News 등등 수많은 웹사이트에서 질병에 대한 정보를 모아서 이를 구글맵에 보여주는 서비스입니다. 10월 초에 조류독감에 대한 내용들이 우리나라에 보고되고 있지만, 안심 수준인 주황색입니다. 서비스는 간단한데, 이를 구축하는것은 꽤나 복잡합니다. 20,000여개의 웹 사이트의 정보를 나타내는 ProMED Mail 등의 14개의 소스로 부터 질병정보, 지리정보, 질병대상 등등의 정보를 수집하고 이를 자신들이 이미 만들어 놓은 딕셔너리를 통해 카테고리..

blogging 2008.10.22

즐거운 모니터링

이것저것 복잡하고, 바쁘다는 핑계로 포스팅 주기가 점점 느려지네요 ^^;; 오늘은 클러스터의 job 모니터링과 @Home 서비스에서 사용할 수 있는 대시보드 위젯을 소개하려고 합니다. 그동안 Mac을 사용하면서도 위젯은 별로 사용하고 있지 않았는데, 오늘 살펴볼 두 개의 위젯 때문에 위젯의 매력에 푹 빠져 버렸습니다. Xgrid@Stanford Widget Xgrid는 Mac에서 Grid 서비스에 사용하는데 필요한 것으로 아마도 SGE의 역활을 하는것으로 알고 있습니다. Xgrid에 묶인 클러스터들의 CPU 성능, 프로세서 정보, 에이전트 정보 등을 게이지 형태로 보여주고 있습니다. 이러한 정보는 Xgrid에서 제공하는 유틸리티를 통해서 모으고 이를 XML 형태로 만들어 위젯에서 XML 정보를 파싱해서 ..

blogging 2008.10.21