4대 지놈 브라우저(Genome Browser) UCSC, Ensembl, NCBI MapView, Gbrowse에 대한 소개 및 특히 Gbrowser에 대한 내용입니다. DAS를 통한 분산 주석 처리와 Genome의 특정 Region의 빠른 검색을 위한 R-Tree 알고리즘과 그 성능에 대한 간단한 자료입니다. 별 내용은 없음,,,(가끔 오타도 있는데 수정하기가,, ^^;;) View SlideShare presentation or Upload your own. (tags: ucsc ncbi)
수백개의 R 코드를 돌려야 할 일이 있다면, 한대의 컴퓨터에서는 100일이 걸릴일이라면 100대의 컴퓨터라면 100일 + 알파,, 요 알파는 각 컴퓨터에 로그인하고 R 코드를 옮기고, 명령어를 통해서 실행하고, 그결과를 취합하고,,, 여간 알파에 드는 시간이 많이 드는것이 아니다. 그래서 클러스터와 job 매니지먼트가 있다. 여기서는 리눅스 기반의 클러스터에 효율적으로 R 코드를 수백대의 컴퓨터에 실행하고 그 결과를 손쉽게 얻는 방법을 소개한다. 기본적으로 R의 경우에는 Interaction 프로그램으로 사용자와의 대화 형식으로 코드를 작성하게 된다. 명령->응답->명령->응답,,,의 형식 따라서 R 코드를 Bash에서 사용하기 위해서는 --quite, --no-save의 옵션을 통해서 처음 나오는 R에..
13 난쟁이 Berkeley에서 발표한 The Landscape of Parallel Computing Research: A View from Berkeley를 보면 난쟁이(Dwarf)라는 개념을 이용해서 병렬 컴퓨팅 환경에서 어플리케이션들을 집합을 가지고 통신 및 전산 공통 패턴에 대해서 정리하고 있다. 핵심적인 것은 17p~19p에 걸쳐서 총 13개의 Dwarfs와 각각의 Dwarfs들이 Embedded Computing, General Purpose Computing, Machine Learning, Graphics/Games/Databases에서 어떠한 형태로 발현? 되는지를 요약하고 있다. 또한 2008년도 자신의 연구에 대한 문서를 보면 각 Dwarfs(Motif라는 표현)와 컴퓨팅분야, 자신..
지금까지 살아오면서, 부모님께서 넌 하는짓이 할아버지랑 똑같냐,,, 라는 말은 자주 들었다. 내 동생에게 그런 말씀을 하시는건 한번도 보지 못했는데 말이다. 유독 형제중에 왜 나만 그런 소리를 자주 듣게 되는지 여기 그 증거?중 하나가 있다. 바로 23andMe... 할어버지인 Fred, 그리고 아버지인 Greg, 그리고 그의 두 아들 lan, Alan 이들의 유사성을 비교한 그림을 보면 큰아들 lan(첫번째 있으니까 큰 아들인것 같다 ^^)이 작은 아들보다 할아버지와 더 유사하다. ^^;; 나도 할아버지의 데이터가 있다면,,, 나중에 후손을 위해서라도 내 유전정보를 남겨야 하는것인가?? Mendel 가족
오늘도 모니터링에 대한 이야기인데요, 모니터링 대상이 조금 바뀌었습니다. 바로 질병입니다. 예전에 HealthMap(Global Dsease Alert Map)이라는 서비스에 대해서 언급한적이 있는데요, 이 서비스는 ProMED Mail, WHO, Google News 등등 수많은 웹사이트에서 질병에 대한 정보를 모아서 이를 구글맵에 보여주는 서비스입니다. 10월 초에 조류독감에 대한 내용들이 우리나라에 보고되고 있지만, 안심 수준인 주황색입니다. 서비스는 간단한데, 이를 구축하는것은 꽤나 복잡합니다. 20,000여개의 웹 사이트의 정보를 나타내는 ProMED Mail 등의 14개의 소스로 부터 질병정보, 지리정보, 질병대상 등등의 정보를 수집하고 이를 자신들이 이미 만들어 놓은 딕셔너리를 통해 카테고리..