전체 글 749

질병 정보를 FireFox에서 검색하세요.

FireFox를 사용하고 계신다면, FireFox의 Search plugin을 추가해보세요. 각종 질병 정보를 간단하게 검색하실수 있습니다. 질병정보 검색 FireFox 플러그인(여기를 클릭하세요) 설치하시고 질병정보 검색 Firfox 플러그인(여기를 클릭)을 설치하고 나면, FireFox 브라우저에 검색창에 아래 그림과 같이 Health Info - Search Disease 란이 생기면 여기서 관심 질병을 검색어로 입력하시면, 해당 질병에 대한 정보가 나옵니다. ^^

blogging 2008.07.08

Agile development for Bioinformatics

이화여대 시스템생물학 연구소와 서울대 생명의약네트워크 연구정보센터의 주관으로 Agile을 통한 Bioinformatics 소프트웨어 개발의 생산성 향상에 관한 워크샵이 열립니다. 7월 28일 부터 8월 2일까지니까, 관심있는 분들은 많은 참여를 바랍니다. ^^ Agile은 이미 BMC Bioinformatics의 "Agile methods in biomedical software development: a multi-site experience report"라는 논문으로도 나와 있죠 ^^;; 그리고 현재 구글 그룹스에 "Open Bioinformatics Korea"라는 그룹이 만들어져 있습니다. 제목만 봐도 어떤곳인지 솔깃하시죠 ^^;; 다음에 좀더 자세한 내용을 다루기로 하고, 오늘은 이정도만,,,(..

Bioblogs 2008.07.08

Serial Job과 LoadLeveler

Grid Engine에서는 Serial Job을 위해 Array job을 지원하지만, 아쉽게도 IBM의 LoadLeveler에서는 지원하고 있지 않습니다. 따라서, 1,000개의 Serial Job을 수행하기 위해서는 1,000개의 Job Script를 작성하여 1,000번을 Queue에 제출해줘야 합니다. 따라서, 간단하게 python 스크립트를 만들어서 수행할 수가 있죠,,, 이전 포스팅의 Array job처럼 말이죠,,, | View | Upload your own 계속 추가중인 자료입니다. ^^;;

blogging 2008.07.07

DRM을 이용한 대량의 데이터 분석을 손쉽게

본 문서는 Grid Engine의 "Simple-Job-Array-Howto" 문서를 기반으로 만들어졌으며, 이전에 포스팅한 "스케줄러 - 기본으로 돌아가기"와 밀접한 관계가 있습니다. ^^ DRM에서의 Serial 프로그램 실행하기 많은 수의 job들을 실행하기 위해서는 어떻게 해야 할까? 1,000개의 데이터셋이 있고, 이것을 하나의 프로그램이 실행한다고 한다면, 모두 1,000개의 Shell 스크립트를 작성해서 queue에 넣어야 할것이다. 바로 이러한 자잘한? 문제를 해결하기 위해서 Grid Engine에서는 Array job이라는 해결책을 제시해 주고 있다. -i 옵션의 인자를 입력으로 받고, -o 인자의 파일에 program의 수행결과를 쓰는 프로그램을 Grid Engine을 통해 제출한다고 ..

Bioblogs 2008.07.07

Job Scheduler로 보는 맞춤형 의료 서비스

민간 우주 여행, 로봇의 달탐사, 10일 안에 100명의 Genome 염기서열 분석 모두 꿈 같은 이야기이지만, 그 꿈같은 이야기들이 X PRIZE 재단에 의해서 커다란 상금을 걸고 진행중이거나 이미 끝난 대회이다. 2006년 개인의 맞춤형 의료 서비스의 진입을 위하여 X PRIZE에서는 민간에서 10일 안에 100명의 Genome을 해석할 수 있다면, 그것도 Genome 당 $10,000 이상의 비용이 들어가지 않도록 해낸다면, $1,000만 우승 상금을 얻게 된다. 이것이 바로 Archon X PRIZE for Genomics 이다. 그럼 이러한 일을 가능하게 하는데 중요한 역할을 하는 것이 무엇일까? 바로 Grid 컴퓨팅이나 클러스터 컴퓨팅의 Job Scheduler, DRM(Distributed ..

Bioblogs 2008.07.07

스케줄러 - 기본으로 돌아가기

퇴근 시간을 5분 남겨 놓고 요상한 논문 하나를 소개? 받았다. "Application of the Linux cluster for exhaustive window haplotype analysis using the FBAT and Unphased programs" 라는 다소 장문의 제목을 가진 논문이었다. 대량으로 쏟아지는 생물학 데이터를 이용한 연구에서 고성능 컴퓨팅 파워의 필요성은 누구나다 인지하고 있는 주요 관심사이다. 저자는 불행히도 생물학 통계 패키지(소프트웨어)들이 대부분 병렬화 되어 있지 않고 또한 병렬화 하더라도 새로운 코드를 신뢰할 테스트도 필요할 뿐더러, 병렬화가 누구네 집 똥개 이름도 아니기에, 이를 우회하여 고성능의 컴퓨팅 파워를 얻기 위해 리눅스 클러스터에서 큐잉 시스템을을 이용..

blogging 2008.07.04

우편번호로 지도를 작성하자 - MDS(Multi Dimensional Scaling) - 실패 ^^

예전부터 지도상의 좌표를 주소로 변환의 정확성을 높이기 위해 ML을 적용해야겠다는 생각만 했었는데, 오늘은 그 생각을 실행하기 전에 우선 약 5만개의 우편번호 데이터베이스에 우편번호에 해당하는 좌표간의 거리를 Km로 변환하고 5만x5만 행렬을 만들었다. 제법 100MB 넘는 행렬 데이터를 가진 텍스트 파일이 만들어졌다. 그런데 막상 R을 이용해서 MDS plot을 생성하려고 하는데,,, 여기 저기서 에러가 -.- 한참만에 알아낸건 바로 원본 DB에 문제가 있었다. 1) 중복되는 우편번호가 있다. (원래 그런건가??, 이건 배포하는 우편번호를 보고 확인해봐야겠다) 2) 우편번호가 달라도 좌표가 같은 것들도 있다.(이건 내가 만들때 그렇게 만들었기 때문에,,,) 3) 좌표값이 없는 우편번호가 존재한다. (이..

blogging 2008.06.30

구글맵 좌표를 네이버 지도 좌표로 변환하기 또는 그 역~

네이버에서 사용하는 좌표계와 구글맵에서 사용하는 좌표계는 서로 상이하죠 ^^ 그 둘 사이의 좌표를 서로 변환하는 라이브러리입니다. PHP로 작성된 라이브러리인데, 정확히 어디서 구했는지 출처는 모르겠습니다. ^^;; 지리에 대해서 정확히 알지는 못하지만 서로 간의 좌표를 정확히 변환하지는 못한다고 하는데,, 뭐 잘 모르겠습니다. 어쨌든 여기에서 geotrans.php를 다운로드 하시고 다음과 같이 사용하시면 됩니다.

blogging 2008.06.27

천식과 관련된 protein interation 네트워크

네이버 뉴스를 기웃거리다가 생물정보학으로 천식 유발 후보 유전자 찾았다 라는 기사를 보고 이건 또 뭐야! 하면서 기사를 클릭했더니 요즘 꽤나 흥미를 가지고 있던 바로 질병 네트워크에 관한 논문의 기사였다. 뭐~~ A protein interaction network associated with asthma OMIM, GEO에서 천식 관련 단백질 606개 찾고, 단백질 사이의 상호작용(PPI)를 네트워크화 해보니까 269개는 하나씩 분리되고 337개는 269개가 서로 연결되어 cluster 형성하는 등 28개의 cluster가 연결되어 네트워크를 형성 허브 역할 , 클러스터간 연결고리 역할을 하는 천식 유발 후보 유전자 7개(SRC, CREBBP, MAPK1, GNB2L1, VAV1, CBL, BRCA1)..

Bioblogs 2008.06.27