전체 글 749

질병 네트워크

원은 하나의 질병을 나타내며, 원의 크기는 현재 질병과 다른 질병들과 관련되었음을 상대적으로 나타낸것으로 원의 크기가 클 수록 해당 질병이 다른 질병들과 연관이 많음을 나타낸다. (AIDS의 경우 4개의 서로 다른 질병과 연관이 있으며, Colon cancer의 경우 34개의 다른 질병들과 연관이 있다.) 원들 사이의 선은 서로 같은 유전자가 질병에 관여하면 질병간에 연결선이 생성된다. 선의 굵기가 굵을 수록 두 질병간에 연관된 유전자가 많음을 의미한다.(Diabetes mellitus와 MODY의 경우 총 5개의 유전자가 일치하기 때문에 굵은 선으로 연결되어 있다.) Pajek 질병 네트워크 파일 (다운로드 하셔서 Pajek에서 열어서 보시면 위의 네트워크가 보입니다.) 추가 : 각 질병에 대해서 카테..

Bioblogs 2008.06.23

BioBlogRSS에서는 - 2008년 6월 23일 #1

BioBlogRSS에 올라오는 블로그의 글들을 요약해서 남겨 놓기로 했다. 너무 많은 글들이 올라오고 있는(?? ^^) 상황에서 좀 정리한다는 의미와 함께 이렇게라도 조금이나마 남기다 보면 Bio::Blogs처럼 되지 않을까?? ^^ 완전 주관적인 나의 관심을 끈 내용을 위주로!!! 오늘은 그 첫번째로 4개를 선택해 봤습니다. 박사 논문을 준비중이신 분들에게 유용할 LaTeX관련 글과 함께 HTML 문서를 조금이나마 수월하게 만드는 방법이 준비되어 있습니다. 그 다음은 RSS를 이용해서 자신의 친구들의 Flickr, 블로그 등등 온갖 Social 웹사이트의 RSS를 불러와 감시??하는 FriendFeed와 태그 클라우드를 만들어주는 사이트입니다. 모든 글들은 BioBlogRSS에 있습니다. ^^ 오늘의 ..

Bioblogs 2008.06.23

질병 네트워크 - 알츠하이머와 천식

알츠하이머와 천식이 관련이 있을까? 에이즈와 알츠하이머와의 관계는? 이러한 물음에 대한 접근을 보여주는 아주 재미있는 논문이다. 고려대학교의 고광일(물리학)교수의 논문이다. 처음에는 질병들간의 네트워크를 그리더니 이제는 약물과의 관계까지 ^^ The human disease network Drug-target network Mapping the Human 'Diseasome' 가장 기초적인 작업은 질병에 대한 정보를 제공하는 OMIM 데이터베이스에서 각 질병과 그 질병에 관여하는 유전자를 추출하고, 타 질병의 유전자와 일치하는 질병들간에 네트워크를 작성하는 것이다. 참 간단한 아이디어인데,,, 누구도 시도하지 않았다는것,,, ^^ 박모박사님이 논문세미나 시간에 발표한 논문이었는데, 하나 그려 놓으면 재미..

Bioblogs 2008.06.20

Apache Log 분석을 위한 Hadoop MapReduce

저번주는 MapReduce를 Streaming 방식으로 작성된것을 실행해 보았따. Writing An Hadoop MapReduce Program In Python을 보면 WordCount 예제가 Python으로 작성되어 있다. 또 URL을 통해 해당 URL을 제목을 가져오는 Python 예제도 있다. 그런데,, 하나의 노드로 마스터와 네임노드를 구성해서 할 경우에는 잘 되었는데,, 막상 15노드로 Hadoop 클러스터를 구성하고 실행을 하는데,, Map 작업의 결과는 잘 나오는데 Reduce에서 결과 레코드가 모두 0 즉, 결과가 없다. 뭐가 잘못되었는 전혀 감이 오지 않아서Streaming을 포기하고 결국 Java로 하기로 했다. 그래서 오늘은 깔끔하게 Streaming을 잊고,,, 저번에 잠깐 살펴..

blogging 2008.06.17

PubMed 검색결과를 impact factor 값으로 정렬해서 보기

어제 PubMed의 검색 결과로 나온 논문을 클릭하면 유사논문 찾기 서비스에 대해서 잠깐 언급했는데, 오늘은 PubMed의 검색결과를 impact factor 순으로 정렬해서 보여주는 것에 대해서 이야기 해보려고 한다. BioBlogRSS에 자주 등장하는 YOKOFAKUN 블로그의 Pubmed, impact factors, sorting and FriendFeed 글에서 나온 이야기이다. 여기에서 우선 jar 파일을 다운로드한 후, PubMed의 검색결과를 XML 형태로 저장한다. Display 형태를 XML로 하고 File을 선택하면 XML 형태의 pubmed_result.txt 라는 검색결과 파일을 얻을 수 있다. 그럼 준비된 jar 파일을 PubMed검색결과 파일을 입력으로 주고 실행하면 sort된..

Bioblogs 2008.06.11

좌표 지명 변환 - Reverse Geocoding

위/경도를 넣으면 해당 지점의 주소를 반환하는 Reverse Geocoding을 처음 만난것은 2007년도 중반쯤 야후의 플릭커 서비스에서였다. 예전 포스팅에서(아직 플릭커가 한글화 되기전 영문으로 국내 주소가 나오는것을 깜딱 놀랐었다.) 좌표지명변환과의 첫 대면을 볼 수 있다. ^^;; 그 후로 우편번호에 해당하는 주소지의 좌표를 죄다 긁어 모아서 국내 좌표 지명 변환 서비스를 만들었는데,,, 이미 이전에 야후 거기에서도 지도 오픈 API를 제공하고 있었다는걸 댓글을 보고 알게 되었다. ^^;; 야후의 Open API 호출 결과 http://kr.open.gugi.yahoo.com/service/rgc.php?appid=YahooDemo&latitude=36.36513767979439&longitude..

blogging 2008.06.10

Biomedical계의 PageRank ^^

PageRank without hyperlinks: reranking with PubMed related article networks for biomedical text retrieval BMC Bioinformatics에 나온 논문인데,, 간단하게 Google의 PageRank가 웹페이지의 특성인 hyperlink를 통해서 점수를 주는건데,, 이 논문에서는 이러한 PageRank에서의 hyperlink 대신에 논문의 인용(citation)을 이용한다는 것이다. 음 꽤 그럴싸한데,, 근데 원래 그러던거 아니였던건가보네 ^^;; 뭐 이쪽에는 별 관심이 없었던 터라. 자세히 읽어보지는 않았지만,,, 그냥 PubMed에서 검색 결과와 함께 오른쪽에 보여주던 Related Articles가 오늘 따라 예사롭게..

blogging 2008.06.10

Embarrassingly parallel and BLAST

Embarrassingly parallel: 완전하게 독립되어 각각의 프로세서에 나누어 실행될 수 있는 병렬화의 하나~ 각 sub task와의 커뮤니케이션이 필요없는,,, 아래 그림에서 coarse-grained parallelism이 여기에 속할 수 있겠다. Grid Computing의 응용의 하나인 SETI@home이나 MapReduce도 Embarrassingly parallel쪽의 병렬화라고 볼 수 있겠다. ^^ Coarse-Grain, Fine-Grain Parallel embarrassingly parallel: disconnected computational embarrassingly parallel: master-slave approach 요 몇일 Hadoop 예제를 돌려보면서, 이 예제들..

Bioblogs 2008.06.05