Bioinformatics 39

OBK(Open Bioinformatics Korea) 모임 후기

2010년 첫 모임이 신촌의 토즈에서 있었습니다. 모두들 바쁘신 와중에도 무려 16분이 참석해주셨습니다. 도넛으로 간단히 허기를 달래고, 싱가폴에 계신 김한조 박사님을 연결해서 지금 하고 계신일에 대해서 재미있게 말씀해 주셨습니다. 아쉬운 점은 노트북의 스피커로 나오는 음성이 좀 작아서,,, 다음에는 스피커도 준비해야 할 듯 합니다. 올 겨울 들어서 너무 추운데,,, 김한조 박사님은 반팔을 입고 계셨습니다... -.-;; 그 다음으로 제가 간단하게 PubMed와 블로그의 글들의 RSS를 가져와서 야후 파이프를 이용해서 원하는 글과 저널을 다시 한번 필터링하는 방법에 대해서 이야기 했습니다. 거의 1년만에 발표에 성공 ㅜㅜ View more presentations from Hong ChangBum. 그리..

blogging 2010.02.05

Bioinformatics를 위한 Hadoop

Hadoop World: NYC 2009에서 아마존 웹 서비스의 Deepak Singh가 Hadoop for Bioinformatics라는 재미있는 주제로 발표를 했다. 넥스알의 한재선 박사님도 이메일 아카이빙 솔루션인 Terapot에 대해서도 발표를 하셨군요. 1. 엄청난 데이터가 몰려들어와 있고, 몰려들고 있다. 직접 발표를 들은것이 아니라, 슬라이드만 보고 혼자 생각한것을 적어본다면, 1-30 페이지까지는 엄청나게 쏟아져나오는 데이터에 대해서 이야기 하고 있는것 같습니다. 이부분에 대해서는 저도 제작년 발표때 언급을 한것인데, 추가 된것이라면 NGS를 이용한 엄청난 데이터에 대해서 더 언급 되어있습니다. 5-7페이지: 공개된 많은 생물학 데이터(genebank, pdb 등등)들이 있다고 합니다. 9..

blogging 2009.10.26

Landscape of Parallel computing Research

13 난쟁이 Berkeley에서 발표한 The Landscape of Parallel Computing Research: A View from Berkeley를 보면 난쟁이(Dwarf)라는 개념을 이용해서 병렬 컴퓨팅 환경에서 어플리케이션들을 집합을 가지고 통신 및 전산 공통 패턴에 대해서 정리하고 있다. 핵심적인 것은 17p~19p에 걸쳐서 총 13개의 Dwarfs와 각각의 Dwarfs들이 Embedded Computing, General Purpose Computing, Machine Learning, Graphics/Games/Databases에서 어떠한 형태로 발현? 되는지를 요약하고 있다. 또한 2008년도 자신의 연구에 대한 문서를 보면 각 Dwarfs(Motif라는 표현)와 컴퓨팅분야, 자신..

blogging 2008.11.04

Agile development for Bioinformatics

이화여대 시스템생물학 연구소와 서울대 생명의약네트워크 연구정보센터의 주관으로 Agile을 통한 Bioinformatics 소프트웨어 개발의 생산성 향상에 관한 워크샵이 열립니다. 7월 28일 부터 8월 2일까지니까, 관심있는 분들은 많은 참여를 바랍니다. ^^ Agile은 이미 BMC Bioinformatics의 "Agile methods in biomedical software development: a multi-site experience report"라는 논문으로도 나와 있죠 ^^;; 그리고 현재 구글 그룹스에 "Open Bioinformatics Korea"라는 그룹이 만들어져 있습니다. 제목만 봐도 어떤곳인지 솔깃하시죠 ^^;; 다음에 좀더 자세한 내용을 다루기로 하고, 오늘은 이정도만,,,(..

Bioblogs 2008.07.08

Job Scheduler로 보는 맞춤형 의료 서비스

민간 우주 여행, 로봇의 달탐사, 10일 안에 100명의 Genome 염기서열 분석 모두 꿈 같은 이야기이지만, 그 꿈같은 이야기들이 X PRIZE 재단에 의해서 커다란 상금을 걸고 진행중이거나 이미 끝난 대회이다. 2006년 개인의 맞춤형 의료 서비스의 진입을 위하여 X PRIZE에서는 민간에서 10일 안에 100명의 Genome을 해석할 수 있다면, 그것도 Genome 당 $10,000 이상의 비용이 들어가지 않도록 해낸다면, $1,000만 우승 상금을 얻게 된다. 이것이 바로 Archon X PRIZE for Genomics 이다. 그럼 이러한 일을 가능하게 하는데 중요한 역할을 하는 것이 무엇일까? 바로 Grid 컴퓨팅이나 클러스터 컴퓨팅의 Job Scheduler, DRM(Distributed ..

Bioblogs 2008.07.07

당신의 실험 데이터가 논병아리에

당신의 소중한 데이터와 결과를 논병아리에 보관하시겠습니까?? 논병아리 어미와 새끼 (자료 출처 : http://www.flickr.com/photos/narkosearzt/253071046/) Bio::Blogs #8 의 Reviews and tips에도 소개되었던 Bioinformatics Zen의 organized as a dry lab scientist의 내용은 요즘 회자되고 있는 Electronic Lab Note나 단순히 야동을 긁어 모으는 사람이나 모두에게 한번 생각해 볼 문제이다. 누구나 다 자신만의 방법으로 폴더나 파일을 만들고 데이터를 저장하는데 있어 어떠한 것이 최선이고 모범답안이라고 할 수는 없겠지만, 이러한 것들이 유용함에도 불구하고 논병아리에 아무 의미있는 Noname1, Nona..

Bioblogs 2008.04.15

블로그를 위한 초절정 아이템 BioBlogRSS 위젯 베타 버전을 배포합니다.

생긴것은 위의 그림처럼 바뀌었습니다. 최근글의 경우에는 RSS를 읽어와서 간단하게 표시해 줄 수 있기 때문에 인기글에 대한 정보를 제공해 주고 있습니다. 그럼 인기글의 선정은 어떠한 방식으로 되는 걸까요? 인기글은 우선 로그인하지 않은 상태에서도 추천, 반대 기능을 사용이 가능합니다. 따라서 아무나 들어와서 '좋아' 버튼을 그냥 아무 부담없이 꾹 눌러 주시면 됩니다. 그리고 인기글 선정은 다음과 같은 아주 복잡한 과정을 거쳐서 선정됩니다. 추천한 사람이 많고 작성된지 48시간 이내인 글에 대해서 인기글이 선정되며, 7일 지난 글에 대해서는 호감도를 계산하지 않습니다. 아주 복잡하죠 ^^;; 그럼 자신의 블로그나 웹페이지 어떻게 삽입하냐? 코드 생성 위자드 같은걸 만들 수도 있지만, 아직은 베타 버전이기 ..

Bioblogs 2008.04.11

바이오인포매틱스와 슈퍼 컴퓨팅 - 마음을 다스리는 글

바이오인포매틱스 분야에서도 많은 부분에서 컴퓨팅 파워를 필요로 하지만, 그 중에서도 대표적인 부분은 genome comparison과 alignment 일것이다. 이러한 대용량 컴퓨팅 파워에서 그래픽 카드의 비약적인 발전으로 GPU의 그래픽 이외의 계산에 응용되기 시작했다. 그런데 여기서 한가지 짚고 넘어가야 할 것이 있다. 슈퍼컴퓨팅 분야에서 클러스터를 이용한 방법은 비교적 값싼 하드웨어를 통해서 높은 성능을 얻을 수 있다는 장점으로 많이 사용되고 있다. 그러나 각 컴퓨터에 분산된 메모리에 접근해서 사용하기 위해서는 MPI와 같은 라이브러리를 이용해서 병렬 프로그래밍을 해야만 한다. 그래야 분산된 메모리를 마치 하나의 메모리처럼 사용하여 프로그래밍을 할 수 있다. 마찬가지로 GPU의 성능이 아무리 뛰어..

Bioblogs 2008.03.27

생물정보학에서의 서열 유사성 검색 - GPU와 Suffix Tree를 이용한 병렬처리

생물정보학에서의 서열 유사성 검색의 중요성은 굳이 설명하지 않아도 다들 이해하시리라 믿는다. 여기서는 String Match라는 관점에서 서열 데이터(text)로 부터 주어진 서열 찾는 Suffix Tree 알고리즘과 이 알고리즘을 GPU를 통해서 구현하는 방법에 대해서 알아보고자 한다. GPU(Graphics Processing Unit)는 무엇인가? 간단하게 말하면 컴퓨터에 있는 그래픽 카드의 CPU라고 생각하면 될것이다. 요즘 게임들은 3D와 실사와 정말 유사한 화면을 제공하는데, 이러한 것들을 CPU가 아닌 그래픽 카드의 GPU에서 처리하게 함으로써 좀 더 빠르게 게임을 할 수 있는 환경을 제공하는 것이다. 그런데 이 GPU의 아키텍처의 특성상 이것만 하기에는 너무 아깝기 때문에 범용적인 수치연산..

Bioblogs 2008.03.26

BioBlogRSS 서비스가 이렇게 바뀌었습니다.

기존의 Bioinformatics 관련 블로거들의 글들을 수집해서 보여주던 BioBlogRSS는 DB를 사용하고 있지 않아서 좀 느리고, 제목과 해당 블로그로 갈 수 있는 링크만을 제공했었죠,, 그나마 레몬펜을 통해서 블로그 글에 대한 자신의 의견이나 블로그의 내용등을 이용자가 직접 작성할 수 있도록 만든 메타 블로그 사이트였습니다. 기존의 BioBlogRSS (http://www.hongiiv.com/bioblogrss_/bioblog.html) 링크는 살려두었습니다. ^^ 이번에 공개된 설치형 메타 블로그 인 날개(Wing)으로 바꾸고 약간의 스킨변경과 레몬펜을 달았습니다. 제자신이 생각하기에 기존에는 레몬펜의 역할을 많이 기대했는데,, 그냥 일반적인 메타 블로그 형태가 더 나을것 같다는 생각에 바꿔..

Bioblogs 2008.03.21