Google 8

PlatformDay 컨퍼런스

구글이 어떻게 수많은 데이터를 저장하고 처리하는지, 과연 이것을 어떻게 생물학의 데이터 처리에 활용할지에 대한 힌트를 얻고자 한다면 여기 PlatformDay 컨퍼런스에서 찾을실 수 있을겁니다. 솔직히 말씀드리면 당장은 자신이 하고 있는 연구에 적용해서 능수능란하게 사용하실 여건은 되지 않을것이지만, 충분한 아이디어는 얻을 수 있을것입니다. PlatformDay (출처 : NEXR 블로그) 다양하고 방대한 생물학 데이터를 여러가지 기계학습(machine learning) 기법을 통해 어떻게 처리해야 하는지에 대해 집단지성 프로그래밍 책을 통해 학습하고, 대량의 데이터의 기계학습을 위한 대용량저장/처리 방법을 PlatformDay에서 아이디어를 얻는다면 참 좋을것 같습니다.(말이 참 매끄럽지 않네,,,^^..

Bioblogs 2008.04.28

익숙한것에 익숙해져 버리다.

Genome Browser를 만들면서 한가지 고민에 빠지게 되었다. 이걸 왜 만들고 있는지에 대한 원초적인 질문에 답을 찾지 못하고 있다는 것이다. 왜 이걸 지금에야 생각하고 있는건지... 그동안 생물학자들은 여러가지 Genome Browser를 사용하고 있었지만, 그 생김새나 기능들은 그닥 큰 차이가 없기 때문에 별 어려움이 없이 사용하고 있다. 좀 불편하더라도 그 불편함을 모르고 그냥... 거기에다가 GMOD(Generic Model Organism Database project)에서도 GBrowse라는 브라우저를 제공하고 있다. 아마 이 브라우저가 가장 보편적인 Genome Browser의 표준(?)일 것이다. 그런데 이러한 기존 방식의 Genome Browser가 아닌 Google Map API를..

Bioblogs 2008.02.27

Bioinformatics 연구자를 위한 컴퓨팅 환경 제공

이전에 국내 바이오인포매틱스 관련 오픈소스 현황이라는 주제의 글에서 대용량 데이터 분석 환경 지원 부분에서 연구를 위해서 단순하게 슈퍼컴퓨터나 cluster 컴퓨터의 기본적인 환경만을 제공하는 것이 아니라 이러한 환경에 + 유틸리티를 덧붙여 제공해야 한다고 언급했었습니다. 그 일례로 Yahoo에서는 학교나 일반 기업에서 구비하기 힘든 Hadoop기반의 클러스터 컴퓨팅 자원에 대해서 학술 연구 목적으로 지원을 하고 있다고 했었죠. 슈퍼컴퓨팅 자원 + 이를 좀더 유연하게 활용할 수 있는 utility(야후에서는 Hadoop) Google의 official 블로그에서도 Supporting cluster computing in the research community이라는 글이 올라왔습니다. 역시나 Google..

Bioblogs 2008.02.26

Java 사용자 정의 Component 만들기

이전 포스팅에서 총 3개의 Java Panel 만들고 Panel 자체를 이미지로 출력해서 Google Maps API에서 사용할 Custom Map Tile에 사용하기로 했다. 문제는 Sense Panel과 AntiSense Panel에 Genome 정보(SNP, CNV, Exon, Intron 등등등등)를 어떻게 표시할것인가?에 대한 것이다. 그전에 그러면 Bioinformatics에서 위의 정보들을 보여주기 위해서 사용하는 그래픽은 어떠한 것들이 있는지 간단히 살펴보자. BioRuby의 다양한 생물 정보 표시 그래프?? 위의 그림들은 흔히 우리가 Genome Browser에서 보는 표시형식들이다. box, line, line with handles, directed, directed box, tria..

java-programming 2008.02.16

Geocoding과 구글맵

일전에 한참 GoogleMap을 가지고 이런 저런 작업(?)을 하다가 주소나 우편번호를 입력하면 해당 위치가 지도상에 보여지도록하는 방법에 대해서 이리저리 알아보고 다녔던 기억이 났다. 이것을 가리켜서 전문용어(?)로 Reverse Geocoding이라고 한다. 그럼 이러한 주소정보만을 가지고 어떻게 해당지역을 지도위에 표시해줄 수 있을까?? 지도를 수십만개의 작은 영역으로 나누고 해당 영역마다 주소정보를 넣어 놓는 방법도 있을테고, 여기서는 작은영역이 작을수록 보다 정밀하게 주소에 대응하는 지역을 찾을 수 있겠다. 이외에도 뭐 생각한다면 여러가지 무식한 방법들이 많을테고... 내가 선택한 방법은 우선 전국의 우편번호와 우편번호에 따른 주소를 가기고 와서 이 우편번호에 대응하는 지도의 위도와 경도를 데이..

blogging 2008.01.04

Korea Bio e-Science - 이글은 구글 그룹스 바이오커뮤니티에 등록된 내용입니다.

여기 계신분들은 이미 Biopipe는 알고 계실테고 Taverna는 Biopipe와 유사한데 뭐라 좀 말하긴 그렇고 암튼 요번에 KISTI의 CCBB에서도 Bioworks라는 Bio 워크플로우 툴을 만들었는데요,,, 자세한 내용은 http://socmaster.homelinux.org/~hongiiv 를 참고 각 기관에서는 서로 다른 서비스라고 말할수도 있겠지만 제가 보기에는 그나물에 그밥인것 같은데요,,, (암튼 요즘 왜이렇게 워크플로우 툴들이 많이 나오는지...) 제 생각엔 이러한 툴의 성능이나 기능보다는 어떻게 실 사용자들에게 좀 더 많은 정보와 손쉬운 접근을 가능하게 하느냐가 관건인건 같습니다. 달랑 툴하나 보단 그 툴을 사용하기 위한 그 무엇이 실사용자에겐 더 필요할것 같은데요. 그런 의미에서 ..

blogging 2007.11.06

PlatformDay를 기억하시나요? 그럼 Web2Hub는??

올해초 블로고스피어를 뜨겁게(?) 달군 행사가 하나 있었다. PlatformDay라는 이름의 행사였는데, 구글 플랫폼에 대한 내용과 이를 오픈소스로 구현한 Hadoop에 대한 행사였다. 참석하진 못하고 블로그와 관련기사를 통해 행사에 대한 내용을 접할 수 있었다. 생각보다 많은 분들이 관심을 가지고 참여했다는 소리를 들었던 기억이 있었다. 나도 뒤늦게나마 Web2Hub 사이트를 들락날락 거리면서 한동안 주의 깊게 살펴보던 기억이 났다. 그러다 이런저런일에 치이면서 기억의 저편으로 사라질 무렵... 오늘 금요일 집에 내려가려고 서울역에서 대전으로 가는 KTX에 몸을 실었다. 회사를 끝내고 저녁도 먹고 마침 읽을 책들(공상과학SF소설과 전생에 관한 소설^^)을 사느라 좀 늦은 시간이었다. 창가쪽이 아니라 먼..

blogging 2007.09.08

구글 gmail을 웹하드처럼 gspace

firefox의 플러그인으로 작동하는 gspace는 gmail의 계정을 웹하드처럼 사용하도록 해준다. 그림처럼 내하드디스크의 내용이 왼쪽에 오른쪽에는 지메일에 저장된 내용을 보여준다. 언젠가 리눅스에서 지메일을 계정을 마운트해서 사용하는것을 본적이 있었는데 그것보다 훨씬 나아보인다. 공짜 웹하드가 생겼다. ㅋㅋㅋ 물론 gspace로 저장을 하면 gmail로도 메일이 날라온다.

computer system 2006.05.03