전체 글 749

너 자신을 알라! 구글 창업자도 안다.

구글의 세르게이 브린이 개인 블로그(http://too.blogspot.com)를 개설했다는 기사를 어제 보게 되었다. 역시나(아내 사랑??) 첫 글의 주제는 바로 파킨슨 병[1][2](질병에 대한 정보를 얻고 싶다면 firefox 플러그인을 설치해서 사용하면 편리합니다.)에 관한 내용이었다. 어머니가 파킨슨 병에 걸렸고, 자신 또한 그병에 취약하다는 내용의 글이었다. 이러한 정보는 바로 세르게이의 부인이 일하고 있는 23andMe에서 알아냈겠지 ^^;; 이제는 이러한 유전정보는 세르게이와 같이 일반 개인들의 관심사가 되어가고 있다. Common sense for our genomes 23andMe의 핵심 가치(Core Value) 중 "We believe that your genetic informat..

blogging 2008.09.20

개인용 Genome 브라우저

(맞춤형 개인 의료, 개인 Genome 서비스, Google Health, 23andMe) 논문에서나 볼 수 있는 내용들이 점점 나(개인)에게 실질적으로 다가오고 있다. 이런 상황에서 자신의 Genome 정보를 시각화하고 다른 정보와 결합해서 보여주는 Genome Browser 또한 개인(연구용이라기 보다 좀 아는 일반인)에게 맞추어져야 할것이다. 제임스 왓슨 박사의 개인 Genome 브라우저 - 이런건 일반인에게 필요 없지,,, 만약 23andMe에서 Ensembl이나 UCSC Genome Browser에 개인의 정보를 추가해서 보여준다면 일반인들은 질색을 할 것이다. 그럼 개인의 입장에서 한번 살펴보자. 나는 나의 Genome 정보를 가지고 있다. 그럼 이것만 가지고는 그 어떤 정보도 찾을 수가 없다..

요즘 작업 환경은 어떠신가요?

추석 명절도 끝나고 일을 하려고 키보드를 두드리지만, 자꾸 엄한 웹페이지만 돌아다니고 있다. 무슨 추석이 끝났는데도, 왜 이리 더운지 -.-;; 일하기 정말 싫다. 어쨌거나 일은 해야해야하니,,, 여기서 잠깐 요즘 작업환경을 간단하게 소개하고 넘어가려고 한다. 일도 하기 싫은데 잘됐다. ^^;; 요즘은 웹 프로그래머가 되어버렸다. 간단하게 php와 prototype, jquery, google maps api, mysql을 가지고 전형적인 웹 프로그래머가 되어 버렸다. ^^;; 테스트를 위한 테스트 서버에 웹서버를 올리고 작업하고 있는데, 처음에는 무턱대고 ssh로 접속해서 vi를 통해서 코드를 작성하고 있었다. 그러다가는 그림 파일을 편집할 경우 scp로 다운받아서 수정하고 다시 scp~~ 왜 이리 콘..

blogging 2008.09.17

이건 뭐라고 해야 하는 건가요?

KISTI 슈퍼컴퓨팅센터에서는 슈퍼컴퓨팅 소식지를 발간하는데요, 저 역시 책자로 받아서 잘 읽고 있습니다. 요번 여름호에서는 "시스템 생물학과 슈퍼컴퓨터', 계산유전체학과 병렬 프로그래밍', '슈퍼컴퓨터를 사용한 가상세포연구', 'KISTI Bioworks 시스템소개' 등의 생물학 관련 글들이 많이 올라와서 재미있게 읽고있는데, 뭔가 어디서 많이 본듯한 내용이 보이기 시작했습니다. 이번호 소식지 표지 이 기사는 KISTI에서 만든 Bioworks 시스템을 소개하는 글입니다. 여기서 국내외의 생물학 워크플로우들을 소개하는 부분이 나옵니다. 제 블로그의 글과 소식지의 글을 나란히 열거해봤습니다. 한번 찬찬히 ^^;; 읽어보세요. KISTI 소식지의 BioWMS 내용 2007년 제 블로그에 올린 글의 내용 K..

blogging 2008.09.12

SNP Browser 작업

10,000명에 대한 각각의 500,000개의 데이터 즉, 10,000 x 500,000의 속이 꽉찬 매트릭스가 탄생하게 된다. 여기서 원하는 것들만 뽑아내서 지지고 볶고 다듬는 작업,, sparse matrix도 아니고 ㅜㅜ. 여기서 우선 DB에 넣고 원하는 값만을 뽑아내는 작업을 해봤는데, 프로그램 작성시 DB에 대해서 연결을 해줘야 하고, 인덱스에 테이블 쪼개기, 하드웨어 최적화 등등의 작업까지 모두 해보았지만, 별로 맘에 들지 않는다. 간단한 질의를 수행했지만 6분정도의 시간이 소요 간단하게 말해 10,000 x 500,000 매트릭스 내용을 보여주는 브라우저 - 현재 프로토타입 단계 자세한건 나중에 ^^ 브라우저야 어느정도의 시간을 감수하면서 DB에 넣을 데이터들을 만들었지만, 저 데이터를 가지..

집단지성프로그래밍 데이터셋을 입맛대로 바꾸기

지오코딩을 활용한 온라인 데이트 사이트 데이터 만들기 집단지성프로그래밍을 구입한지는 꽤 된거 같은데, 계속 가방속에서 자고 있다. 가장 관심을 끄는 부분부터 틈나면 읽어 나가고는 있는데, 요즘 9장을 좀 읽고 있다가 이전에 만들어 놓은 (리버스)지오코딩 서비스도 사용할 겸 사용되는 데이터셋도 국내용(??)으로 바꿀겸 간단히 코드와 데이터셋을 변경했다. 9장 고급 분류 기법: 커널 기법과 SVM을 보면 중매 데이터 세트가 나온다. 이 중매 데이터(matchmaker.csv)는 나이, 흡연여부, 자녀희망, 관심목록, 거주지의 형식으로 되어있는데, 마지막의 거주지는 4절 '분류 데이터의 특성'의 '야후! 지도를 사용한 거리 계산' 부분에서 설명이 나온다. 주소를 가지고 위/경도의 좌표 정보를 야후의 지오코딩 ..

blogging 2008.08.31

Hadoop Community 2차 모임

Google Groups의 hadoop community에 2차 모임 공지가 있었습니다. 일자는 바로 오늘이구요(Hadoop에 관심 있으신 분들은 가입해 보세요 ^^). 오늘 모임은 아무래도 MapReduce를 이용한 ML 알고리즘의 구현에 대한 내용이 솔깃합니다. 한박사님께서도 세미나와 1차 모임때도 ML에 대한 언급을 하셨는데, 오늘은 아예 ML에 대해서만 ^^ Apache에도 Apache Mahout이 있습니다만, 암튼 기대가 되는군요. 요즘 집단 지성 프로그래밍에서도 알 수 있듯이(IT 분야나 생물정보학 등 많은 분야에서 ML이 이미 오래전부터 사용되기는 했지만) 좀 더 사람들에게 친숙해져 가고 있는 느낌입니다. ^^ 늦었지만 1차 모임때 사진 ^^ 두번째 Hadoop Community 모임을 개..

blogging 2008.08.27