전체 글 749

요즘 AI에 인간 광우병에 제대로 얻어 맞고 있구나,,,

혼선 주는 `전염병 정보망` 사이트 김용선 교수팀 논문에 질병관리본부 연구원들 참여 첫번째는 질병관리본부가 "질병통제 종합정보망"을 새로 구축하면서 기존의 웹페이지가 방치되어 가뜩이나 심난한 이 판국에 국민들에게 혼선을 주고 있다는 내용이다. 두번째는 김용선 교수의 논문이 한국인이 서양인에 비해 광우병에 취약하는 주장을 뒷받침하는 논거를 활용되는데 반해, 질병관리본부는 크로이츠펠트-야콥병(vCJD)과 인간광우병을 일으키는 프리온 단백질 유전자형과의 연관성에 대해서는 일체 언급하고 있지 않다고 지적하고 있을 뿐 아니라저자 중 5명이 질병관리본부에 적을 두고 있다고 꼬집고 있다.(내가 아는 분도 있네 ^^) 저 자신도 문제가 있다고 인식은 하고 있지만, 뭐 따지고 들자면 뭔 꼬투리인들 못잡겠습니까? 저같이?..

blogging 2008.05.15

근황 토크

요즘 집단지성 프로그래밍 책을 읽으면서,, 저번에 좀 날림으로 만들었던 좌표를 이용한 주소찾기를 Machine Learning을 이용해서 좀 더 정확도와 신뢰도를 높일 수 있지 않을까? 라는 생각을 해본다. SVM(Support Vector Machine)을 이용하면 좀 될 것 같기도 한데,,, PLOS Computational Biology에 Machine Learning에 대한 글이 두개씩이나 된다. 하나는 전체적인 이야기이고, 다른 하나는 Bayesian Network에 관한 것,,, YOKOFAKUN 블로그에 따르면 illumina genotypes 데이터를 MySQL에다 집어넣어보고 그 속도에 실망하고는 , HDF5를 써보라는 권유를(smart한 fseek/fread/fwrite^^) 뒤로 하고..

blogging 2008.05.14

열차 무선 인터넷 사용하기 - KTX편

현재 무선 인터넷이 가능한 열차는 KTX 전열차와 새마을, 무궁화의 열차카페 연결 차량이라고 한다. 노브북이 없는 사용자들도 5,13호차에 설치된 컴퓨터를 통해 이용이 가능할 뿐만 아니라, 고속철도 역사에서 오천원의 렌탈 비용을 받고 노트북도 렌탈해준다고 한다. 마침 오늘 대전으로 내려오는 길에-모든 열차가 매진이란다. 역시 연휴이긴 연휴인가 보다 ^^- 거금 천원을 투자해서 한번 사용해 보고 있는 중이다. 열차에서는 현재 사용설명서를 배포하고 있어서 자세한 정보를 볼 수 있다. 열차에서의 AP의 위치는 3, 5, 8, 11, 14, 17호차에 설치되어 있기 때문에 그나마 원활한 인터넷 사용을 위해서는 가급적 위의 호차에서 사용하는 것이 좋을 듯하다. 지금 현재 17호차에 탑승하고 있는데,, 간단한 인터..

blogging 2008.05.10

인간 광우병과 한국인

요즘 쇠고기 수입과 맞물려 인간 광우병으로 불리는 변종 크로이츠펠트 야콥병(vCJD)이 한국인에게서 아주 취약하다는 말이 나오고, 한간에서는 쇠고기가 수입되면 미국인과는 달리 한국인은 모두 인간 광우병에 걸려 죽을거라고 걱정을 하고 있다. 뭐 많은 이야기야 BRIC에서도 한창 논의가 뜨겁게 이루어지고 있다. 유전적 변이(Genetic Variation) 여기서 말하고자 하는 것은 한국인이 다른 인종과 다르다는 것이다. 사람과 사람, 인종과 인종간의 차이는 분명 존재하고 그 차이로 인해 너/나, 한국인/영국인이라 불릴 수 있는 것이다. 사이언스가 선정한 유전적 변이 연구 2007년 마지막달 나온 사이언스지를 보면 "올해의 짱(breakthrough of the year)"에 인간의 유전적 변이(Human ..

Bioblogs 2008.05.07

Machine learning in bioinformatics

분산 파일 시스템 &분산 컴퓨팅: Google Map Reduce, Apache HadoopMap Reduce for Machine Learnning: Map-Reduce for Machine Learning on MulticoreHadoop for Machine Learning:Apache Mahout 구글의 Map Reduce는 분산 파일과 분산 컴퓨팅을 위한 프로그래밍 모델로서 이를 오픈소스로 구현한 것이 Apache Hadoop이다. 원래 구글이 검색에 사용하기 위한 것으로 수많이 웹 페이지를 분류하고 인덱싱하기 위한 프로그래밍 모델이다. Hadoop 역시 Nutch라는 Lucene 공개 검색엔진의 Indexer와 Search로 구성된 자바로 구현한 오픈소스 검색엔진의 분산 파일 시스템으로 Map..

Bioblogs 2008.05.06

PlatformDay 컨퍼런스

구글이 어떻게 수많은 데이터를 저장하고 처리하는지, 과연 이것을 어떻게 생물학의 데이터 처리에 활용할지에 대한 힌트를 얻고자 한다면 여기 PlatformDay 컨퍼런스에서 찾을실 수 있을겁니다. 솔직히 말씀드리면 당장은 자신이 하고 있는 연구에 적용해서 능수능란하게 사용하실 여건은 되지 않을것이지만, 충분한 아이디어는 얻을 수 있을것입니다. PlatformDay (출처 : NEXR 블로그) 다양하고 방대한 생물학 데이터를 여러가지 기계학습(machine learning) 기법을 통해 어떻게 처리해야 하는지에 대해 집단지성 프로그래밍 책을 통해 학습하고, 대량의 데이터의 기계학습을 위한 대용량저장/처리 방법을 PlatformDay에서 아이디어를 얻는다면 참 좋을것 같습니다.(말이 참 매끄럽지 않네,,,^^..

Bioblogs 2008.04.28

집단지성 프로그래밍 책 받았습니다.

저번주 금요일 예약한 집단지성 프로그래밍 책을 받았습니다. 역시나 이책의 저자인 Toby Segaran이라는 분은 컴퓨터 생명공학 회사인 Genstruct 에서 약제 발현 원리 이해를 위한 알고리즘을 설계하고 데이터마이닝 기법을 적용하는 부서를 맡고 계신다는군요. 일전에 어디선가 주워 보았던 미국의 WallMart의 성장 동영상도 이분이 만드셨다는 것을 블로그를 보고 알았습니다. Python의 PIL(Python Imaging Library)를 이용해서 만든 1,380개의 이미지로 만든 동영상이라는군요,, 생물정보학 뿐만 아니라, 방대한 데이터를 다루는 모든 분들께 추천드리고 싶습니다. 여기서는 사용한 데이터를 살짝 생물학 데이터로 바꾸면, 정말 쉽고 흥미진진한 책이 나올꺼 같은데,,,

book story 2008.04.28

사파리에서 한글 입력 문제

Safari에서 한글 입력이 되지 않는다는 긴급 제보를 받고 들어가보니 진짜루 한글이 입력되지 않는 일이 벌어지고 있었습니다. 이런 맥을 쓴다는 놈이 자기 블로그가 사파리에서 한글 입력이 되지 않는 것도 모르고 있다니,,, 문제점을 해결하고자, 스킨을 변경해서 한글을 입력해보니 잘되는것이었습니다. 그럼 문제는 CSS뿐,,,, CSS의 textarea 부분에 font-family가 두번 지정되어 있었습니다. 그외에는 뭐 봐도 모르겠구,,, 하나 살짝 지웠더니 한글이 입력이 잘되는 ^^;;; 물론 윈도우용 Safari가 아니라 맥용 Safari입니다. 이 자리를 빌어서 다시 한번 lordmiss님께 감사를,,,,^^;; 코멘트는 글 내용과 상관없어도 상관없습니다. ㅋㅋㅋ

blogging 2008.04.23

Programmable Web에 등록된 Reverse Geocoding API

일전에 지도상의 좌표에 해당하는 주소를 반환하는 API를 만들고 나서, Programmable Web에 등록했는데 몇주가 지나도 등록이 안되어 있길래 안되나 부다 했더니, 오늘 가보니 등록 되었습니다. ^^;; 등록된 이상 좀더 신경좀 써서 개선해나가야 할 책임감이 생겨버렸습니다. (^____^);; Geocoding Service for Korea 란 이름으로 등록되었군요,,,왜 이렇게 등록이 더딘거야~ 좀더 채워 나가야지,,ㅋㅋㅋ

blogging 2008.04.21