요즘 집단지성 프로그래밍 책을 읽으면서,, 저번에 좀 날림으로 만들었던 좌표를 이용한 주소찾기를 Machine Learning을 이용해서 좀 더 정확도와 신뢰도를 높일 수 있지 않을까? 라는 생각을 해본다. SVM(Support Vector Machine)을 이용하면 좀 될 것 같기도 한데,,, PLOS Computational Biology에 Machine Learning에 대한 글이 두개씩이나 된다. 하나는 전체적인 이야기이고, 다른 하나는 Bayesian Network에 관한 것,,, YOKOFAKUN 블로그에 따르면 illumina genotypes 데이터를 MySQL에다 집어넣어보고 그 속도에 실망하고는 , HDF5를 써보라는 권유를(smart한 fseek/fread/fwrite^^) 뒤로 하고..
현재 무선 인터넷이 가능한 열차는 KTX 전열차와 새마을, 무궁화의 열차카페 연결 차량이라고 한다. 노브북이 없는 사용자들도 5,13호차에 설치된 컴퓨터를 통해 이용이 가능할 뿐만 아니라, 고속철도 역사에서 오천원의 렌탈 비용을 받고 노트북도 렌탈해준다고 한다. 마침 오늘 대전으로 내려오는 길에-모든 열차가 매진이란다. 역시 연휴이긴 연휴인가 보다 ^^- 거금 천원을 투자해서 한번 사용해 보고 있는 중이다. 열차에서는 현재 사용설명서를 배포하고 있어서 자세한 정보를 볼 수 있다. 열차에서의 AP의 위치는 3, 5, 8, 11, 14, 17호차에 설치되어 있기 때문에 그나마 원활한 인터넷 사용을 위해서는 가급적 위의 호차에서 사용하는 것이 좋을 듯하다. 지금 현재 17호차에 탑승하고 있는데,, 간단한 인터..
요즘 쇠고기 수입과 맞물려 인간 광우병으로 불리는 변종 크로이츠펠트 야콥병(vCJD)이 한국인에게서 아주 취약하다는 말이 나오고, 한간에서는 쇠고기가 수입되면 미국인과는 달리 한국인은 모두 인간 광우병에 걸려 죽을거라고 걱정을 하고 있다. 뭐 많은 이야기야 BRIC에서도 한창 논의가 뜨겁게 이루어지고 있다. 유전적 변이(Genetic Variation) 여기서 말하고자 하는 것은 한국인이 다른 인종과 다르다는 것이다. 사람과 사람, 인종과 인종간의 차이는 분명 존재하고 그 차이로 인해 너/나, 한국인/영국인이라 불릴 수 있는 것이다. 사이언스가 선정한 유전적 변이 연구 2007년 마지막달 나온 사이언스지를 보면 "올해의 짱(breakthrough of the year)"에 인간의 유전적 변이(Human ..
분산 파일 시스템 &분산 컴퓨팅: Google Map Reduce, Apache HadoopMap Reduce for Machine Learnning: Map-Reduce for Machine Learning on MulticoreHadoop for Machine Learning:Apache Mahout 구글의 Map Reduce는 분산 파일과 분산 컴퓨팅을 위한 프로그래밍 모델로서 이를 오픈소스로 구현한 것이 Apache Hadoop이다. 원래 구글이 검색에 사용하기 위한 것으로 수많이 웹 페이지를 분류하고 인덱싱하기 위한 프로그래밍 모델이다. Hadoop 역시 Nutch라는 Lucene 공개 검색엔진의 Indexer와 Search로 구성된 자바로 구현한 오픈소스 검색엔진의 분산 파일 시스템으로 Map..
구글이 어떻게 수많은 데이터를 저장하고 처리하는지, 과연 이것을 어떻게 생물학의 데이터 처리에 활용할지에 대한 힌트를 얻고자 한다면 여기 PlatformDay 컨퍼런스에서 찾을실 수 있을겁니다. 솔직히 말씀드리면 당장은 자신이 하고 있는 연구에 적용해서 능수능란하게 사용하실 여건은 되지 않을것이지만, 충분한 아이디어는 얻을 수 있을것입니다. PlatformDay (출처 : NEXR 블로그) 다양하고 방대한 생물학 데이터를 여러가지 기계학습(machine learning) 기법을 통해 어떻게 처리해야 하는지에 대해 집단지성 프로그래밍 책을 통해 학습하고, 대량의 데이터의 기계학습을 위한 대용량저장/처리 방법을 PlatformDay에서 아이디어를 얻는다면 참 좋을것 같습니다.(말이 참 매끄럽지 않네,,,^^..