blogging

근황 토크

hongiiv 2008. 5. 14. 19:24
반응형
요즘 집단지성 프로그래밍 책을 읽으면서,, 저번에 좀 날림으로 만들었던 좌표를 이용한 주소찾기를 Machine Learning을 이용해서 좀 더 정확도와 신뢰도를 높일 수 있지 않을까? 라는 생각을 해본다. SVM(Support Vector Machine)을 이용하면 좀 될 것 같기도 한데,,,

PLOS Computational Biology에 Machine Learning에 대한 글이 두개씩이나 된다. 하나는 전체적인 이야기이고, 다른 하나는 Bayesian Network에 관한 것,,,

YOKOFAKUN 블로그에 따르면 illumina genotypes 데이터를 MySQL에다 집어넣어보고 그 속도에 실망하고는 , HDF5를 써보라는 권유를(smart한 fseek/fread/fwrite^^) 뒤로 하고 BerkeleyDB에다가 Hapmap 데이터를 넣고는 또 그 속도에 실망한다. 댓글에 따르면, GenoByte를 이용하라고 한다. GenoByte 음,,, 엔진을 새로 만들다니,,, 그럼 데이터에 따라서 항상 새로운 엔진을 만들고 만들고,,, 그렇게 해야 그나마 데이터를 처리한단 말인가??

Ensemble 데이터를 통째로 가져오고 있다. 이거 exon array 분석 시나리오 따라 하다가 배보다 배꼽이 더 커져간다. Ensemble도 dbSNP처럼 데이터베이스에 직접 연결을 허용하는구나,,,게다가 잘 구성된 API까지,, 역시 Ensemble 답구나^^

Ensembl Connect

실패도 맛봐야 하는것을,, 그 실패마저 맛보지 못하다니 ㅜㅜ


반응형