티스토리 뷰
반응형
- 분산 파일 시스템 &분산 컴퓨팅: Google Map Reduce, Apache Hadoop
- Map Reduce for Machine Learnning: Map-Reduce for Machine Learning on Multicore
- Hadoop for Machine Learning:Apache Mahout
여기서 주목해야 할 점은 이러한 Map-Reduce를 여러가지 Machine Learning에 적용할 수 있다는 것이다. 따라서 엄청난 변수와 입력을 다룰 수 있게 된다는 것이다. Machine learning in bioinformatics를 보면,
- 지도(교수, 감독?)분류(supervised classification)
- 클러스터링(clustering)
- 확률 그래프 모델(probabilistic graphical models)
- locally weighted linear regression(LWLR)
- k-means
- logistic regression(LR)
- naive Bayes(NB)
- SVM
- ICA
- PCA
- gaussian discriminant analysis(GDA)
- EM
- backpropagation(NN)
이전 블로그에서 봤던 GPU를 이용한 프로그래밍이나, MPI와 같은 메세지패싱에 비해서 Map-Reduce는 파일 시스템에 대한 분산까지도 고려하고, 많은 부분에 적용 가능하기에 참 매력적이지 않을 수 없다.
Machine Learning을 통해서 데이터 분석시에 한번쯤 데이터가 커서 걱정된다면, 한번쯤 알아 두어도 좋을 듯 하다.
반응형
공지사항
최근에 올라온 글