집단지성 프로그래밍 3

집단지성프로그래밍 데이터셋을 입맛대로 바꾸기

지오코딩을 활용한 온라인 데이트 사이트 데이터 만들기 집단지성프로그래밍을 구입한지는 꽤 된거 같은데, 계속 가방속에서 자고 있다. 가장 관심을 끄는 부분부터 틈나면 읽어 나가고는 있는데, 요즘 9장을 좀 읽고 있다가 이전에 만들어 놓은 (리버스)지오코딩 서비스도 사용할 겸 사용되는 데이터셋도 국내용(??)으로 바꿀겸 간단히 코드와 데이터셋을 변경했다. 9장 고급 분류 기법: 커널 기법과 SVM을 보면 중매 데이터 세트가 나온다. 이 중매 데이터(matchmaker.csv)는 나이, 흡연여부, 자녀희망, 관심목록, 거주지의 형식으로 되어있는데, 마지막의 거주지는 4절 '분류 데이터의 특성'의 '야후! 지도를 사용한 거리 계산' 부분에서 설명이 나온다. 주소를 가지고 위/경도의 좌표 정보를 야후의 지오코딩 ..

blogging 2008.08.31

집단지성 프로그래밍 책 받았습니다.

저번주 금요일 예약한 집단지성 프로그래밍 책을 받았습니다. 역시나 이책의 저자인 Toby Segaran이라는 분은 컴퓨터 생명공학 회사인 Genstruct 에서 약제 발현 원리 이해를 위한 알고리즘을 설계하고 데이터마이닝 기법을 적용하는 부서를 맡고 계신다는군요. 일전에 어디선가 주워 보았던 미국의 WallMart의 성장 동영상도 이분이 만드셨다는 것을 블로그를 보고 알았습니다. Python의 PIL(Python Imaging Library)를 이용해서 만든 1,380개의 이미지로 만든 동영상이라는군요,, 생물정보학 뿐만 아니라, 방대한 데이터를 다루는 모든 분들께 추천드리고 싶습니다. 여기서는 사용한 데이터를 살짝 생물학 데이터로 바꾸면, 정말 쉽고 흥미진진한 책이 나올꺼 같은데,,,

book story 2008.04.28

이런 책도 나왔군요,, 재미있겠는데

국내 번역서 제목은 "집단지성 프로그래밍" 원서 제목은 "Programming Collective Intelligence: Building Smart Web 2.0 Applications" 제목은 우선 접어두고, 한빛미디어의 새로운 번역서인데, 30일날 나온다는군요. 제목만 보고서는 자바스크립트나 Ajax 뭐 이런것들 나오겠거니 했는데 목차를 보니 이건 제 생각이 빗나가 버렸습니다. Programming Collective Intelligence: Building Smart Web 2.0 Applications 잠깐 주요 목차(낚시성 목차?? ^^)를 보시면, K-Means ClusteringNetwork VisualizationTraining the ClassifierTraining the TreeUn..

book story 2008.04.16