집단지성 3

집단지성프로그래밍 데이터셋을 입맛대로 바꾸기

지오코딩을 활용한 온라인 데이트 사이트 데이터 만들기 집단지성프로그래밍을 구입한지는 꽤 된거 같은데, 계속 가방속에서 자고 있다. 가장 관심을 끄는 부분부터 틈나면 읽어 나가고는 있는데, 요즘 9장을 좀 읽고 있다가 이전에 만들어 놓은 (리버스)지오코딩 서비스도 사용할 겸 사용되는 데이터셋도 국내용(??)으로 바꿀겸 간단히 코드와 데이터셋을 변경했다. 9장 고급 분류 기법: 커널 기법과 SVM을 보면 중매 데이터 세트가 나온다. 이 중매 데이터(matchmaker.csv)는 나이, 흡연여부, 자녀희망, 관심목록, 거주지의 형식으로 되어있는데, 마지막의 거주지는 4절 '분류 데이터의 특성'의 '야후! 지도를 사용한 거리 계산' 부분에서 설명이 나온다. 주소를 가지고 위/경도의 좌표 정보를 야후의 지오코딩 ..

blogging 2008.08.31

Freebase: 비(정지훈)를 넣어 놓다.

Freebase(집단지성의 저자도 이쪽으로 적을 옮겼다는군요 ^^)는 시맨틱하게 만들어진 공공의 데이터베이스(위키피디아 같은)인데,, 스피드레이서 정지훈을 살짝 넣어줬다. ^^;; Freebase의 Speed Racer에 포함된 정지훈~~ Freebase의 매시업인 Thinkbase로 그려진 Speed Racer 그래프 Freebase의 Data Model로 뭔가 해보면 좋을듯한데,,, 상당히 매력있는 사이트이다. 한번 가보는것이 좋을듯 ^^

blogging 2008.05.21

집단지성 프로그래밍 책 받았습니다.

저번주 금요일 예약한 집단지성 프로그래밍 책을 받았습니다. 역시나 이책의 저자인 Toby Segaran이라는 분은 컴퓨터 생명공학 회사인 Genstruct 에서 약제 발현 원리 이해를 위한 알고리즘을 설계하고 데이터마이닝 기법을 적용하는 부서를 맡고 계신다는군요. 일전에 어디선가 주워 보았던 미국의 WallMart의 성장 동영상도 이분이 만드셨다는 것을 블로그를 보고 알았습니다. Python의 PIL(Python Imaging Library)를 이용해서 만든 1,380개의 이미지로 만든 동영상이라는군요,, 생물정보학 뿐만 아니라, 방대한 데이터를 다루는 모든 분들께 추천드리고 싶습니다. 여기서는 사용한 데이터를 살짝 생물학 데이터로 바꾸면, 정말 쉽고 흥미진진한 책이 나올꺼 같은데,,,

book story 2008.04.28