blogging

원더걸스냐? 소녀시대냐? 순위 예측하기

hongiiv 2009. 2. 27. 01:23
반응형
오늘,,아니 어제군요,, "구글님은 독감 창궐도 예견하신다"라는 글을 보았습니다. 구글에서 나온 네이처 논문에 대한 글인데, 간단히 요약하자면 구글에서 지난 몇년간 독감에 관련된 검색어와 실제 CDC에서 발표하는 독감 정보를 가지고 예측 모형을 만들었는데 그게 맞는다는 것이었습니다.

그래서 과연 이것이 국내에서도 먹힐 것인가?에 대해서 간단히 살펴봣습니다. 우선 Google Trends에서 소녀시대와 원더걸스의 검색어 추이와 SBS에서 제공하는 가요순위를 두 그룹이 동시에 활동한 시기인 2007년 11월 부터 2008년 6월 까지만 살펴봤습니다.

언뜻 보더라도 각 그룹의 검색어 추이와 실제 가요순위 추이가 같은걸 볼 수 있습니다. 이로써 간단하게나마 구글 트렌드를 통해서 가요순위도 예측할 수 있는 모형을 만들 수 있을 수도 있다는 생각이 드는군요 ^^;; 한번 딥하게 해봐 -.-;;

원더걸스

그럼 각 그룹의 이름과 함께 순위에 영향을 줄만한 높은 상관 관계를 가지는 멤버(검색어)는 누굴 정할 수 있을까요?

원더걸스
원더걸스의 경우 소희 정도가 상관관계가 있는 검색어,,,

소녀시대,원더걸스
소녀시대의 경우 태연, 티파니, 수영(이건 소녀시대 수영이 아니라 swimming -.- 여름철에 뛰는 걸 보면), 윤아 정도인데,, 수영은 아무래도...

저런식으로 높은 상관 관계를 가지는 단어를 뽑고 가중치를 만들어서 순위 예측 모형을 만들면 되곘군요, 갑자기 검색회사가 갖고 싶어졌다.
반응형