blogging

즐거운 모니터링 - 두번째 이야기

hongiiv 2008. 10. 22. 18:20
반응형
오늘도 모니터링에 대한 이야기인데요, 모니터링 대상이 조금 바뀌었습니다. 바로 질병입니다. 예전에 HealthMap(Global Dsease Alert Map)이라는 서비스에 대해서 언급한적이 있는데요, 이 서비스는 ProMED Mail, WHO, Google News 등등 수많은 웹사이트에서 질병에 대한 정보를 모아서 이를 구글맵에 보여주는 서비스입니다.

healthmap
10월 초에 조류독감에 대한 내용들이 우리나라에 보고되고 있지만, 안심 수준인 주황색입니다.

서비스는 간단한데, 이를 구축하는것은 꽤나 복잡합니다. 20,000여개의 웹 사이트의 정보를 나타내는 ProMED Mail 등의 14개의 소스로 부터 질병정보, 지리정보, 질병대상 등등의 정보를 수집하고 이를 자신들이 이미 만들어 놓은 딕셔너리를 통해 카테고리화한 후 클러스터링의 작업을 거쳐 해당 정보가 위험도가 높은 뉴스인지, 경고 수준인지, 이미 지난 뉴스인지 등을 필터링하여 이를 위치정보와 결합하여 구글맵에 보여주게 됩니다.

왠만한 기술이나 알고리즘은 다 들어가는 군요,, ^^ 자연어 처리, 머신 러닝, 텍스트 마이닝 등등등...전세계의 모든 웹사이트들이 어떠한 표준을 가지고 질병에 대한 뉴스를 따로 제공하지 않는 이상 어쩔 수가 없는 상황이겠죠,

물론 따로 제공한다하더라도 일반인들이 만들어내는 블로그의 글이나 기타 메타블로그와 같은 곳에 수집된 검증되지 않는 질병정보들도 스며든다면, 어떠한 예측도 가능할 것 같다는 생각이 들기도 합니다. 만일 한국의 어떤 지역의 블로거들이 복통을 호소하는 글들이 요 몇일 자주 올라오는 것을 캡쳐해서 이를 식중독과 연결할 수도 있고, 향후 전세계적으로 식중독이 창궐?한다면 그 발원지를 해당 블로그를 통해 얻어진 정보를 가지고 알아낼 수도 있겠죠,, 물론 어렵겠지만 말입니다. 뭐 웹2.0을 통한 역학조사나 질병통제 정도 되겠죠 ^^;;

여기서 잠깐 투모로우라는 영화를 보면 주인공이 대통령 앞에서 빙하가 덮치고 있다면서 지도를 활용하는 모습을 볼 수 있습니다.

그림 6
그림 2
점점 내려오고 있습니다. 망했네 -.-

그럼 국내의 정보들을 모아서 질병 지도를 만들어 볼까? 생각했습니다. 좀 뒤적거려 보니깐, 우리나라의 CDC 질병관리본부에서도 질병에 관한 뉴스를 제공하고, 각종 포털이나 언론사에서도 항상 뉴스는 제공하고 있죠. 하지만 여기서 정보를 추출하기는 역부족이고, 그래서 간단하게 HealthMap의 정보를 가져와서 국가를 선택하면 지도 대신 게이지를 통해서 위험정도를 보여주고 대표 질병 정보도 함께 나타나도록 만들면... 대충 이런 모습이 되겠죠,,

Disease OutBreak
대시보드 위젯을 통해서 국가를 선택하면 해당 국가의 위험정도를 ^^;;

대표 질병정보와 함께 어떻게 대처해야하는지,,등의 부가정보도 찾을 수 있게 만든다면, 해당 국가를 여행하려는 여행객들은 들러서 예방접종은 뭘해야 하는지 등의 부가 정보를 얻도록 ^^ 아직 완성 안되었거든요 조만간 잘 추스려서,,, 공개하겠습니다.
반응형