데이터베이스 2

우편번호로 지도를 작성하자 - MDS(Multi Dimensional Scaling) - 실패 ^^

예전부터 지도상의 좌표를 주소로 변환의 정확성을 높이기 위해 ML을 적용해야겠다는 생각만 했었는데, 오늘은 그 생각을 실행하기 전에 우선 약 5만개의 우편번호 데이터베이스에 우편번호에 해당하는 좌표간의 거리를 Km로 변환하고 5만x5만 행렬을 만들었다. 제법 100MB 넘는 행렬 데이터를 가진 텍스트 파일이 만들어졌다. 그런데 막상 R을 이용해서 MDS plot을 생성하려고 하는데,,, 여기 저기서 에러가 -.- 한참만에 알아낸건 바로 원본 DB에 문제가 있었다. 1) 중복되는 우편번호가 있다. (원래 그런건가??, 이건 배포하는 우편번호를 보고 확인해봐야겠다) 2) 우편번호가 달라도 좌표가 같은 것들도 있다.(이건 내가 만들때 그렇게 만들었기 때문에,,,) 3) 좌표값이 없는 우편번호가 존재한다. (이..

blogging 2008.06.30

우편번호에 대응하는 지도상의 좌표 DB

지난번 포스팅에서도 언급했고,, Web2.0과 인터넷지도에서도 언급했듯이 우리나라 우편번호에 해당하는 네이버 지도상의 좌표입니다. 간단하게 우편번호 DB의 주소를 네이버의 OpenAPI를 통해서 쿼리를 날려서 네이버 지도의 좌표값을 입력한 DB입니다. 대충 이렇게 생겼습니다. ^^ 물론 우편번호상의 주소가 네이버에 없는 경우가 있기 때문에 이런것들은 상위 주소?로 일괄적으로 넣었습니다. 따라서 이 DB는 정확하지 않다는 것을 알려 드립니다. 부탁하시는 분들이 좀 있어서 아예 블로그에 공개합니다. 우편번호지도좌표DB다운로드

Open API 2008.03.28