구글이 어떻게 수많은 데이터를 저장하고 처리하는지, 과연 이것을 어떻게 생물학의 데이터 처리에 활용할지에 대한 힌트를 얻고자 한다면 여기 PlatformDay 컨퍼런스에서 찾을실 수 있을겁니다. 솔직히 말씀드리면 당장은 자신이 하고 있는 연구에 적용해서 능수능란하게 사용하실 여건은 되지 않을것이지만, 충분한 아이디어는 얻을 수 있을것입니다. PlatformDay (출처 : NEXR 블로그) 다양하고 방대한 생물학 데이터를 여러가지 기계학습(machine learning) 기법을 통해 어떻게 처리해야 하는지에 대해 집단지성 프로그래밍 책을 통해 학습하고, 대량의 데이터의 기계학습을 위한 대용량저장/처리 방법을 PlatformDay에서 아이디어를 얻는다면 참 좋을것 같습니다.(말이 참 매끄럽지 않네,,,^^..
Genome Browser를 만들면서 한가지 고민에 빠지게 되었다. 이걸 왜 만들고 있는지에 대한 원초적인 질문에 답을 찾지 못하고 있다는 것이다. 왜 이걸 지금에야 생각하고 있는건지... 그동안 생물학자들은 여러가지 Genome Browser를 사용하고 있었지만, 그 생김새나 기능들은 그닥 큰 차이가 없기 때문에 별 어려움이 없이 사용하고 있다. 좀 불편하더라도 그 불편함을 모르고 그냥... 거기에다가 GMOD(Generic Model Organism Database project)에서도 GBrowse라는 브라우저를 제공하고 있다. 아마 이 브라우저가 가장 보편적인 Genome Browser의 표준(?)일 것이다. 그런데 이러한 기존 방식의 Genome Browser가 아닌 Google Map API를..
이전에 국내 바이오인포매틱스 관련 오픈소스 현황이라는 주제의 글에서 대용량 데이터 분석 환경 지원 부분에서 연구를 위해서 단순하게 슈퍼컴퓨터나 cluster 컴퓨터의 기본적인 환경만을 제공하는 것이 아니라 이러한 환경에 + 유틸리티를 덧붙여 제공해야 한다고 언급했었습니다. 그 일례로 Yahoo에서는 학교나 일반 기업에서 구비하기 힘든 Hadoop기반의 클러스터 컴퓨팅 자원에 대해서 학술 연구 목적으로 지원을 하고 있다고 했었죠. 슈퍼컴퓨팅 자원 + 이를 좀더 유연하게 활용할 수 있는 utility(야후에서는 Hadoop) Google의 official 블로그에서도 Supporting cluster computing in the research community이라는 글이 올라왔습니다. 역시나 Google..
이전 포스팅에서 총 3개의 Java Panel 만들고 Panel 자체를 이미지로 출력해서 Google Maps API에서 사용할 Custom Map Tile에 사용하기로 했다. 문제는 Sense Panel과 AntiSense Panel에 Genome 정보(SNP, CNV, Exon, Intron 등등등등)를 어떻게 표시할것인가?에 대한 것이다. 그전에 그러면 Bioinformatics에서 위의 정보들을 보여주기 위해서 사용하는 그래픽은 어떠한 것들이 있는지 간단히 살펴보자. BioRuby의 다양한 생물 정보 표시 그래프?? 위의 그림들은 흔히 우리가 Genome Browser에서 보는 표시형식들이다. box, line, line with handles, directed, directed box, tria..
일전에 한참 GoogleMap을 가지고 이런 저런 작업(?)을 하다가 주소나 우편번호를 입력하면 해당 위치가 지도상에 보여지도록하는 방법에 대해서 이리저리 알아보고 다녔던 기억이 났다. 이것을 가리켜서 전문용어(?)로 Reverse Geocoding이라고 한다. 그럼 이러한 주소정보만을 가지고 어떻게 해당지역을 지도위에 표시해줄 수 있을까?? 지도를 수십만개의 작은 영역으로 나누고 해당 영역마다 주소정보를 넣어 놓는 방법도 있을테고, 여기서는 작은영역이 작을수록 보다 정밀하게 주소에 대응하는 지역을 찾을 수 있겠다. 이외에도 뭐 생각한다면 여러가지 무식한 방법들이 많을테고... 내가 선택한 방법은 우선 전국의 우편번호와 우편번호에 따른 주소를 가기고 와서 이 우편번호에 대응하는 지도의 위도와 경도를 데이..
여기 계신분들은 이미 Biopipe는 알고 계실테고 Taverna는 Biopipe와 유사한데 뭐라 좀 말하긴 그렇고 암튼 요번에 KISTI의 CCBB에서도 Bioworks라는 Bio 워크플로우 툴을 만들었는데요,,, 자세한 내용은 http://socmaster.homelinux.org/~hongiiv 를 참고 각 기관에서는 서로 다른 서비스라고 말할수도 있겠지만 제가 보기에는 그나물에 그밥인것 같은데요,,, (암튼 요즘 왜이렇게 워크플로우 툴들이 많이 나오는지...) 제 생각엔 이러한 툴의 성능이나 기능보다는 어떻게 실 사용자들에게 좀 더 많은 정보와 손쉬운 접근을 가능하게 하느냐가 관건인건 같습니다. 달랑 툴하나 보단 그 툴을 사용하기 위한 그 무엇이 실사용자에겐 더 필요할것 같은데요. 그런 의미에서 ..