국내에도 상당한 숫자의 기기가 퍼진걸로 알고 있는데, 얼마전 중국의 BGI도 왕창 구매한 시퀀싱의 민주화를 이끌고 있는 기기입니다. 네 LT의 IonTorrent입니다. IonTorrent는 기본 Torrent Suit라는게 분석을 해주는데, 여기서 부족한 것은 API를 이용하여 플러그인 형태로 개발이 가능합니다. 가령 이런것들이 되겠죠. Case 1) 여러대의 장비에서 별도로 생산된 read 데이터들을 한번에 분석한다거나 Case 2) 별도 내부의 유전체 등의 DB와 연동되어 specific한 결과를 생성한다거나 Case 3) 별도의 자체 제작된 알고리즘(RNA-Seq, ChIP-Seq 등등)을 이용 한다거나 Case 4) 암/신생아와 같은 clinical 한 리포트를 생성한다거나, BRCA 유전자 리..
나쁜 데이터는 데이터가 누락된 값이나 잘못된 기록과 같은 기술적인 부분뿐만 아니라 그보다 훨씬 더 많다. 이러한 데이터 문제를 이겨내기 위한 다양한 영역의 전문가들의 이야기를 나쁜데이터 핸드북에서 제시하고 있다. 물론 이쪽 업계(Bioinformatics)에서도 이런 나쁜 데이터를 흔히 접할 수 있다. 하지만, 오늘은 간단한 웹프로그래밍을 하면서 만난 나쁜 데이터에 대해서 이야기 해보려고 한다. 덧) 몰랐는데 이책의 역자가 KT에서 근무하는군요. ㅋ 사인이라도 받고 싶은데 말이죠. 요즘 민간뿐만 아니라 정부나 이쪽 업계 (genome research)에도 데이터의 공유와 더 나아가서는 big data에 대한 이야기와 함께 data science라는 말을 흔히 듣을 수 있게 되었다. 요즘에야 KTH API..
많은 분들이 GenomeCloud가 내부적으로 어떻게 클라우드 자원을 관리하고 유전체 데이터를 분석하는지에 대해서 궁금해 하셔서 간단하게 기술적인 설명을 해볼까한다. 일반 생물학 연구자들도 한번쯤 읽어두면 자신의 데이터가 어떻게 분석되는지 연구에 활용하려면 GenomeCloud를 어떤식으로 해야 할지에 대한 폭 넓은 안목을 가지게 될 수 있으니 강추!!! (-.-;;) 1. ucloud biz (클라우드 자원) CPU/메모리/디스크/OS/네트워크 등의 개별 자원을 제공하는 서비스로 GenomeCloud는 분석할 대상에 따라 개별 자원들을 조립하여 사용합니다. 분석에 대한 요청이 들어오면 개별자원을 조립하고 분석을 수행한 후 다시 개별 자원을 반납하게 됩니다. ucloud는 하나의 가상서버(Virtual ..
블로그의 유입 키워드를 보다가 재미난것들이 있어서 소개해 보려고 한다. 걍 빵 터지는 것은 없어도 ㅋㅋㅋ 서정선 이종은 한국인 백인유전자 개체 'ensembl'이 없습니다 수전증 아빠 원인 적금해지비율 난 단맛만좋아 남자친구 귀지 서정선 교수와 이종은 사장을 나란히 검색한 사람은 과연 뭘 알고 싶었을까? 두사람이 사귀나 뭐 그런거?? -.-;; 한국인 백인유전자 서양인과 결혼하면 됩니다. 앙상블을 설치하세요 수전증은 아빠가 원인이 아니라 술을 끊으세요. 적금은 오래 가지고 계세요. 단 맥북 사시려거등 해지하세요 나도 단맛이 좋습니다. 파주세요....