KT의 GenomeCloud 서비스에는 연구자가 손쉽게 Reference Genome에 대해서 Mapping과 Variant Call을 해주고 데이터를 관리해 주는 g-Analysis라는 서비스가 있습니다. Mapping을 수행하고 나면 BAM이라는 표준 포맷으로 결과를 제공하고 있는데, 이 파일은 Human의 경우 대략 100 ~ 200 GB 정도의 크기가 됩니다. GenomeCloud에서의 BAM 파일 활용법 이 파일을 가지고 Variant Call 이나 Genome Browser를 통해 시각화하는데에 사용됩니다. 그래서 GenomeCloud 서비스에서는 다음의 4가지 방법으로 이 파일을 사용할 수 있도록 하고 있습니다. GenomeCloud에 그냥 보관 (저희가 안전하게 보관해 드립니다. 1개월 또..
지난 1년여 남짓 KT라는 회사에 들어와서 정말 필요한 서비스가 무엇인지 고민하고 또 그것을 어떻게 연구자들에게 좋은 모습으로 보여드릴까 고민한 흔적이 이번 "GenomeCloud"라는 서비스로 베타 테스트를 진행하게 되었습니다. 실제 필드에서 산/학/연 모두가 서로 윈윈할 수 있는 그런 서비스를 출시하기 위해 노력했고, 아직은 부족한 부분이 더 많지만, 우선 매 맞을 각오로 오늘 이렇게 선보이게 되었습니다. 우선 서비스는 다음의 두가지로 나뉘어집니다. 바이오인포매틱스 연구자를 죽이는? g-Cluster 저도 한창 이런저런 분석을 하던 시절 제일 불편했던 점 (그 반대로 핑계가 되어 나를 보호해준?)이 내가 원하는 시간에 바로 분석을 할 수 없었던 점입니다. 항상 연구소나 학교의 컴퓨팅은 바쁘게 돌아가죠..
ReadWriteWeb에 실린 "How Big Data Is Improving Helathcare"를 보면 "Big data in Healthcare Hype and Hope"라는 보고서가 있다. 해당 보고서에 따르면 현재 빅 데이터가 6가지 방법으로 우리의 건강(Healthcare)을 돕고 있다고 이야기 하고 있다. 개인적으로 천식환자를 트래킹하고 정보를 수집, 이를 활용하는 Asthmapolis (천식나라)와 SNS를 통한 질병 관측 지도를 보여주는 Sickwether (아픈날씨) 서비스는 꽤 흥미로왔다. 특히 Sickwether와 같은 경우 맘스홀릭과 같은 커뮤니티나 앱을 통해 데이터의 질/양적 향상을 도모하고 읍면동 단위의 예보를 통해 지역 병원 및 약국 의약품 광고 + 건강관련(피트니스센터, 동..
Science Translational Medicine의 Rapid Whole-Genome Sequencing for Genetic Disease Diagnosis in Neonatal Intensive Care Units 두개의 새로운 알고리즘 (SSAGA and RUNES)과 일루미나의 새로운 시퀀서(Illumina HiSeq 2500)를 이용하여 whole genome seqencing의 신생아에게 적용하여 신속하게 유전질환의 진단에 사용 캔자스시티의 Children's Mercy Hospital의 Stephen Kingsmore가 이끄는 Center for Pediatric Genomic Medicine에 따르면 50시간내에 혈액채취에서 WGS를 수행하고 진단까지 수행하고 약 $13,500 (1천..
요즘 ENCODE 프로젝트가 publish 되면서 이것과 관련한 여러 이슈들이 나오고 있습니다. 기본적으로 이따우 프로젝트를 할 필요가 있는지의 논쟁부터 시작해서 데이터가 갖는 의미를 비롯해서 데이터를 분석하는 툴들을 모아 이미지 형태로 제공하여 손쉽게 누구나 분석을 재현할 수 있도록 하는 등등 상당히 핫한 내용들이죠. 하지만, 오늘 말씀드릴 내용은 바로 분석에 DNAnexus라는 상용의 서비스를 사용했다는 것입니다. 스탠포드 대학에서는 ENCDOE 데이터중에서 ChIP-seq 데이터를 분석하는데 참여했드랬죠. Arned Sidown와 Serafim Batzoglou의 포닥으로 계신 Anshul Kundaje (현재 MIT의 research scientist로 옮김) 가 119명의 다양한 셀라인의 ChI..
게놈에서의 표준이라는 것을 논하기 전에 표준이라는 사전적 의미를 보면 "일반적인 것 또는 평균적인것"이라는 의미가 있다. 이러한 표준의 예문 중 하나를 보자면 "그사람 정도의 키면 한국 남자의 표준은 된다" 한국인 남자의 표준 키가 있기에 우리는 그사람의 키를 가늠할 수 있을 뿐만 아니라 이 표준을 가지고 옷을 만들거나 버스 천정의 높이를 정한다거나 등 여러가지로 활용이 가능하다. 가령 미국인의 표준에 맞추어진 버스를 우리가 탄다면 대부분의 한국인은 높은 곳에 손잡이가 위치해 있어 불편할 것이다. 그러기에 한국인 표준이라는 것이 있으면 좋다. 물론 없으면 좀 불편하겠지만 말이다. 그럼 한국인 게놈 표준이라는 것은 뭘까?를 고민하기 전에 우리가 유전체를 통해 현재 하고 있는 일에서 불편한 점을 생각해 본다..