분류 전체보기 749

지금까지의 gwas는 잊어라, 새로운 연구 패러다임

지금까지 질병관련 유전자를 찾는 gwas 연구에서 있어서 몇가지 트렌드를 짚어보자면 다음과 같다. 1. 불과 몇년전만 하더라도 아니 아직까지도 많은 수의 샘플을 모으는데에 있어서 어려움이 따른다. 2. 한 사람 한사람 유전정보를 얻기 위한 Genome-wide SNP chip 가격이 점점 하락하고 있다. 3. 대부분의 연구가 유럽인을 조상으로 두고 있는 흔히 말하는 European을 중심으로 연구가 진행되어왔다. 4. 개별적으로 진행되었던 연구들이 모아지고 이를 통한 meta 분석이 현재 주를 이루고 있다. 5. 기존의 연구 결과에 대한 검증 연구가 이루어지고 있다. 이러한 현재 트렌드와 더불어 다음과 같은 꾸준한 움직임이 포착되어지고 있는데 하나씩 살펴보자면 다음과 같다. 1. 질병외에 다른 trait..

STRUCTURE 프로그램을 이용한 Population Structure 분석

STRUCTURE라는 프로그램과 SNP 데이터를 이용해서 population structure를 분석하는 방법입니다. 예전에 128개의 SNP으로 분석하는 방법에 대한 글은 이곳을 클릭하시기 바랍니다. 윈도우용 프로그램을 다운로드 하셔서 위의 링크의 예제 파일을 다운로드하신 후 분석하시면 됩니다. 한국인의 infomative한 SNP 마커 발굴에 관한 논문은 다음의 논문을 참고하시면 됩니다. Int J Legal Med (2010) 124:125–131 DOI 10.1007/s00414-009-0389-9 Development of SNP-based human identification system View more presentations from Hong ChangBum

갤럭시를 이용한 Exome 데이터 분석

가끔 어디서부턴가 유래를 알 수 없는 데이터를 받게 되고 또 그것을 분석해야 하는 일들이 종종 생기게 된다. 최근(지금은 아니지만)에는 그러한 데이터중의 하나가 바로 NGS 시퀀싱 데이터였다. 몇 년전 Roche/454의 pyrosequencing을 통해 생성된 데이터였는데, SFF 형태로 데이터를 받게 되었다. 454라는 것은 알고 있었는데 그 당시만 해도 당췌 Flowgram이 뭔지, SFF를 fastq 포맷으로 바꾸느라 삽질하고 이것저건 mapping/variant call 프로그램들 셋팅하느라 시간 보낸걸 생각하면 요즘은 참 세상이 많이 좋아졌다라는 생각을 하지만 여전히 예전의 나처럼 삽질하고 있는 또는 삽질할 분들께 도움이 될까하는 마음에 ^^;; Life Techologies의 SOLiD 데이..

인체 미생물과 한국인 SNP을 기반으로 하는 포렌식 사이언스

범죄 수사에 있어서 DNA는 STR profile, 미토콘드리아 DNA 염기서열이 가장 많이 사용되고 있다. 더불어 이에 대한 각종 연구와 데이터베이스 또한 잘 연구/구축되어 있다. 미국 FBI는 미국의 각 주정부와 연결된 범죄자의 유전자를 조사를 실사하는 CODIS라는 시스템을 갖추고 있으며, 이 시스템에는 400만명의 DNA 자료가 축적되어 있다고 한다. 미국 FBI는 표준 13개의 STR을 검사하고 이를 통해 신원을 파악하는데에 이용하고 있다. 이는 13개라는 비교적 적은 수의 마커를 통해 강력하게 개인 식별이 가능하기 때문에 많이 사용되고 있다. 911과 DNA 그리고 IT 인프라 그러나 911과 같이 시신이 많이 훼손된 경우 온전하게 13개의 STR 마커를 확보하기 어려웠기 때문에 STR, 미토..

공공보건과 NGS+Bioinformaics+클라우드 컴퓨팅의 만남

요즘 유럽이 장출혈성 대장균 (EHEC, enterohemorrhagic E. coli)으로 인해 떠들썩하다. 대장균(colon bacterium, 학명은 Escherichia coil,Escherichia속 세균의 1종)은 사람이나 동물의 장 속에 사는 세균으로 특히 대장에 많이 존재하기 때문에 대장균이라고 불리운다. 질병관리본부 국립보건연구원 감염병센터(7과)의 장내세균과에서 이러한 장출혈성 대장균에 대한 연구가 이루어지고 있다. "중국 BGI에서는 이 장출혈성 대장균이 서로 다른 2종의 박테리아가 결합된 변종으로 치명적인 유전자를 갖고 있다고 밝혔다. STEC(시가 톡신 생성 대장균, Shiga toxin producing Escherichia coli)로 불리는 변종으로 판명된 이 박테리아는 중앙..

CTO 당신만 보세요 - 바이오인포매틱스와 Hadoop의 만남은 필연적

벌써 몇 년전부터 데이터 쓰나미라는 표현이 딱 들어 맞는 일들이 생명공학 분야에서 일어나고 있다. 그때마다 도마위에 올라오는 이야기는 바로 그리드, 클러스터, 슈퍼컴퓨터, 클라우드라는 단어들이었고 이러한 하드웨어와 맞물려서 MapReduce와 HDFS™의 기반의 Hadoop이 언급되었다. 아니 지금도 다들 바이오인포매틱스에는 하둡이 필요하다고 말하고 있다. 하지만 Hadoop은 하나의 플랫폼으로 이를 실무에서 사용하기에는 하드웨어 및 이에 따른 설정이 그리 쉽지만은 않은 상황이다. 요즘 누구나 다 바이오인포매틱스와 Genomics에 불을 켜고 마치 가로등에 나방들을 보고 있는 것 같은 상황에서 변변한 Hadoop 플랫폼 하나 제공하고 있지 못하는 국내의 현실을 보면 그저 안타까울 뿐이다. 특히나 의사결정..

당신의 유전자에 대한 권리는 당신에게 없다

얼마전 미국 뉴욕 지방 법원 로버트 스위트 판사는 2010년 3월 29일 미국시민자유연맹(ACLU)이 생명공학 업체인 미리어드 제네틱스를 상대로 유전적 유방암 진단에 대한 특허에 대한 무효화 소송에서 특허에 대해 단순히 인체에서 일어나는 작용을 규명했을뿐 이는 특허로 보호 받을 만한 대상이 아니라는 판결을 내렸다. 지금까지 알려진 당신이 지니고 있는 유전자 중 20%는 당신에게 권리가 없다 1998년 10월 미국 특허청이 생명공학회사인 인사이트에게 최초로 인간 유전자에 대한 특허를 내준것을 시작으로 지금까지 많은 생명공학회사들은 인간 유전자에 특허를 신청했다. 생명공학 회사들은 유전 질환에 대한 치료약을 개발하거나 검사에 대해서 치료법을 제어 할 수 있도록 특허 권리를 챙기고 있으며, 지금까지 알려진 유..

23andMe는 상업 회사가 아니라 연구기관이다??

얼마전부터 사람들이 23andMe 가격 정책이 바뀌었다는데요? 라고 물어보는데, 23andMe 서비스에 접속해 본지도 오래된지라 아는척을 하지 못하고 머뭇거리고만 있었다. 그리고 마침내 오늘에서야 이 질문에 답해 보려고 한다. 23andMe의 현재까지 수익은 얼마나 될까? 현재까지 공식적으로 밝혀진 것은 23andMe의 고객은 75,000명 (23andMe의 CEO가 언급, 10th Systems Biology & P4 Medicine) 이라고 말하고 있다. 고객당 평균 $300의 비용을 들여 서비스를 받았다고 할 경우 수학정석에 나와 있는 공식에 의해 75000*300= $22,500,000 = 24,592,500,000 원 (오늘환율 1,093원 적용시) 즉 현재까지 2백4십억여원의 수입이 발생한걸로..

블로그 이제 정리합니다.

"보건복지부 질병관리본부 국립보건연구원 유전체센터"에서 7년이 넘는 시간을 보내고 5월 2일부터는 KT로 출근합니다. 학교를 졸업하고 처음으로 발을 디딘곳이 유전체센터였고, 그 곳에서 너무 많은 분들의 도움으로 많은 것들을 배우고 또 많은 것들을 경험하게 되었습니다. 생물학의 전반적인 부분이나 유전체, 통계에 대한 풍부한 지식을 가진 많은 분들과 함께 일을 할 수 있어서 저에게는 매우 즐거웠던 시간이었었고, 그러한 분들이 없었더라도 지금의 저는 분명 없었을 것입니다. 마지막으로 한분 한분 만나뵈면서 인사를 드린다고는 했지만, 미처 인사를 드리지 못한 분들께 다시 한번 이 자리를 빌어서 감사하다는 말씀 드리고 싶네요. 많은 분들이 연구하던 놈이 왠 전화국이냐?라고 말씀하시는데… 이 부분에 대해서는 따로 기..

blogging 2011.05.01

BioSMACK: Genome-wide association 분석을 위한 리눅스 라이브 시디

예전에 유전통계 워크샵에서 교육용으로 만들었던 리눅스 시디(BioSMACK)에 대한 발표자료입니다. 기본적인 GWA 도구와 매뉴얼, 예제 데이터를 넣어 만든 라이브 시디였는데, 교육에도 사용하고 홍콩에서 열린 IEEE BIBM 2010에도 발표하게 되었죠. 내일은 화요일마다 열리는 센터 세미나 시간인데, 홍콩 학회 (작년 12월)와 BioSMACK에 대한 간략한 발표가 있어서 자료를 만들어봤습니다. 아직 이런 스타일의 발표 자료는 만들기도 힘들거니와 (괜히 어설프게 했다간 오히려 의사 전달에 장애만 생기고 -.-;;) 센터 세미나 시간에 너무 파격적인거 아닌가??? 하는 생각도... 참고로 파워포인트블루스 저자의 발표 자료인데, 발표자료 만드실때 참고하시면 될것 같습니다. 여전히 파워포인트 자료는 프린트..

blogging 2011.04.04