유전자정보분석

공공보건과 NGS+Bioinformaics+클라우드 컴퓨팅의 만남

hongiiv 2011. 6. 7. 02:20
반응형
요즘 유럽이 장출혈성 대장균 (EHEC, enterohemorrhagic E. coli)으로 인해 떠들썩하다. 대장균(colon bacterium, 학명은 Escherichia coil,Escherichia속 세균의 1종)은 사람이나 동물의 장 속에 사는 세균으로 특히 대장에 많이 존재하기 때문에 대장균이라고 불리운다. 질병관리본부 국립보건연구원 감염병센터(7과)의 장내세균과에서 이러한 장출혈성 대장균에 대한 연구가 이루어지고 있다.

"중국 BGI에서는 이 장출혈성 대장균이 서로 다른 2종의 박테리아가 결합된 변종으로 치명적인 유전자를 갖고 있다고 밝혔다. STEC(시가 톡신 생성 대장균, Shiga toxin producing Escherichia coli)로 불리는 변종으로 판명된 이 박테리아는 중앙아프리카공화국에서만 발견된 장응접성대장균(Enteroadherent E. coli, EAEC)와 염기서열이 93% 일치하며 장출혈성대장균(EHEC)의 염기서열의 특성도 갖고 있다고 말하고 있다. STEC는 아미노글로코시드 계, 매크로라이드 계, 베타락탐 계 등의 항생제에 내성이 있는 유전자를 포함하고 있어 치료가 더욱 어려운 것으로 분석되고 있다. " - 국내 기사들 참고

이러한 보고가 나온것은 독일 함부르크대학과 공동으로 BGI가 이 박테리아의 염기서열을 해독했기 때문으로 high-throughput 기술 (NGS)과 Bioinformaics가 공공보건(public health)에 기여한 결과이다. 그리고 마지막으로 바로 클라우드 컴퓨팅의 도움이 있었기 때문이다.

2011년 5월 21일
독일에서 장출혈성 대장균(EHEC)으로 첫 사망사 발생

2011년 6월 2일
BGI에서 IonTorrent라는 NGS 장비(5개의 chip 사용? 5 run?)로 시퀀싱 데이터 생산하고 이를 ftp에 공개

시퀀싱 Read File


2011년 6월 2일 몇 시간 후
Nick Loman(@pathogenomenick)이 MIRA라는 de novo assembly 프로그램을 통해 완전한 염기 서열을 발표 (assebled)

Edge Bio사에서 CLC Genomics Workbench 프로그램의 기본 옵션을 가지고 de novo assemble을 수행 (CLC의 trimming과 FastQC 프로그램을 통한 trimming한 read 데이터 및 mapping 데이터 제공) assemble을 trimming하지 않은 데이터를 사용

최종 서열 정보

2011년 6월 3일 아침
Era7 bioinformatics사에서 Nick이 assemble한 데이터를 기반으로 annotation 정보를 공개 - BG7 파이프라인이라고 불리는 자신들의 분석 프로세스를 통해 분석하였으며 이는 Amazon EC2를 통해 접근이 가능

그 결과를 영국 Hinxton의 Welcome Trust Conference Centre에서 열린 Applied Bioinformatics & Public Health Microbiology에서 발표

여기서 과연 독일에 왜 중국의 BGI를 통해 시퀀싱을 수행 했는지 자세한 내막은 알 수 없지만... 그건 그렇고 NGS 기술과 클라우드 컴퓨팅의 발전으로 공공보건에서 활약이 앞으로도 많은 기대가 된다. 한편으로는 과연 국내에서도 이렇게 데이터를 바로 공개하고 많은 연구자들의 참여가 이루어질 수 있을까?라는 생각을 한번 해보게 한다.

이를 계기로 LT의 Ion Torrent는 인기가 급상승할 듯하다. 요즘 chip이 많이 발전해서 throughput도 좋아지고 또한 Ion Torrent 자체가 이러한 미생물 시퀀싱 등에 사용하기에 좋은 DNA Desktop Machine이니... 이번 기회에 질병관리본부도 Ion Torrent 영업하면 먹힐듯 ㅋㅋㅋ

<참고>
미생물
미생물 (Microorganisim)은 0.1mm이하의 미세한 생물로 조류(algae), 세균류(bacteria), 원생동물(protozoa), 사상균류(fungi), 효모류(Yeast), 바이러스(virus) 등이 이에 속한다.

미생물과 NGS
요즘 NGS를 이용한 metagenomic seqencing을 통해 인체 장내에 수백만의 유전자를 갖는 미생물을 동정하는 연구가 활발히 진행중이다. 장내 미생물들이 보유하는 유전자의 수는 인제 전체의 유전자 수보다 많으며 이들의 구성과 활동은 인체의 성장발육과 매우 밀접한 관계가 있다고 알려져 있으며 여러 중요한 질병의 발생은 모두 장내 균 무리의 구성과 밀접한 관계가 있다는 연구들이 있지만 어떤 미생물 종이 얼마나 다양하게 분포되어 있는지에 대해서는 구체적으로 알려지지 않았다. 최근 이러한 장내 미생물의 유전체를 분석한 연구는 중국의 북경지놈연구소(BGI, Beijing Genomics Institute)에서 주도적으로 연구되고 있다.


반응형