Fork me on GitHub 단맛만좋아요 :: 단맛만좋아요

Deep Genomics
2017.01.12 07:53 | blogging

누가 뭐래도 요즘 화두는 deep learning이 아닐까? 그렇다면 현재 genomics 또는 이와 관련하여 어떤 움직임들이 있는지 한번 알아보도록 한다.


유전질환 딥러닝 - Face2Gene

예전 칼 짐머의 "Game of Genomes"의 시즌1의 두번째 에피소드인 "깨어진 코드"편을 보면 이런 장면이 나온다.  칼 짐머가 자신의 염기서열을 시퀀싱 하기로 한후 보스턴의 브리검여성병원의 로버트 그린은 칼 짐머의 얼굴을 유심히 보는 장면이 나온다.


“전 지금 유전병에서 나타나는 얼굴의 특징을 찾고 있는 거에요” 브리검여성병원(Brgham and women’s hospital)의 로버트 그린이 말했다. “눈의 모양, 귀가 너무 낮게 있지는 않은지. 귀가 복잡하게 생기진 않았는지” 그린박사는 사무실을 앞뒤로 걸어보도록 했다. 나는 웨스트민스터 도그쇼의 테리어 같다는 느낌이 들었다. 몇몇 유전병은 걸음걸이에 숨겨져 있다고 그린이 설명했다.


유전병은 얼굴이나 걸음걸이 등에 숨겨져 있다는 것이다. 굳이 genome을 분석하지 않더라고 말이다. 바로 이부분을 실제 만든 서비스가 바로 "Face2Gene"이라는 앱으로 이들은 "smart phenotyping better genetics"라는 슬로건을 내걸고 있다.




사진을 올리면 딥러닝을 통해 눈꺼풀이 얼마나 좁은지? 귀는 얼굴에서 얼마나 낮은지? 등을 정량화하고 얼굴과 가장 가능성이 있는 증후군에 대해서 순위를 매겨 보여주는 한편 위의 그림처럼 히트맵을 오버레이 시켜 어떤 특징이 가장 일치 하는지를 보여 준다.


유전변이 발굴 딥러닝 - DeepVariant

얼마전 미 FDA에서는 NGS를 통해 생산된 데이터에서 얼마나 variant를 잘 찾는지에 대한 챌린지를 수행한적이 있다. SNP와 INDEL 두부분으로 나누어 미리 정답을 알고 있는 샘플의 FASTQ 파일을 제공하고 이를 참가자들을 알고리즘을 통해 분석된 결과와 얼마 일치하는지에 대해서 평가를 수행했는데 SNP 부분에서 1등을 차지한 곳이 베릴리 라이프 사이언스 (전 구글 라이프 사이언스로 구글의 지주회사인 알파벳의 계열사)가 1등을 먹었다.


바로 이 베릴리 사이언스가 variant를 찾는데 사용한 기법이 바로 딥 러닝 기법으로 기존의 GATK 같은 툴들이 베이지안 확률을 통해 찾는데에 비해 pileup 파일을 이미지화 하여 CNN(Convolutional Neural Network)를 이용하여 정확도를 높였다. 



변이 해석 딥러닝 - Watson for Genomics

이미 왓슨은 국내에도 도입되어 운영되고 있는데 이는 Watson for Oncology로 NGS등을 통해 생산된 Somatic mutation (VCF 또는 MAF 파일) 이나 Copy number variation (log2 format)을 입력받는 genomics에 특화된 부분은 Watson for Genomics(Watson Genomics Advisor)로 현재 개발중에 있다.


최근 기사에서는 일루미나가 자사의 TruSight 170 패널을 통해 생산된 NGS 시퀀싱 데이터에 대한 해석을 Watson for Genomics를 통해 올해 안에 제공할 예정이라고 한다.




Watson for Genomics는 임상에 포커스된 결과들을 제공하게 된다.

  • List of Dysfunctional Proteins
  • IBM Developed Driver Score
  • Targeted Therapies


이외에도 Pathway Analysis, Drug Recommendation 정보를 제공한다.




결론

현재까지 genomics와 이와 관련된 부분에서 어떻게 딥러닝이 활용되고 있는지에 대해서 알아보았다. 이제는 환자의 유전체 데이터 생산전부터 딥러닝이 활용되기 시작하여 최종적으로 유전체 데이터를 분석하고 해석하는데에 딥러닝이 활용되기 시작되었다. 그렇다고 우리의 직업이 없어질 것인가? 이제는 좀 더 큰 시야를 가지고 이러한 딥러닝을 어는 부분에 적용할지와 함께 트레이닝 데이터에 대해서 어떤 종류의 데이터를 얼마나 어떻게 확보할지 그리고 어떻게 훈련 시킬지에 대해서 생각해봐야 할 것이다.



저작자 표시 비영리 동일 조건 변경 허락
신고
Software enginner of GenomeCloud. Covers bioinformatics, computational biology, and life science informatics.
Posted in : blogging at 2017.01.12 07:53
Currently 댓글이 없습니다. comments want to say something now?
23andMe 재단장
2015.10.28 21:25 | 개인유전체분석

국내 질병 예측성 유전자 검사 현황

지난 19일 "질병예측성 유전자 검사의 개선방안 공청회"가 진행되었다. 공청회의 질병관리본부의 질병예측성 유전자 검사의 관리에 관한 용역 결과에 대한 세션에서 의하면 유전자 검사를 6개의 카테고리로 나누어 관리하는 방안으로 카테고리 1~4까지는 기존의 유전자 검사에 해당하며 카테고리 5와 6의 경우는 다음과 같은 기준으로 나뉘어 관리하도록 하고 있다.


질병관리본부의 질병예측성 유전자 검사 관리 용역 결과 유전자 검사 분류


이에 유전체기업협의회의 경우 기존 검사와 더불어 질병예측성 유전자검사와 웰니스 유전자 검사의 카테고리로 나누어 관리하고자 하고 있다. 특히 웰니스 유전자 검사의 경우 DTC를 허용하는 것을 골자로 하고 있다.


유전체기업협의회의 유전자검사 분류 방안

미국의 질병 예측성 유전자 검사 현황

미국의 경우 2006년 23andMe가 질병 예측성 유전자 검사를 DTC를 통해 시작한 이후 13년 FDA의 판매중지 명령에 의해 수행되지 못하는 실정이다. 


다만, 최근 15년 2월 FDA는 이중 상염색체열성유전질환(autosomal recessive disorders)의 유전자 검사에 대해서 의료기관을 거치지 않고 일반 임신진단키드와 같이 일반인이 직접 구매하여 사용할 수 있도록 DTC를 허용했다. 정확히 지난 14년 6월 bloom syndrome이라는 상염색체열성유전질환에 대해서 FDA에 승인(clear) 요청이 있었고 이를 올해 2월 승인 후 10월달에야 decision summary가 공개되었다.


FDA의 승인 내용은 해당 검사에 대해서 Class II로 분류하고 "Autosomal Recessive Carrier Screening Gene Mutation Detection System"이라는 기기타입(Device Type)과 PKB라는 상품코드(Product Code)를 부여하여 관리되는 한편 해당 승인과 더불어 상염색체열성유전질환은 의사를 거치지 않고도(DTC) PMA가 아닌 의견 수렴을 위한 30일간의 최소 부담의 규제만으로 제공이 가능하다는 것을 포함하고 있다.


지난2월 FDA의 승인 후 실제 서비스를 위한 decision summary가 이번달 릴리즈 되면서 23andMe는 발빠르게 웹페이지를 단장하고 새로운 서비스를 제공 준비를 하고 있다. 23andMe는 승인시 제출한 bloom syndrome외에도 36개의 상염색체열성유전질환(cystic fibrosis, sickle cell anemia, Tay-Sachs 등)에 대한 검사도 제공한다.

예측성이 아닌 유전질환의 보인정보

23andMe로서는 기존의 health라는 메뉴를 통해 질병예측성 정보를 제공하는 Health Risks와 Drug Response를 과감하게 현재로서는 포기 했지만, 기존의 health 메뉴중 하나였던 Inherited Conditions에 대해서는 FDA의 승인이라는 값진 선물을 받았다. 


기본적으로 유전자 검사가 임상에 도입되기 위해서는 해당 검사를 이용함으로써 얻을 수 있는 이익과 위험도를 평가하는 임상적 유용성(clinical utility)이나 해당 질환을 정확하게 예측하고 검출하는 임상적 타당성(clinical validity)를 질병예측성유전자 검사가 만족할만한 수준이 아니기 때문에 우선 이를 만족할 수 있는 유전질환에 대한 승인을 시작했으나 점차 예측성 부분으로 승인을 확장할 것으로 보인다. 이번 승인은 23andMe로서는 어쩔 수 없이 유전질환이 타깃이었지만 어찌보면 기존의 분자진단 업체들의 밥그릇을 빼앗아 올 수 있는 기회가 된 것일 수도 있다. 뭐 이게 메인인 서비스들이 막강히 버티고 있고 어차피 23andMe는 보인자 정보가 메인은 아니니...


DTC로서의 Inherited Condition

이번 승인은 모든 유전질환이 아닌 자손에게 유전질환에 대한 risk를 물려 줄 수 있는지에 대한 검사로 현재 대부분은 한국인을 포함한 아시안에서는 그리 유용한 검사가 아니다. 따라서 국내에서 해당 서비스를 받는다 해도 그리 임상적 유용성을 만족할 만한 것은 아니지만( bloom syndrome만 보더라도 Ashkenazi Jewish에 대해서 107명 중 1명이 보인자로 0.93%며 Asian이나 African American에서는 0%) 다양한 인종이 존재하는 미국에서는 그 유용성이 클 수 있다고 할 수 있다. Anne Wojcicki도 부모중 한명이 Jewish로 그녀 또한 bloom syndrome에 대한 보인자라고 한다. 뭐 한때 부부사이였던 구글의 Sergey Brin도 부모가 Jewish로 유전질환에서 자유롭지 못했다. 아마도 이 서비스자체가 부부였던 둘의 자식에 대한 사랑은 아니었을까 한다. ㅋㅋㅋ

Bloom Syndrome

23andMe는 사업초기부터 Illumina의 chip을 사용(2008년 v1, 2011sus v3, 2014년 v4)하고 있으며 현재는 BeadChip v4 assay (Illumina HumanOmniExpress-23 format chip)을 사용하고 있다. 이 칩은 ~750,000 SNPs를 커버하고 있으며 약 200,000개의 custom markers를 추가(현재 할 수 있는 것으로 알려져 있다. 해당 칩에는 SNPs외에도 II와 DD, DI의 genotype을 가지는 deletion과 insertion 또한 확인이 가능하며 그 수는 대략 60여개에 달한다.


Bloom Syndrome은 BLM 유전자의 2281에서의 6-염기쌍결실/7-염기쌍 삽입 (rs113993962)의 BLMAsh라고도 불리는 유전변이를 가지고 보인정보를 판단한다. 23andMe 형태의 genotype으로 보자면 "DI"인 경우는 보인자이며 "II"인 경우 bloom syndrome 환자 "DD"인 경우 정상이라고 할 수 있다.


Analytical performance 분석적 성능

FDA의 23andMe 서비스에 대한 decision summary에 따르면 23andMe는 FDA에 510(k) 드노보 프로세스를 진행하면서 6개의 셀라인을 가지고 analytical performance(찾고자하는 유전자형을 정확하고 믿을 만하게 검출하느냐)를 수행했다. 


4 homozygous common (DD)

1 BLMAsh heterozygous (DI)

1 BLMAsh homozygous rare (II)


각 셀라인은 5일에 걸쳐 2곳(site1, site2)에서 각각 별도로 진행되었으며 이때 4개의 reagents와 3대의 별도의 Tecan, iScan 장비의 조함을 사용하여 진행하여 DD의 경우 360번 DI와 II의 경우 720번의 replicate를 수행했다. 

각 site별 실험에 따른 정확성과 재현성(Precision/Reproducibility)


또한 이들은 Interference와 관련하여 Endogenous와 소고기가 포함된 음식 섭취, 소고기가 포함되지 않은 음식 섭취, 음료 섭취, 검씹기, 이빨닦기의 Exogenous Interference와 함께 흡연에 대한 Interference에 대해서도 analytical performance에 관한 내용을 제출했다.


이빨 좀 닦아 본 후(간섭에 의한)  재현성 - QC fail은 있어도 QC만 통과하면 정확함

Comparison Studies 비교 시험

타액을 통해 23andMe의 자체 Biobank로부터 genotyping된 총65샘플에 대해서 bi-directional sequencing을 통한 결과와 비교 시험 결과 DI(heteo)인 경우와  DD(homo)인 경우에 대해서 총5개 샘플은 QC에 fail되었으나 다시 시도해서 모두 genotyping과 동일한 결과를 얻었다.

Clinical Studies 임상적 시험

지금까지 본 바로 아무리 잘 잡아냈다고 하더라도 지금까지 봐온 BLMAsh가 기존의 논문등의 근거가 부족하다면 이 검사에 대한 승인은 처음부터 재고려해보아야 할 것이다. 23andMe는 ACMG의 Ashkenazi Jewish decent에 대한 보인자 스크리닝 가이드라인과 Bloom Syndrome에서 BLM 유전자의 원인 변이라는 논문을 근거로 제시하고 있다.


Ashkenazi Jewish에서의 Bloom syndrome외의 다양한 유전질환에 대한 carrier frequency

결론

지금까지 살펴본 바와 같이 23andMe는 FDA의 승인을 받기 위해 기존의 의료기기들이 허가를 받기 위해 필요한 분석적 성능이나 임상적 성능 등 다양한 결과들을 제출하고 허가를 받았다.  비록 질병의 예측성 유전자 검사가 아닌 기존의 보인자 유전검사라는 틀에서 이루어지긴 했지만 이번 기회를 통해 23andMe는 FDA와 어떠한 관계를 가지고 어떻게 허가를 진행해야 할지에 대한 값진 교훈을 얻게 되었고 분명 이는 23andMe에게는 앞으로의 서비스 확장과 사업 진행에 있어서 큰 도움이 될 것이라고 생각한다.


23andMe는 질병 예측성 유전자 검사라는 카테고리(예전의 health 카테고리)를 잃었지만 아직도 Ancestry, wellness, traits의 정보와 함께 FDA의 승인된 보인정보(carrier status)를 얻었다. 


국내에서도 카페인이나, 유당분해, 알콜분해 등의 웰니스에 관련한 유전자를 DTC로 풀어나가는 한편 체계화된 연구를 기반으로 규제기관과의 허가에 관한 이슈를 풀어나아갔으면 한다.


저작자 표시 비영리 동일 조건 변경 허락
신고
Software enginner of GenomeCloud. Covers bioinformatics, computational biology, and life science informatics.
Posted in : 개인유전체분석 at 2015.10.28 21:25
Currently 7 comments want to say something now?

티스토리 툴바