Fork me on GitHub 단맛만좋아요 :: 23andMe Research Portal - 유전체데이터베이스 팔기

23andMe Research Portal - 유전체데이터베이스 팔기
2015.01.26 13:06 | 개인유전체분석

23andMe 유전체 데이터베이스 판매

지난 일주일 간격으로 23andMe는 화이자 (Pfizer), 지넨테크 (Genetech)와 유전체 데이터 사용에 관한 파트너십을 체결했다. 지넨테크는 암치료제인 아바스틴 (Avastin)과 허셉틴 (Herceptin)을 생산하는 회사로 로슈 (Roche)에 속해 있다. 이 두 회사외에도 23andMe는 총 14개의 private companies 및 대학들과 파트너십을 체결했다고 전했다. 이로서 파트너십을 체결한 Big Pharma와 Biotech 회사들은 23andMe가 이미 모아 놓은 데이터를 곧바로 활용할 수 있게 된 것이다.

유전체 데이터 규모

23andMe는 자신들의 데이터베이스를 "23andMe's Research Portal"이라고 부르는데, 현재까지 75만명이상의 유전체 데이터 (genotyped individuals)를 확보하고 있으며 이중 65만명 이상의 데이터가 자신들의 데이터를 연구에 활용하도록 동의를 한 데이터라고 한다.


23andMe의 고객에게 자신의 데이터를 연구에 활용하도록 동의 여부를 묻는 화면


물론 해당 유전체 데이터는 200만개의 형질데이터(phenotypic data)를 포함하고 있으며, 이중 1천개가 curated된 데이터라고 한다. 즉, 65만명에 대한 유전체 데이터와 1천개의 임상변수를 사용할 수 있는 것이다. (Conditions/Diagnoses, Medication Usage, Response to Medication, Family History of Disease, Health Behaviors, Personality Traits, Environmental Exposures, Geographic Location)

암 및 자가면역 코호트

위의 데이터들은 다양한 코호트를 포함하고 있는데 암, 자가면역, 파킨슨, 알츠하이머 코호트 등이 존재한다.암 관련 코호트의 경우 6,000명의 유방암 환자(confirmed control 198,000명)와 5,000명의 전립선암(confirmed control 221,000명), 1,700명의 대장암 (confirmed control 431,000명) 코호트가 존재한다.1,500명의 루프스 환자와 이에 대응하는 367,000명의 contorls, 류머티스, IBD,  celiac 등의 코호트를 가지고 있다.

APOE e4/파킨슨 코호트

APOE e4와 관련한 120,000명 이상의 데이터와 파킨슨 관련 10,000명의 데이터를 보유하고 있다. 이러한 데이터의 경우 23andMe는 일반고객과는 별도로 비교적 저렴한 가격 또는 무료로 참여자를 모집함으로써 해당 데이터들을 수집할 수 있었다.

Research Portal

23andMe는 해당 데이터를 손쉽게 검색하고 자신의 연구 테마에 맞도록 샘플이나 변수를 설정하고 해당 결과까지 확인할 수 있는 Research Portal을 제공함으로써 샘플이나 데이터를 모을 필요없이 실시간(real time)으로 GWAS, PheWAS 연구를 수행할 수 있도록 해준다.

23andMe의 Research Portal: 원하는 유전체 데이터를 손쉽게 검색 가능한 인터페이스

국내 유전체 데이터 포털

지금까지 23andMe의 유전체 데이터 포털에 대해서 살펴보았는데 국내에서도 이러한 데이터 포털이 존재한다. 물론 연구자에게 국한되어 있으며 국가가 관리하고 있다. 질병관리본부의 한국인체자원은행사업을 통해 생산된 데이터로 코호트 기반과 질병기반의 인체자원을 분양하고 있는데 바로 여기에 유전체 데이터가 일부 포함되어 있다.


그럼 어떠한 유전체 데이터와 그와 연관된 데이터들이 존재하는지를 확인하기 위해서는 인체자원은행 분양데스크 홈페이지를 통해 검색이 가능하다. 인체자원검색 메뉴에서 역학기반검색을 선택하면 선택 가능한 자원 중 "유전체자료"가 포함된 데이터를 검색이 가능하다.


갑상선 과거력을 가진 유전체 데이터 검색


아래예는 농촌코호트 (522명) 중에서 갑상선질환을 앓았던 사람중 유전체 데이터를 포함하는 샘플 (총 45명)을 검색한 화면이다. 바로 이 데이터를 분양 신청하면 심사를 거쳐 해당 데이터를 이용할 수 가 있게 된다.

유전체 데이터 검색 결과


국내에서 유전체데이터를 검색하고 사용할 수 있는 시스템이 존재하지만 데이터 중 유전체 데이터를 가진 데이터는 일부에 불과하다. 하지만 잘 활용한다면 충분히 흥미로운 데이터임에는 분명하다.

시사점

미 FDA는 23andMe는 그동안 축적한 데이터를 기반으로 자체적으로 다양한 연구를 수행하는 한편 연구에 활용할 수 있는 잘 관리된 데이터베이스를 구축하고 이를 Research Portal이라는 이름으로 내놓고 여러 제약 및 Biotech와 파트너십을 통해 그 영향력을 점점 확대하고 있다.샘플을 모은 과정은 자사의 일반 고객과 연구기관과의 협력을 통해 자사 고객과는 다른 특정 질환의 샘플을 모으는 프젝트를 통해 저렴한 가격에 손쉽게 구하기 힘든 샘플을 손쉽게 구하는 전략을 펼쳤다. 이렇게 모은 샘플들이 알츠하이머나 파킨슨병에 대한 샘플들로 이번 지넨테크와 협력을 하는 부분이 바로 파킨슨병에 대한 것이다. 이러한 사실을 본다면 첫번째 시사점은 바로 참여자에게 부담없는 비용의 유전체 검사와 그에 따르는 샘플 수집과 연구에 활용이다. 여러 질환관련 학회나 각 질환관련 환우회 또는 질환연합회를 적극 활용하는 것 또한 좋은 포인트라고 할 수 있겠다.


23andMe Demographics


이러한 사실을 보면 유전체 데이터와 이를 통한 사업은 꽤나 관심이 갈 만한 사업이다. 그렇다면 후발 또는 국내에서 이러한 사업을 한다면 가능할까? 우선은 23andMe의 데이터는 77%가 European의 데이터라는 것이다. 이중 라틴이나 아프리카를 제외한다면 East/South 아시안은 채 10%도 되지 않는다는 것이다. 이러한 사실은 이미 일본의 도시바나 소니의 경우에도 그 중요성을 알고 아시아인의 유전체 데이터베이스 구축을 그들의 헬스케어 전략에 포함하고 있다. 그렇다 두번째 시사점은 아직은 아시안 유전체 데이터베이스는 속된 말로 돈 될 수 있다는 것이다.


소니의 유전체 데이터베이스 사업


세번째 시사점은 단순히 데이터를 모으는 것이 아니라 자체적인 R&D가 가능해야 한다는 것이다. 23andMe는 자체 연구를 통해 이미 상당한 수의 논문을 발표했으며, 이를 기반으로 자사의 서비스에 자사의 연구결과를 포함/검증하는데에 사용하고 있다는 것이다. 바로 이러한 자체적인 R&D가 가능했기에 그들을 연구를 위해 최적화된 Research Portal의 구축이 가능했던 것이고 바로 잘 정제 (curated)된 데이터는 Big Pharma들에게 매력적일 수 밖에 없었을 것이다.

참고

23andMe Research Portal Platform 문서

23andMe Research Portal 홈페이지

Research Portal 사용예

23andMe 연구 목록





저작자 표시 비영리 동일 조건 변경 허락
신고
Software enginner of GenomeCloud. Covers bioinformatics, computational biology, and life science informatics.
Posted in : 개인유전체분석 at 2015.01.26 13:06
Currently 2 comments want to say something now?

티스토리 툴바