분류 전체보기 749

상용 및 오픈소스를 이용한 NGS 분석 서비스의 Mapping Rate 비교

아래 글에서 언급했던 논문의 서플을 보면 다음과 같이 NGS 분석 서비스를 비교한 테이블이 나온다. 테이블의 첫번째 나오는 것이 논문 저자들이 만든 HugeSeq이라는 파이프라인에 대한 것으로 다음과 같은 항목에 대해서 각각의 서비스들을 비교했다. 크게 항목을 나누자면 웹기반의 서비스와 직접 다운로드해서 설치하는 것으로 나눌 수 있다. 우선 웹 기반의 서비스중 대표격인 DNAnexus는 Align, SNP Call, Indel Call을 지원하지만 아직 SV (Structural Variant) Call은 지원하지 않고 있으며 commercial한 서비스이다. 즉 커머셜하면서 웹 기반으로 제공되는 서비스 중 최고를 달리고 있다. 테이블 1. NGS 데이터 분석 서비스 비교 Alignment SNP Cal..

하버드와 Broad가 있는 보스턴 캠브리지

삼지창 카페 어제 밤 보스턴에 도착하고 나서는 철저한 숙면을 취한후 아침에 느긋하게 브런치로 호텔 근처의 Newbury가에 있는 Trident Bookseller & Cafe로 향했다. 책과 함께 음식을 파는 곳인데, Newbury는 하인즈컨벤션센터역에서 부터 시내까지 쭉 뻗은 길로서 나름 이동네에서 쇼핑으로 유명한 길거리라고 한다. 에그베네딕트를 주문하고는 처묵처묵,,, 감자는 별로구 커피는 좋았구 계산하기 계산서 달라고 한 후 신용카드를 끼워서 놓으면 가져가서 카드 긁어서 손님용/가게빵용/원래계산서 요렇게 3개를 다시 가져온다. 다시 가게빵용에는 택스 포함한 가격이 나오고 밑에 팁/합계가 공란으로 나온다. 팁란에 팁 적고 합계 적어주고 걍 나온다. 아니 걍 나오라고 했다. 근데 결제는 원래 요금만 나..

blogging 2012.04.25

동일 individual의 서로 다른 sample, platform, analysis tool을 사용한 분석

NGS를 수행하는데에 있어서 동일한 사람에 대해서 혈액 vs. 타액, Illumina HiSeq 2000 vs. Complete Genomics, GATK vs. SAMtools 자 이제 각각의 대결?을 한번 훑어 보기로 하자. 물론 정답은 없다. 걍 한번 심심하니까 한번 보는거다. Performance comparison of whole-genome sequencing platforms.Lam HY, Clark MJ, Chen R, Chen R, Natsoulis G, O'Huallachain M, Dewey FE, Habegger L, Ashley EA, Gerstein MB, Butte AJ, Ji HP, Snyder M.Nat Biotechnol. 2011 Dec 18;30(1):78-82. do..

새로운 파이프라인 하나 들어 놓으시죠 (1)

NGS 데이터를 가지고 variation을 찾고 annotation하는데 정답이 있을까요? 뭐 굳이 찾는다면 Broad에서 1000 Genomes Project를 하면서 우리 이렇게 했어!!라고 내놓은것쯤 되려나요? 암튼 또하나의 NGS 데이터를 분석하는 파이프라인, 딱풀이 나왔습니다. 왠 딱풀이냐 @.@ 걍 전 딱풀이라고 부르겠습니다. 근데 이딱풀 그저 그런 딱풀인데, 멋지구리하게 포장해놨습니다. 바로 이런 능력이 필요한데 말이죠. 그럼 딱풀 포장 벗겨보겠습니다. Nat Biotechnol. 2012 Mar 7;30(3):226-9. doi: 10.1038/nbt.2134.Detecting and annotating genetic variations using the HugeSeq pipeline.La..

NGS 데이터 분석 관련 세미나

요즘 많은 연구자분들이 genome 관련 데이터를 자신의 연구에 사용하고 계십니다. 이에 따라서 국내에서 많은 교육과정이 생겨나고 꾸준히 진행되고 있습니다. 여기서는 현재 제가 아는 대표적인 과정들을 넣어 놓았으니 참고하시기 바랍니다. KOBIC 차세대 생명정보 교육 프로그램 (http://education.kobic.re.kr) KOBIC(국가생명연구자원정보센터)에서는 현재 7회까지 차세대생명정보학 교육이 이루어지고 있는데요. 간간히 NGS 관련 교육이 올라오고 있습니다. 년간 교육계획을 보면 지난해 12월에 이어서 오는 4월에도 NGS 관련 교육이 있을 예정이더군요. WGS (Whole Genome Sequencing), WES (Whole Exome Sequencing), Epi-Genome, RN..

HP의 퍼블릭 클라우드 잠깐 사용기

얼마전에 HP도 Amazon의 AWS와 같은 퍼블릭 클라우드 서비스를 시작한다는 기사를 보고 Private Beta 테스트 신청을 해놓은것이 얼마전에 승인되어 Access Code를 받았다. HP는 OpenStack을 기반으로 서비스를 구성하고 있으며 컴퓨팅 리소스를 제공하는 "HP Cloud Compute"와 스토리지를 제공하는 "HP Cloud Object Storage"라는 서비스를 각각 제공하고 있다. HP Cloud Services 현재 Private Beta 시점에서 사용 가능한 상품중 최고 사양은 8 vCore / 32 GB RAM으로 KT의 ucloud biz가 제공하는 12 vCore / 32 GB RAM에 비해 core에서 차이가 난다. 하지만 이는 vCore이기 때문에 실제 두 클라우..

Linux 2012.02.21

Genome 관련 최신 소식 보기

GenomeWeb 기사는 몇몇 내용을 제외하고는 유료로 기사 읽기가 가능합니다. 가끔 링크를 따라가면 간혹 본문 내용을 읽을 수 있기도 하고,,, 암튼 제목만으로도 충분히 많은 최신의 소식들을 접할 수 있는 있는 곳인데요. 오늘은 이 기사를 꼼수를 이용해서 볼 수 있는 방법을 알려드리려고 합니다. 물론 어떤 불법적인 요소는 없습니다. 1) 읽고 싶은 기사가 있는데 자물쇠 모양의 아이콘이 있다면 우선 기사의 제목을 복사합니다. 2) 구글검색에 해당 기사의 제목으로 검색합니다. 3) 제일 위에 뜨는 검색결과는 분명 genomeweb일겁니다. 4) 저장된 페이지를 누르지 않습니다. - 얼마전까지만 하더라도 캐시에 실제 기사내용이 들어있었는데 언제부터인지 안되더라구요 5) 저장된 페이지가 아닌 이페이지 번역하기..

blogging 2012.02.14

유전체는 임상으로 가고 있다. 그렇다면...

오늘 GenomeWeb 기사를 보다가 "Life Tech to Partner with Dx Companies on Clinical Use of Ion Torrent"라는 기사를 보았습니다. 여기서 몇개의 단어만 바꾸면 "Genomics to Partner with Hospital on Clinical Use of NGS tech"가 되겠죠. 그렇습니다. 이게 요즘 화두입니다. 그래서 이에 대한 제 생각을 두서없이 한번 적어보려고 합니다. 물론 내용 중에 사실과는 다른 잘못된 부분이 있을수도 있고, 제가 많이 배우지 않아 관점을 벗어나거나 큰 그림을 못 보고 지껄이는걸 수도 있습니다. 그렇다면 과감하게 그냥 넘어가세요. ㅋㅋㅋ 미국: 국가차원 미 국립보건원(NIH)은 $5억를 유전체 시퀀싱에 기반한 진단 ..

GIW 2011 / BIOINFO 2011 참가 후기

지난 월요일부터 수요일까지 부산 그랜드 호텔에서 GIW 2011/BIOINFO 211 컨퍼런스가 있었습니다. KT도 약간의 후원하게 되었고, 그에 따라 참가하게 되었습니다. 조만간 KT도 멋진 발표를 할날을 기대하며....ㅋㅋㅋ 간단하게 리뷰에 들어가겠습니다. 행사장 전경 KT도 후원했습니다.!!! Information-based design of drug repositioning and combiniation 김성훈 교수 (서울대학교 약대) 서울대 김성훈 교수님의 발표로 기존 약물의 새로운 기능을 밝히기 위한 자신의 PharmDB에 대한 설명이 있었습니다. My Samples, My Study, My Sequencing 김경아 (BMS) 일루미나의 국내 총판을 담당하는 BMS의 발표로 일루미나의 HiS..

blogging 2011.12.08

한국인 공개 데이터에 대한 단상

KPGP 공개 데이터를 가지고 분석하기 전에 그들간의 어떠한 연결 고리가 있는지 확인하는 방법에 대해서 저번 포스팅에서 잠깐 다루었습니다. 실제 모든 KPGP 공개 데이터를 가지고 kinship을 분석해 보니 제가 원하던 결과가 나오지 않아서 현재 좀 의하한 상태입니다. Genome 연구에서의 데이터 공개의 의미 공개된 genome 데이터는 기본적으로 그들간의 kinship이 있어서는 안됩니다. 아니 있어도 됩니다. 하지만, 혈연관계가 있다면은 마땅히 그 정보 또한 공개되어야 합니다. 그래야만 완벽한 공개 데이터라고 할 수 있습니다. 기본적으로 genome 데이터는 부모에서 자식에게로 유전되는 즉 관계가 있는 데이터입니다. 따라서 자신이 어떠한 연구를 수행하는냐에 따라서 이러한 혈연관계가 있는 데이터를 ..