유전자정보분석 127

CTO 당신만 보세요 - 바이오인포매틱스와 Hadoop의 만남은 필연적

벌써 몇 년전부터 데이터 쓰나미라는 표현이 딱 들어 맞는 일들이 생명공학 분야에서 일어나고 있다. 그때마다 도마위에 올라오는 이야기는 바로 그리드, 클러스터, 슈퍼컴퓨터, 클라우드라는 단어들이었고 이러한 하드웨어와 맞물려서 MapReduce와 HDFS™의 기반의 Hadoop이 언급되었다. 아니 지금도 다들 바이오인포매틱스에는 하둡이 필요하다고 말하고 있다. 하지만 Hadoop은 하나의 플랫폼으로 이를 실무에서 사용하기에는 하드웨어 및 이에 따른 설정이 그리 쉽지만은 않은 상황이다. 요즘 누구나 다 바이오인포매틱스와 Genomics에 불을 켜고 마치 가로등에 나방들을 보고 있는 것 같은 상황에서 변변한 Hadoop 플랫폼 하나 제공하고 있지 못하는 국내의 현실을 보면 그저 안타까울 뿐이다. 특히나 의사결정..

당신의 유전자에 대한 권리는 당신에게 없다

얼마전 미국 뉴욕 지방 법원 로버트 스위트 판사는 2010년 3월 29일 미국시민자유연맹(ACLU)이 생명공학 업체인 미리어드 제네틱스를 상대로 유전적 유방암 진단에 대한 특허에 대한 무효화 소송에서 특허에 대해 단순히 인체에서 일어나는 작용을 규명했을뿐 이는 특허로 보호 받을 만한 대상이 아니라는 판결을 내렸다. 지금까지 알려진 당신이 지니고 있는 유전자 중 20%는 당신에게 권리가 없다 1998년 10월 미국 특허청이 생명공학회사인 인사이트에게 최초로 인간 유전자에 대한 특허를 내준것을 시작으로 지금까지 많은 생명공학회사들은 인간 유전자에 특허를 신청했다. 생명공학 회사들은 유전 질환에 대한 치료약을 개발하거나 검사에 대해서 치료법을 제어 할 수 있도록 특허 권리를 챙기고 있으며, 지금까지 알려진 유..

아웃 브레이크와 소셜 네트워크

내과의사는 아니지만 간간히 관심있는 주제의 논문들이 발표되어 NEJM을 보게 된다. 오늘은 2011년 2월에 나온 "Whole-Genome Sequencing and Social-Network Analysis of Tuberculosis Outbreak (결핵 유행에서의 홀 지놈 시퀀싱과 사회연결망 분석)"라는 논문이다. 여기서 혼동하지 말아야하는 부분이 있는데, 요즘 자주 접하게 되는것이 바로 Social-Network라는 용어인데, 흔히 facebook과 것은 Social Network Service (SNS)라고 하며, Social-Network Analysis(사회연결망 분석)은 인터넷 공간에서의 사회적인 관계가 아닌 실제 사람과 사람간의 관계를 통한 네트워크이며 이를 분석하는 것이다. 즉, 논문..

게임기가 생각나는 NGS 시퀀서

예전에는 갖고 싶었던 것도 많았는데... 그중에 하나가 PSP였다. 휴대용 게임기로 예판때 구입했던 기억이... 그리고 아이폰 역시 잠실운동장에서 줄서서...ㅋㅋㅋ 그런데 꽤 오랫동안 내 마음을 뺏는 stuff가 없었다. 그런데 그만 하나 덜컥 생겨버렸다. 오늘은 내 마음을 사로잡은 요놈을 한번 소개해보려고한다. 큰 놈 하나 작은 놈 하나 NGS 시퀀싱 장비하면 Illumina, Roche, Life Technologies(이하 LT)라는 세 회사가 주름을 잡고 있다. Roche는 타미플루하면 생각나는 기업이겠지만 NGS 장비도 만드는 회사중 하나이다. 요즘 이들 회사에서 밀고 있는 시퀀서 모델은 각각 HiSeq, Genome Sequencer, SOLiD 로 장비 가격만으로도 몇 억원을 호가하는 장비들..

후성 유전체(2) - 히스톤 단백질의 변형: 히스톤의 메틸레이션

오늘은 후성 유전체 두 번째 시간으로 첫 번째에서는 유전체 발현에 DNA상에서의 메틸레이션의 영향에 대해서 살펴봤다면, 오늘은 DNA가 감싸고 있는 히스톤에서의 메틸레이션에 대해서 살펴보고자 한다. 우선 DNA는 인간의 세포핵속에서 30억 bp정도의 염기 형태로 죽 늘어져 있는것이 아니라 히스톤이라는 단백질에 감겨져 있다. 어머니가 실을 실패에 감싸서 실이 엉키지 않도록 보관하고 바느질을 하실때 실패의 실을 풀어서 사용하시는 것처럼 30억 bp DNA(실)는 실패(히스톤 단백질들)에 잘 감겨져 있다. 우리가 흔히 보는 X자 모양의 DNA들은 히스톤 단백질에 감겨져 있으며, 이렇게 감겨진 DNA와 히스톤 단백질을 가리켜 뉴클레오좀이라고 부른다. (출처: http://jasmine71.wordpress.co..

후성 유전체(1) - DNA 메틸레이션

언제부턴가 후성유전체라는 단어가 유독 귀에 거슬리기 시작했다. 언제부터였더라??? 그 동안 DNA만 가지고 놀기도 바빠 죽을 지경이고 DNA도 몰라서 버벅 거리고 있는데 후성유전체는 또 뭐란 말이냐! 우선 인간의 DNA는 초등학교만 졸업하더라도 A, T, G, C의 네개의 염기로 구성되어 있다는 것쯤은 알고 있을 만도 하다. 염기(수산화이온(OH-) 이온을 생성하거나 주는 물질)라? 우선 패스~하고, 이 중 C (Cytosine, 시토신)는 C4H5N3O의 화학식을 지닌 피리미딘 (pyrimidine, N을 함유한 화합물의 골격) 염기 (피리미딘염기: 핵산의 구성분으로 시토신, 우라실, 티민 등이 있음) 뭔소리진 모르겠다면, 다시 시작하자! 시토신(C4H5N3O)의 분자 구조식 인간 DNA의 기본 염기인..

Amazon 클라우드와 Biology 정리

계속 업데이트, 이외 정보 있으시면 댓글이나 이메일 환영, 모르시면 질문도 환영 =끝= 1. Amazon Machine Images(AMI) for Biology a. JBrowse AMI 32-bit images: ami-8ff312e6 64-bit images: ami-346c8b5d (based on CentOS) b. Galaxy AMI AMI: ami-228a7e4b Name 115971652512/galaxy-cloudman-2010-10-08 c. GBrowse AMI AMI: ami-c228cfab Search: gbrowse d. UCSC Genome Browser In your AWS console screen, start an instance from the AMI: ami-cc55b..

Galaxy와 Amazon web services 요금

Galaxy는 기본적으로 3가지 방법을 통해서 사용이 가능하다. 1) http://usegalaxy.org 웹사이트를 통해서 제공되는 클러스터를 사용하는 방법 2) 자신의 로컬 머신에 직접 설치해서 사용하는 방법 3) 아마존의 AWS를 통해서 사용하는 방법이다. 우선 첫번째 방법은 가장 접하기 쉬운 방법으로 별도의 설치나 머신이 없어도 가능한 방법이지만, Galaxy에서 제공하는 서버리소스를 사용하기 때문에 사용자가 많거나 커스터마이즈에 한계가 있다. 또한 현재 런닝하고 있는 작업에 대한 세밀한 정보 등이 제공되지 않는다는 단점이 있다. 우선 이들이 Galaxy를 서비스하기 위해서 어떠한 리소스를 사용하고 있는지 살펴보면, 헤드 노드(사용자들이 제출한 작업을 받아들이고 이를 잡을 수행하는 컴퓨터 노드에 ..

지놈 블로거 그들이 뜬다 - The rise of the genome bloggers

얼마전 유전자로 알아본 선조 결과에 발끈? 이라는 글을 쓴 적이 있다. 잠깐 요약하자면, 자신의 지놈 정보를 공개한 젊은이가 그것을 가지고 그의 조상 (선조)에 대한 분석 결과가 유대인에 대한 언급이 있자 이에 대해서 그럴일이 없다고 분석에 뭔가 문제가 있을것이라는 주장을 했지만, 유대인인 증조부 (greate-grandfather)가 19세기 폴란드에서 미국이로 이주해온 사실을 알게 되었다는 것이었다. 이는 우리에게 두가지 시사점을 안겨다 주는데, 첫째는 이제는 자신의 실명과 함께 자신의 지놈 정보를 공개하는 시대라는 점이다. 지금까지 인터넷을 통해서 자신의 사진, 거주지 또는 인터넷에서의 흔적을 찾을 수 있는 시대였지만, 이제는 그보다도 더욱더 사적인 지놈 정보가 포함되는 그런 시대라는 것이다. 두번..

Genomics & Cloud (3) - Amazon 클라우드 서비스 둘러보기

Amazon의 web services 중 Galaxy를 사용하기 위해 필요한 서비스는 Compute와 Storage 서비스로 Compute 서비스는 Amazon Elastic Compute Cloud (EC2)와 Amazon Elastic MapReduce가 존재하며, Storage 서비스는 Amazon Simple Storage Service (S3)와 Amazon Elastic Block Store (EBS)가 존재한다. 간단히 Compute 서비스의 EC2와 Storage 서비스의 EBS에 대해서 살펴본 후 다음편에서 실제 Galaxy를 아마존의 클라우드 서비스에 연결하도록 하겠다. Amazon Elastic Compute Cloud (EC2) Amazon Instance EC2는 Amazon의 핵..