howto

UCSC의 DBSNP 데이터를 단 2줄로 내 컴퓨터로 가져오기

hongiiv 2008. 3. 3. 11:37
반응형
Pierre Lindenbaum(Blog : YOKOFAKUN) 이 분은 프랑스분이신거 같은데 프로필에 보면 바이러스학을 전공하시는걸로 되어있는데,,, Nature Network의 Bioinformatics그룹이나 MyExperiment에서 봤던(?)분이다. 이것저것 참 재미있는 내용이 많은 블로그이고, BioBlogRSS에도 등록되어 구독되고 있는 바로 그 블로그인데,, 여기의 My fNotebook: Apache Tomcat / Bioinformatics의 글에서 누구나가 쉽게 리눅스에서 웹서버를 설치하고 활용하는 방법에 대해서 적어 주셨다. 이 글에서 UCSC의 dbsnp를 가져오는 부분만 발췌해서 보면 다음과 같다.

1. snp 정보가 들어갈 데이터베이스를 생성한다.

mysql -u root -p -D test -e 'create table snp(chrom varchar(10) ,chromStart int not null,chromEnd int not null,name varchar(20) unique not null)'

2. 만든 snp 테이블을 UCSC의 dbsnp 데이터로 채워 넣는다.

mysql -N --user=genome --host=genome-mysql.cse.ucsc.edu -A -D hg18 -e 'select chrom,chromStart,chromEnd,name from snp126 where chrom="chrM" ' |\
gawk -F ' ' '{printf("insert into test.snp(chrom,chromStart,chromEnd,name) values (\"%s\",%s,%s,\"%s\");\n",$1,$2,$3,$4);}' |\
mysql -u login -p

끝. SNP 연구하시거나 할때 유용하게 단 두줄(줄은 좀 길어요 ^^) 잊지 마세요.
반응형