본문 바로가기

Taverna

Taverna 2로 가는 길목에서 Taverna 1.7 버전이 나왔습니다. 우선 1.7 버전으로 업그레이드 되면서 눈에 띄게 달라진 점이라면 T2 Activity palette, Taverna 2 preview의 2개의 Perspective가 화면 상단에 추가 되었구요. 사용할 수 있는 공개 플러그인들도 대거 추가되었습니다.내년 6월인가에 Taverna 2 버전이 발표된다고 하는데 미리미리 그 기능들을 보여주는거 같습니다. Papers도 버전업되고 이것저것 연말이라 그런지 버전업 붐입니다. 얼른 업그레이드 해야지 ^^
Taverna 사용 내역을 기록하기 Taverna에서는 자신이 수행한 워크플로우에 대한 내용을 데이터베이스에 기록해 놓을 수 있다. input과 output을 비롯해서 중간에 생성된 결과물까지 몽땅 데이터베이스에 기록해 놓았다가 언제든지 다시 실행해 볼 수 있다.바로 LogBook이라는 플러그인이 그것을 가능하게 해준다. 위의 그림처럼 자신이 수행한 워크플로우에 대한 모든 내역을 기록하고 다시 꺼내 볼 수 있도록 하고 있다. MySQL 데이터베이스만 설정해 주면 사용준비 끝이다. 자신..
Taverna Plugins 개발하기 뭐하나 새로운걸 만드는 것보다는 Taverna에 통합하는 편이 나을듯 해서 Taverna 개발자 가이드를 보고 있습니다. 나름 이런저런 설명을 친절하게 해 놓았지만, 실제 뭔가를 만들기에는 좀더 공부를 해야겠습니다. 문서에는 가장 좋은 레퍼런스는 Taverna 자신의 소스코드라니 소스코드를 뚫어지게 쳐다보는 수 밖엔 ^^;;Taverna를 이용하여 Plugins을 개발하기 위해서는 우선 SVN, SPI(Service Provider Interface..
Taverna에서 대용량 데이터 다루기 - 간단한 웹 서비스 Biopipe 경진대회 문제를 풀면서 8,000여개의 multiple 서열을 sort하는 beanshell 스크립트를 만들었는데, 로컬에서 돌아가다 보니 좀 시간이 걸렸다. 간단하게 웹 서비스를 만들어서 휘리릭 배포해서 쓰고 싶어졌다. Axis와 JWS를 이용해서 간단하게 해결하자.우선 Tomcat에 Axis를 설치한다. Axis를 다운로드 받아서 common/lib에 라이브러리들 옮기고 webapps/axis 디렉토리를 Tomcat의 webapps..
Biopipe 경진대회 단백체 문제 이전까지는 유전체 문제를 풀어보았는데 이제 단백체 문제를 풀어보도록 하겠다. KOBIC의 Biopipe를 통해서 문제를 풀어야 하는데, 계속해서 Taverna를 이용해서 문제를 풀고 있으니... 경진대회에 참가하려면 Biopipe로 작성해야 하는데 ㅋㅋ 자! 그럼 단백체 1번 문제를 살펴보자. OMIM 데이터베이스를 이용해서 질병관련 유전자를 찾고 이 유전자의 Symbol을 이용해서 단백질 서열을 얻은다음 EBI interproscan을 통해 얻어진..
Biopipe 경진 대회의 연결툴 요청 답변 아래 내용은 Biopipe 경진대회에 연결툴 요청에 관한 답변이다. 파일형태의 output을 String형태의 input과 연결하기 위한 File2String과 그 반대인 String2File에 대한 모듈을 작성했다고 연락이 왔다. Biopipe 홈페이지에는 이 내용이 없는것 같아서 답변내용을 블로그에 올린다. 다른 참가분들도 이모듈을 이용해서 디자인 하시길...^&^Reply:1. 기존의 모듈이 나타나지 않은 이유 : searchSimple..
Biopipe 경진대회 Taverna를 이용한 문제2 풀이 새로운 문제가 오늘 따근따근하게 올라왔으니 한번 어떤가 풀어봐야겠다. 문제 풀이라기 보단 그냥 힌트로 블럭 조립하는 느낌이다. 새로운 문제의 1단계는 'Candidatus Carsonella ruddii PV'라는 세균의 전체 유전체 서열을 FASTA 포맷으로 가져오고 코딩서열 (CDS) 목록을 포함하는 유전체의 주석 정보를 GenBank flat file 포맷으로 가져오기 바랍니다. DDBJ에서 제공하는 GIB 데이터베이스의 웹 서비스를 이용하면 ..
KOBIC의 Biopipe 경진대회 - 삼일째 오후 어제 포스팅에서 언급했던것과 같이 Biopipe를 통해 문제를 해결하려고 Biopipe 사이트에 들어가서 차근차근 진행하다가 내가 잘못해서 그런지 몰라도 처음부터 꽉 막혀 버렸다.WSDbfetch_fetchData를 통해서 서열을 얻고 이를 protein 서열로 바꾸기 위해nucleic_translation_transeq를 사용했다. 각각의 모듈을 독립적으로 실행시 잘 돌아간다. 전체적으로 돌리면 아무런 반응이 없다. 시간이 흐른뒤 점심을 먹고 다시..
Biopipe beta 경진대회 3단계 문제 풀이 1,2 단계는 그럭저럭 해볼만 하다. 하지만 3단계는 ㅋㅋ3단계 문제는 Blast의 결과 정확히 말하자면 blastp의 결과물을 가지고 유용한 정보 Pathway, PPI정보등을 찾는것이다. 이건 무한한 상상력을 발휘하면 되겠다.그럼 이제부터 풀어보도록하자.우선 blast 결과물은 어떠한 DB를 대상으로 했는가가 중요하다. Pathway 정보는 KEGG를 통해서 알수 있는데 Blast의 결과에 나오는 ID와 KEGG에서 사용하는 ID가 서로 상이하기..
Taverna를 이용한 Biopipe 경진대회 문제 풀이 아래 포스팅에도 언급했던 이번 국가생물자원정보관리센터(KOBIC)에서는 경진대회에 참가하는 방법이 두가지가 있다. 첫째, 직접 생물학적 의미를 가지는 파이라인을 본인이 직접 제작하는 방법 둘째, 제출된 문제를 해결하는 방법우선 아이디어가 없기 때문에 ^^;; 제출된 문제를 해결해보기로 했다. 문제는 간단했다. 유전체와 단백체를 나뉘어 있으며 각 3단계의 총 6개의 문제가 제출되어있다. 각 문제는 독립적인 문제가 아니라 연결되어지는 말그대로 단계별로 ..
Tarverna에서 Blast Workflow 예제

티스토리 툴바