バイヲ::ほげ.pm 計画
プロジェクトは BioRuby に移行しました。
今後は Ruby を用いて開発を進めていきます。
BOSC 2001 で BioPerl の人たちにも BioRuby の宣伝をしてきます(2000/07)。
BioRuby banner

「バイヲ::ほげ.pm 計画」では、分子生物学データベースをパースするための Perl モジュールや、 ゲノム解析に必要なツール類を作っていきます。

同様なプロジェクトに bioperl がありますが、 ローカルにデータを持っている場合はあまりうれしくないことと、 インハウスで開発したデータベースにも対応させたいこと、 そして何よりも、人の作ったモジュールは読みにくく、いじりにくいということで、 自前でボチボチやっていこうという計画です。

このページの他、バイヲ組合員ナカヲ作の、 DBGET クライアント もよろしく。

● Genes パース用のモジュール:Genes.pm, Genes.pm,v
Ver 1.1 (1999/08/04)
GenBank.pm を元に GENES データベース用モジュールを作成。メソッドは GenBank.pm よりずっと充実。でもうちの研究室以外では役に立たないっしょ。:)
● GenBank パース用のモジュール:GenBank.pm, GenBank.pm,v
Ver 2.2 (2000/9/30)
PUBMED タグに対応。
Ver 2.1 (2000/9/30)
get() 用に SOURCE_ORGANISM, SOURCE_TAXONOMY を SPECIES, TAXONOMY に変更。
genpept() のバグ fix。
Ver 2.0 (2000/9/28)
ntseq(), aaseq() 導入。
Feature Location フォーマットに対応。
$gb->ntseq("CDS1") など様々な方法で呼び出すだけで、対応する Feature Location の join(), group(), order(), complement(), one-of() etc. を自動的にパースし、DNA 配列を返す。
getseq(), getcomplseq() 廃止。
そろそろ具体例を載せた日本語のドキュメントが必要ですな。
Ver 1.6 (1999/09/26)
多少効率化を図る。
Ver 1.5 (1999/08/04)
get() メソッドのバグなどを修正。
getrevseq() の名前を getcomplseq() に変えた。
Ver 1.4 (1999/08/03)
getrevseq はマチガイで getcomplseq に直す。parse_LOCUS のバグ fix。
Ver 1.3 (1999/07/09)
大幅に書き直して、パースのルーチンと整形ルーチンを切り分け、パースするだけならだいぶ軽くなった。
でもその分、色んなデータにアクセスしやすいように余分なことを付け加えていたら結果的には 10 % しか速くなってない。がはは。(速くしたい場合 parse_qualifier() を呼ぶ回数を減らすのが効果的)
直接ハッシュにアクセスするとエントリを行単位のブロックで切り出しただけのフォーマットが、get() メソッドを使ってアクセスするとタグに対応する中身を詰めたフォーマットが、それぞれ得られるようにした。これまでのバージョンとはだいぶ使い方ちゃうよ。使い方は pod 参照。
コメントなどで使っていた日本語を無くした。
Ver 1.2 (1999/07/03)
Bio::DB::GenBank.pm は bio.perl の同名モジュールと同じ配置なので、とりあえず場所だけ動かして GenBank.pm にした。てけとー。
REFERENCE タグをリファレンスのリストにした。
Ver 1.1 (1999/05/14)
Bio::DB::GenBank.pm をとりあえず作成してみた。
● FASTA 形式のエントリを全て FASTA や BLAST にかけるラッパー:vs-genes.pl
Usage:
  % ./vs-genes.pl -p PROG -q QueryDB -t TargetDB [-k ktup] [-v 1] [-d DIR]

  -p PROG      : (fasta3|ssearch3|tfasta3|fastx3|tfastx3)[_t]
                   or
                 (blastp|blastn|blastx|tblastn|tblastx)
                   or
                 (hmmpfam|hmmpfam_n)
  -q QueryDB   : Query nucleotide or peptide sequence in FASTA format
  -t TargetDB  : Target DB in FASTA format or BLAST2 formatdb format

  -k ktup      : FASTA ktup value (optional)
  -v verbose   : verbose output of processing (optional)
  -d resultdir : result output directory (optional)
    

Last modified: Mon May 14 15:50:18 2001 KATAYAMA Toshiaki <katayama@kuicr.kyoto-u.ac.jp>