Macにblast+をインストール

snow leopardの環境でblast+をインストールしてみます。

#まずは、ncbiのftpサイトからバイナリファイルをダウンロードしてきます。

$ curl -O ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.2.26/ncbi-blast-2.2.26+.dmg

#インストーラーの起動
$ open ncbi-blast-2.2.26+.dmg

#データベース構築のための準備

$ mkdir ~/blast
$ cd ~/blast
$ mkdir db
$ cd db

#ncbiのftpサーバーから、zebrafishのmRNAのRefseqの情報を取得する。
$ ftp ftp.ncbi.nlm.nih.gov
# usernameはanonymous です。passwordはmail addressです。
> cd ./refseq/D_rerio/mRNA_Prot
> get zebrafish.rna.fna.gz
> quit

#ダウンロードしたファイルを解凍
$ gunzip zebrafish.rna.fna.gz

#解凍したファイルの中身を確認
$ less zebrafish.rna.fna

#データベースを作成(zebrafish.rnaとする)
$ makeblastdb -in zebrafish.rna.fna -out zebrafish.rna -dbtype nucl -hash_index
# ~/blast/dbに先ほど作成したデータベースに関係するバイナリファイルが生成しているか確認する。
a$ ls -l
total 161072
-rw-r--r--  1 kappa  staff  61601369  9 18 06:23 zebrafish.rna.fna
-rw-r--r--  1 kappa  staff    463168  9 18 23:49 zebrafish.rna.nhd
-rw-r--r--  1 kappa  staff     10816  9 18 23:49 zebrafish.rna.nhi
-rw-r--r--  1 kappa  staff   4681996  9 18 23:49 zebrafish.rna.nhr
-rw-r--r--  1 kappa  staff    340056  9 18 23:49 zebrafish.rna.nin
-rw-r--r--  1 kappa  staff    113356  9 18 23:49 zebrafish.rna.nog
-rw-r--r--  1 kappa  staff    714386  9 18 23:49 zebrafish.rna.nsd
-rw-r--r--  1 kappa  staff     14750  9 18 23:49 zebrafish.rna.nsi
-rw-r--r--  1 kappa  staff  14506797  9 18 23:49 zebrafish.rna.nsq

#ホームディレクトリに設定ファイル(.ncbirc)を作る
$ ~/.ncbirc


; Start the section for BLAST configuration
[BLAST]
; Specifies the path where BLAST databases are installed
BLASTDB=/Users/kappa/blast/db
; Specifies the data sources to use for automatic resolution
; for sequence identifiers
DATA_LOADERS=none
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_PROT_DATA_LOADER=nr
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_NUCL_DATA_LOADER=nt
; Windowmasker settings (experimental)
[WINDOW_MASKER]
WINDOW_MASKER_PATH=/Users/kappa/blast/db/windowmasker
; end of file


#これで設定完了
#tp53のmRNAの配列をblastにかけてみる。
$ head tp53.fasta

>gi|18859502|ref|NM_131327.1| Danio rerio tumor protein p53 (tp53), mRNA
GTTTAGTGGAGAGGAGGTCGGCAAAATCAATTCTTGCAAAGCAATGGCGCAAAACGACAGCCAAGAGTTC
GCGGAGCTCTGGGAGAAGAATTTGATTATTCAGCCCCCAGGTGGTGGCTCTTGCTGGGACATCATTAATG
ATGAGGAGTACTTGCCGGGATCGTTTGACCCCAATTTTTTTGAAAATGTGCTTGAAGAACAGCCTCAGCC
ATCCACTCTCCCACCAACATCCACTGTTCCGGAGACAAGCGACTATCCCGGCGATCATGGATTTAGGCTC
AGGTTCCCGCAGTCTGGCACAGCAAAATCTGTAACTTGCACTTATTCACCGGACCTGAATAAACTCTTCT
GTCAGCTGGCAAAAACTTGCCCCGTTCAAATGGTGGTGGACGTTGCCCCTCCACAGGGCTCCGTGGTTCG
AGCCACTGCCATCTATAAGAAGTCCGAGCATGTGGCTGAAGTGGTCCGCAGATGCCCCCATCATGAGCGA
ACCCCGGATGGAGATAACTTGGCGCCTGCTGGTCATTTGATAAGAGTGGAGGGCAATCAGCGAGCAAATT
ACAGGGAAGATAACATCACTTTAAGGCATAGTGTTTTTGTCCCATATGAAGCACCACAGCTTGGTGCTGA

$ blastn -db zebrafish.rna -query tp53.fasta  -out blast.out

$ less blast.out