#まずは、ncbiのftpサイトからバイナリファイルをダウンロードしてきます。
$ curl -O ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.2.26/ncbi-blast-2.2.26+.dmg
#インストーラーの起動
$ open ncbi-blast-2.2.26+.dmg
#データベース構築のための準備
$ mkdir ~/blast
$ cd ~/blast
$ mkdir db
$ cd db
#ncbiのftpサーバーから、zebrafishのmRNAのRefseqの情報を取得する。
$ ftp ftp.ncbi.nlm.nih.gov
# usernameはanonymous です。passwordはmail addressです。
> cd ./refseq/D_rerio/mRNA_Prot
> get zebrafish.rna.fna.gz
> quit
#ダウンロードしたファイルを解凍
$ gunzip zebrafish.rna.fna.gz
#解凍したファイルの中身を確認
$ less zebrafish.rna.fna
#データベースを作成(zebrafish.rnaとする)
$ makeblastdb -in zebrafish.rna.fna -out zebrafish.rna -dbtype nucl -hash_index
# ~/blast/dbに先ほど作成したデータベースに関係するバイナリファイルが生成しているか確認する。
a$ ls -l
total 161072
-rw-r--r-- 1 kappa staff 61601369 9 18 06:23 zebrafish.rna.fna
-rw-r--r-- 1 kappa staff 463168 9 18 23:49 zebrafish.rna.nhd
-rw-r--r-- 1 kappa staff 10816 9 18 23:49 zebrafish.rna.nhi
-rw-r--r-- 1 kappa staff 4681996 9 18 23:49 zebrafish.rna.nhr
-rw-r--r-- 1 kappa staff 340056 9 18 23:49 zebrafish.rna.nin
-rw-r--r-- 1 kappa staff 113356 9 18 23:49 zebrafish.rna.nog
-rw-r--r-- 1 kappa staff 714386 9 18 23:49 zebrafish.rna.nsd
-rw-r--r-- 1 kappa staff 14750 9 18 23:49 zebrafish.rna.nsi
-rw-r--r-- 1 kappa staff 14506797 9 18 23:49 zebrafish.rna.nsq
#ホームディレクトリに設定ファイル(.ncbirc)を作る
$ ~/.ncbirc
; Start the section for BLAST configuration
[BLAST]
; Specifies the path where BLAST databases are installed
BLASTDB=/Users/kappa/blast/db
; Specifies the data sources to use for automatic resolution
; for sequence identifiers
DATA_LOADERS=none
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_PROT_DATA_LOADER=nr
; Specifies the BLAST database to use resolve protein sequences
;BLASTDB_NUCL_DATA_LOADER=nt
; Windowmasker settings (experimental)
[WINDOW_MASKER]
WINDOW_MASKER_PATH=/Users/kappa/blast/db/windowmasker
; end of file
#これで設定完了
#tp53のmRNAの配列をblastにかけてみる。
$ head tp53.fasta
>gi|18859502|ref|NM_131327.1| Danio rerio tumor protein p53 (tp53), mRNA
GTTTAGTGGAGAGGAGGTCGGCAAAATCAATTCTTGCAAAGCAATGGCGCAAAACGACAGCCAAGAGTTC
GCGGAGCTCTGGGAGAAGAATTTGATTATTCAGCCCCCAGGTGGTGGCTCTTGCTGGGACATCATTAATG
ATGAGGAGTACTTGCCGGGATCGTTTGACCCCAATTTTTTTGAAAATGTGCTTGAAGAACAGCCTCAGCC
ATCCACTCTCCCACCAACATCCACTGTTCCGGAGACAAGCGACTATCCCGGCGATCATGGATTTAGGCTC
AGGTTCCCGCAGTCTGGCACAGCAAAATCTGTAACTTGCACTTATTCACCGGACCTGAATAAACTCTTCT
GTCAGCTGGCAAAAACTTGCCCCGTTCAAATGGTGGTGGACGTTGCCCCTCCACAGGGCTCCGTGGTTCG
AGCCACTGCCATCTATAAGAAGTCCGAGCATGTGGCTGAAGTGGTCCGCAGATGCCCCCATCATGAGCGA
ACCCCGGATGGAGATAACTTGGCGCCTGCTGGTCATTTGATAAGAGTGGAGGGCAATCAGCGAGCAAATT
ACAGGGAAGATAACATCACTTTAAGGCATAGTGTTTTTGTCCCATATGAAGCACCACAGCTTGGTGCTGA
$ head tp53.fasta
>gi|18859502|ref|NM_131327.1| Danio rerio tumor protein p53 (tp53), mRNA
GTTTAGTGGAGAGGAGGTCGGCAAAATCAATTCTTGCAAAGCAATGGCGCAAAACGACAGCCAAGAGTTC
GCGGAGCTCTGGGAGAAGAATTTGATTATTCAGCCCCCAGGTGGTGGCTCTTGCTGGGACATCATTAATG
ATGAGGAGTACTTGCCGGGATCGTTTGACCCCAATTTTTTTGAAAATGTGCTTGAAGAACAGCCTCAGCC
ATCCACTCTCCCACCAACATCCACTGTTCCGGAGACAAGCGACTATCCCGGCGATCATGGATTTAGGCTC
AGGTTCCCGCAGTCTGGCACAGCAAAATCTGTAACTTGCACTTATTCACCGGACCTGAATAAACTCTTCT
GTCAGCTGGCAAAAACTTGCCCCGTTCAAATGGTGGTGGACGTTGCCCCTCCACAGGGCTCCGTGGTTCG
AGCCACTGCCATCTATAAGAAGTCCGAGCATGTGGCTGAAGTGGTCCGCAGATGCCCCCATCATGAGCGA
ACCCCGGATGGAGATAACTTGGCGCCTGCTGGTCATTTGATAAGAGTGGAGGGCAATCAGCGAGCAAATT
ACAGGGAAGATAACATCACTTTAAGGCATAGTGTTTTTGTCCCATATGAAGCACCACAGCTTGGTGCTGA
$ blastn -db zebrafish.rna -query tp53.fasta -out blast.out
$ less blast.out