homo sapiens のVEGFA(vascular endothelial growth factor A isoform a)をネタにEMBOSSを使い倒してみる。
#Refseqの配列のuniform sequence address, 名前、アクッセンション番号、核酸配列orアミノ酸配列、配列の長さ、gcの割合、配列の説明を取得
$ infoseq
Display basic information about sequences
Input (gapped) sequence(s): refseq:NM_001025366
USA Database Name Accession Type Length %GC Organism Description
refseq-id:NM_001025366 refseq NM_001025366 NM_001025366 N 3677 51.26 Homo sapiens (human) Homo sapiens vascular endothelial growth factor A (VEGFA), transcript variant 1, mRNA.
#一行でテキストファイルに出力してしまなら
$ infoseq refseq:NM_001025366 -outfile=NM_001025366_infoseq.txt
Reads and writes (returns) sequences
Input (gapped) sequence(s): refseq:NM_001025366
output sequence(s) [nm_001025366.fasta]: NM_001025366.nt
#seqretコマンドを使って塩基配列を取り出す。
Reads and writes (returns) sequences
Input (gapped) sequence(s): refseq:NM_001025366
output sequence(s) [nm_001025366.fasta]: NM_001025366.nt
#一行で書くなら
$seqret refseq:NM_001025366 -outseq NM_001025366
#NM_001025366を毎回入力するのがめんどくさい場合は、テキストファイルの中に
#refseq:NM_001025366と書いたものを用意して、@+ファイル名でseqretの引数に加えてやればよい。この方法だと、複数の配列をテキストファイルの中に書いておけば、一度に複数の配列をダウンロードしてくることができる。
$ seqret @NM_001025366.txt -outseq=NM_001025366
#配列以外の情報もすべてゲットしたいときは、entretコマンドがおすすめ。
$ entret @NM_001025366.txt -outfile=NM_001025366.entret
#配列のアノテーションが書かれているfeatureの部分を可視化するには,showfeatコマンド
$ showfeat @NM_001025366.txt -outfile=NM_001025366.entret