EMBOSSを使って、塩基配列を操作。プライマーの設計。

homo sapiens のVEGFA(vascular endothelial growth factor A isoform a)をネタにEMBOSSを使い倒してみる。

#Refseqの配列のuniform sequence address, 名前、アクッセンション番号、核酸配列orアミノ酸配列、配列の長さ、gcの割合、配列の説明を取得
$ infoseq 
 
 Display basic information about sequences
Input (gapped) sequence(s): refseq:NM_001025366
USA                      Database  Name           Accession      Type Length %GC    Organism            Description
refseq-id:NM_001025366   refseq         NM_001025366   NM_001025366   N    3677   51.26  Homo sapiens (human) Homo sapiens vascular endothelial growth factor A (VEGFA), transcript variant 1, mRNA.

#一行でテキストファイルに出力してしまなら
$ infoseq refseq:NM_001025366 -outfile=NM_001025366_infoseq.txt

Reads and writes (returns) sequences
Input (gapped) sequence(s): refseq:NM_001025366
output sequence(s) [nm_001025366.fasta]: NM_001025366.nt

#seqretコマンドを使って塩基配列を取り出す。
Reads and writes (returns) sequences
Input (gapped) sequence(s): refseq:NM_001025366
output sequence(s) [nm_001025366.fasta]: NM_001025366.nt

#一行で書くなら
$seqret refseq:NM_001025366 -outseq NM_001025366

#NM_001025366を毎回入力するのがめんどくさい場合は、テキストファイルの中に
#refseq:NM_001025366と書いたものを用意して、@+ファイル名でseqretの引数に加えてやればよい。この方法だと、複数の配列をテキストファイルの中に書いておけば、一度に複数の配列をダウンロードしてくることができる。
$ seqret @NM_001025366.txt  -outseq=NM_001025366


 #配列以外の情報もすべてゲットしたいときは、entretコマンドがおすすめ。
$ entret @NM_001025366.txt  -outfile=NM_001025366.entret


#配列のアノテーションが書かれているfeatureの部分を可視化するには,showfeatコマンド
$ showfeat @NM_001025366.txt  -outfile=NM_001025366.entret