医療系の仕事をしています。生命の尊さ、美しさがどのようなメカニズムで生じるのかに興味があります。科学の方法論を用いて、このような問いに応えたい、私はこう思って医学生物学の基礎研究のトレーニングを受けてきました。生命を科学的手法を用いて理解を試みる上で、genomeを始めとした種々の大量データの処理が必要不可欠であることを痛感しました。また、生命科学が物理学、数学、統計学、有機化学などの種々の学問と深い関わりを持つことを実感しました。そのため、このブログは広範囲の学問領域に関しての記事を載せています。日々の学習内容を文書に書き残し、それを読み返すことによって、体系化された知識を身に付けることを目標としています。どうぞよろしくお願いします。
ubuntuの環境でEMBOSSを使えるようにする!!!(しんどかった。。。)
#まずはコンパイルできる環境を整えるために必要なソフトをインストールします。
$sudo apt-get install build-essential
EMBOSSのホームページ http://emboss.sourceforge.net/
ここのEMBOSSのソースファイルがおいてある ftp://emboss.open-bio.org/pub/EMBOSS/
$ls
2011 R ダウンロード デスクトップ ビデオ ミュージック
examples.desktop テンプレート ドキュメント ピクチャ 公開
$wget ftp://emboss.open-bio.org/pub/EMBOSS/EMBOSS-6.3.1.tar.gz
$ls
2011 R ダウンロード デスクトップ ビデオ ミュージック
EMBOSS-6.3.1.tar.gz examples.desktop テンプレート ドキュメント ピクチャ 公開
$tar xfz EMBOSS-6.3.1.tar.gz #圧縮形式のEMBOSS-6.3.1.tar.gzをカレントディレクトリに展開する
$ls
2011 EMBOSS-6.3.1.tar.gz examples.desktop テンプレート ドキュメント ピクチャ 公開
EMBOSS-6.3.1 R ダウンロード デスクトップ ビデオ ミュージック
$cd EMBOSS-6.3.1 #展開により生成したディレクトリに移動
$pwd
/home/tetsuo/EMBOSS-6.3.1
$./configure --without-x
#configureコマンドは、インストールするPC環境(コンパイラの種類など)をチェックして、その環境にあったビルド方法を定義した「Makefile」というファイルに作成する。 "--without-x"というオプションをつけないとubuntu10.04の環境ではエラーが出てしまう!!!!!!!!!!!!!!!!!!
#X11 graphics have been selected but no X11 header files have been found.らしいんで
$make #makeコマンドはMakefileに記述された方法でソースファイルをコンパイル、実行ファイルを作る。
$sudo make install #インストールを実行
#EMBOSSを使うには、"emboss.default"を作成する必要がある。以下のディレクトリにテンプレートがおいてあるのでそれをコピーして使う。
$cd /usr/local/share/EMBOSS
$sudo cp emboss.default.template emboss.default
$wossname #wossnameでコマンド一覧を表示しようと思って入れてもエラーメッセージが出て本当に困った。
$export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH
#これを入力する必要があることがいつまでもたっても調べきれず、途方に暮れた・・・・。外国のユーザーの方はとっくの昔に掲示板に質問してて、ビックリした。。
$wossname
Finds programs by keywords in their short description
Text to search for, or blank to list all programs: add
SEARCH FOR 'ACD'
acdc Test an application ACD file
acdpretty Correctly reformat an application ACD file
acdtable Generate an HTML table of parameters from an application ACD file
acdtrace Trace processing of an application ACD file (for testing)
acdvalid Validate an application ACD file
$showdb #データベースを表示。
Displays information on configured databases
# Name Type ID Qry All Comment
# ============ ========== == === === =======
tpir Protein OK OK OK PIR using NBRF access for 4 files
tsw Protein OK OK OK Swissprot native format with EMBL CD-ROM index
tswnew Protein OK OK OK Swissnew as 3 files in native format with EMBL CD-ROM index
twp Protein OK OK OK EMBL new in native format with EMBL CD-ROM index
tembl Nucleotide OK OK OK EMBL in native format with EMBL CD-ROM index
tgb Nucleotide OK OK OK Genbank IDs
tgenbank Nucleotide OK OK OK GenBank in native format with EMBL CD-ROM index
#このままでは(初期状態ではネットワーク越しの遺伝子配列の取得が指定されていないので、一例として、先ほど作成したemboss.defaultの内容に対して以下の記述を追加する)
# ただし、emboss.defaultも読み取り専用の設定となっておいる。これを変更するため、root権限で読み取り専用を解除する$sudo nautilusでパスワードを入力し、ファイルマネージャーを起動する。
# /usr/local/share/EMBOSSのフォルダを開き、「emboss.default」を右クリックして、「プロパティ」→「アクセス権」のタブを開き、「読み込み専用」のところを「読み書き」に変更。そしてやっと開いたファイルに対して、本文の末尾に続けて、ネット上で公開されているKNOBのソースコード(http://itoshi.tv/emboss.default)をぶち込む。これでかの有名なKNOB(Knoppix for Bio)と同じ環境でEMBOSSを楽しむことができる(ハズ)♪♪♪
--------------ここから-------------------------------
#
# emboss.default for Knoppix for bio (KNOB)
#
# written by Itoshi NIKAIDO <dritoshi at gmail dot com>
#
SET emboss_data /usr/share/EMBOSS/data
########################
### access method SRSWWW
########################
DB embl [
type: N
format: embl
method: srswww
dbalias: embl
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "The EMBL nucleotide sequence database constitutes Europes primary nucleotide sequence resource. The database is produced in an international collaboration with GenBank (USA) and the DNA Database of Japan (DDBJ)."
]
DB refseq [
type: N
format: genbank
method: srswww
dbalias: REFSEQ
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Database providing non-redundant curated data representing knowledge of known genes"
]
DB swall [
type: P
format: swiss
method: srswww
dbalias: SWALL
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "A combined database of Swiss-Prot, SPTREMBL and TREMBLNEW. Does not contain REMTREMBL. "
]
DB swissprot [
type: P
format: swiss
method: srswww
dbalias: SWISSPROT
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Database of protein sequences produced collaboratively by the Swiss Institute for Bioinformatics (SIB) and the European Bioinformatics Institute (EBI). "
]
DB SpTrEMBL [
type: P
format: embl
method: srswww
dbalias: SPTREMBL
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Contains the translations of all coding sequences present in the EMBL sequence database not yet integrated in SWISS-PROT "
]
DB pir [
type: P
format: pir
method: srswww
dbalias: PIR
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Protein Identification Resource. "
]
DB refseqp [
type: P
format: genbank
method: srswww
dbalias: REFSEQP
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Database of protein information from REFSEQ "
]
DB DDBJRELEASE [
type: N
format: genbank
method: srswww
url: http://srs.ddbj.nig.ac.jp/cgi-bin/wgetz
dbalias: DDBJRELEASE
fields: "sv des org key"
comment: "DDBJRELEASE IDs"
]
DB DDBJNEW [
type: N
format: genbank
method: srswww
url: http://srs.ddbj.nig.ac.jp/cgi-bin/wgetz
dbalias: DDBJNEW
fields: "sv des org key"
comment: "DDBJNEW IDs"
]
DB GENBANK [
type: N
format: genbank
method: url
url: "http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=nucleotide&rettype=gb&retmode=text&id=%s"
dbalias: GENBANKN
comment: "NCBI IDs"
]
# SET emboss_proxy "10.3.1.1:8080"
--------------ここまで-----------------------------------------
あと、これも入れときました。
DB swissprot [
type: P
format: swiss
method: srswww
dbalias: SWISSPROT
fields: "sv des org key"
url: http://srs.ebi.ac.uk/cgi-bin/wgetz
comment: "Database of protein sequences by SIB and EBI. "
]
これで完成です!!
これで私のPCでもEMBOSSが楽しみたい放題になるといいなあと思います。