医療系の仕事をしています。生命の尊さ、美しさがどのようなメカニズムで生じるのかに興味があります。科学の方法論を用いて、このような問いに応えたい、私はこう思って医学生物学の基礎研究のトレーニングを受けてきました。生命を科学的手法を用いて理解を試みる上で、genomeを始めとした種々の大量データの処理が必要不可欠であることを痛感しました。また、生命科学が物理学、数学、統計学、有機化学などの種々の学問と深い関わりを持つことを実感しました。そのため、このブログは広範囲の学問領域に関しての記事を載せています。日々の学習内容を文書に書き残し、それを読み返すことによって、体系化された知識を身に付けることを目標としています。どうぞよろしくお願いします。
mol2psによりsdf->psの変換をしたどーーーー♪
pubchemにいって、アスピリンを入力して構造式のデータをとってくる。
このとき、
1 Download SDF
2 2D SDF save
の2段階で行った。
でも、以下の用にしてもできてしまうことを発見した
$ wget http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=2244
一般化すると
$ wget http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=xxxx
で好きな化合物のsdfファイルがとってこれそうだ!!!
それでダウンロードしたファイルをカレントディレクトリに移動しといて、
$ head CID_2244.sdf
2244
-OEChem-02121112262D
21 21 0 0 0 0 0 0 0999 V2000
3.7320 -0.0600 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
6.3301 1.4400 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
4.5981 1.4400 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
2.8660 -1.5600 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0
4.5981 -0.5600 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
5.4641 -0.0600 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
ここで、mol2psという、MOLファイル表示をPostscriptに出力するソフトウェアをインストールする。
$ wget http://merian.pch.univie.ac.at/pch/download/chemistry\
> /mol2ps/bin/mol2ps-latest-linux-i386.gz
$ gunzip mol2ps-latest-linux-i386.gz
$ sudo install mol2ps-latest-linux-i386 /usr/local/bin/mol2ps
よし、実際ps形式に変更してみるぞ!!
$ mol2ps CID_2244.sdf > CID_2244.ps
$ head CID_2244.ps
%!PS-Adobe-2.0
%%Creator: mol2ps 0.2, Norbert Haider, University of Vienna, 2011
%%Title: CID_2244.sdf
% the following settings were used:
% font: Helvetica 14 pt (9 pt for subscripts)
% line width: 1.0
% automatic rotation:
% 0.00� around X axis
% 0.00� around Y axis
% 0.00� around Z axis
やはりブログにはpngファイルしか貼れないのでファイル形式を変換していく。
$ sudo apt-get install gv
$ ps2pdf CID_2244.ps
$ convert CID_2244.pdf -CID_2244.png