mol2psによりsdf->psの変換をしたどーーーー♪



pubchemにいって、アスピリンを入力して構造式のデータをとってくる。

このとき、

1 Download SDF
2 2D SDF save

の2段階で行った。

でも、以下の用にしてもできてしまうことを発見した

$ wget http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=2244


一般化すると


$ wget http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=xxxx

で好きな化合物のsdfファイルがとってこれそうだ!!!





それでダウンロードしたファイルをカレントディレクトリに移動しといて、

$ head CID_2244.sdf
2244
  -OEChem-02121112262D

 21 21  0     0  0  0  0  0  0999 V2000
    3.7320   -0.0600    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    6.3301    1.4400    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    4.5981    1.4400    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    2.8660   -1.5600    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
    4.5981   -0.5600    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    5.4641   -0.0600    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0


ここで、mol2psという、MOLファイル表示をPostscriptに出力するソフトウェアをインストールする。

$ wget http://merian.pch.univie.ac.at/pch/download/chemistry\
> /mol2ps/bin/mol2ps-latest-linux-i386.gz


$ gunzip mol2ps-latest-linux-i386.gz
$ sudo install mol2ps-latest-linux-i386 /usr/local/bin/mol2ps


よし、実際ps形式に変更してみるぞ!!

$ mol2ps CID_2244.sdf > CID_2244.ps


$ head CID_2244.ps
%!PS-Adobe-2.0
%%Creator: mol2ps 0.2,  Norbert Haider, University of Vienna, 2011
%%Title: CID_2244.sdf
% the following settings were used:
% font: Helvetica 14 pt (9 pt for subscripts)
% line width: 1.0
% automatic rotation:
%      0.00� around X axis
%      0.00� around Y axis
%      0.00� around Z axis

やはりブログにはpngファイルしか貼れないのでファイル形式を変換していく。


$ sudo apt-get install gv
$ ps2pdf CID_2244.ps
$ convert CID_2244.pdf -CID_2244.png