clustalについて

前回のブログで

コマンドライン上で

$ clustalw

を使った。

そもそもclustalとは

以下のようなアプリケーションを言うらしい。(Wikipedia: http://ja.wikipedia.org/wiki/Clustalより引用)

Clustalは広く用いられている多重整列プログラムである。現在はコマンドライン版のClustal WGUI版のClustal Xとがある。欧州バイオインフォマティクス研究所FTPサーバから入手できる。


以下の3つの段階を踏む。
  1. 1対1の整列(ペアワイズアラインメント)を行う
    1対1の整列を総当たりで行い、配列一致度の行列を作成する。


  2. 配列一致度に基づいて樹形図(Guide Tree)を得る
    配列一致度を距離尺度に用いて階層型クラスタリングを行う。この際のアルゴリズムは近隣結合法(または非加重結合法)が用いられている。


  3. 樹形図に沿って配列を追加しながら整列を行う
    最も一致度の高い配列ペアからはじめて、樹形図に沿って1つずつ配列を追加しながら整列させていくことで効率的に多重整列を得る。


これらは自動的に行われるが、ガイドツリーのみを計算させたり、ガイドツリーを指定して多重整列のみを行わせることもできる。