バイオインフォマティクス 中部大学2024年秋学期

塩基配列を比較する2

手作業で塩基配列を比較する

配布した用紙を使って二つの塩基配列(ATTGGATTGAAGGGAGCTCCA と ATTGGATTTGAAGGGAGCTCC)を比較せよ。

塩基配列の比較を二次元で行う

  1. 新しいワークシートもしくは新しいExcelのファイルを用意する。
  2. B1のセルに1つ目の塩基配列、B2のセルに二つ目の塩基配列を入力する。
  3. 1つ目の塩基配列をB6からB26のセルに1塩基ずつばらします。 そのためにA6からA26に1から21の数字を入れるようにし、B6からB26のセルに =mid($B$1,A6,1) と入力します。
  4. 2つ目の塩基配列をC5からW5のセルに1塩基ずつばらします。 そのためにC4からW4に1から21の数字を入れるようにし、C5からW5のセルに =mid($B$2,C4,1) と入力します。
  5. B列の塩基配列と5行目の塩基配列をif関数で比較します。 C6のセルに =if(C$5=$B6,"*","") と入力します。 C6のセルをC6からW26までコピーします。

左上から右下に向けて*が並んでいることがわかる。 塩基配列の9番目付近で*の並びが右にずれていることに注目せよ。

一塩基ずつ比較をすると4分の1の確率で偶然一致して*が表示される。 これはノイズになり、本来見たい*が左上から右下につながって見えることを邪魔をすることになる。 ノイズを減らすための工夫を考えよ。

練習

次の二つの塩基配列を比較せよ

ATTGGATTGAAGGGAGCTCCA
ATTGGATGCTCCA

同じ塩基配列どうしで比較せよ

ATTGGCAATTGGCAATTGGCA

YASSを使う

二つの塩基配列を水平方向と垂直方向に並べて、一致するところに点を打ってつくる図をハープロット(harplot)と呼ぶ。 ハープロットは二つの塩基配列の似ているところを分かりやすく表示するよい方法である。

上記のようにExcelを使うことで小さなハープロット(のような図)をつくることができるが、大きな塩基配列では難しい。 そこで専用のツールを使う。

ハープロットを作成してくれるウェブサービスがYASSである。 (厳密にはハープロットではないが、その違いはここでは問題にならないので便宜的に利用する)。

  1. YASS のページを開く。
  2. "Paste your sequence(s)" ののテキストエリアに下記の塩基配列をコピーする。

    テキストエリアの右のselectボタンをクリックする。
  3. "Paste your sequence(s)" ののテキストエリアに下記の塩基配列をコピーする。

    テキストエリアの右のselectボタンをクリックする。
  4. run YASS ボタンをクリックする。
  5. DotplotのSimpleをクリックする。
  6. ハープロットが表示される。 図中の緑の線は二つの塩基配列の似ているところを示している。 赤線(右上がりの斜線)は相補鎖が似ているところを示す。 緑線または赤線をクリックするとアライメントが表示される。

以下の二つの塩基配列をハープロットで比較せよ。