4.13.4 Base Distribution

Base Distribution (塩基分布) 解析は、特定の1塩基、または、複数塩基の組み合わせの分布をDNA の位置関数として調べるものです。図 4.17 に示すのはそのセットアップパネルです。

図 4.17:Base Distribution パネル

このパネルを使って、任意の単一塩基、または、それらの任意の組み合わせを指定することができます。この図では、このシーケンス長に存在する G+C 塩基の分布量を表示させるために、G と C のボックスにチェックが入れられています。窓サイズには 20 が、オフセットには 1 が選択されています。このパネルの一番上の図にこれに関する説明があります。ヌクレオチド 1 ~ 20 の間に G+C がどれだけあるかを調べ、この窓にある G の数と C の数の和がプロットされます。次に、窓を1塩基 (オフセット指定の1塩基) だけ移動し、ヌクレオチド 2 ~ 21 が評価されます。窓サイズ 20 とオフセット 1 を使用したこれと同じプロセスが、DNA シーケンスの終わりまで繰り返し実行されます。この解析は、DNA 領域の中で注目に値しそうな塩基組成がないかを局所的に調べるのに役立ちます。図 4.18 に解析結果を示します。ヌクレオチド 250 付近が A+T の多い領域である (つまり、G+C が少ない) ことが、これによって簡単にわかる点に注目してください。この解析は、他の解析では視覚化できない DNA の特徴を指摘できる点で非常に役立ちます。

図 4.18: Base Distribution の出力例