チュートリアル 17: Testcode (インタラクティブな解析の紹介)

Gene Inspector はインタラクティブなアプリケーションです。これは、殆ど全ての関数を殆どいつでも実行することができることを意味します。また、画面上の出力オブジェクトを通じてインタラクティブにその外観を変更したり、解析に戻ったり、さらに、Testcode に関するこのチュートリアルや、チュートリアル 18:“ドットマトリックス解析 (インタラクティブな解析のもう一つの事例)” で説明するような解析的プロセスも続行できることを意味します。

  1. TestCode 解析で出力された結果は、それを元にして更に別な情報を作成したり、別の解析を立ち上げるのに使用することができます。この機能には、各解析を再計算する機能が加わります。Analysis > New Analysis... を選択し、Nucleic acid analysis から TestCode を選択します。

  2. TestCode は、ある読み枠 (open reading frame) がタンパク質を実際にコードするかどうかを決定するのに使用します。この解析に関する詳細な情報は “TestCode” をご覧ください。図 2.39 に示すような TestCode パネルが表示されるはずです。このパネルについては、ここでは詳しくは触れないことにします。“Minimum Length Open Reading Frame to Consider” には 200 を (図の A )、Method は “Only Stop Codons” を、ORFs and rare codons ボタンを選択し、ポップアップメニューから標準テーブルとして Drosophila melanogaster (図の B) を選択します。
    図 2.39: TestCode の Setup パネル

  3. 左側の Input Sequence アイコンをクリックして、DNA シーケンスファイル Drosophila Hsps から hsp70 シーケンスを選択します。

  4. Run ボタンをクリックして解析をスタートします。処理速度の遅いコンピュータであれば解析の実行に多少時間がかかります。解析の実行中であっても、ノートブックの背景をクリックすることでテキストを入力することができます。ノートブックで別な作業したり、別のアプリケーションに切り替えても、Gene Inspector では解析処理が進められます。このことは、解析の実行中であっても作業が中断されることはないことを意味します。データベース検索やシーケンス比較のような時間の掛かる解析であっても、待ち時間を無駄にすることはありません。

  5. 図 2.40 に示すようなプロットが出力されるはずです。上側閾値をあらわすグリーンのラインより上の点 (0.95 付近) はいずれも、その領域が実際にタンパク質をコードする尤度 (likelihood) 95% に対応します。この事例の場合、1600 ~ 3600 の領域がプロットの高い部分と、ラベル A で示した読み枠に対応します。目盛りはレアコドン (Rare Codon) があることを示します。予測されたこのタンパク質に関して言えば、レアコドンの数は非常に少ないので、実際の遺伝子である可能性が高いと考えられます。
    図 2.40:TestCode 出力結果

  6. この出力結果から、読み枠 A は、何らかのタンパク質をコードし、その DNA 領域に対応するタンパク質シーケンスの作成に何らかの関わりがあるだろうと考えられます。これは、Gene Inspector で簡単に実行できます。出力オブジェクトをダブルクリックしてそれをターゲット状態にします。

  7. 次に、この読み枠 (ORF) を1回クリックして選択状態にします。ORF が選択状態になったら、Object > Translate DNA for Selected ORF を選択します。Gene Inspector にその DNA セグメントが読み込まれ、この解析で指定したテーブルを使用して翻訳が行われ、これによって生成されたペプチドシーケンスが新規シーケンスウィンドウとして配置されます。

  8. 新規シーケンスウィンドウで ORF1 という名称をクリックしたら、Sequence > Sequence Info... を選択してみましょう。プログラムによって適切なテキストが自動的に生成されているのを確認できます。この情報はタンパク質の由来を識別するのに役立ちます。

以上は、ユーザーの思考の自然な流れに沿った直観的な操作で Gene Inspector を活用できた良い例です。ある DNA シーケンスについて、コーディング領域があるかを調べ、そのことが確認できたら、今度はさらに一歩進めて、それに対応するペプチドシーケンスを作成して、それを調べてみたいと思うでしょう。

以上でこのチュートリアルを終わります。ここでチュートリアルを終了しても、次のチュートリアルに進んでも結構です。次に進む場合は、現在開いているウィンドウを全て閉じてください。