3.3 Editing ペイン

Editing ペインには、シーケンス名をあらわす Name 列、各行の先頭の残基位置をあらわす Position 列、そして、シーケンスそのものをあらわす領域の合計3つの領域があります:これらに加え、シーケンス内の文字位置をあらわすルーラー (Ruler) があります (また、多重整列したシーケンスを表示するための機能も用意されています。詳細は、"Multiple Sequence Alignments" をご覧ください)。シーケンスの名称をクリックすると、そのシーケンス全体が選択状態になり、シーケンス全体に対して操作を実行できるようになります (あるシーケンス全体を別なシーケンスウィンドウにコピー&ペーストするような場合)。シーケンス名を選択すると、そのシーケンスに関する情報を確認することもできます。図 3.2 は、ある核酸シーケンスの情報をあらわしたものです。このウィンドウでは、シーケンス自体に関する情報が表示されるとともに、コメントとしてのテキストを入力したり、先頭ヌクレオチドの位置を再定義することができます。シーケンスが核酸 (nucleic acids) の場合は、シーケンスを DNA または RNA として表示することができます (RNA では T の代わりに U を表示)。シーケンスの形状を環状 (Circular) または線状 (linear) に定義することもできます。この場合、一部の解析の実行で影響が出ます。例えば、DNA を環状 (circular) に定義すると、制限酵素消化 (restriction enzyme digests) 解析では、複製起点をクロスするシーケンスが検索されることになります (例:pBR322 の Eco RI 部位など)。

図 3.2:核酸シーケンスの情報

 

図 3.3 は、タンパク質のシーケンス情報を示したものです。核酸シーケンスで表示されるのと基本的には同じ内容が表示されますが、環状のタンパク質は (まだ) 存在しませんので、シーケンスを環状にすることはできません。

図 3.3:ペプチドシーケンスの Get Info... ウィンドウ

 

シーケンスドキュメント内に並んだ各シーケンスの順番は、Option (Alt) キーを押したまま、シーケンスの名称のいずれかをクリックし、その列を上下にドラッグすることで変更することができます。シーケンスを Option + ドラッグすると、マウスボタンを離したときにシーケンスが配置される場所を示すインジケーターが表示されます。

新規のシーケンスをシーケンスドキュメントに追加するには、Sequence > New Sequence... を選択します。これを実行すると、新規シーケンスの名称を入力するためのダイアログボックスが表示されます。これによって追加するシーケンスは、シーケンスエディタードキュメントの最後のシーケンスの下に作成されることになります。最後に、他の場所からコピーしたシーケンスを新規シーケンスにペーストするか、新規シーケンスにデータを直接入力します。

シーケンスそのものの中にある文字範囲をマウスでドラッグすれば、ワードプロセッサでするのと同様に選択することもできます。なお、マウスを縦方向にドラッグして選択範囲を広げようとしても、ワードプロセッサとは異なり、選択できるのは最初にクリックしたシーケンスのみである点にご注意ください。他のシーケンスを交互に選択することはできません。

選択した残基 (ヌクレオチド又はアミノ酸) に対して様々な操作を実行することができます。あるセグメントを選択して解析を実行すると、選択したシーケンスで選択した範囲の文字が、解析セットアップのインプットパネルでデフォルトのシーケンスとして使用されます。この機能を使えば、シーケンスで作業しながら、ある文字範囲を選択することで、その範囲の特定の文字列に対して解析を実行するといった使い方ができます。

シーケンスに制限酵素部位 (restriction sites) と翻訳 (translation) を表示する詳細ビューを Feature Object に作成することも可能です。

 

シーケンスの操作方法

Sequence > Manipulate サブメニューには、シーケンスの選択したセグメントに対して実行することのできる幾つかの操作が用意されています。シーケンスが核酸 (nucleic acid) の場合は、Invert... と Translate... の2つが選択肢になります。Invert (反転) は、現在の DNA 鎖をひっくり返し、相補的 DNA 鎖を 5' から 3' の方向で表示します (例えば、ACCCGT というシーケンスを Invert で反転すると ACGGGT になります)。この DNA 鎖は同じ場所で反転されるため、現在の選択範囲が置き換えられます。これによって、ベクターへの挿入を反転するような操作を実行することができます。シーケンスの反転をしながらそのオリジナルも保持したい場合は、まずはじめに、反転したいシーケンスをコピーし、新規シーケンスウィンドウ、または、同一ウィンドウの新規シーケンスにそれをペーストしたあと、Invert を選択してください。新規シーケンスエディタ・ドキュメントを作成するには、File > New... を選択します。同一ドキュメントに新規シーケンスを作成するには、Sequence > New Sequence... を選択します。

Sequence > Manipulate > Translate... を選択すると、現在選択している核酸シーケンスの文字が翻訳されます。翻訳テーブルの選択を経て、核酸セグメントの選択範囲を翻訳した内容が新規ペプチドシーケンス・ウィンドウに作成されます。

シーケンスがペプチドの場合は、Sequence > Manipulate > Reverse Translate... を選択できます。このオプションを使えば、コドン選好テーブルの選択を経て、そのテーブル内の使用頻度を使用して、与えられたペプチドをコードする DNA シーケンスが作成されます。作成される DNA のコドン使用頻度は、選択した生物のコドン使用頻度と一致します。

 

シーケンスエディタにおけるシーケンスのフォーマット

シーケンスエディタには、シーケンスを表示するためのフォーマットを定義する数多くのオプションが用意されています。Sequence > Format Sequence... を選択すると、図 3.4 に示すようなダイアログが表示されます。Groups ボックスを使えば、文字をグループ化するか否か、グループ化する場合はそのサイズを指定することができます。Spaces ボックスでは、グループ間の間隔を設定することができます。この間隔の指定には、固定ピクセル数 (Space groups by pixel width)、または、標準文字幅のパーセント (By percent of character width) のいずれかを選択することができます。なお、シーケンスエディタでは、シーケンスの表示に Times, Helvetica, Palatino, Bookman 等のプロポーショナルフォントも使用できる点に注意してください。プロポーショナルフォントは均等幅ではありませんが、ウィンドウ内では文字が均等間隔で表示されます。ただし、プロポーショナルフォントを均等に表示させるために、プログラムは文字の一つ一つの位置を計算しますので、シーケンスの表示がそれだけ遅くなる点に注意してください。表示速度が低下するこうした問題は古いコンピューターで起こる可能性がありますが、最新のコンピュータであれば顕在化することはありません。画面の更新にあまりにも時間が掛かるようでしたら、表示フォントを余分な計算を必要としない均等フォント (Monaco や Courier など) に変更してみてください。

図 3.4: Format Sequence ダイアログ

 

Format メニューの中にある項目を使用することによってフォント、サイズ、シーケンスのスタイル設定を変更することも可能です。コマンドの中には、シーケンス表示の変更がドキュメント内のシーケンス全体に対してしかできないものもあります (フル機能を使ったシーケンスの表示については、 “Creating a Features Object View of a Sequence” をご覧ください) 。このようなイベントに対して警告を表示させたい場合は、Sequence > Use Extra Caution... を選択します。これを選択すると、図 3.5 に示すようなダイアログが表示されます。このプログラムで実行される内容をよく把握しており、こうしたダイアログで操作を妨げられたくない場合は、No ボタンをクリックします。プログラムがこれから実行する内容を告知させたい場合は、Yes ボタンをクリックします。

図 3.5: 特別警告 (Extra Caution) の使用