チュートリアル 8:コメントの検索とファイルの検索

前のチュートリアルでは、サイトマーカー、DNA セグメント、クロノグラフィック世代、関心領域それぞれに関連するコメントを入力できることを学びました。ひとつのコンストラクト内の世代 (Generation) が膨大な数にのぼれば、コンストラクトのどこに情報を保存したか、また、どのファイルに情報を保存したかを思い出すのが困難になることもあるでしょう。また、各コンストラクトに関連する一般的な情報の一部として、例えばコンストラクトの保管場所などの情報を保存しており、例えば、部屋番号 211 の冷蔵庫にある全てのコンストラクトのリストを知りたい場合、全てのファイルを素早く検索できると便利です。GCK のファイル検索機能を使えば、これらを実行することができます。

  1. GCK を起動して、tutorial files フォルダにある pBR322 ファイルを開きます。このベクターには複製起点 (origin of replication) があったことは憶えていますが、画面には表示されていませんし、どの世代に関連づけているのかも憶えていません。このような場合、Search Comments 機能を使うことで、この feature の場所を特定することができます。

  2. Construct > Search Comments… を選択すると、ダイアログボックスが表示されます。Key Text フィールドにキーワードとして "origin" と入力して、Search ボタンをクリックします。 結果は、図 2.39 のようになります。この検索では、クロノグラフィ、セグメント (segment)、領域 (region)、サイトマーカー、一般情報 (general info) の一部に関連付けられた全てのコメントと feature 名を対象に "origin" というキーワードがないかを調べます。ダイアログボックスの左側にあるチェックボックスを使うことで、特定の feature のみを検索対象に指定することも可能です。
    図 2.39:コメントの検索画面

  3. 図 2.39 の右側に表示されたリストには、その名称やコメント内に "origin" というキーワードを含むすべての feature が含まれています。右側のリストにある "origin" という文字をクリックして、Show Info ボタンをクリックすると、条件に一致したコンテクストを確認することができます。図 2.40 のようなダイアログが表示されます。これが “get info” (情報取得) ボックスの標準領域です。検索した文字列の位置が簡単に確認できるよう "origin" という文字列が Region Comments フィールドでハイライトで表示されている点に注目してください。このダイアログから、複製起点 (origin of replication) がヌクレオチド 2484 から 2723 にあり、それは generation#1 の領域にあることが分かります (ダイアログの左下に表示されています)。
    図 2.40:Origin の検索結果

  4. 単一のコンストラクトにあるコメントをこのように検索できるのはとても便利ですが、ハードディスクや特定のフォルダ、あるいは共有ファイルサーバーの特定フォルダにある全てのファイルを対象に検索するにはどうすればよいでしょうか? ここでファイル検索機能の出番です。ファイル検索機能を使えば、高度な検索条件をセットアップし、ディスク上のファイルを見つけ出すことができます。Tools > Search Files… を選択すると、図 2.41 のようなダイアログが表示されます。このダイアログの一行目に検索条件を入力します。ここでは、単純な検索を実行することにします。一番上の行に “ampicillin” とだけ入力してください。なお、例えば “room 211-3B” と入力して、部屋番号 211 番の冷蔵庫の箱 3B に保管された全てのコンストラクトを検索するのも簡単です。もちろん、この内容がコメントとして入力されていればの話ですが。ここでの目的は、“ampicillin” というキーワードをコメントに含む全てのファイルを見つけ出すことです。DNA 配列を検索するのと同じではありません。それぞれのファイルにコメントを丁寧に入力していれば、コンストラクト・データベースの検索ツールとしてファイル検索機能を利用することができます。
    図 2.41:ファイル検索ダイアログ

  5. 検索クエリーボックスには、検索したいテキストが表示される点に注意してください。ダイアログの Find Match In セクションでは、検索対象に DNA 配列、または、コメント (およびタイトル) を指定することができます。Any Comments というラジオボタンをクリックします。 次に、Search Directory を指定する必要があります。これは、検索条件に一致するファイルの検索対象にしたいフォルダです。フォルダ内に別のフォルダが含まれるフォルダを選択し、かつ、そのフォルダも検索対象にしたい場合は、ダイアログの下側にある Scan Subdirectories チェックボタンにチェックを入れてください。

  6. Set Directory ボタンをクリックすると、検索したいディレクトリ (フォルダ) を定義することができます。図 2.42 のようなダイアログが表示されます。検索したいファイルが含まれるディレクトリを選択します。この事例においては、GCK3 フォルダのみを選択します。
    図 2.42:ディレクトリの設定

  7. 以上で、検索を実行する準備が整いました。図 2.41 に示すダイアログで Search ボタンをクリックします。進捗状況を知らせるプログレスインジケーターが表示された後、図 2.43 のようなダイアログが表示されます。このウィンドウには、検索クエリーの後に続いて、設定した検索条件に一致するすべてのファイルがリストで表示されます。リスト内のファイルのいずれかをクリックすると、そのファイルを開くことができます。Save List ボタンをクリックして、クエリーに一致する全リストのテキストファイルを作成することも可能です。例えば、アンピシリン耐性遺伝子 (ampicillin resistance gene) を含むすべてのコンストラクトのリスト (あるいは、部屋番号 211 の冷蔵庫の箱番号 3B に含まれるコンストラクトのリスト) を作成する場合に便利です。
    図 2.43:検索結果 (#1)

  8. 別な検索も実行してみましょう。もう一度 File > Search Files… を選択して、図 2.44 に示すのと同じ内容のクエリーを入力します。こんどの検索条件は少し複雑です。"ampicillin" と "galactosidase" を含み、かつ、"tetracycline" を含まないファイルの検索です。ポップアップメニューの and, or, および、contains/doesn’t contain の組み合わせを変えて (これらはブール演算子とも呼ばれています)、それらがどのように機能するかを、ウィンドウ下部にある検索クエリーボックスで確認することも可能です。クエリーの内容を図と同じに戻して、Search ボタンをクリックしてください。
    図 2.44:ファイルの検索 (#2)

  9. 図 2.43 に示すようなリストを表示させることもあります。誰かが入力すべきコメントを入力していなければどうなるでしょうか?塩基配列をインポートしただけの注釈の付けられていない (コメントが全く存在しない) ファイルだったらどうなるでしょうか? コメントの出来が不完全であれば、検索結果も満足いくものとはなりません (特に、tetracycline のような特定のテキスト項目がないことを探したい場合)。このような事態に対応するために、GCK では、コメントの代わりに DNA 配列情報を使って検索できるようにもなっています。File > Search Files… を再度選択します。今度は、DNA Sequence というラジオボタンを選択します。ここで、アンピシリン (ampicillin) 遺伝子と β -galactosidase 遺伝子の含まれるコンストラクトを検索することにしましょう。それぞれの遺伝子をあらわす 15 のヌクレオチド配列を使用することができます。アンピシリン耐性遺伝子 (β -lactamase 遺伝子) の場合は、CAACATTTCCGTGTC と入力します (小文字で入力しても構いません)。β -galactosidase の場合は、GCGGATAACAATTTC と入力します。画面は図 2.45 のようになっているはずです。準備が整ったら Search ボタンをクリックします。
    図 2.45:ファイルの検索 (#3)

  10. DNA 配列はすべてのファイルに含まれているので、得られる検索結果は正確そのものです。従って、ファイルに両方のクエリー配列が含まれていれば、そのファイルは必ずリストに表示されます。検索結果は、図 2.46 のようになるはずです。この事例では、pGFP を選択しているため pGFP コンストラクトにたどり着くパス名がウィンドウの Search Directory 領域に表示されています。
    図 2.46:検索結果 (#3)

  11. 以上でこのチュートリアルは終了です。ここですべてのウィンドウを閉じてください (pBR322 に加えた変更内容は保存しないでください)。

ファイル検索機能は、非常にパワフルな機能です。組織内のファイルサーバーに保存されたすべてのコンストラクトから必要なファイルを選び出すことができます。コメントを入力するのに熱心なユーザーであれば、組織内の全てのファイルのコメントを誰でも検索することができます。また、コメントの内容を調べることで、誰に聞けばそのコンストラクトを入手できるかが分かります。