3.9 シーケンスのインポート

File > Import > Import DNA Sequences... を選択すると、図 3.16 に示すようなダイアログが表示されます。この図の事例は、GCG シーケンスをインポートしているところです。“Interpret As” ポップアップメニューをクリックすると、ファイルリスト内で表示させるドキュメントの種類を指定できます。“Files of type” ポップアップで Text Files を選択すると、TEXT タイプのファイルが全て表示されます。TEXT ファイルは、全てのワードプロセッサやシーケンスを処理するその他のアプリケーションの多くで作成される形式です。したがって、これを選択することは、ある特定ファイルフォーマットの判断を Gene Inspector に任せることになります。これは、Textco 独自のコードまたは Indiana University の Don Gilbert による ReadSeq コード (ftp.bio.indiana.edu にて FTP から入手可能) を使用して実行されます (Don に感謝!)。Don は、各種ファイルをシーケンス解析プログラムで互いに読み込めるように、このコードをコミュニティで利用できるようにしていますので、彼の許可を得て我々はこのコードを使用しています。現在、インポートできるテキストファイルフォーマットは次に示す 10 種類 (および、Gene Construction Kit と DNA Inspector IIe フォーマット) です:

図 3.16:DNA シーケンスのインポート

 

なお、プレーンテキストのみで作成された DNA やタンパク質シーケンスをインポートすることも可能です。これらは、Plain TEXT カテゴリでプレーンテキストとして見なされます。

シーケンスをインポートする際、不適切な文字は全てフィルターで除外されます。なお、フォーマットを間違えると、シーケンスの一部の文字がコメントになる場合もありますでご注意ください。従って、お使いのシーケンスファイルがどのフォーマットであるかが確実でない場合は、それをまずワードプロセッサで編集し、それをテキストファイルで保存したのちにインポートするようにしてください。

シーケンスのインポートには、新規シーケンスドキュメントに配置する場合と、既存のシーケンスドキュメントに追加する場合があります。ダイアログの下にあるラジオボタンを使用して (図 3.16 参照)、シーケンスデータをプログラムでどのように処理するかを指定します。