付録: GCK にインポートできるファイル形式

注意:すべてのファイルは、以下の規則に従ってインポートされます。Staden ファイル (非標準のヌクレオチド文字を使用可能なファイル) を除くすべてのファイルで利用できる文字は、国際規格によって定められた Legal Nucleotide Characters のみです。アルファベットの小文字は大文字に変換され、UT に変換されます。ヌクレオチド文字以外の文字はすべて無視されます。この中には、全ての数字、リターン、タブ、ラインフィード (改行) も含まれます。塩基配列のインポートに関する詳細ついては、 “塩基配列のインポート” をご覧ください。

 

DNA Inspector

DNA Inspector™ IIe で生成される標準ファイル形式です。これらのファイル形式は、関連する DNA Inspector マニュアルに列記されています。このファイル形式は、開発元の Textco BioSoftware 社で既に取扱い終了となっている DNA Inspector IIe をお使いのユーザー様向けに用のインポートオプションとして用意されている点にご注意ください。Textco BioSoftware 社では、DNA Inspector IIe の後継製品として Gene Inspector™ を取り扱っています。詳細は Gene Inspector™ 製品情報をご覧ください。

 

GenBank

File > Import の使用により、先頭に文字列 "ORIGIN" が含まれる行のすべての情報をコメントとして取り込みます。この行の後に続くテキストは、塩基配列としてみなされます。GenBank の全ての features を GCK の feature としてインポートするには、Tools > Deluxe Import を使用します。詳細は、チュートリアル 6:DNA セグメントのクローニングとサイレント突然変異 をご覧ください。

 

Intelligenetics

";" で始まるすべての行はコメントして取り込まれます。セミコロンのない行の一行目は sequence ID (name) となります。それ以降の行はすべて塩基配列としてみなされます。

 

Pearson (FASTA)

>’ で始まるすべての行は、コメント行となります。先頭に > がある場合、新しい塩基配列の開始をあらわします。Pearson ファイルでは同一ファイル内に複数の塩基配列を保存することができます。先頭に > がない行は、塩基配列の行となります。

 

NBRF

一行目が HEADER 行、二行目が TITLE 行となります。いずれの行もコメントとして取り込まれます。三行目以降が塩基配列情報となり、アスタリスク "*" で終了します。アスタリスク以降に記載された内容はすべてコメントとなります。

 

Text

TEXT ファイルに含まれる情報はすべて塩基配列とみなされます。ヌクレオチド以外の文字はいずれも削除され、アルファベットの小文字は大文字に変換され、また、UT に変換されます。

 

GCG (Wisconsin)

全ての情報は、2つ続いたピリオドがあるまでコメントとなります。2つのピリオドより後の情報は、塩基配列とみなされます。

 

EMBL (SwissProt)

ファイルの一行目から、すべての行の内容はコメントとなります。"SQ" で始まる行もコメントに含まれます。"SQ" で始まる行の直後から塩基配列が開始します。塩基配列情報は、‘//’ で終了します。

 

Staden

塩基配列とコメントが混合しています。いずれのコメントも ‘<‘ で始まり ‘>’ で終わります。コメント以外はすべて塩基配列とみなされます。Gene Construction Kit では、Staden シーケンスファイルをコメント行で始まると想定しています。

 

Gene Inspector

Gene Inspector は、Textco BioSoftware 社の塩基配列解析および分子生物学者のノートブックプログラムです。GI シーケンスであれば GCK のコンストラクトウィンドウに直接インポートすることができます。GI ファイルに複数の塩基配列が含まれている場合は、その中から関心のあるものを選択することができます。一度の操作でインポートできるのは一つの塩基配列のみとなっています。