|
|
 |
 |

| RGP アノテーションについて |
|
[アノテーション手順]
Annotation pipeline
- PAC/BAC クローンの配列に対して遺伝子予測プログラムを実行する。
- 解析結果をAnnotationPlot (編集ツール) に読み込み、遺伝子を予測する。
- 予測遺伝子はタンパク質との相同性検索の結果から機能を予測し、分類する。
- アノテーション結果は公的データベースである DDBJ/EMBL/GenBank に登録する。
[詳細なアノテーション手順]
| 1.1 | 相同性検索 |
|
BLAST programs (http://www.ncbi.nlm.nih.gov/BLAST/)
- blastxの実行。
データーベースはNCBI NonRedundant Protein database, nr (ftp://ncbi.nlm.nih.gov/blast/db)。
- blastnの実行。
データーベースはRice cDNA sequence (イネ完全長cDNA, イネEST) database。
- sim4, gap2の実行。
データーベースはRice cDNA sequence。
|
| 1.2 | 遺伝子予測プログラム |
|
|
| 2 | 遺伝子予測 |
|
- 相同性検索結果を重視したコード領域のモデリング
cDNAに相同性を示した場合、sim4, gap2の結果を考慮する。
- 予測プログラムの結果からの最適な選択
少なくとも2つ以上のプログラムが遺伝子を予測した範囲から、最適なプログラムを選択。
combinerの結果を考慮する。
|
| 3 | 遺伝子機能予測 |
| 予測遺伝子はnrに対するblastpの結果から、機能を予測する。
相同性を示したしきい値はE-values of < 10-20とする。
IRGSP基準に基づく
- 既知タンパク質に対して、100%一致した場合、その既知タンパク質と同じ機能名とする。
例) 既知タンパク質名が'XXX'の場合、予測遺伝子名は'XXX'
- 既知タンパク質に対して、相同性を示した時には 、既知タンパク質名の前に 'putative'をつける。
例) 既知タンパク質名が'XXX'の場合、予測遺伝子名は'putative XXX'
- 推定でタンパク質名が付いているものに対して、相同性を示したときには、'-like'をつける。
例) タンパク質名が'probable XXX'の場合、予測遺伝子名は'XXX-like'
- 遺伝子予測の際にcDNAsを参照した場合は、'unknown protein'とする。
- タンパク質, cDNAに相同性を示さない場合は 'hypothetical protein' とする。
RGPオリジナル(IRGSP基準では予測しない領域)
- 一つの遺伝子予測プログラムからの予測は 'hypothetical ORF' とする。
- 完全長cDNAが相同性を示した領域だが、ORFがなかった領域は 'noncoding transcript' とする。
- 終止コドンやフレームシフトが原因で、遺伝子が機能していないと思われる領域は 'pseudogene' とする。
|
[topへ戻る]
|
|
 |

|
|