![Page 1: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/1.jpg)
1.GeneMarkのホームページへ。(http://opal.biology.gatech.edu/GeneMark/)
大腸菌ゲノムなのでここをクリック。
![Page 2: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/2.jpg)
2.データを入力。
塩基配列を入力。
学習セットを入力。実習では大腸菌K12を入力。
![Page 3: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/3.jpg)
3.出力オプションを入力。
読枠ごとの予測ORFを出力。
予測ORFのアミノ酸配列を出力。
予測ORFの塩基配列を出力。
入力がすべて完了したらここをクリック。
![Page 4: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/4.jpg)
4.GeneMarkの出力。
予測ORF。1番目は短いので無視する。
+は順方向、-は逆方向。
1番目(上の表では2番目)の予測ORFのアミノ酸配列。
![Page 5: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/5.jpg)
1番目(上の表では2番目)の予測ORFのアミノ酸配列。
2番目の予測ORFのアミノ酸配列。
3番目の予測ORFのアミノ酸配列。
4番目の予測ORFのアミノ酸配列。
![Page 6: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/6.jpg)
1番目(上の表では2番目)の予測ORFの塩基配列。
2番目の予測ORFの塩基配列。
![Page 7: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/7.jpg)
3番目の予測ORFの塩基配列。
4番目の予測ORFの塩基配列。
![Page 8: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/8.jpg)
5.BLASTの入力。予測されたORFの確認。
例として4番目の予測ORFの塩基配列。
アミノ酸配列でも塩基配列でもどちらでもよいが、ここでは塩基配列で入力する。
![Page 9: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/9.jpg)
5.BLASTの出力。予測されたORFの確認。
ここらあたりは同じスコアなので同じタンパク質。
![Page 10: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/10.jpg)
当然、全く同じタンパク質が見つかっている。しかしよく見ると、入力した塩基配列は、18番目のアミノ酸からのものである。
検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。
確認するため、ここをクリック。
![Page 11: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/11.jpg)
入力した塩基配列は、18番目のアミノ酸(MCEGL・・・)からのものであった。
塩基配列を17アミノ酸(17×3=51塩基)さかのぼってみる。
![Page 12: 大腸菌ゲノムなのでここをクリック。xraylab/keiji/genome_anal/process.pdf当然、全く同じタンパク質が見つかっている。しかしよく見ると、 入力した塩基配列は、18番目のアミノ酸からのものである。検索されたタンパク質は203アミノ酸なので、17アミノ酸少ない。確認するため、ここをクリック。](https://reader034.vdocuments.pub/reader034/viewer/2022051822/5feccc736553fe3742143b6d/html5/thumbnails/12.jpg)
CCAACATATCATAACGGAGTGATCGCATTGAACATGCCAATGACCGAAAGAATAAGAGCAGGCAAGCTATTTACCGATATGTGCGAAGGCTTACCGGAAAAAAGACTTCGTGGGAAAACGTTAATGTATGAGTTTAATCACTCGCATCCATCAGAAGTTGAAAAAAGAGAAAGCCTGATTAAAGAAATGTTTGCCACGGTAGGGGAAAACGCCTGGGTAGAACCGCCTGTCTATTTCTCTTACGGTTCCAACATCCATATAGGCCGCAATTTTTATGCAAATTTCAATTTAACCATTGTC6000GATGACTACACGGTAACAATCGGTGATAACGTACTGATTGCACCCAACGTTACTCTTTCCGTTACGGGACACCCTGTACACCATGAATTGAGAAAAAACGGCGAGATGTACTCTTTTCCGATAACGATTGGCAATAACGTCTGGATCGGAAGTCATGTGGTTATTAATCCAGGCGTCACCATCGGGGATAATTCTGTTATTGGCGCGGGTAGTATCGTCACAAAAGACATTCCACCAAACGTCGTGGCGGCTGGCGTTCCTTGTCGGGTTATTCGCGAAATAAACGACCGGGATAAGCACTATTATTTCAAAGATTATAAAGTTGAATCGTCAGTTTAAATTATAAAAATTGCCTGATACGCTGCGCTTATCAGGCCTACAAGTTCAGCGATCTACATTAGCCGCATCC
塩基配列を17アミノ酸(17×3=51塩基)さかのぼってみるとTTGを開始コドンとしてMNMPMT・・・と続き、検索されたタンパク質のORFであることがわかる。つまりGeneMarkの予測は、今回、開始コドンを間違ったことになる。しかしながら、BLASTによるホモロジー検索で正しいORFを導くことができた。ちなみにGeneMarkは、他の3つの予測ORFについては正しく予測している。
正しい開始コドンGeneMarkが予測した開始コドン