수) 1. dna sequence를 protein의 amino acid sequence로...

5
생명정보 처리학(9/35, ) 5 - 1 1. DNA sequenceProteinamino acid sequence로 변환하기 : DNA 염기 서열을 단백질의 아미노산 서열로 변환하기 위해서는 promoter가 있어야 함. 아울러, transcription 과정에서 DNA의 intron 부위가 splicing 과정에 의해서 제거됨. 이와 함께, stem and loof 구조가 만들어지기 위해서는 template strand의 마지막에 AA…AA, 즉 A가 연속된 poly(A)-tail이 있어야 함. 이러한 원리는 이용하여 DNA의 염기서열을 단백질의 아미노산 서열로 바꿔 주는 프로그램이 있음. <MITGenScan을 이용한 DNA sequence amino acid sequence로 변환하기> ① www.yahoo.com에서 GenScan 검색 ② mit(GenScan sever)로 들어가서 2005년 기출문제 DNA 서열검색 ③ MIT 수퍼 컴퓨터 작동 ④ intron 부위 사라지고 단백질 서열로 변환된 결과가 나옴 ⇒ GenScan은 실제 생물의 유전정보 발현의 과정을 가상에서 발현시켜 주는 프로그램임. 아울러 GenScan은 pokayote이나 eukaryote을 구분하지 않고 amino acid sequence로 변환시킨다. 이 프로그램은 transcription과 translation 과정의 splicing을 알아서 해주는 기능이 있으며, intron과 exon 부위를 알아내는데 도움을 준다. 아울러, gene의 DNA sequence는 알고 있지만, 이름을 모르고 있을 경우 NCBI blast 검색 엔진과 함께 사용하면 유전자 이름 및 기능 등에 관하여 알아낼 수 있으므로 편리한 검색 엔진이다.

Upload: others

Post on 15-Feb-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 수) 1. DNA sequence를 Protein의 amino acid sequence로 변환하기cfs7.blog.daum.net/upload_control/download.blog?fhandle... · 2015-01-19 · 생명정보 처리학(9/3․5,

생명정보 처리학(9/3․5, 월․수)

5 - 1

1. DNA sequence를 Protein의 amino acid sequence로 변환하기

: DNA 염기 서열을 단백질의 아미노산 서열로 변환하기 위해서는 promoter가 있어야 함.

아울러, transcription 과정에서 DNA의 intron 부위가 splicing 과정에 의해서 제거됨. 이와 함께,

stem and loof 구조가 만들어지기 위해서는 template strand의 마지막에 AA…AA, 즉 A가

연속된 poly(A)-tail이 있어야 함. 이러한 원리는 이용하여 DNA의 염기서열을 단백질의 아미노산

서열로 바꿔 주는 프로그램이 있음.

<MIT의 GenScan을 이용한 DNA sequence → amino acid sequence로 변환하기>

① www.yahoo.com에서 GenScan 검색

② mit(GenScan sever)로 들어가서 2005년 기출문제 DNA 서열검색

③ MIT 수퍼 컴퓨터 작동

④ intron 부위 사라지고 단백질 서열로 변환된 결과가 나옴

⇒ GenScan은 실제 생물의 유전정보 발현의 과정을 가상에서 발현시켜 주는 프로그램임. 아울러

GenScan은 pokayote이나 eukaryote을 구분하지 않고 amino acid sequence로 변환시킨다.

이 프로그램은 transcription과 translation 과정의 splicing을 알아서 해주는 기능이 있으며,

intron과 exon 부위를 알아내는데 도움을 준다.

아울러, gene의 DNA sequence는 알고 있지만, 이름을 모르고 있을 경우 NCBI blast 검색

엔진과 함께 사용하면 유전자 이름 및 기능 등에 관하여 알아낼 수 있으므로 편리한 검색

엔진이다.

Page 2: 수) 1. DNA sequence를 Protein의 amino acid sequence로 변환하기cfs7.blog.daum.net/upload_control/download.blog?fhandle... · 2015-01-19 · 생명정보 처리학(9/3․5,

생명정보 처리학(9/3․5, 월․수)

5 - 2

⑤ 아래 있는 화면은 검색 결과임.

< 반드시 알고 있어야 할 사항>

1. Predicted genes/exons

: 예상되는 exon의 위치를 나타냄.

왼쪽의 검색결과로부터 exon의 개수는

총 5개가 존재함을 알 수가 있으며, exon의

위치는 ↔의 사이가 됨.

2. Predicted peptide sequence(s)

: 이것은 검색시 입력된 DNA 서열이

transciption(include splicing)과

translation 과정을 거치게 되면 예상되는

아미노산 서열을 나타낸 결과임.

3. Explanation

: 이것은 검색 결과에 대한 기호의 의미를

설명해 주는 부분임.

Q) 첫 번째 exon의 위치는?

Q) gene의 initiation site의 위치는?

Q) gene의 termination site의 위치는?

Page 3: 수) 1. DNA sequence를 Protein의 amino acid sequence로 변환하기cfs7.blog.daum.net/upload_control/download.blog?fhandle... · 2015-01-19 · 생명정보 처리학(9/3․5,

생명정보 처리학(9/3․5, 월․수)

5 - 3

2. DNA sequence의 BLAST 검색

① NCBI GenBank의 Nucleotide blast 메뉴로 들어감.

② 염기서열 붙여 넣기(2005년 기출문제)

*(염기서열만 들어가도록 편집해서 붙어 넣어야 함)

③ option 항목(others selection)

④ blast 검색을 누르면 database가 검색되고, 29개의 검색결과 나옴.

⑤ 결과 해석

→ 검정색으로 갈수록 상동성 떨어짐. 검색결과 맨 위의 것이 상동성이 가장 높은 것임.

⇒ 결과는 토기의 EPO 유전자임.

Page 4: 수) 1. DNA sequence를 Protein의 amino acid sequence로 변환하기cfs7.blog.daum.net/upload_control/download.blog?fhandle... · 2015-01-19 · 생명정보 처리학(9/3․5,

생명정보 처리학(9/3․5, 월․수)

5 - 4

3. BLAST란?

① BLAST는 NCBI에서 제공하는 서열의 상동성 검색 프로그램으로, chromosome의 위치나 다른

서열과의 상동성을 확인하는데 유용한 프로그램임.

- blast n : nucleotide 상동성 검색

- blast p : protein 상동성 검색

② BLAST 검색 엔진에는 GenBank의 blast p와 GenScan의 기능을 합쳐진 편리한 검색 프로그램이

존재한다. 이 검색엔진은 tBLAST series이며, 서로 다른 종류의 서열의 상동성을 검색하는데

매우 편리하다.

- blast x : DNA sequence를 amino acid sequence로 변환하여 단백질 상동성 검색 프로그램.

- tblast n : amino acid sequence를 DNA sequence로 변환하여 DNA 상동성 검색 프로그램.

- tblast x : DNA or amino acid sequence의 database를 모두 이용한 무작위 검색 프로그램

③ 용어설명

- putative : 아직 논문이 나오지 않은 상태의 것으로, 실험을 통해 sequence에 대한 기능을

확인하지는 못해보고 단지 서열만 분석한 경우를 의미함.

- quary : 검색할 sequence

- sbjct : 비교된 sequence

- positive : (+)소수성 아미노산이 바뀌지만 전체적으로 영향을 주지 않는 상태로 바뀐 정도.

(상동성이 낮더라도 높을 수가 있음)

- Identity : sequence의 상동성

<Information box>

아주 외 인 경우이긴 하지만 상동성은 90% 이상인데 비하여, 유 자의 기능이 상반된

경우도 존재함. 이런 경우는 조 단백질에서 발견되고 있음.

④ 검색 option

- Organism : 원하는 생물종에서만 상동성을 검색하고 싶을 때, option 창에 생물종 이름 넣음.

4. tblast x를 이용한 검색

① GenBank에서 nucleotide U43709를 검색하고, sequence 복사

② BLAST의 tblast x에 복사한 염기서열을 넣고 blast 검색(option : arabidopsis)

Page 5: 수) 1. DNA sequence를 Protein의 amino acid sequence로 변환하기cfs7.blog.daum.net/upload_control/download.blog?fhandle... · 2015-01-19 · 생명정보 처리학(9/3․5,

생명정보 처리학(9/3․5, 월․수)

5 - 5

③ 아래 화면은 검색 결과임.

* 상동성이 99%라면 같은 종이라도 돌연변이에 의해서 1~2개의 염기만이 다른 것이므로 큰 신경 쓸

것은 없음 (why? 어떤 종이라도 돌연변이는 존재하기 때문)

* AT : arabidopsis의 약어

HS : Homo sapiens의 약어

3 : chromosome의 위치를 표시한 것

g : genome