휴먼게놈프로젝트와 컴퓨터 human genome project and computer science

50
http://biohackers.net 휴휴휴휴휴휴휴휴휴 휴휴휴 Human genome project and Computer science 2005-12-03 Biocom OB 세세세 93’ 세세세 http://biohackers.net/wiki/HgpAndComput er

Upload: semah

Post on 06-Jan-2016

76 views

Category:

Documents


0 download

DESCRIPTION

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science. 2005-12-03 Biocom OB 세미나 93 ’ 김형용 http://biohackers.net/wiki/HgpAndComputer. 순서. 생물학 백그라운드 Genome 의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여. Genome. 게놈 ? 지놈 ? 유전자 (gene), 유전체 (genome). Great 3 books. 우주 – 생명 - 인간. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

http://biohackers.net

휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer

science

2005-12-03 Biocom OB 세미나93’ 김형용

http://biohackers.net/wiki/HgpAndComputer

Page 2: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

순서 생물학 백그라운드 Genome 의 구조 서열결정작업 HGP 이후의 이야기들 컴퓨터과학의 기여

Page 3: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genome

게놈 ? 지놈 ? 유전자 (gene), 유전체 (genome)

Page 4: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Great 3 books

우주 – 생명 - 인간

Page 5: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Central Dogma of Molecular Biology

Page 6: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 7: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Protein structure

20 Amino acids Sequence specifies conformation RNase

Page 8: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Life

DNA’s common method of producing more DNA

Review the life

Page 9: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Evolution

Self replicator

Page 10: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Chromosome

1 cM ~= 1 Mbps

Page 11: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Gene structure

Page 12: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 13: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Junk DNA

전체 Genome 의 5% 만이 단백질이 되는 영역 . 그렇다면 나머지는 ?

Repetitive sequence LINE (>300bps) SINE (300bps), Alu (30000~50000 개 ) Microsatelite

Page 14: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Human genome

3~4x1014 cells (~=245)

> 200 cell type

3x109 bps (3Gbps = 3Gbyte)

20000~25000 Genes

98% unknown functional DNA

0.1% difference with you

Information theory : 30Mbyte

Page 15: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Human genome project DOE, NHGRI 에서 시작 . 2003 년 공식 완료 . 13 년 .

7 개국 참여 95% 나 되는 Junk DNA 를 꼭 그 많은 돈을 들여서

해야만 했는가 ? 목적

Human DNA 에서 모든 Gene의 동정 30 억 염기서열의 결정 Database에 결과의 저장 이를 분석할 수 있는 도구의 향상 관련 윤리적 문제의 연구

Page 16: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

History

PCR RFLP Genetic marker BAC Shotgun sequencing Whole genome shotgun

Page 17: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Gel Electrophoresis 젤 ( 그물막 ) 에 전하를 띤 물질을 통과시킴으로 , 분리하는 방법 .

작을수록 멀리 ~ DNA, Protein

Page 18: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

PCR

Polymerase Chain Reaction

Page 19: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genetic marker

Polymorphic allele locus

Page 20: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 21: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genetic map

Page 22: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Cloning

무지 작은 저 분자를 하나씩 직접 읽을 수 없다 .

따라서 , “ 동일” 한 것들 여러 개를 갖고 실험

Page 23: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Gene cloning Gene cloning 과정

1. Genome 상에서 원하는 영역을 정한다 . 2. 원하는 영역을 뽑아낼 수 있는 PrimerDesign 을 한다 . 3. PCR 로 해당영역의 major band 를 확인하고 , 추출한다 . 4. CloningVector 에 삽입한다 . 5. Selection 의 과정을 통해 , 해당 유전자가 삽입된 벡터가 들어있는

클론을 선발한다 . Cloning vector

Plasmid : Cosmid : 30 kb BAC : 350 kb YAC : 2 Mb 이상 PAC : 300 kb

Page 24: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

DNA sequencing

Page 25: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

DNA sequencing

Page 26: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Frederic Sanger DNA, Protein 유효길이 700-800bp

DNA sequencing

Page 27: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Shotgun sequencing게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤 ,

아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다 . 재조립하기 위해 파괴하는 것 , 그것이 분자생물학자들의 저주받을

운명이고 직업적 강박관념이다 . -- 다니엘코엥 , 휴먼게놈을 찾아서

Page 28: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genome sequencing

Clone by clone method Genetic marker 에

따라 BAC 선발 후 shotgun

Whole genome shotgun 무작정 shotgun Repeat 로 인한

조립에의 어려움 . 컴퓨터만 믿는다 .

Page 29: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Current status (since 2003) Human Chromosome 4 Completed, April 2005. Human Chromosome 2 Completed, April 2005. Human Chromosome X Completed, March 2005. Human Chromosome 16 Completed, December 2004. Human Gene Count Estimates Changed to 20,000 to 25,000,

October 2004. Human Chromosome 5 Completed, September 2004. Human Chromosome 9 Completed, May 2004. Human Chromosome 10 Completed, May 2004. Human Chromosome 19 Completed, March 2004. Human Chromosome 13 Completed, March 2004. Human Chromosome 6 Completed, October 2003. Human Chromosome 7 Completed, July 2003. Human Chromosome Y Completed, June 2003. Human Genome Project Completion: 1990-2003 (April 2003)

Page 30: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genome browser

UCSC Genome browser NCBI Genome browser Ensembl VistaBrowser

Page 31: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genetic disease – before HGP

Page 32: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Genetic disease – after HGP

Page 33: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Comparative genomics Synteny (Gene order), Gene duplicati

on, Gene fusion

Page 34: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 35: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Comparative genomics

Page 36: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

SNP Single Nucleotide Polymorphism 종간 다양성 종내 다양성 염기변화 유전자내 아미노산변화

구조변화

Page 37: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Haplotype

Page 38: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 39: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

HapMap 일본 , 영국 , 중국 ,

캐나다 , 미국 , 나이지리아

Project 의 목표는 MinorAllele 의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60 만개 SNPs 을 genotype 하는 것

Page 40: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Transcriptome, Proteome

EST DNA chip Proteomics

Page 41: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

EST Expression Sequence Tag

Page 42: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 43: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 44: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science
Page 45: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Transformational grammar Regular grammar : computer program Context free grammar : DNA

Palindrome, “ 다시 합창합시다” Context sensitive grammar Unrestricted Grammar : 자연어

Page 46: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Sequence alignment

Page 47: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Smith-Waterman algorithm

Page 48: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

BLAST

Unknown sequence

Known sequenceDatabase

Page 49: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

Object oriented programming

Computer programming paradigm 생명현상의 모델링

Page 50: 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science

마치며… Rosetta stone Programming