数据库使用 杨建华 2010/9/28. outline of the topics ucsc and ensembl genome browser (blat vs...

45
数数数数数 数数数 2010/9/28

Upload: osborn-green

Post on 13-Dec-2015

283 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

数据库使用

杨建华2010/9/28

Page 2: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Outline of the Topics

UCSC and Ensembl Genome Browser

(Blat vs Blast vs Blastz vs Multiz)

挖掘数据用 Table Browser 或 BioMart用户友好化你的数据

写自动查询程序

基因组浏览器的介绍

序列查询

Page 3: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

UCSC Genome Browser Introduction

Jim Kent

(http://www.genome.ucsc.edu/)

Page 4: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Organization of genomic data…

Genome backbone: base position number

Ann

otat

ion

Tra

cks

chromosome band

known genes

predicted genes

evolutionary conservation

SNPs

sts sites

gap locations

repeated regions

microarray/expression data

more…

Links out to more data

Page 5: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Ensembl Genome Browser Introductionhttp://www.ensembl.org

Ewan Birney

Page 6: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

1

1 Select Clade

2

2 Select Species

3

3 Select Assembly

4

4 Position or Term

5

5 Image width

6

6

Configure track and Image

7 Submit

7

Genome Browser

Page 7: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Protein gene

microRNA/snoRNA

Multiz Alignment

Conserved Score

Get ImageGet sequence

Genome Browser

Page 8: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<

Track colors may have meaning—for example, UCSC Gene track:

exon exon exon3’ UTR 5’ UTR

Intron, and direction of transcription <<< or >>>

Genome Browser

Page 9: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Phenotype and Disease

Mapping and sequencing

Gene and Gene Prediction

mRNA and EST

Expression and Regulation

Comparative Genomics

Variation and Repeats

Genome Browser

Page 10: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Genome Browser

Hide: removes a track from view

Dense: the track is displayed with all features collapsed into a single line.

Squish: the track is displayed with each annotation feature shown separately, but at 50% the height of full mode.

Pack: the track is displayed with each annotation feature shown separately and labeled, but not necessarily displayed on a separate line.

Full: the track is displayed with each annotation feature on a separate line.

Page 11: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression PatternExample: has-miR-1-1/ has-miR133a-2 and Its Target Gene

(Hand2)

1 2

Page 12: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

select

Page 13: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

Page 14: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

select

Page 15: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

Page 16: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

Page 17: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

1 2

Page 18: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Host Gene of ncRNA and Expression Pattern

Page 19: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Blat vs Blast vs Blastz vs Multiz

BLAT = BLAST-like Alignment Tool• Rapid searches by INDEXING the entire genome

• Works best with high similarity matches– Kent, WJ. Genome Res. 2002. 12:656

Choices

Paste one or more sequences

Page 20: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据
Page 21: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Blastz Alignments

Page 22: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Chain and Net alignment

Evolution's cauldron: duplication, deletion, and rearrangement

Page 23: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

CTAGGAAAAAATATCTTCATATACTTGTCTGATTATTTCTTTAAGATTCATAAAAGTGG |||||||||||||||||||||||||||||||||||||||||| CTAGGAAAAAATATCTTCATATACTTGTCTGATTATTTCTTT-----------------

AAAAAAAAAAAAAAGATTCATAAAAGTGAAACAAAGGTACGATTTTATGT |||||||.|||||||||||||||||||.|||||||||| ------------AAGATTCgTAAAAGTGAAACAAAGGTAtGATTTTATGT

snoRNA + intron

RetroGene derived from H/ACA snoRNA

Evolution's cauldron: duplication, deletion, and rearrangement

Page 24: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -Convert

Page 25: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools-Convert

Page 26: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -LiftOver

Page 27: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -liftOver

Paste Data

Page 28: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -liftOver

Page 29: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -liftOver

Page 30: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Track Type Annotation TrackSQL Table

Restricts the query Combines the output of two queries

The Table Browser

Page 31: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

1. Extract Intron of Protein-coding Gene In the Human Genome

2. snoRNA/microRNA Intersect with Intron

Find snoRNA/microRNA located within Intron in the human genome

Page 32: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

1 Choose Human genome

2 Choose SQL Table

3 Choose Region

4 Choose Filter

Extract Intron of KnownGene In the Human Genome

Page 33: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Output KnownGene as Custom Track

Page 34: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Custom Track

Displaying Custom Track in the Browser

Page 35: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Choose SQL Table

Intersect with snoRNA/microRNA

Page 36: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Intersect with snoRNA/microRNA

Page 37: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Intersect with snoRNA/microRNA

Page 38: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

summary

snoRNA/microRNA Summary Statistics

Page 39: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

1. Format the data

2. upload the data

3. display the results in the Genome Browser

Displaying liftOver Results in the Chimp Genome

Page 40: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Displaying Results in the Genome Browser

Page 41: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Displaying liftOver Results in the Genome Browser

Paste data

Page 42: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Displaying liftOver Results in the Genome Browser

Page 43: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Tools -LiftOver

Page 44: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Writing automated procedures for genome-wide queries

Local Browser Installation

(Rice UCSC Genome Browser Using the Browser Source Code Base, And so on)

Writing a Perl/C/PHP program to automatically extract database data

Page 45: 数据库使用 杨建华 2010/9/28. Outline of the Topics UCSC and Ensembl Genome Browser (Blat vs Blast vs Blastz vs Multiz) 挖掘数据用 Table Browser 或 BioMart 用户友好化你的数据

Thank You !