30-07-09KDBIO Group1
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
A database made in Portugal for the A database made in Portugal for the analysis of transcription regulatory associations analysis of transcription regulatory associations
in in yeastyeast
Regulat
ors
Search
Yeast
AndConsen
sus
Tracking
Transcr
iptional
30-07-09KDBIO Group2
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Motivation
• For a given ORF/Gene, identify regulatory associations• Search for Transcription Factors (TFs) acting on that ORF/Gene
• Use SGD or RSAT to retrieve the promoter sequence• Use TRANSFAC or SCPD to get a list of TFs binding sites• Use RSAT to search TFs bind sites within the promoter region• Use PUBMED to search for bibliographic references
• TRY TO IDENTIFY REGULATORY ASSOCIATIONS ...
30-07-09KDBIO Group3
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Motivation
www.yeastract.com
30-07-09KDBIO Group4
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Concepts
• Gene Ontology•Process•Function•Component
• Gene
• Protein
• Consensus
30-07-09KDBIO Group5
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Conceptual Model
30-07-09KDBIO Group6
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Data Extraction
-function-depth
function
-process-depth
process
-component-depth
component
*
* *
*
*
*
-regulationmode-reference-evidencecode
regulation
-orfname-genename-genesequence-promotersequence-url-retrotransposon-alternativenames
orfgene
YEASTRACTYEASTRACT
txttxt
txt
-consensus-variant
consensus
RSA Tools
34400 RA from >1000bibliographic references
30-07-09KDBIO Group7
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Graphic depictions of Transcriptional Regulatory Networks
30-07-09KDBIO Group8
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Yeastract-Discoverer
30-07-09KDBIO Group9
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Motif finders output
30-07-09KDBIO Group10
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
# Accesses to YEASTRACT28 Jul 2008 – 28 Jul 2009
• >80 different countries
• >300 different institutions
• >16 000 visits
• >160 000 pageviews
30-07-09KDBIO Group11
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Origin of YEASTRACT users Map overlay – city view
30-07-09KDBIO Group12
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
Origin of YEASTRACT users Ranking of Countries – top 20
1. United States2. Portugal3. Germany4. Spain5. United Kingdom6. France7. China8. Japan9. Taiwan10. Mexico
11. India12. Switzerland13. Brazil14. Poland15. Canada16. Australia17. Italy18. Sweden19. Netherlands20. Israel
30-07-09KDBIO Group13
Instituto de Engenharia de Sistemas e Computadores Investigação e Desenvolvimento em Lisboa
technologyfrom seed
An example of successful cooperation