curso de verão 2012 - instituto de matemática e ... · curso de verão 2012 biologia sistêmica...
TRANSCRIPT
Universidade Estadual do Norte Fluminense
Curso de verão 2012
Biologia sistêmica evolutiva
Thiago Motta Venancio, M.Sc., PhD
Histórico
* Graduação – Ciências Biológicas (Mar 1998 – Dez 2001)
→ Universidade Estadual do Norte Fluminense - Dr. J. Xavier-Filho
* Mestrado – Biociências e Biotecnologia (Mar 2002 – Jan 2004)
→ Universidade Estadual do Norte Fluminense - Dr. J. Xavier-Filho
* Doutorado – Bioinformática (Mar 2004 – Fev 2008)
→ Universidade de São Paulo – Dr. S. Verjovski-Almeida e JC Setúbal
* Pós-Doutorado – Biologia computacional (Mar 2008 – Out 2010)
→ NCBI – NIH – Dr. L Aravind
* Professor Associado – Universidade Estadual do Norte Fluminense (UENF)
(Out 2010 - )
Tópicos abordados:
-Introdução
- Genômica
- Redes biológicas sob uma perspectiva evolutiva
-Integração de dados:
- Redes de modifcação de proteínas por peptídeos tipo ubiquitina (Ub/Ubl)
- Redes de resposta a estresse químico
- Genômica comparativa e biologia sistêmica
- Expectativas
'Nothing in biology makes sense except in the light of evolution'- Dobzhansky
Modern synthesis
Genetics
Biochemistry
Dev. Biology
Morphology
Ecology
Botany
Taxonomy
"The structure was too pretty not to be true." -- JAMES D. WATSON
DNA structureThe beginnings of molecular biology and the study of genes and genomes
History of genomics1980First complete genome sequenced – F. Sanger
• FX174 - 5,386 bp, 9 proteins.
1995→ First cellular genome
→ Haemophilus influenzea (bacteria, 1.8 Mb)
1996→ Saccharomyces cerevisiae (baker's yeast, 12.1 Mb)
1997→ E. coli (4.7 Mbp)
2000-2001Pseudomonas aeruginosa (6.3 Mbp) A. thaliana (100 Mbp) D. melanogaster (180Mbp)Homo sapiens (3Gbp)
Redes em biologia - Introdução
Interações
A
B
Rede
Proteínas
Interação física
Proteína-Proteína
A
B
Interações ptn-ptn
Metabólitos
Conversãoenzimática
Proteína-metabólito
A
B
Metabólica
Fatores de transcriçãoGenes alvo
Interaçãotranscricional
Proteína-DNA
A
B
Transcricional
Nós
Arestas
Aravind L, Anantharaman V, Venancio TM.Birth Defects Res C, 2009
Direcionada, não direcionada, cliques e hubs
# E1s < # E2s < # E3s
Hochstrasser, Nature (2009)
Activation enzymeActivation enzyme
Conjugation enzyme
Conjugation enzyme
Ligases(RING and HECT)
Ligases(RING and HECT)
Basic ubiquitin conjugation pathway
Effects of Ub/Ubl modification
Ciechanover; Nat Rev Mol Cell Biol 2005
Destabilizing roles Non-destabilizing roles
Network construction
DatabasesBioGridIntactMint
Other studies5 ubiquitylation5 sumoylation
2 Rpn10 (Proteasome)1 Rsp5 (E3)
Ub pathway componentsExtensive literature and sequence
search
Spatio-temporal dynamicsFOP
Protein localization, abundance and half-lifeTranscriptional network
Chromatin proteinsCell cycle
Topological structureAttack/failure simulations
Detection of functional modulesIdentification of high-confidence interactions
Overall structure of the U-net
Protein-protein interactions Genetic interactions
Biochemical nature of the Ub network interactions
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
Nodes: 3,954Edges: 14,487
E3 > E2 > E1
Rank plot – comparação da importância de genes em duas redes diferentes
Venancio et al; Genome Biology 2009
1
1113 12
1410
24
7
3
6
9 8
5
14
95 8
12
117
13
10
12
3 4
6
A B
5 6
129
A
B
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
Core proteasome subunits
Proteasome receptors
Inte
raçõ
es e
ntre
mem
bros
da
via
Ub
Interações totais dos membros da via Ub
F-box proteins
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
Plant Physiology, 4th
Taiz and ZeigerAdapted
Substrate
RING finger
Modular structure - Finding maximal cliques
http://scienceblogs.com/goodmath/upload/2007/07/maximal-cliques.jpg
Problemas:
Grande quantidade
Redundância
Incompletos
Tirar vantagem da reduncância dos cliques
Genes funcionalmente relacionados participam juntos de vários cliques
Usamos então a point-wise mutual information para avaliar a co-ocorrência de genes em cliques.
Probability of finding two genes together in a clique
Product of the probability of finding the genes independently
A significância das associações foi calculada usando redes randomizadaspreservando o grau de cada gene (número de links)
Proteasome
Peroxisome
SCP
ER / ERAD
Splicing
APC
Sumoylation
Golgi/vesicles
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
15 F-box
Novel UBL
Ub, SUMO and cellular compartments
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
Enrichment of Ub targets in non-nuclear compartments and of SUMO targets in nuclear-related components
(p < 10-9)
ESCRT
ERAD
Sorting
DNA repair and chromatin structure
Bud formation
Bud formation
Nucleolus structure
Ub and SUMO in the nucleus
Chromatin proteins are enriched in sumoylation targets, as opposed to TFs (p < 10-16). This is true even using only nuclear proteins as background.
Modification of TFs represents a potentially major impact in the proteome, considering that such TFsregulate 2,899 proteins (almost half of the proteome).
TF ORF U-net nU-net p-valRPN4 YDL020C 37 97 2.20E-16REB1 YBR049C 21 174 0.000196AFT1 YGL071W 25 302 0.007463SIP4 YJL089W 5 23 0.008167YAP3 YHL009C 4 17 0.01413
TFs regulating the Ub pathwayUb pathway genes receiving more
connections from TFs
F-boxSUMOReg. Rsp5POZUBLE3F-box
Venancio, Balaji, Iyer, Aravind; Genome Biology 2009
Ub, SUMO and cell cycle
Genes do ciclo celular tendem a ser modificados por Ub.
Genes regulados pelas ciclinas Cln3 e Clb2 são preferencialmente regulados por Ub
SUMO aparenta ser especialmente importante para a regulação de genes expressos na fase G1 do ciclo celular.
Biochemical data from:Spellman et al; Mol Biol Cell 1998
Adaptado de Wuster and Madan Babu, 2008. Trends in Biotechnology
34 artigos
-Nomenclatura
-Formato
-Redundância
-“Essencialidade”
5233 genes (90% do genoma)
425 compostos químicos
Multidrug resistance
Diferenças entre parálogos: Ypt31/32
Transportadores, tráfego vesicular e receptores de membrana
SCPnet
Genes envolvidos em processos similares
Conectividade (graus) nas duas redes
Acetilases, oxidases e outras atividades enzimáticas
MDRs e SCP-hubs possuem naturezas distintas
Robustez X evolvabilidade – MDRs e SCP-hubsAssortatividade X dissortatividade
Motifs mais frequentes:
Ssk2-Pbs2
Ssk2-Hog1
Pbs2-Hog1
Bck1-Slt2
Estabilidade da parede celular e resistência a estresse
1: Conectar genes a compostos com base em 34 estudos de genética-química(quimiogenética, chemical genetics) e formar uma rede chamada chemical-phenotype network (CPnet)
2: Comparar a lista de genes (proteínas) contectados a um composto Ci na CPnet a listaparceiros de uma dada proteína Pj na rede de interação proteína-proteína (PPInet)
3: Se a sobreposição é estatísticamente significante (p<10^-3), conectar P a C.
4: Caso o grupo de proteínas conectado a cada composto C represente algum complexoprotéico conhecido, conecta o complexo ao composto C. Constrói a rede composto-complexos protéicos.
Estratégia geral
Interações quimiogenéticas
Interações proteína-proteína
CPCnet
Rede bimodal:83 compostos químicos51 complexos protéicos182 arestas
Cobre 12.5% dos complexosprotéicos conhecidos em levedura
Interações físicas
Compostos similares ligam-se aosmesmos complexos
Em alguns casos, uma outra via podeconverter o composto em outro.
Hayes and Wolf, 1997
Substâncias não relacionadasligando o mesmo complexo
Neomycin e verrucarin estão ligadas a 16 e 15 proteínas, respectivamente, sendo 12
delas comuns aos dois compostos
Williamson, 2000. Nature
Compostos com mecanismos de ação distintosse ligam ao complexo
Interações indiretas
As duas categorias de complexos protéicos maisrepresentadas estãao envolvidas com
transporte vesicular e cromatina
Cromatina
Inibidor daHMG-Coa
dehydrogenase
Despolimerização de actina
A grande maioria das conexões entre compostos químicos e complexos
protéicos são provavelmente indiretas
Cromatina TFIID e SAGA – regulação da transcrição por POL II
López-Maury et al., 2008, Nature Reviews Genetics
Genes reguladospor SAGA
10 compostos
Genes reguladospor TFIID
1 composto
Resposta ao estresse no citoesqueleto
Alguns compostos que promovem a despolimerização do citoesqueleto estãoconectados a chaperonas (ex: prefoldin).
Remontagem do citoesqueleto
PERSPECTIVAS
Principais dados para geração de redes biológicas
- Interações genéticas
- Interações ptn-ptn
- Regulação por fatores de transcrição
- Conversões enzimáticas
- Co-expressão gênica (menos informativa)
Baixo custo de sequenciamento e implicações na biologia sistêmica.
Variabilidade entre indivíduos e epistasia.
Pergunta de 1 bilhão de dólares: como, olhando para o genoma, podemos
identificar genes que integram processos biológicos comuns e como tais
interações se relacionam a doenças humanas?
Referências e agradecimentos
Venancio TM, Balaji S, Geetha S, Aravind L. Robustness and evolvability in natural chemical resistance: identification of novel systems properties, biochemical mechanisms and regulatory interactions. Mol Biosyst. 2010.
Venancio TM, Balaji S, Aravind L. High-confidence mapping of chemical compounds and protein complexes reveals novel aspects of chemical stress response in yeast. Mol Biosyst. 2010.
Venancio TM, Aravind L. CYSTM, a novel cysteine-rich transmembrane module with a role in stress tolerance across eukaryotes. Bioinformatics. 2010
Venancio TM, Balaji S, Iyer LM, Aravind L. Reconstructing the ubiquitin network: cross-talk with other systems and identification of novel functions. Genome Biol. 2009
Aravind L, Anantharaman V, Venancio TM. Apprehending multicellularity: regulatory networks, genomics, and evolution. Birth Defects Res C Embryo Today. 2009
Venancio, Aravind. Reconstructing prokaryotic transcriptional regulatory networks: lessons from actinobacteria. J Biol. 2009
Intramural ResearchProgram
Lakshminarayan IyerL. AravindVivek AnantharamanDapeng ZhangAbhiman SaraswatiRobson de SouzaS. Balaji (Harvard) Dra. Elenir Amancio Oliveira
Daniel Bellieny-Rabelo (M.Sc. student)Isabela Alves Manhães (undergrad)
Vagas disponí[email protected]