softwares de análises estatísticas em biologia sistêmica
DESCRIPTION
V Conferência Sul em Modelagem Computacional. Softwares de Análises Estatísticas em Biologia Sistêmica. Prof. Dr. Éder Maiquel Simão Email: [email protected] Rio Grande, Setembro de 2012. Roteiro. 1- Teoria 1.1 Introdução; 1.2 Informação Genética; 1.3 Formação do Câncer; - PowerPoint PPT PresentationTRANSCRIPT
Software para Anlises Estatsticas em Biologia Sistmica
Softwares de Anlises Estatsticas em Biologia SistmicaProf. Dr. der Maiquel SimoEmail: [email protected]
Rio Grande, Setembro de 2012
V Conferncia Sul em Modelagem Computacional Roteiro1- Teoria1.1 Introduo;1.2 Informao Gentica;1.3 Formao do Cncer;1.4 Expresso de Protenas;
2- Prtica2.1 Normalizao;2.2 Atividade Relativa - Diversidade Relativa;2.3 Mudana de Expresso;2.4 Mapas Funcionais.
1.1 IntroduoBiologia Sistmica: Integrao entre os fenmenos e as teorias que envolvem os sistemas biolgicos. - Informao;- Abordagem sistmica;
O objetivo do mini curso ser mostrar a funcionalidade de alguns softwares de anlises estatsticas usados pela biologia sistmica para investigar a expresso de vias e genes relacionados a doenas humanas.
1- Dados de expresso do GEO e genes da Ontologia Ontocancro;
2- Software R, com pacotes do Bioconductor;
3- Software ViaComplex;
4- Mapas Funcionais Banco de Dados String. 1.2 Informao GenticaUmcromossomo uma longa sequncia deDNA, que contm vriosgenes, e outras sequncias de nucleotdeos com funes especficas nasclulasdosseres vivos.
(String)Um conjunto de protenas desempenha uma funo especfica.
Ex: - Protenas que do cor aos olhos;- Envolvidas na morte celular;- Na proliferao celular...
1.4 EXPRESSO DE PROTENAS
GENOMAPROTEOMA
TRANSCRIPTOMAinteraoprot-geneMETABOLOMA
CitratesynthaseMalatedehydrogenaseFumaraseSuccinatedehydrogenaseINTERATOMAinteraoprot-protExpresso de protenas: Todos as clulas tem a mesma quantidade de genes e as clulas com funes diferentes produzem protenas especializadas naquela funo.
COMO MEDIR A EXPRESSO DE PROTENAS?
7MICROARRANJOSRNA-Seq
23
23 Bancos de Dadoshttp://www.ncbi.nlm.nih.gov/geo/
Bancos de Dados
Adrenocortical Carcinomas , AdenomasGSE10927
PASTA 1- ARQUIVOS .CEL (GSE10927)
Glndulas suprarrenais: Estimulam a converso de protenas e gorduras em glicose, ao mesmo tempo que diminuem a captao de glicose pelas clulas, aumentando, assim, a utilizao de gorduras.2.1 Normalizao
Software R com pacotes do Bioconductor
ARQUIVOS .CELGrfico de bigodes, indica a disperso entre as amostras. A linha preta a mediana, a caixa representa os elementos entre o 10 e o 30 quadrante.
ABRINDO O ARQUIVO GSE10927_RMA.XLS
MATRIZ NORMALIZADA- Cada elemento representa uma sonda de um gene;- Cada linha corresponde ao valor de expresso do mesmo gene;- Cada Coluna corresponde a uma amostra (microarranjo) de um determinado tecido.
AGRUPAR OS TECIDOS
1- Criar 2 colunas em branco, separando as amostras;2- Fazer a mdia entre as amostras;3- Expandir o clculo para todos os genes.
4- Criar nova planilha e colar as sondas com as mdias;
5- Para gerar o arquivo de expresso usado no software ViaComplex devemos baixar o arquivo da plataforma referente a srie que estamos analisando:6- Deste arquivo 2 colunas so extradas:- A primeira corresponde ao IDENTIFICADOR da SONDA;- A segunda corresponde ao SMBOLO APROVADO DO GENE.
OBS: Passo j realizado. 7- Com a plataforma devemos formar as combinaes de expresso a serem analisadas:ADENOMA x NORMAL e CNCER x NORMAL
Observaes Importantes: No arquivo TXT de expresso no pode aparecer o caractere / ou espaos em branco nas clulas de clculo.# Devemos sempre cuidar o espao existente no final do arquivo.
ADENOMA x NORMAL e CNCER x NORMALSALVAR CADA UM DESTES ARQUIVOS COMO:texto (separado por tabulao)
PASTA 2 - Criar arquivos para o SOFTWARE VIACOMPLEXBANCOS DE DADOS DE VIAS E GENES:NCI PATHAWAY, REACTOME, BIOCARTA e ONTOLOGIA ONTOCANCRO
http://ontocancro.inf.ufsm.br/
PASTA 3 - VIAS E GENES - ONTOLOGIA ONTOCANCRO
23Diversidade Entropia de ShannonFrequncia da diversidade do gene i
Diversidade relativa
2.2 Atividade Relativa - Diversidade RelativaCncer NormalAtividade relativa
25
26
27
282.3 Mudana de ExpressoCncer, adenoma Normal
No de vezes que a expresso varia entre os genes de uma via (conjunto de genes com uma determinada funo)Para encontrar a mudana de expresso entre os genes de uma via:
1- Encontrar as vias de interesse:
http://ontocancro.inf.ufsm.br/
PASTA 5 - Fold Change
Software R com pacotes do BioconductorMudana de Expresso Para efetuarmos os clculos da mudana de expresso so necessrios alguns arquivos importantes:1- Vias de interesse;2- Arquivo RData, salvo durante a Normalizao dos dados;3-Script.
Objetivo: Atravs da atividade relativa iremos analisar a expresso das amostras de tecidos pr cancerosos do clon em uma rede de protenas envolvida na manuteno do genoma. Para isso precisaremos construir uma rede de interao.2.4 Mapas funcionais
http://ontocancro.inf.ufsm.br/
http://string-db.org/Banco de Dados String
Contm vrias informaes do genoma:Inclu mais de 5 milhes de protenas de 1133 Organismos
Passo 6 - Software STRINGArquivo Medusa
Resultado
Artigos publicados com os Softwares