introdução à bioinformá - câmpus de jaboticabalgenomics.fcav.unesp.br/aulas2017/intro.pdf ·...
TRANSCRIPT
![Page 1: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/1.jpg)
Introdução à
Bioinformática
Danillo Oliveira de Alvarenga
Departamento de TecnologiaUniversidade Estadual Paulista
Jaboticabal-SP
![Page 2: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/2.jpg)
● Área interdisciplinar
– Biologia Molecular
– Bioquímica
– Tecnologia da Informação
– Ciência da Computação
● Desenvolvimento
– escrita de algoritmos
– implementação de métodos
● Análise
– utilização de programas para análise
– interpretação de informação
Bioinformática
![Page 3: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/3.jpg)
● Outros nomes
– biologia computacional
– computação biológica
● Controvérsia
– várias definições
– várias discussões
● Diferenças sutis
– análise
– desenvolvimento
Bioinformática
![Page 4: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/4.jpg)
No nascimento da biologia molecular, reconheceu-se que um tema de pesquisa central deveria ser como os organismos vivos reúnem, processam, armazenam e
utilizam informação. No início dos anos 1970, definimos bioinformática como o estudo dos processos informáticos em sistemas bióticos em múltiplos níveis.
Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou a significar, a partir dos anos 1980, o desenvolvimento e o
uso de métodos computacionais para gerenciamento e análise de dados de sequências, determinação de estrutura proteica, predição funcional
baseada em homologia e filogenia.
Paulien Hogeweg
The Roots of Bioinformatics in Theoretical BiologyPLOS Comp Biol 7: e1002021, 2011
Bioinformática
![Page 5: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/5.jpg)
● Mágica
– solução para alguns problemas
– dados ruins resultados ruins→– tão ampla quanto a própria biologia
● Totalmente inacessível
– prática
– diferentes níveis
● Uma disciplina completamente distinta
– necessária em praticamente todas as áreas
– biologia do século XXI
Bioinformática Não É
![Page 6: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/6.jpg)
Margaret Oakley Dayhoff(1925-1983)
Atlas of Protein Sequence and Structure (1985)
Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences (1966)
Histórico
![Page 7: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/7.jpg)
Histórico
![Page 8: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/8.jpg)
Histórico
![Page 9: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/9.jpg)
Histórico
![Page 10: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/10.jpg)
● Avanços tecnológicos e científico
– computação
– biologia molecular
– sequenciamento
● Volume de dados
– larga escala
– alta velocidade
– grande complexidade
● Bioinformática
– ferramenta mais viável
Relevância
![Page 11: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/11.jpg)
Sequências Disponíveis
GenBank
● Dezembro 1982– 680.338 bases– 606 sequências
● Junho 2017– 234.997.362.623 bases– 201.663.568 sequências
WGS
● Abril 2002– 692.266.338 bases– 172.768 sequências
● Junho 2017– 2.164.683.993.369 bases– 487.891.767 sequências
![Page 12: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/12.jpg)
Genomas Disponíveis
![Page 13: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/13.jpg)
Distribuição de Genomas por Domínio
![Page 14: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/14.jpg)
Ômicas
DNA
↓
RNA
↓
proteínas
↓
metabólitos
diversos
← Genômica, Metagenômica
← Transcritômica, Metatranscritômica
← Proteômica, Metaproteômica
← Metabolômica, Metametabolômica
![Page 15: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/15.jpg)
● Estudo do DNA total em uma célula ou cápsula
● Etapas
– extração de DNA do organismo desejado
– fragmentação do DNA extraído
– sequenciamento do genoma-alvo
– reconstituição a partir dos fragmentos sequenciados
– predição de genes e anotação
Genômica
![Page 16: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/16.jpg)
Genômica
![Page 17: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/17.jpg)
● Estudo do RNA mensageiro total em uma célula
● Etapas
– caracterização do genoma-alvo
– extração de RNA do organismo desejado
– eliminação de RNA ribossômico e transportador
– transcrição reversa e sequenciamento
– mapeamento dos transcritos contra referência
– avaliação de diferenças em relação às condições
Transcritômica
![Page 18: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/18.jpg)
Transcritômica
![Page 19: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/19.jpg)
● Estudo de moléculas em amostras mistas
– metagenômica
– metatranscritômica
– metaproteômica
– metametabolômica
● Etapas
– extração das moléculas da amostra
– tratamento das moléculas extraídas
– sequenciamento e reconstituição
– identificação e separação de sequências
– predição e anotação de táxons e funções
Meta*ômicas
![Page 20: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/20.jpg)
● Genômica
– um organismo
– linhagem cultivada
– ambiente estranho
● Metagenômica
– vários organismos
– não cultivados ou em cocultivo
– genômica de comunidades
Metagenômica
![Page 21: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/21.jpg)
Metagenômica
![Page 22: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/22.jpg)
● Recursos computacionais
– capacidade de processamento
– espaço para armazenamento
● Fonte de dados
– organismos
– alvos
● Recursos humanos
– analistas
– programadores
Estrutura
![Page 23: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/23.jpg)
● Composição biológica
– sequências
● Informação biológica
– anotação
– comparação
– predição
● Bancos
– públicos
– privados
Dados
![Page 24: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/24.jpg)
● Biomoléculas
– ácidos nucleicos
– proteínas
● Conjuntos de caracteres alfabéticos
– 5 + 12 bases
– 20 + 13 aminoácidos
Sequências Biológicas
![Page 25: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/25.jpg)
Nucleotídeos
![Page 26: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/26.jpg)
Bases Nitrogenadas
![Page 27: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/27.jpg)
Mutações
![Page 28: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/28.jpg)
Nucleotídeos
![Page 29: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/29.jpg)
Ácido Desoxirribonucleico (DNA)
![Page 30: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/30.jpg)
Ácido Ribonucleico (RNA)
![Page 31: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/31.jpg)
Gene
![Page 32: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/32.jpg)
Operon
![Page 33: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/33.jpg)
Agrupamento Gênico
![Page 34: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/34.jpg)
● Homologia
– Caractere compartilhado presente no ancestral comum
– Mesma origem, não necessariamente a mesma função
– Revela relação evolutiva
● Homoplasia
– Caractere compartilhado não presente no ancestral comum
– Origem diferente, função semelhante
– Não revela relação evolutiva
Origem de Genes
![Page 35: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/35.jpg)
● Ortólogos
– Transferência vertical
● Xenólogos
– Transferência horizontal
● Parálogos
– Duplicação gênica
Homólogos
![Page 36: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/36.jpg)
Aminoácidos
![Page 37: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/37.jpg)
Aminoácidos
![Page 38: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/38.jpg)
Proteínas
![Page 39: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/39.jpg)
Estrutura Primária de Proteínas
![Page 40: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/40.jpg)
Estrutura Secundária de Proteínas
![Page 41: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/41.jpg)
Estrutura Secundária de Proteínas
![Page 42: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/42.jpg)
Estrutura Secundária de Proteínas
![Page 43: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/43.jpg)
Estrutura Terciária de Proteínas
![Page 44: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/44.jpg)
Estrutura Terciária de Proteínas
![Page 45: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/45.jpg)
Estrutura Terciária de Proteínas
![Page 46: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/46.jpg)
Estrutura Quaternária de Proteínas
![Page 47: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/47.jpg)
Bases Nitrogenadas
Base 1 letra Base 1 letra
adenina A guanina ou citosina S
citosina C adenina ou timina W
guanina G guanina ou timina K
timina / uracila T / U adenina ou citosina M
desconhecida Nadenina ou guanina ou timina D
lacuna – adenina ou citosina ou timina
H
purina R adenina ou guanina ou citosina V
pirimidina Yguanina ou timina ou citosina B
![Page 48: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/48.jpg)
Aminoácidos
Aminoácido 3 letras 1 letra Aminoácido 3 letras 1 letra
alanina Ala A metionina Met M
cisteína Cys C asparagina Asn N
aspartato Asp D prolina Pro P
glutamato Glu E glutamina Gln Q
fenilalanina Phe F arginina Arg R
glicina Gly G serina Ser S
histidina His H treonina Thr T
isoleucina Ile I valina Val V
lisina Lys K triptofano Trp W
leucina Leu L tirosina Tyr Y
![Page 49: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/49.jpg)
Aminoácidos
Outros 3 letras 1 letra
desconhecido Xaa X
selenocisteína Sec U
pirrolisina Pyl O
asparagina ou aspartato Asx B
glutamina ou glutamato Glx Z
leucina ou isoleucina Xle J
hidrofóbico inexistente Φ
aromático inexistente Ω
alifático inexistente Ψ
pequeno inexistente π
hidrofílico inexistente ζ
positivo inexistente +
negativo inexistente –
![Page 50: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/50.jpg)
Código Genético
![Page 51: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/51.jpg)
● Códon de início
– Aqui Tem um Gene
● Códons de terminação
– Termine AgorA
– Termine AGora
– Termine aGorA
Código Genético
5’- ATG TGA CTA GCT ACT ACG TAC TAG CGA TCG ATG CAT CGT ACA TGA -3’
5’- ATG AGC TAC GTA CGT ACG ATC CGT AGT CTG ACT GAG AGT AGC TAG -3’
5’- ATG CTA GTC GTA CTG AGT CAT GCG ATC TAA CGA TCA GTT GGG TGA -3’
![Page 52: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/52.jpg)
● Bases/Aminoácidos
– Fasta
● Qualidades
– Qual
– Fastq
● Anotações
– GenBank
– GFF
– EMBL
Formatos de Sequências
![Page 53: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/53.jpg)
● Fasta (.fasta, .fas, .fa, .fna)
>Sequência 1ATCGAGTCAGTCGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGTCATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCAGTCGTATCGAT
>Sequência 2AGTCGTAGTCAGTCGATCGTAGTCGATCGTAGTCCCAGCGATTCGATCGTAGTCGATCGTAGTCGATCGTCAGTCTGATGCAGTCGTAGTCAGTCGATGCTGATA
>Sequência 3GACGTACGTAGCTAGTCGATCGTAGTCGATCGTAGCGTATCAGTCGTAGTCAGTCGTAGTCAGTCGTAGTCGAGTCTGACGTAGTCGATCGTAGTCGATCGTACG
Formatos de Sequências
![Page 54: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/54.jpg)
● Fasta (.fasta, .fas, .fa, .faa)
>Sequência 1KLLAKKCACJALCJALKKLVLKEKLFLKEICIIOSKALKJFSDJOFJEHVEUCIAWKLCKJSVUIEFIALHFEYFHADJASJFOSDUSDUFJAOPKFSKAUOAAC
>Sequência 2AUFGEWYFWEJOKAMVJASDTRSRSUYIEKFKFMVAUDTWTYHVMVKSVISYGAJSJKAMAOIVHDSYWUAOIWYYEEUHGJLKOAIVTAGGBVKDVIWEIEJEI
>Sequência 3OIEIWUTIOEJGIEKGLMJHFUIHSFJAOFJAJGHIWEJUHERUIGSKDFMKSDMFIOSJDIJSDIGOJSAIOJDSGEHGUIEHUWIURGOSOJWUWQIJJISJS
Formatos de Sequências
![Page 55: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/55.jpg)
● Grau de confiança
– probabilidade de erro
– escala logarítmica
● Phred
– 10: 1 em 10 (90 %)
– 20: 1 em 100 (99 %)
– 30: 1 em 1000 (99,9 %)
– 40: 1 em 10.000 (99,99%)
Qualidade de Sequenciamento de DNA
![Page 56: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/56.jpg)
● Qual (.qual)
>Sequência 110 20 30 40 50 50 50 50 50 20 25 2530 30 20 15 20 35 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 20 30 20 10 10
Formatos de Sequências
![Page 57: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/57.jpg)
● Fastq (.fastq)
@Sequência 1TTGCCTGCCTATCATTTTAGTGCCTGTGAGGTGGAGATGTGAGGATCAGT+Sequência 1hhhhhhhhhhghhghhhhhfhhhhhfffffe`ee[`X]b[d[ed`[Y[^Y
@Sequência 2GATTTGTATGAAAGTATACAACTAAAACTGCAGGTGGATCAGAGTAAGTC+Sequência 2hhhhgfhhcghghggfcffdhfehhhhcehdchhdhahehffffde`bVd
@Sequência 3TGCATGATCTTCAGTGCCAGGACCTTATCAAGCGGTTTGGTCCCTTTGTT+Sequência 3dhhhgchhhghhhfhhhhhdhhhhehhghfhhhchfddffcffafhfghe
Formatos de Sequências
![Page 58: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/58.jpg)
● GenBank (.gb, .gbk)
LOCUS BX571963 240 bp DNA linear DEFINITION Rhodopseudomonas palustris CGA009 DnaA.ACCESSION BX571963VERSION BX571963.1
FEATURES Location/Qualifiers source 1..480 /organism="Rhodopseudomonas palustris CGA009" /strain="CGA009" gene 101..340 /gene="dnaA" /locus_tag="RPA0001" CDS 101..340 /gene="dnaA" /locus_tag="RPA0001" /product="chromosomal replication protein DnaA"
Formatos de Sequências
![Page 59: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/59.jpg)
● EMBL (.embl)
ID BX571963 standard; DNA; 240 BP.XXAC BX571963;XXDE Rhodopseudomomnas palustris CGA009 chromosomalDE replication protein DnaA, complete cds.XXSQ Sequence 240 BP; acaagatgcc attgtccccc ggcctcctgc tgctgctgct 40 ctgccctgcc cctggagggt ggccccaccg gccgagacag 80 caggaataag gaaaagcagc ctcctgactt tcctcgcttg 120 aggccagtgc cgggcccctc ataggagagg aagctcggga 160 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc 200 agaccttctc ctcctgcaaa taaaacctca cccatgaatg 240//
Formatos de Sequências
![Page 60: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/60.jpg)
● GFF (.gff)
##gff-version 3##sequence-region BX571963 1 240seq1 gene 1 240 ID=C114_00001;product=DnaA##FASTA>BX571963 BX571963 Rhodopseudomomnas palustris CGA009 chromosomal replication protein DnaA, complete cds.acaagatgccattgtcccccggcctcctgctgctgctgctctgccctgcccctggagggtggccccaccggccgagacagcaggaataaggaaaagcagcctcctgactttcctcgcttgaggccagtgccgggcccctcataggagaggaagctcgggagcgcacccccccagcaatccgcgcgccgggacagaatgccagaccttctcctcctgcaaataaaacctcacccatgaatg
Formatos de Sequências
![Page 61: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/61.jpg)
● Alinhamentos
– verificar similaridades
– apontar dissimilaridades
● Identificação de sítios homólogos
– regiões conservadas
– regiões variáveis
● Tipos
– emparelhado/múltiplo
– local/global/semiglobal
Comparação entre Sequências
![Page 62: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/62.jpg)
● Alinhamento de regiões
– subsequências
– maximização de correspondência
– eliminação de colunas
● Matriz de substituição
– tempo de divergência
– penalização
– pontuação
Alinhamento Local
![Page 63: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/63.jpg)
● Stephen Altschul et al.
– Basic Local Alignment Search Tool (1990)
● Alinhamento local
– nucleotídeos × nucleotídeos
– aminoácidos × aminoácidos
– nucleotídeos × aminoácidos
– aminoácidos × nucleotídeos
● Banco de dados diversos
– remoto
– local
BLAST
![Page 64: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/64.jpg)
● BLASTn
Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_2 86.1 1e-9
> Sequência_2Length=1103
Score = 86.1 bits (40), Expect = 1e-9 Identities = 35/40 (88%), Gaps = 0/46 (0%) Strand=Plus/Minus
Query 1213 TTTTTTGTCTGAATCAGGATGTCCAGGATTTAAGGATTTT 1253 |||||||||| |||||| |||||||||||||||||||Sbjct 779 TTTTTTGTCTGCATCAGGTACTCCAGGATTTAAGGATTTT 819
BLAST
![Page 65: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/65.jpg)
● BLASTx
Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_3 45.1 9e-7
> Sequência_3Length=309
Score = 45.1 bits (105), Expect = 9e-7 Identities = 23/57 (40%), Positives = 36/57 (63%), Gaps = 1/57 (2%) Frame = +3
Query 807 IRLKGTRVGIETILFDYLFHAKSPEEIAKTYTSLTLEQVYATILYYLHNQQSVDEYI 977 + ++ +RV ++TI+ + + EEIA Y SL L VYA I +YLH+Q+ VD Y+Sbjct 28 VVIRNSRVTLDTIVAVF-NQGVTAEEIAYRYPSLMLADVYAAIAFYLHHQEEVDSYL 83
BLAST
![Page 66: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/66.jpg)
● Alinhamento de ponta a ponta
– sequências completas
– utilização de todos os sítios
● Sequências utilizadas
– homólogas
– tamanho semelhante
– mesmo sentido
Alinhamento Global
![Page 67: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/67.jpg)
● Fasta (.fasta, .fas, .fa, .fna)
>Seq_1ATCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT
>Seq_2ATCGAGCTAGCGGTAGATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGTCGATCACGTAGTAGCAGTAGTTGCAACGTTATCGAT
>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT
Formatos de Alinhamento
![Page 68: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/68.jpg)
● Fasta (.fasta, .fas, .fa, .fna)
>Seq_1ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT
>Seq_2ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTGCAACGTTATCGAT
>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT
Formatos de Alinhamento
![Page 69: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/69.jpg)
● Clustal (.aln)
Seq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAG **** *** **************************
Seq_1 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTASeq_2 TCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTASeq_3 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTA ****** ********* ************ ** * ****
Seq_1 GTTGCA----TATCGATSeq_2 GTTGCAACGTTATCGATSeq_3 GTTGCA----TATCGAT ****** *******
Formatos de Alinhamento
![Page 70: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/70.jpg)
● Phylip (.phy)
3 105Seq_1 ATCG------ --GTAGTCGA TCGTAGTCTG ACGTACGATGSeq_2 ATCGAGCTAG CGGTA---GA TCGTAGTCTG ACGTACGATGSeq_3 ATCGAGCTAG CGGTAGTCGA TCGTAGTCTG ACGTACGATG
TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG TCAGTCGATG AGATGCGATG T----CGATC ACGTAGT-AG TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG
TCGTAGTAGT TGCA----TA TCGAT -C--AGTAGT TGCAACGTTA TCGAT TCGTAGTAGT TGCA----TA TCGAT
Formatos de Alinhamento
![Page 71: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/71.jpg)
● Nexus (.nex)
#NEXUSBEGIN DATA;dimensions ntax=3 nchar=105;format missing=? interleave=yes datatype=DNA gap=- match=.;
matrixSeq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG
Seq_1 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTSeq_2 AGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTSeq_3 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTT;end;
Formatos de Alinhamento
![Page 72: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/72.jpg)
Montagem
ATGCGGCATCGCATGAGTGC
ATGAGTGCACGCAGCTGA
CAGCTGAGTCTAATATG
TCGCATGAGTGCACGCAGCTGAGTC
![Page 73: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/73.jpg)
Montagem
ATGCGGCATCGCATGAGTGC
ATGAGTGCACGCAGCTGA
CAGCTGAGTCTAATATG
TCGCATGAGTGCACGCAGCTGAGTC
![Page 74: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/74.jpg)
Montagem
ATGCGGCATCGCATGAGTGCATGAGTGCACGCAGCTGA
CAGCTGAGTCTAATATGTCGCATGAGTGCACGCAGCTGAGTC
ATGCGGCATCGCATGAGTGCATGCTAGCTGAGTCTAATATG
![Page 75: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/75.jpg)
Conhecendo o (GNU/)Linux
![Page 76: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/76.jpg)
● Físicas (hardware)
– processador
– memória
– disco rígido
– placas e controladores
– dispositivos de entrada/saída
● Lógicas (software)
– sistema operacional
– interface
– bibliotecas
– aplicativos
– documentação
Componentes de um Computador
![Page 77: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/77.jpg)
● Gerenciador de recursos
– controla dispositivos
– coordena tarefas
– administra pedidos
– regula processos
– manipula dados
● Coração da máquina
– inicialização
– execução
– processamento
Sistema Operacional
![Page 78: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/78.jpg)
Microsoft Windows
Apple macOS
GNU/Linux
Sistemas Operacionais
![Page 79: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/79.jpg)
Microsoft Windows
Apple macOS
GNU/Linux
Sistemas Operacionais
![Page 80: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/80.jpg)
● Ken Thompson & Denis Ritchie (1969)
– AT&T
● Inovações
– multitarefa
– multiusuário
● Variantes proprietárias
– código fechado
– licença restritiva
UNIX
![Page 81: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/81.jpg)
● “Clones”
– GNU/Linux
– BSD
– Solaris
– Xenix
● Padronização
– Portable Operating System Interface (POSIX)
– Executable and Linkable Format (ELF)
UNIX
![Page 82: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/82.jpg)
UNIX
![Page 83: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/83.jpg)
● Richard Matthew Stallman (1983)
– GNU’s Not Unix
– Free Software Foundation
● Linha de comando
– utilitários
– aplicativos
– compiladores
● GNU Public License
GNU
![Page 84: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/84.jpg)
● Linus Benedict Torvalds (1991)
– Linus’ Unix
– Linux Foundation
● Núcleo operacional
– física lógica←→– entrada saída←→– gerenciamento
● GNU Public License
Linux
![Page 85: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/85.jpg)
Linux
![Page 86: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/86.jpg)
Linux
![Page 87: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/87.jpg)
Distribuições
● Coleções coerentes de projetos
– GNU
– Linux
– SystemD/Upstart/SysV
– Deb/RPM/tar.gz
– X/Wayland
– Gnome/KDE/XFCE/LXDE
– aplicativos
– customizações
● Slackware e Debian (1993)
– mais antigas na ativa
![Page 88: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/88.jpg)
Distribuições
![Page 89: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/89.jpg)
Distribuições
● Baseadas no Debian
– Debian
– Ubuntu
– Mint
● Baseadas no Red Hat
– Red Hat
– CentOS
– Fedora
● Outras bases
– Slackware
– Gentoo
– OpenSUSE
– Arch
![Page 90: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/90.jpg)
Distribuições
![Page 91: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/91.jpg)
Distribuições
![Page 92: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/92.jpg)
Por Quê?
● Sistema dominante
– servidores
– computação científica
– supercomputadores
– dispositivos móveis
● Muitas vantagens
– gratuito
– livre e com código aberto
– alterações são compartilhadas
● Grande estabilidade
– segurança
– suporte
![Page 93: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/93.jpg)
Linux na Bioinformática
● Flexibilidade
– gratuito
– customizável
● Diversidade
– programas otimizados
– programas exclusivos
● Colaborativo
– desenvolvido em comunidades
– aberto e reproduzível
![Page 94: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/94.jpg)
Bio-Linux
● UK National Environmental Research Council (2006)
– Open Software for Biologists: From Famine to Feat
● Voltada para bioinformática
– sistema operacional
– conjunto de pacotes
– mais de 250 programas
● Várias formas
– SO independente (baseado no Ubuntu)
– adicionar a um sistema pré-instalado
![Page 95: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/95.jpg)
Preciso Mudar de SO?
● Não
– trabalho remoto
– servidores disponíveis na Internet
– programas comerciais
● Sim
– compatível com todas as configurações
– sem limitações
– toda a capacidade disponível
– melhor forma de aprender
![Page 96: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/96.jpg)
Preciso Mudar de SO?
● Sem alterações
– virtualização
– mídia externa
● Execução direta
– substituir o sistema atual
– instalar ao lado do sistema atual
![Page 97: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/97.jpg)
Subsistema Windows para Linux
![Page 98: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/98.jpg)
Terminais para Android
![Page 99: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/99.jpg)
Servidores
● Fornecem serviços
– “nuvem”
– atendem clientes
– maior capacidade de processamento
– maior espaço para armazenamento
● Plataforma-padrão
– mesmas ferramentas
– favorece comparações entre a equipe
– facilita acesso às últimas versões
– reduz o número de especialistas
![Page 100: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/100.jpg)
Servidores
● Secure Shell (SSH)
– terminal
– PuTTY
– Cygwin
● Virtual Network Computing (VNC)
– gráfico
– VNC Viewer
● WinSCP
![Page 101: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/101.jpg)
Interfaces de Programas
● Gráfica
– Galaxy
– CLCBio
– Geneious
● Linha de comando
– maior parte dos programas
![Page 102: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/102.jpg)
Linha de Comando
● Interface de texto
– instruções comandos→
● Mais eficiente
– mais leve
– mais rápida
– mais objetiva
● Permite automação
![Page 103: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/103.jpg)
Programação
● Conjunto de instruções para algum processo
– comandos em sequência lógica
● Linguagens distintas
– compiladas
– interpretadas
● Bioprojetos
– Open Bioinformatics Foundation
![Page 104: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/104.jpg)
Programas Compilados
● Linguagens de menor abstração
– mais complexas
– mais rápidas
● Compilador
– tradução em código binário
– maior número de detalhes
● Principais linguagens
– C
– C++
● Instalação mais trabalhosa
![Page 105: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/105.jpg)
Programas Interpretados
● Linguagens de maior abstração
– mais simples
– mais lentas
● Interpretador
– maior abstração
– instruções legíveis
● Principais linguagens
– Perl
– Python
– R
● Instalação simples
![Page 106: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/106.jpg)
Licenças
● Questões legais
– direitos autorais
– patentes
● Permissão
– o que fazer
– como fazer
– distribuição
![Page 107: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/107.jpg)
Licenças
● Proprietária
– variável
● Livre/permissiva
– domínio público
– BSD
– MIT
– Apache
● Livre/viral
– GPL
![Page 108: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/108.jpg)
Prática
![Page 109: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou](https://reader034.vdocuments.pub/reader034/viewer/2022042314/5f0276597e708231d40461c8/html5/thumbnails/109.jpg)
1) https://cygwin.com/;
2) mover instalador para a Área de Trabalho;
3) Prompt de Comando;
4) cd Desktop;
5) setup-x86.exe --no-admin.
Cygwin