tassel - trait analysis by association, evolution and linkage

31
1 TASSEL Trait Analysis by aSSociation, Evolution and Linkage

Upload: marcos-castro

Post on 07-Aug-2015

151 views

Category:

Software


4 download

TRANSCRIPT

Page 1: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

1

TASSEL

Trait Analysis by aSSociation, Evolution and Linkage

Page 2: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

2

Mapeamento por associação

● Software para o mapeamento por associação de traços (características) complexos [1].

Page 3: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

3

Conceitos

● Mapeamento por associação– Método para mapear QTLs

● QLT (quantitative trait loci)– Expressão de caracteres fenotípicos

– Caracteres quantitativos● Vários genes● Distribuição contínua● Quantidades: peso, altura etc.

Page 4: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

4

Estudo de associação

● Identificar associações entre o fenótipo e um ou mais marcadores genéticos

● Marcador genético– Diferenças entre indivíduos

– Detectar QTLs

– Exemplo: SNPs

Page 5: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

5

SNPs

● Single Nucleotide Polymosphisms● Grande abundância

– A cada 300 ~ 600 nucleotídeos [2]

● Tecnologias de genotipagem● Mutações que se propagaram ao longo de

gerações

Page 6: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

6

SNPs

Page 7: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

7

TASSEL - Instalação

● http://www.maizegenetics.net/tassel

Page 8: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

8

TASSEL - Instalação

● Recomendável via git– https://git-scm.com/downloads

● Para copiar o projeto:– git clone <endereço da versão>

● Para atualizações:– git pull

Page 9: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

9

TASSEL Pipeline

● Consiste em módulos (plugins)● Saída de um módulo pode ser utilizada como

entrada para outro módulo

Page 10: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

10

Termos importantes

● Sequence File: arquivo texto com uma sequência de DNA e informações adicionais da plataforma Illumina.

● Taxa: amostra individual● Key File: arquivo texto usado para atribuir um

GBS Bar Code para uma Taxa● GBS Tag: sequência DNA

Page 11: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

11

Arquivos de teste

● Download de arquivos de testes:– http://mirrors.iplantcollaborative.org/browse/iplan

t/home/shared/panzea/tassel/GBSTestData.tar● Pasta GBS

– Pipeline_Testing_key.txt → key file

Page 12: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

12

Tassel GBS Pipeline

● 3 pipelines– Discovery Pipeline (genoma de referência)

● Vários passos

– Production Pipeline● Utiliza informação do Discovery Pipeline● Um passo

– UNEAK (sem um genoma de referência)

Page 13: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

13

Estrutura de diretórios

● É necessária uma estrutura de diretórios– ./fastq

– ./tagCounts

– ./mergedTagCounts

– (…)

● Exemplo: o plugin FastqToTagCountPlugin redireciona sua saída para o diretório tagCounts.

Page 14: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

14

Discovery Pipeline

● Genoma de referência● Na pasta GBS (arquivos de teste) possui um

genoma de referência:– ZmB73_RefGen_(...)

Page 15: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

15

Discovery Pipeline

● Execução por linha de comando através de um script em Perl que se comunica com a aplicação Java

● Sintaxe:– run_pipeline.pl -fork1 -PluginName –plugin-option(s)

-endPlugin -runfork1

● TASSEL pode rodar vários processos de uma vez, combinar resultados etc.

Page 16: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

16

TASSEL GBS Pipeline

● Sintaxe:– run_pipeline.pl -fork1 -PluginName –plugin-option(s)

-endPlugin -runfork1

● Em máquinas Windows sem o Perl instalado, pode-se utilizar o “run_pipeline.bat”

● Cada passo do pipeline é especificado com um comando “-fork” e um número

Page 17: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

17

TASSEL GBS Pipeline

● Sintaxe:– run_pipeline.pl -fork1 -PluginName –plugin-option(s)

-endPlugin -runfork1

● O “fork” é seguido pelo nome do plugin e as opções do plugin.

● “-endPlugin” sinaliza o final das opções.● “-runfork1” executa o plugin especificado.

Page 18: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

18

TASSEL GBS Pipeline

● Sintaxe:– run_pipeline.pl -fork1 -PluginName –plugin-option(s)

-endPlugin -runfork1

● Caso você chame o plugin sem argumento algum, então serão impressas suas opções/argumentos.

Page 19: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

19

TASSEL GBS Pipeline

Page 20: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

20

TASSEL GBS Pipeline

● Exemplos de argumentos para o plugin FastqToTagCountPlugin– -i → especifica o diretório de entrada contendo

arquivo FASTQ

– -e → especifica enzima utilizada na criação de uma biblioteca GBS (exemplo: ApeKI)

– -o → diretório de saída

Page 21: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

21

TASSEL GBS Pipeline

● Exemplo de comando:– run_pipeline.pl -fork1 -FastToTagCountPlugin -i

fastq -k myGBSProject_key.txt -e ApeKI -o tagCounts -endPlugin -runfork1

● fastq → faz parte da estrutura de diretórios● -k → key file● -e → enzima de restrição (ApeKI)● -o → saída para o diretório tagCounts

Page 22: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

22

TASSEL GBS Pipeline

● Exemplo comando com vários fork's

Run_pipeline.bat -fork1 –h mdp_genotype.hmp.txt -

filterAlign -filterAlignMinFreq 0.05 -fork2 -r

mdp_traits.txt -fork3 -q mdp_population_structure.txt -

excludeLastTrait -fork4 -k mdp_kinship.txt -combine5 -

input1 -input2 -input3 -intersect -combine6 -input5 -

input4 -mlm -export mlm_output_tutorial -runfork1 -

runfork2 -runfork3 -runfork4

Page 23: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

23

Enzimas de restrição

● TASSEL-GBS pipeline não se limita às enzimas de restrição específicas usadas nos protocolos GBS.

● Novas enzimas podem ser adicionadas:– Basta solicitar no Google Group

– http://groups.google.com/group/tassel

Page 24: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

24

TASSEL GBS Pipeline

● O default de memória é 1.5GB, caso tenha mais memória, é aconselhável aumentar a quantidade de memória editando o arquivo run_pipeline.pl

● Ou passando por argumento:– run_pipeline.pl -Xmx6g (...)

Page 25: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

25

TASSEL GBS Pipeline

● O primeiro passo do pipeline requer pelo menos 6G.

● Recomendável 16G

Page 26: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

26

TASSEL GBS Pipeline

● Muitos dos comandos produzem uma saída enorme no console

● Pode ser útil redirecionar a saída para um arquivo

● Utiliza-se o comando: | tee log.txt– run_pipeline.pl (…) | tee log.txt

Page 27: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

27

Discovery Pipeline

Page 28: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

28

TASSEL GBS Pipeline

● Alguns arquivos (exemplo: TagCounts) estão em formato binário.

● Para converter para um formato legível:– BinaryToTextPlugin

● Para arquivos de textos muito grandes:– Utilizar os comandos head e/ou tail

● head -10 meuArquivo.txt● Mostra as 10 primeiras linhas de meuArquivo.txt

Page 29: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

29

GUI

Page 30: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

30

Linha de comando

● Vantagens:– Pode ser usada a saída de um comando como

entrada de outro comando através de scripts

– Execução em servidor

– Consome menos recursos

Page 31: TASSEL - Trait Analysis by aSSociation, Evolution and Linkage

31

Referências

● [1] http://bioinformatics.oxfordjournals.org/content/23/19/2633.full.pdf

● [2] http://www.lge.ibi.unicamp.br/lgeextensao2008/extsup/snps.pdf

● Wiki Tassel:– https://bitbucket.org/tasseladmin/tassel-5-source/wi

ki/Home