ANÁLISE MULTIVARIADA E FILTROS DE ANÁLISE MULTIVARIADA E FILTROS DE GRAHAM: reconhecimento de padrões GRAHAM: reconhecimento de padrões aplicado aos fundamentos do mercado aplicado aos fundamentos do mercado acionário brasileiro para o período de acionário brasileiro para o período de
1999-20091999-2009Alysson Ramos Artuso
2012
Tese de Doutorado (Programação Matemática)
Apresentação
• Introdução• Filtros de Graham• Risco e Retorno de Ações• Análise Multivariada• Teoria da Informação• Metodologia• Principais resultados• Considerações Finais
Introdução – Bolsa de Valores
• Estabilização econômica (1994), regulamentação do mercado (2001) e longo período de alta (2002-2007) crescimento no investimento em renda variável
• Assunto começa a ser explorado nos trabalhos de pós-graduação
Introdução – Bolsa de Valores
Introdução – Bolsa de Valores
• Análise de valor Graham e Dodd• Princípios centrais:
– A ação representa uma parte de um negócio real, com um valor intrínseco que independe do seu preço
– O mercado é um pêndulo entre o otimismo insustentável e o pessimismo injustificável
– Retorno depende do preço pago– Margem de segurança e diversificação
Introdução – Filtros de Graham
• Uma empresa é potencialmente um bom investimento se:– For “boa” (crescimento consistente,
financiamento conservador etc)– For “barata” (patrimônio líquido elevado,
lucro elevado etc em comparação ao preço)
• Filtros de Graham formas de identificar uma empresa “boa e barata”
Introdução – Reconhecimento de Padrões
• Programação Matemática• Data Mining
– Redes Neurais– Árvores de Decisão– Métodos Baysianos...
• Técnicas Estatísticas – Análise Multivariada:
• Análise Fatorial• Análise Discriminante• Regressão Logística...
Introdução – Risco/Retorno
• Analisar retorno deve envolver uma medida de risco:– Comparação com um índice de mercado
Ibovespa– Baseados em média/variância Índice de
Sharpe– Baseado em coeficientes de regressão Alfa
de Jensen
• Hipótese do Mercado Eficiente– Erros de precificação são aleatórios e não há
correlação dos desvios com qualquer variável não há estratégias consistentes
Objetivo Geral
• Propor e analisar técnicas baseadas em Métodos Estatísticos Multivariados e na Teoria da Informação para ranquear as empresas de acordo com seus múltiplos e índices econômico-financeiros comuns da Análise Fundamentalista, visando à construção de portfólios com uma rentabilidade acima da de mercado.
Objetivos Específicos
• Testar a aplicabilidade dos filtros de Graham e dos conceitos que os sustentam no mercado acionário nacional.
• Identificar e interpretar fatores explicativos da maior parte da variabilidade dos dados.
• Construir modelos de discriminação das empresas de acordo com sua rentabilidade e testar o poder preditivo desses modelos.
• Apontar indícios sobre a eficiência do mercado acionário brasileiro.
Justificativas
• Tema:– Vem se popularizando no Brasil– Poucas pesquisas acadêmicas nacionais
• Suporte teórico de Graham:– Estabeleceu um rigoroso método de
avaliação– Sua escola de investimento é uma das
principais evidências contrárias à Hipótese do Mercado Eficiente
– Pouco explorado nas pesquisas brasileiras (nenhuma testando profundamente seus conceitos)
Justificativas
• Técnicas Estatísticas:– Fundamentais para avaliar risco/retorno– Tratadas superficialmente na maioria dos
trabalhos da área– Trazem somente comparações simples de
carteiras baseadas em múltiplos• Análise Multivariada:
– Interesse crescente– Problemas de diversificação e proposição
de modelos– Inovação na forma de aplicação aos
fundamentos contábeis
Histórico de pesquisas
• Muitos dos estudos desconsideram ajustes ao risco
• Baseados em estratégias utilizadas no passado modificações no mercado e disseminação da prática
• Ações de valor x ações de crescimento e Múltiplos de Mercado (mas quase nunca com critérios múltiplos)
Filtros de Graham
• São 10 filtros baseados em– Múltiplos de mercado– Indicadores econômicos e financeiros
• Mercado norte-americano entre as décadas de 1930-70
• Abordagem de Graham Reconhecimento de Padrões identificar variáveis relevantes e superfícies de separação
Filtros de Graham
1. Índice Lucro/Preço superior ao dobro da taxa livre de risco
2. P/L menor que 40% do P/L médio do mercado (5 anos)
3. DY maior que 2/3 da taxa livre de risco
4. Preço inferior a 2/3 do VCT5. Preço inferior a 2/3 do CGL
Filtros de Graham
6. Dívida total menor que VCT7. Liquidez Corrente maior que 28. LGM maior que 29. Crescimento do lucro maior que
7% ao ano nos últimos 10 anos10. Não mais do que 2 anos de
lucros em declínio nos últimos 10 anos
Filtros de Graham
• Avaliação bastante conservadora poucas empresas satisfazem os 10 critérios (7 podem ser suficiente)
• Carteira deve ter pelo menos 10 ativos (recomendado 30)
• Usando os qualificadores originais não seria possível formar carteiras no mercado brasileiro nos últimos 10 anos
Risco/Retorno
• Risco Desvio padrão• Diversificação diminui o risco (diminui
a oscilação)
Risco/Retorno
• Medidas utilizadas:– Comparação dos retornos logarítmicos
(Ibovespa como carteira de mercado)
– Índice de Sharpe
– Alfa de Jensen
fE(r) rIS
ffE(r) r . E(r) r
Análise Multivariada
• Estudo simultâneo de muitas variáveis:– Redução de dados ou simplificação
estrutural– Classificação e agrupamento;– Investigação de dependência entre
variáveis– Predição– Teste e construção de hipóteses
Análise Multivariada – Componentes Principais
• Investigar quais variáveis mais contribuem para a variabilidade dos dados
• Transformar um conjunto de variáveis correlacionada em um novo conjunto de variáveis não-correlacionadas
• Usada também para o descarte de outliers
Análise Multivariada – Componentes Principais
• A j-ésima componente amostral é dada por
onde são os autovalores e autovetores de S,
ˆ ˆ ˆ ˆY e X e X ... e Xˆ pj 1j 1 pj2j 2 'e Xj
1 2 pp1 2ˆ ˆ ˆ( , ),( , ),...,( , )ˆ ˆ ˆe e e
j j i jˆ ˆ ˆˆV(Y ) Cov(Y,Y ) 0e
Análise Multivariada – Análise Fatorial
• Agrupar as variáveis em fatores explicativos não-correlacionados
• Identificar fatores de forma a compreender melhor o funcionamento do evento estudado
• Classificar as observações de acordo com o escore fatorial
Análise Multivariada – Análise Fatorial
• No modelo fatorial se pressupões que as “p” variáveis X sejam linearmente dependentes sobre “m” variáveis aleatórias não-observáveis F chamadas fatores comuns
X LF
Análise Multivariada – Análise Fatorial
• Estimação dos pesos e variâncias específicas pelo método das componentes principais
1/2ˆˆ ˆ ˆˆˆL CD ; S LL'
ˆˆ ˆ ˆe e e111 1p12
ˆ ˆ ˆe e e ˆ1/221 22 2pˆ ˆ 2C D
ˆ ˆ ˆe e e ˆp1 p2 pp p
Análise Multivariada – Análise Fatorial
• Os escores fatoriais estimados para as variáveis padronizados são dados por:
• Escore bruto de cada observação ponderado pelos autovalores:
1ˆ ˆ ˆ ˆF L 'L L 'z
k k
j j i ii 1 i 1
ˆ ˆ ˆE f '. / '
Análise Multivariada – Teste T2 de Hotelling
• Teste multivariado para diferença entre as médias
• Constatar se dois grupos previamente selecionados possuem diferenças significativas
1
21 2 0 p 1 2 0
1 2
1 1T x x ' S x x
n n
1 2
2 1 2p,n n p 1
1 2
n n p 1T ~ F 1
n n 2 p
Análise Multivariada – Análise Discriminante
• Determinar quais variáveis melhor segregam os grupos
• Utilizar essas variáveis para criar regras de classificação, alocando novos objetos nos grupos previamente definidos
Análise Multivariada – Método de Fisher
• Transformar as observações multivariadas X em observações univariadas Y, tal que os Y’s dos grupos sejam separados tanto quanto possível.
Análise Multivariada – Método de Fisher
• Função Discriminante Linear de Fisher aloca uma nova observação se Y ≥ m para um grupo ou para outro (Y < m).
1ˆ ˆY ( )'Sp
'C X X X X1 2
Y Y1 1 1 2m ( )'S ( )p2 2
X X X X1 2 1 2
Análise Multivariada – Regressão Logística
• Descrever a relação entre uma variável resposta e as variáveis explicativas
• Resposta dicotômica utilizada para a classificação
• Estimação dos parâmetros via métodos iterativos
Análise Multivariada – Regressão Logística
• Regressão Linear: E(Y/x) = 0 + 1X • Regressão Logística:
β β x10eE(Y/x) (x)
β β x101 e
(x)g(x) ln β β x
101 (x)
0 E(Y/x) 1
Análise Multivariada – Método stepwise
• Acréscimo (forward) ou retirada (backward) de variável de acordo com algum critério (p. ex.: capacidade de previsão do modelo).
• Manter a qualidade da previsão usando um menor número de variáveis
Teoria da Informação
• Originalmente desenvolvida para sinais em cabos de comunicação (Shannon, 1948)
• Capacidade de identificar variáveis relevantes por meio de:– Entropia: quantifica a incerteza
relacionada com o valor de uma v.a.– Informação mútua: quantifica o quanto
conhecer uma variável diminui a incerteza sobre outra.
Teoria da Informação
• Entropia: origem na Física• Semelhanças:
– Expressão matemática– Interpretação probabilística
• Diferenças:– Entropia física está relacionada com o
sentido de processos estabelece um princípio físico (2º Lei da Termodinâmica)
– Entropia física não faz referência a distribuições de probabilidade específicas
Teoria da Informação
• Entropia de Shannon:
• Entropia condicional:
• Informação mútua:
n
i ii 1
H p log p
i j j i
H Y | X p i p j | i logp j | i p j,i logp j | i
i j
I Y,X H Y – H Y | X
p i, jI X,Y p i, j log
p(i).p( j)
Teoria da Informação
Teoria da Informação
• Entropia de Rényi família de medidas de entropia da qual a de Shannon é um caso particular:
• Informação mútua de Rényi obtida a partir da divergência de CS:
n
ii 1
1 H log p
1
CS CS XY X Y
CS 2 XY X Y 2 XY 2 X Y
I X,Y D f x,y ;f (x)f (y)
1 1I X,Y H f f f H f H f f
2 2
Árvore de Decisão
• Objetivo de categorizar dados e gerar regras de classificação facilmente interpretáveis.
• Estrutura em forma de árvore:– Cada nó indica um teste– Cada ramo apresenta um resultado do
teste– Cada nó final corresponde a uma
classificação
Árvore de Decisão
Árvore de Decisão
• Algoritmo C4.5 (Quinlan, 1993):– Construção da árvore: seleciona a
variável que melhor separa os grupos pela maior redução da entropia absoluta (informação mútua) e relativa.
– Separação binária dos ramos: pesquisa exaustiva
– Poda da árvore combater overfitting redução de nós por error based pruning
Árvore de Decisão
• Estimação da entropia quadrática de Rényi pela Janela de Parzen com kernel gaussiano:
com σ dado pela regra de Silvermann:
N N
2 j i2 2i 1 j 1
1H X log G x x
N
1
11 d 4X 4N 2d 1
Avaliação dos métodos de classificação
• Taxa aparente de erro (APER) Matriz Confusão
• Abordagem de Lachenbruch equivale a ter um grupo com n observações para ajuste e outro grupo (também de tamanho n) para testar a eficiência do procedimento
Metodologia
• População Amostrada:– Todas as empresas de capital aberta
não-financeiras e de negociação diária (cerca de 350 empresas)
– Dados retirados dos relatórios contábeis CVM e Economática
– Dados de 31/03– Retiradas as que não apresentavam
dados completos (sobrando cerca de 200)
Metodologia
• Variáveis utilizadas:– Indicadores Financeiros: 8– Indicadores de Rentabilidade: 5 (6)– Múltiplos de Mercado: 7– Medidas de Risco/Retorno: 3
– NALD incluída somente nos Filtros de Graham
Metodologia
• Abordagem de carteira• Avaliação dos Filtros de Graham
– Contribuição com novos indicadores
• Análise Fatorial– Identificação e interpretação de fatores– Estratégia de ranqueamento
• Reconhecimento de Padrões– Análise dos modelos: FDLF, MRLM, ADS
e ADR.
Metodologia – Filtros de Graham
• Levantamento de dados• Construção das carteiras• Cálculo das rentabilidades• Testes de hipótese e análise dos
resultados• Proposição de novos qualificadores quartis desenvolvimento de filtros brasileiros
Metodologia – Análise Fatorial
• Levantamento de dados• Descarte de outliers• Testes de viabilidade da AF• Componentes Principais e
extração dos fatores• Rotação varimax• Cálculo do escore• Construção das carteiras
Metodologia – Análise Discriminante
• Separação de grupos (S/F)• Testes de viabilidade da AD• Uso de variáveis originais e método
forward stepwise (separação dos grupos)
• FDFL e MRLM• Avaliação da classificação• Construção das carteiras• Análise dos resultados
Metodologia – Árvore de Decisão
• Mesmos grupos da AD• Algoritmo C4.5 adaptado para
utilizar a entropia quadrática de Rényi
• Análise da classificação (Lachenbruch)
• Construção das carteiras• Análise dos resultados
Metodologia – Contribuições
• Originalidade– Aplicação de métodos não utilizados
na bibliografia levantada– Desenvolvimento de novas
metodologias de classificação e seleção de ativos financeiros (Escores fatoriais, entropia quadrática de Rényi)
• Não-trivialidade– Extensão e complexidade do estudo
Metodologia – Contribuições
• Contribuição científica– Discussão dos conceitos de entropia
para a Física e para a Teoria da Informação
– Proposição de filtros brasileiros– Ranqueamento de ativos via
escores fatoriais da AF– Desenvolvimento e avaliação de
modelos de classificação
Metodologia – Contribuições
• Contribuição social– Contribuição na compreensão do
mercado acionário brasileiro– Proposição de modelos práticos
para o pequeno investidor pessoa física
Principais resultados – Filtros de Graham
• Rentabilidade acima do mercado (ambos os casos)
• Indicadores originais:– Preceitos são válidos– Baixa diversificação (média de 5
ações em carteira)• Qualificadores propostos:
– Mais adequados à realidade brasileira
– Média de 12 ações em carteira– Melhores retornos
Principais resultados – Análise Fatorial
• Elimina o problema de diversificação• Interpretação da influência das
variáveis– Fator 1: Liquidez (LS, LC, LI)– Fator 2: Preço (P/VC, P/VCT)– Fator 3: Rentabilidade (ROA, ROE)– Fator 4: Endividamento (GE, GEM)
• Estabilidade dos fatores• Rentabilidade superior ao mercado
Principais resultados – Análise Discriminante
• Variáveis de destaque:– Preço de Mercado (PM)– Dividend Yield (DY)– Preço por Valor Contábil (P/VC)• Característica dos ativos
selecionados: grandes companhias, que pagam altos dividendos e são negociados a um baixo múltiplo P/VC Ações de valor Graham
• Resultados próximos entre FDLF e MRLM
Principais resultados – Análise Discriminante
• Índice de acerto aproximado: – Total: 83%; Fracasso: 97%; Sucesso: 20%
• Problema de diversificação: grande oscilação no número de ativos Seleção de somente 12 ativos com base no valor de saída do modelo.
• Retornos superiores ao mercado, mas nem sempre com valores significativos
Principais resultados – Árvores de Decisão
• Variáveis de destaque:– Preço de Mercado (PM)– Média de Crescimento dos Lucros (MCL)– Preço por Valor Contábil Tangível (P/VCT)– Dividend Yield (DY)• Índice de acerto aproximado: – Total: 86%; Fracasso: 98%; Sucesso: 40%• Retornos superiores ao mercado,
mas nem sempre com valores significativos Shannon melhor que Rényi
Principais resultados – Estratégias
Filtros de Graham originais (a.p)
Filtros de Graham modificados (a.p)
Análise Fatorial (a.p.)
FDLF 12 Stepwise
1 ano *39,61% *39,78% *38,05% 23,89%2 anos 55,05% *68,81% **64,81% 45,36%3 anos 70,43% *91,01% *83,32% 72,41%5 anos 118,3% 137,16% 145,23% 122,68%
MRLM 12 Stepwise
Árvore de Decisão via Rényi
Árvore de Decisão via Shannon
Ibovespa (a.p)
1 ano 23,62% 17,81% 22,67% 12,37%2 anos 41,11% 35,61% 48,06% 29,32%3 anos 64,87% 46,91% 65,66% 45,10%5 anos 110,29% 92,90% 124,12% 92,49%
• Média do Retorno logarítmico
Principais resultados – Estratégias
Filtros de Graham originais (a.p)
Filtros de Graham modificados (a.p)
Análise Fatorial (a.p.)
FDLF 12 Stepwise
1 ano *0,1056 *0,0975 *0,0687 *0,05902 anos *0,0597 *0,0737 *0,0480 0,0422 3 anos *0,0434 *0,0610 *0,0371 0,0382 5 anos *0,0568 *0,0570 *0,0372 0,0354
MRLM 12 Stepwise
Árvore de Decisão via Rényi
Árvore de Decisão via Shannon
Ibovespa (a.p)
1 ano 0,0472 0,0328 0,0504 0,00532 anos 0,0342 0,0327 **0,0473 0,00673 anos 0,0277 0,0245 0,0355 0,00465 anos 0,0245 0,0272 *0,0369 0,0098
• Índice de Sharpe:
Principais resultados – Estratégias
Filtros de Graham originais (a.p)
Filtros de Graham modificados (a.p)
Análise Fatorial (a.p.)
FDLF 12 Stepwise
1 ano 173,61% *25,81% *26,14% *12,01%2 anos *54,55% *40,93% *35,95% 13,41%3 anos *65,33% *49,66% *41,66% *22,31%5 anos *111,62% *76,60% *69,93% *35,14%
MRLM 12 Stepwise
Árvore de Decisão via Rényi
Árvore de Decisão via Shannon
1 ano *12,16% *7,80% *9,15%2 anos *11,17% 14,05% *17,81%3 anos 15,20% 14,88% *19,85%5 anos *24,74% *31,47% *41,42%
• Alfa de Jensen:
Considerações Finais
• Por meio de técnicas de análise multivariada é possível usar a análise fundamentalista, baseada no método dos múltiplos, para se conseguir rentabilidade acima do mercado.
• Retornos superiores ao mercado:– Fortalecimento do valuation– Indícios de ineficiência do mercado
Considerações Finais
• É possível identificar e interpretar fatores, eliminar o problema de diversificação e construir uma estratégia de sucesso
• 7 modelos testados: Filtros modificados e Análise Fatorial
• Classificação superior a outros modelos em pelo menos 15 pontos percentuais
Considerações Finais
• Possibilidade de continuidade por novos estudos:– Variações dos modelos
apresentados (nº de ativos, estimação, separação dos grupos...)
– Redes Neurais– Máquinas de vetor de suporte (SVM)– Conjuntos aproximativos– Lógica fuzzy...
Trabalhos originados a partir da tese
• Publicados/aceitos:1. Filtros de Graham Aplicados ao Mercado
Acionário Brasileiro. In: XLI SBPO, 2009. 2. O uso de quartis para a aplicação dos filtros de
Graham na Bovespa (1998-2009). Revista Contabilidade & Finanças, v. 21, 2010.
3. Entropias de Shannon e Rényi aplicadas ao Reconhecimento de Padrões. Revista CIATEC, v. 3, p. 56-72, 2011.
4. Estudo de variáveis fundamentalistas e formação de carteiras no mercado acionário via Análise Fatorial. Revista Produção Online, 2012. (prelo)
Trabalhos originados a partir da tese
• Sob avaliação:1. Análise Discriminante e Regressão
Logística – reconhecimento de padrões para a seleção de portfólios no mercado acionário brasileiro
2. Entropia de Shannon e Rényi para a seleção de portfólios no mercado acionário brasileiro
ANÁLISE MULTIVARIADA, TEORIA DA ANÁLISE MULTIVARIADA, TEORIA DA INFORMAÇÃO E FILTROS DE GRAHAM: INFORMAÇÃO E FILTROS DE GRAHAM: reconhecimento de padrões aplicado reconhecimento de padrões aplicado
aos fundamentos do mercado acionário aos fundamentos do mercado acionário brasileiro para o período de 1999-2009brasileiro para o período de 1999-2009
Alysson Ramos Artuso2012
Tese de Doutorado (Programação Matemática)