projeto oriber - home | puc-sp | pontifícia … · o presente trabalho tem por objetivo efetuar...
TRANSCRIPT
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração
Programa de Estudos Pós-Graduados em Administração
PROJETO ORIBER
TEMA : Transformação Produtiva e Inovação Sustentável
ANÁLISE DISCRIMINANTE
Disciplina: Métodos Quantitativos
Professor: Dr. Arnoldo Jose de Hoyos
Leda Honorato da Silva Reis
1. INTRODUÇÃO
2
O presente trabalho tem por objetivo efetuar uma análise comparativa de médias, intervalos de confiança e regressões de dados de indicadores relacionados ao desenvolvimento humano dos países do mundo. O principal propósito é comparar os conglomerados da amostra. Para tal iniciamos com análise da estatística descritiva. Em seguida passamos para a análise da comparação de médias e variância através da One-Way Analysis of Variance. Na terceira parte utilizamos a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento humano que explicam a posição dos países dos conglomerados das amostras. Por fim, fazemos as considerações finais. Os dados são compilados pelo Banco Mundial. O software estatístico utilizado é o MINITAB. 2. ENTENDENDO OS DADOS 2.1 Os Indivíduos Os indivíduos desta análise são os países reportados no GPS. Os dados analisados de cada país são as variáveis que descrevemos a seguir. Os dados foram coletados no banco de dados do GPS. 2.2 As Variáveis Quadro 1. As dezoito Variáveis do Eixo temático:Transformação Produtiva e Inovação Sustentável (Basic Features: Productive Transformation and Sustainable Innovation)
Variável Significado Tipo Unidade de Medida
Social Progress Index
. O Índice foi estruturado em torno de 12 componentes e 54 indicadores distintos consolidadas em três dimensões do Progresso Social: necessidades humanas básicas, Fundações de Bem-estar e oportunidade. A primeira dimensão, necessidades humanas básicas, avalia o quão bem um país prevê necessidades essenciais de seu povo através da medição se as pessoas têm comida suficiente e estão recebendo cuidados médicos básicos, se tiverem acesso a água potável, se tiverem acesso a uma habitação condigna com serviços básicos, e se eles são seguros e protegidos.
Variável Quantitativa
Percentual
Ecosystem Sustainability
A manutenção de um ecossistema sustentável depende da interação de 4 elementos: Produtividade, Diversidade, Resiliência, Distúrbios Naturais. A sustentabilidade dos ecossistemas é determinada pela relação entre esses elementos, e juntos eles determinam o nível de recursos que podem ser tomadas a partir de um ambiente e ainda mantê-lo de forma sustentável.
Variável Quantitativa
Percentual
IDH - 2013 O Índice de Desenvolvimento Humano (IDH) mede o progresso de uma nação a partir de três dimensões: renda, saúde e educação.
Variável Quantitativa
Indicador nominal que varia de 0 a 1
Combustible renewables and waste
Compreendem a biomassa sólida, biomassa líquida, biogás, resíduos industriais e resíduos urbanos, medido em percentagem do consumo total de energia
Variável Quantitativa
Percentual
Suceptibilidad Susceptibilidade refere-se à probabilidade de sofrer dano, perda e interrupção de um evento extremo ou desastres naturais. Assim, a susceptibilidade descreve as características estruturais e condições de enquadramento de uma sociedade.
Variável Quantitativa
Percentual
Global Innovation Ind
Reconhece o papel fundamental da inovação como motor do crescimento económico e prosperidade, e reconhece a necessidade de uma ampla visão horizontal de inovação, que é aplicável à ambas as economias: desenvolvidas e emergentes,
Variável Quantitativa
Percentual
3
com a inclusão de indicadores que vão além das medidas tradicionais de inovação (como o nível de pesquisa e desenvolvimento em um determinado país).
Institutions É formado por três pilares: a) Ambiente Político: indica a percepção da probabilidade de que um país possa ser desestabilizado; da qualidade dos serviços públicos e civis; da formulação e implementação de políticas; e a percepção de violações à liberdade de imprensa; b) Ambiente Regulatório; indica a percepção sobre a capacidade de um governo de formular e implementar políticas de coesão que promovam o desenvolvimento do setor privado c) Ambiente de Negócios: reflete a avaliação de três aspectos : a facilidade de começar um negócio, a facilidade de solução de insolvência e a facilidade de pagamento de impostos.
Variável
Quantitativa
Percentual
Human Capital and Research
Os quatro pilares do Índice são: • O pilar Educação contém indicadores relativos à aspectos quantitativos e qualitativos da educação do outro lado primário, secundário e terciário e contém informações tanto no presente como força de trabalho bem como a futura força de trabalho. • A Saúde e Bem-Estar pilar contém indicadores relativa ao bem-estar físico e mental de uma população sendo, desde a infância até a idade adulta. • O pilar da Força de Trabalho e Emprego destina-se a quantificar a experiência, talento, conhecimento e treinamento na população em idade activa de um país. • O pilar Ambiente propício capta o legal quadro, infra-estrutura e outros fatores que possibilitam retornos sobre o capital humano.
Variável
Quantitativa
Percentual
Infraestructure Percentagem da população sem acesso a saneamento melhorado e a uma fonte de água melhorada. As condições de habitação: parcela da população vivendo em favelas; proporção de habitações semi-sólidos e frágeis. Nutrição: Percentagem da população subnutrida, pobreza excessiva e dependências (jovens menores de 15 anos e adultos maiores de 65 anos) em relaçao à população ativa
Variável Quantitativa
Percentual
Market Sophistication
Este indicador é um derivado dos seguintes indicadores: - (a) disponibilidade de serviços financeiros (b) A acessibilidade dos serviços financeiros (c) financiamento através do mercado de ações local (d) Facilidade de acesso a empréstimos (e) a disponibilidade de capital de risco (f) restrição sobre os fluxos de capital (g) solidez dos bancos (h) a regulação das bolsas de valores e (i) índice de direitos legais.
Variável Quantitativa
Percentual
Knowledge and Technology
Direcionadas para a atividade de invenções e inovações, abrangendo: a) Criação do Conhecimento que envolve: o resultado de Atividades Criativas e Inovadores b) Sobre o Impacto do Conhecimento: aumento da produtividade do trabalho, a entrada de novas empresas, os gastos com software e quantidade de certificação de qualidade ISSO 9001; e c) Difusão do Conhecimento: royalties e taxas de licenças; percentual de exportações de alta tecnologia; percentual das exportações de serviços de comunicação, computação e informação em relação ao total de exportação de serviços; e o percentual de saída de FDI (Foreign Direct Investment) em relação ao PIB (Produto Interno Bruto).
Variável
Quantitativa
Percentual
Creative Outputs A criatividade foi reconhecida como um motor econômico para gerar riqueza, emprego, o desenvolvimento sustentável das cidades do mundo, mudanças tecnológicas, inovação empresarial e reforço da competitividade das cidades e países individuais.
Percentual
4
Criatividade mostrada na produção econômica e nos domínios culturais, por exemplo, pode ser avaliado e apreciado pela comunidade, enquanto a inovação criativa em ciência ou ciência humana poderia ser reconhecida pelas comunidades científicas e acadêmicas. Isto significa "criatividade social" é mensurável e quantificável, embora "a criatividade da vida diária" é uma capacidade geral encontrada em outro lugar em nossa vida é mais difícil de medir.
International Cooperation
Esta questão visa avaliar a disposição e capacidade da liderança política em desenvolver boas relações de vizinhança e cooperar com os países vizinhos em organizações internacionais e regionais • apoiar a integração regional ou internacional.
Indicador nominal que varia de 0 a 10
Effective use of support
Utilização eficaz de apoio : avalia se o Governo tem objetivos claros do desenvolvimento político e econômico, e sobre a forma como a liderança política faz uso de grandes projetos assistenciais internacionais, envolvendo cooperação técnica ou pessoal em sua própria agenda de desenvolvimento. O foco é sobre a capacidade de aprender a partir de know-how internacional, e se adaptar ao aconselhamento externo às realidades nacionais e ainda integrar essa assistência internacional em uma estratégia consistente de desenvolvimento de longo prazo.
Indicador nominal que varia de 0 a 10
Regional Cooperation
Avalia a disposição e capacidade da liderança política em: Desenvolver relações de boa vizinhança; Cooperar com os países vizinhos em organizações internacionais e regionais; Apoiar a integração regional ou internacional; A liderança política ativamente e com êxito constrói e expande cooperativa vizinhança e internacional relacionamentos. Ela promove a integração regional e internacional; A liderança política coopera com muitos estados vizinhos e está em conformidade com as regras estabelecidas pela organizações regionais e internacionais.
Indicador nominal que varia de 0 a 10
EPI- Indice de desempenho ambiental
Classifica o desempenho dos países em questões ambientais principais: proteção à saúde humana e proteção do ecossistema ambiental
Variável
Quantitativa
Percentual
HPI – Bem estar sustentável do país
Medida de bem estar sustentável país oferece uma vida feliz sustentável à longo prazo para as pessoas que vivem nelas.
Variável Quantitativa
Percentual
GINNI index Mede a distribuição de renda e de despesas das famílias Variável Quantitativa
Percentual
Fonte: autor a partir dos dados da planilha estatística e do GPS p.16 As variáveis que melhor identificam a Transformação Produtiva e Inovação Sustentável são: Social Progress Index, IDH 2013, Knowledge and Technology, Market Sophistication, Creative Output, Global Inovation Index. 2.3 A Tabela de Dados A tabela abaixo apresenta os dados das variáveis que melhor identificam a Transformação Produtiva e Inovação Sustentável para países objeto da pesquisa.
País Social Global Market Creative IDH Knowledge
5
Progress
Index Innovation Sophistication
Outputs 2013 and
Index Technology
Albania 69,13 30,5 61,9 20,6 0,716 30,43
Algeria 59,13 24,2 36,2 14 0,689 29,23
Angola 39,93 23,8 42,9 18,1 0,526 38,29
Argentina 70,59 35,1 37,7 36,9 0,808 38,97
Armenia 65,03 36,1 50,4 33,6 0,73 50,26
Australia 86,10 55 68,1 52,5 0,933 61,71
Austria 85,11 53,4 57,2 49,9 0,881 66,15
Azerbaijan 62,44 29,6 59,9 24,6 0,747 28,55
Bangladesh 52,04 24,4 44,1 17,2 0,558 33,85
Belarus 65,20 37,1 46 28,6 0,786 62,22
Belgium 82,63 51,7 58,5 45,7 0,881 72,14
Benin 49,11 24,2 36,5 21,2 0,476 21,54
Bolivia 62,90 27,8 48,2 24,1 0,667 32,48
Bosnia Herzegovina 64,99 32,4 51,9 21,8 0,731 45,81
Botswana 65,60 30,9 49,5 17,3 0,683 36,41
Brazil 69,97 36,3 45,2 33,6 0,744 43,93
Bulgaria 70,24 40,7 44,2 38,1 0,777 57,78
Burkina Faso 47,33 28,2 40,4 23,9 0,388 35,38
Burundi 37,33 22,4 47,3 16,2 0,389 16,92
Cambodia 51,89 28,7 55,8 22,6 0,584 41,03
Cameroon 45,51 27,5 45 27,1 0,504 33,16
Canada 86,95 56,1 75,9 48,3 0,902 70,60
Central Afr Republic 34,17 36,86 50,156 32,57 0,341 46,55
Chad 32,60 36,86 50,156 32,57 0,372 46,55
Chile 76,30 40,6 53,3 38,3 0,822 42,56
China 58,67 46,6 50,5 35,7 0,719 96,49
Colombia 67,24 35,5 51,8 30,7 0,711 37,61
Congo, Republic of 47,99 36,86 50,156 32,57 0,338 46,55
Costa Rica 77,75 37,3 40,7 36,3 0,763 47,69
Croatia 73,31 40,7 42,5 37,9 0,812 55,56
Cuba 61,07 36,86 50,156 32,57 0,815 46,55
Czech Republic 80,41 50,2 49,1 47,3 0,861 75,21
Denmark 86,55 57,5 67,8 52,4 0,9 75,56
Djibouti 45,95 36,86 50,156 32,57 0,467 46,55
Dominican Republic 63,03 32,3 50,4 36,4 0,7 34,87
Ecuador 68,15 27,5 43,7 28,1 0,711 20,51
Egypt 59,97 30 35,4 26,6 0,682 39,32
El Salvador 64,70 29,1 43,1 29,8 0,662 19,15
Estonia 81,28 51,5 55,4 53,4 0,84 62,74
Finland 86,91 60,7 61,4 53,4 0,879 88,55
France 81,11 52,2 61 45,5 0,884 71,45
Georgia 63,94 34,5 55,2 25,9 0,744 47,18
Germany 84,61 56 60,1 50,4 0,911 86,67
6
Ghana 55,96 30,3 42,5 22,9 0,573 49,06
Greece 73,43 38,9 47,9 33,3 0,853 48,21
Guatemala 61,37 30,8 49,5 27,3 0,628 34,02
Guinea 37,41 20,2 32,5 18,2 0,392 17,26
Guyana 60,06 32,5 40,4 36,7 0,638 41,01
Honduras 61,28 26,7 48,9 21,1 0,617 23,59
Hungary 73,87 44,6 42,1 42,5 0,818 67,52
Iceland 88,07 54,1 54,1 66,1 0,895 58,46
India 50,24 33,7 51,2 28,6 0,586 50,94
Indonesia 58,98 31,8 45,3 39,2 0,684 35,56
Iran 56,65 26,1 35,9 18,1 0,749 30,09
Iraq 44,84 36,86 50,156 32,57 0,642 46,55
Ireland 84,05 56,7 70,3 46,9 0,899 86,84
Israel 71,40 55,5 67,5 43,9 0,888 96,44
Italy 76,93 45,7 51 37,5 0,872 68,89
Jamaica 70,39 32,4 44,6 29,4 0,715 33,33
Japan 84,21 52,4 66,8 38,1 0,89 76,58
Jordan 61,92 36,2 39,9 34,9 0,745 46,15
Kazakhstan 59,47 32,8 44,1 23,9 0,689 38,29
Kenya 50,20 31,9 54,4 31,2 0,535 41,88
Korea, Republic of 77,18 55,3 65,4 42,2 0,689 89,06
Kuwait 70,66 35,2 47 28,1 0,814 53,68
Kyrgyzstan 57,08 27,8 53,6 14,1 0,689 31,97
Laos 52,41 36,86 50,156 32,57 0,569 46,55
Latvia 73,91 44,8 54 44,1 0,689 58,80
Lebanon 60,05 33,6 44,6 27,4 0,765 34,53
Lesotho 48,94 27 47,5 16,3 0,486 20,85
Liberia 44,02 36,86 50,156 32,57 0,412 46,55
Lithuania 73,76 41 52,1 36,2 0,834 47,69
Macedonia 68,33 36,9 54,6 32,6 0,732 44,10
Madagascar 44,28 25,5 41,8 22,5 0,498 24,44
Malawi 48,79 27,6 39,6 19,8 0,414 38,12
Malaysia 70,00 45,6 63,9 42 0,773 56,58
Mali 46,85 26,2 38,3 28,7 0,407 27,86
Mauritania 43,11 36,86 50,156 32,57 0,487 46,55
Mauritius 73,68 40,9 63 43,4 0,689 41,37
Mexico 66,41 36 46,9 32,9 0,756 41,88
Moldova 60,12 40,7 51,4 43,3 0,663 57,74
Mongolia 58,97 37,5 57,2 36,4 0,698 37,26
Montenegro 66,80 37 50,6 35,9 0,789 31,62
Morocco 58,01 32,2 42,8 27,4 0,617 39,49
Mozambique 45,23 28,5 49,9 14,3 0,393 41,88
Namibia 61,19 28,5 44,4 27,9 0,624 17,61
Nepal 51,58 23,8 43,1 20,3 0,54 15,04
Netherlands 87,37 60,6 63,6 61,7 0,689 87,86
New Zealand 88,24 54,5 68,9 47,9 0,91 73,33
Nicaragua 62,33 25,5 47,1 23,4 0,614 16,58
7
Niger 40,10 24,3 43,2 1,1 0,337 51,80
Nigeria 42,65 27,8 43,9 32,8 0,504 31,97
Norway 87,12 55,6 57,9 57,5 0,944 64,44
Pakistan 42,40 24 35,8 23,2 0,537 33,33
Panama 72,58 38,3 44,1 45 0,765 39,32
Paraguay 62,65 31,6 50,2 36,9 0,676 25,81
Peru 66,29 34,7 58,5 33,1 0,737 30,43
Philippines 65,86 29,9 44,8 26,5 0,66 42,22
Poland 77,44 40,6 48,2 36,7 0,834 49,23
Portugal 80,49 45,6 53,2 44,7 0,822 51,79
Romania 67,72 38,1 42,9 33 0,785 58,46
Russia 60,79 39,1 42,5 31,4 0,778 60,17
Rwanda 49,46 29,3 59,4 21,3 0,506 29,20
Saudi Arabia 64,38 41,6 59 45 0,836 39,83
Senegal 53,52 30,1 42,4 31 0,485 37,09
Serbia 70,61 35,9 37 29,6 0,745 53,68
Slovakia 78,93 41,9 48,6 39,4 0,83 55,21
Slovenia 81,65 47,2 51,1 42,2 0,874 65,30
South Africa 62,96 38,2 63,8 32,7 0,658 45,64
Spain 80,77 49,3 64,7 42,1 0,869 69,57
Sri Lanka 59,71 29 40,2 27,6 0,75 41,20
Sudan 38,45 12,7 38,9 1,9 0,473 0,00
Swaziland 48,87 25,3 38,1 22,5 0,898 20,51
Sweden 87,08 62,3 68,2 55,4 0,917 96,41
Switzerland 88,19 64,8 74,7 65,3 0,53 100,00
Tajikistan 56,05 23,7 61,3 5 0,607 30,58
Tanzania 46,06 25,6 36,6 20,9 0,488 25,81
Thailand 65,14 39,3 56,9 35,2 0,722 51,28
Togo 42,80 17,6 42,7 0,6 0,473 18,80
Trinidad and Tobago 69,88 31,6 48,4 27,1 0,766 33,33
Tunisia 62,96 32,9 39,9 31,1 0,721 32,14
Turkey 64,62 38,2 49,1 41,2 0,759 51,11
Uganda 47,75 31,1 43,7 27,6 0,484 37,44
Ukraine 64,91 36,3 45,1 30,6 0,734 61,20
United Arab Emirates 72,92 43,2 46,2 46,2 0,827 26,78
United Kingdom 84,56 62,4 81,4 56,6 0,892 92,31
United States 82,77 60,1 83,8 46,5 0,914 95,21
Uruguay 77,51 34,8 40 34,4 0,79 37,09
Uzbekistan 57,34 25,2 41,1 11,7 0,661 34,63
Venezuela 63,78 25,7 29,6 23,4 0,764 42,26
Yemen 40,23 19,5 40,7 15,7 0,5 19,32
Zambia 49,88 25,8 47 21,2 0,561 37,44
8
2.4 Fonte de Dados Todos os dados desta pesquisa foram obtidos em: endereço do site 3. ESTATÍSTICA DESCRITIVA / PESQUISA POR AMOSTRAGEM A pesquisa por amostragem foi feita em três amostras de 50 indivíduos ou países. Começamos com a análise das medidas e gráficos da estatística descritiva de cada variável da população total e por amostra. 3.1 Sumário População
90807060504030
20
15
10
5
0
1,0
0,9
0,8
0,7
0,6
0,5
0,4
20
15
10
5
06050403020
30
20
10
0
807060504030
30
20
10
06050403020100
30
20
10
0
100806040200
30
20
10
0
Social Progress Index
Freq
uenc
y
IDH - 2013 1. Global Innovation Index
1.4 Market Sophistication 1.6 Creative Outputs Knowledge and Technology_N
Mean 63,67StDev 14,20N 132
Social Progress Index
Mean 0,6894StDev 0,1567N 132
IDH - 2013
Mean 36,86StDev 10,91N 132
1. Global Innovation Index
Mean 50,16StDev 10,04N 132
1.4 Market Sophistication
Mean 32,57StDev 12,44N 132
1.6 Creative Outputs
Mean 4666Knowledge and Technology_N
AS VARIAVEIS REPRESENTATIVAS TRANSFORMAÇÃO PRODUTIVA E INOVAÇANormal
Todas as variáveis apresentam curva próxima da normal.
9
3.2 Sumário para Amostra 1 – Tamanho 50
0.96
0.80
0.64
0.48
0.32
10
5
0
1612840-4
20
10
0
20161284
10
5
0
8.0%
7.0%
6.0%
5.0%
4.0%
3.0%
2.0%
1.0%
16
8
0
4000
030
000
2000
010
0000
-1000
0
10
5
0
88807264564840
10
5
0
129630
10
5
0
HDI value_1
Freq
uenc
y
Carbon dioxide emissions_1 Expected Years of schooling_1
Expenditure on education_1 GDP per capita_1 Life expectancy at birth_1
Mean years of schooling_1
Mean 0.6090StDev 0.1826
N 53
HDI value_1
Mean 3.847
StDev 4.443N 53
Carbon dioxide emissions_1
Mean 11.97StDev 3.430
N 53
Expected Years of schooling_1
Mean 0.03808
StDev 0.01492N 53
Expenditure on education_1
Mean 11615StDev 10348N 53
GDP per capita_1
Mean 66.35StDev 10.97
N 53
Life expectancy at birth_1
Mean 7.158
StDev 3.135N 53
Mean years of schooling_1
Histogram of HDI value_1; Carbon dioxi; Expected Yea; ...Normal
Para a primeira amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável Mean years of schooling, que nessa amostra apresenta curva próxima à curva normal, ao contrário do observado na população. 3.3 Sumário para Amostra 2 – Tamanho 50
1.05
0.90
0.75
0.60
0.45
0.30
8
4
01612840-4
20
10
01816141210864
5.0
2.5
0.0
8.0%
6.0%
4.0%
2.0%
0.0%
10
5
0
4000
032
000
2400
016
000
80000
-800
0
16
8
0
888072645648
10
5
0
129630
10
5
0
HDI value_2
Freq
uenc
y
Carbon dioxide emissions_2 Expected Years of schooling_2
Expenditure on education_2 GDP per capita_2 Life expectancy at birth_2
Mean years of schooling_2
Mean 0.6225StDev 0.1814
N 54
HDI value_2
Mean 3.941
StDev 4.163N 54
Carbon dioxide emissions_2
Mean 11.88StDev 3.235
N 54
Expected Years of schooling_2
Mean 0.04020
StDev 0.01766N 54
Expenditure on education_2
Mean 12132StDev 11001N 54
GDP per capita_2
Mean 67.90StDev 10.60
N 54
Life expectancy at birth_2
Mean 7.326
StDev 3.063N 54
Mean years of schooling_2
Histogram of HDI value_2; Carbon dioxi; Expected Yea; ...Normal
10
Para a segunda amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável HDI value, que nessa amostra não apresenta curva próxima à curva normal, ao contrário do observado na população. 3.4 Sumário para Amostra 3 – Tamanho 50
1.00.80.60.40.2
16
8
0
1612840-4
20
10
0
1816141210864
5.0
2.5
0.0
7.0%
6.0%
5.0%
4.0%
3.0%
2.0%
1.0%
8
4
0
4000
030
000
2000
01000
00
-100
00
10
5
0888072645648
10
5
0
1412108642
8
4
0
HDI value_3
Freq
uenc
y
Carbon dioxide emissions_3 Expected Years of schooling_3
Expenditure on education_3 GDP per capita_3 Life expectancy at birth_3
Mean years of schooling_3
Mean 0.6085StDev 0.1792
N 51
HDI value_3
Mean 3.849
StDev 4.057N 51
Carbon dioxide emissions_3
Mean 11.71StDev 3.203
N 51
Expected Years of schooling_3
Mean 0.04055
StDev 0.01336N 51
Expenditure on education_3
Mean 10748StDev 10378N 51
GDP per capita_3
Mean 66.35StDev 10.78
N 51
Life expectancy at birth_3
Mean 7.363
StDev 2.860N 51
Mean years of schooling_3
Histogram of HDI value_3; Carbon dioxi; Expected Yea; ...Normal
Para a terceira amostra de 50 indivíduos observamos um resultado similar às curvas da população, isso demonstra que a amostra representa bem a população. Com exceção da variável HDI value (mesmo comportamento da amostra 2), que nessa amostra não apresenta curva próxima à curva normal, ao contrário do observado na população. 4. COMPARAÇÃO DE MÉDIA, ANÁLISE DE VARIÂNCIA E INTERVALO DE CONFIANÇA. Segue abaixo os resultados da One-Way ANOVA para cada variável, por amostra. A comparação é sempre entre os três conglomerados de cada amostra. 4.1 Amostra 1 – Tamanho 50
Cluster 1 Cluster 2 Cluster 3
Cape Verde El Salvador Cyprus
Guyana Malawi Czech Republic
Nicaragua Kazakhstan Portugal
Kenya Maldives Estonia
Mauritania Uruguay Hungary
Nigeria Niger Equatorial Guinea
11
Solomon Islands Mozambique France
Nepal Malaysia Belgium
India Mauritius Finland
Zambia Panama Italy
Senegal Botswana Australia
Guinea Sierra Leone
Burkina Faso Tunisia
Kyrgyzstan Lithuania
Cameroon Swaziland
Viet Nam Ukraine
Lao People's Democratic Republic Romania
Latvia
Madagascar
The former Yugoslav Republic of Macedonia
Peru
Central African
Republic
Brazil
Russian Federation
South Africa
China
17 26 11
One-way ANOVA: HDI value_1 versus Grupo1 Source DF SS MS F P Grupo1 2 0.7928 0.3964 21.42 0.000 Error 51 0.9441 0.0185 Total 53 1.7369 S = 0.1361 R-Sq = 45.65% R-Sq(adj) = 43.51% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ 1 17 0.4738 0.0873 (----*---) 2 26 0.6108 0.1696 (---*--) 3 11 0.8184 0.1016 (-----*----) ---+---------+---------+---------+------ 0.45 0.60 0.75 0.90 Pooled StDev = 0.1361
One-way ANOVA: Carbon dioxide emissions_1 versus Grupo1 Source DF SS MS F P Grupo1 2 590.48 295.24 34.50 0.000 Error 51 436.39 8.56 Total 53 1026.87
12
S = 2.925 R-Sq = 57.50% R-Sq(adj) = 55.84% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 17 0.600 0.532 (---*---) 2 26 3.427 3.409 (--*--) 3 11 9.927 3.760 (----*----) --+---------+---------+---------+------- 0.0 3.5 7.0 10.5 Pooled StDev = 2.925
One-way ANOVA: Expected Years of schooling_1 versus Grupo1 Source DF SS MS F P Grupo1 2 242.49 121.24 16.74 0.000 Error 51 369.44 7.24 Total 53 611.93 S = 2.691 R-Sq = 39.63% R-Sq(adj) = 37.26% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 17 9.418 1.764 (-----*----) 2 26 12.162 3.054 (----*---) 3 11 15.418 2.941 (------*-----) --------+---------+---------+---------+- 10.0 12.5 15.0 17.5 Pooled StDev = 2.691
One-way ANOVA: Expenditure on education_1 versus Grupo1 Source DF SS MS F P Grupo1 2 0.000541 0.000270 1.23 0.302 Error 51 0.011254 0.000221 Total 53 0.011795 S = 0.01485 R-Sq = 4.58% R-Sq(adj) = 0.84% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- 1 17 0.03488 0.01802 (----------*---------) 2 26 0.03719 0.01311 (-------*-------) 3 11 0.04373 0.01327 (-----------*------------) -+---------+---------+---------+-------- 0.0280 0.0350 0.0420 0.0490 Pooled StDev = 0.01485
One-way ANOVA: GDP per capita_1 versus Grupo1 Source DF SS MS F P Grupo1 2 4813214923 2406607461 158.53 0.000 Error 51 774219116 15180767 Total 53 5587434039
13
S = 3896 R-Sq = 86.14% R-Sq(adj) = 85.60% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 17 2240 776 (--*-) 2 26 10278 3144 (-*-) 3 11 28864 7193 (--*--) +---------+---------+---------+--------- 0 8000 16000 24000 Pooled StDev = 3896
One-way ANOVA: Life expectancy at birth_1 versus Grupo1 Source DF SS MS F P Grupo1 2 1475.8 737.9 7.78 0.001 Error 51 4835.0 94.8 Total 53 6310.8 S = 9.737 R-Sq = 23.39% R-Sq(adj) = 20.38% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 17 61.812 8.794 (-----*------) 2 26 65.358 10.597 (----*-----) 3 11 76.355 8.890 (-------*-------) --------+---------+---------+---------+- 63.0 70.0 77.0 84.0 Pooled StDev = 9.737
One-way ANOVA: Mean years of schooling_1 versus Grupo1 Source DF SS MS F P Grupo1 2 188.16 94.08 14.86 0.000 Error 51 322.94 6.33 Total 53 511.10 S = 2.516 R-Sq = 36.81% R-Sq(adj) = 34.34% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 17 4.924 2.149 (----*----) 2 26 7.342 2.881 (---*---) 3 11 10.209 2.039 (-----*-----) -----+---------+---------+---------+---- 5.0 7.5 10.0 12.5 Pooled StDev = 2.516
Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,
podemos considerar que a média populacional das variáveis dos conglomerados são diferentes, com exceção da variável Expenditure on Education. A variável Life expetancy
14
at birth, apesar de ter o p-value menor ou igual a 5%, não possui médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.
- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per
Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.
0.8
0.6
0.4
321
10
5
0
15.0
12.5
10.0
5.0%
4.0%
3.0%
30000
15000
0321
80
70
60
321
12
8
4
HDI v alue_1
Grupo1
C arbon dioxide emissions_1 Expected Years of schooling_1
Expenditure on education_1 GDP per capita_1 Life expectancy at birth_1
Mean y ears of schooling_1
Boxplot of HDI value_1; Carbon dioxi; Expected Yea; Expenditure ; ...
Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis Expenditure on education e Life expetancy at birth, conforme já explicado anteriormente.
15
Expe
nditu
re on
educ
ation
_1
GDP p
er ca
pita_
1
Carbo
n diox
ide em
ission
s_1
Life e
xpec
tancy at
birth
_1
Mean y
ears
of sc
hool i
ng_1
Expe
cted Y
ears
of sc
hooli
ng_1
HDI v
alue_
1
75.43
83.62
91.81
100.00
Variables
Sim
ilari
tyDendrogram
Single Linkage; Correlation Coefficient Distance
Pelo dendrograma podemos observar que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas, as variáveis Carbon dioxide emissions e GDP per capita também estão correlacionadas, e a variável Expenditure on education possui baixa correlação com as outras variáveis. 4.2 Amostra 2 – Tamanho 50
Cluster 1 Cluster 2 Cluster 3
Senegal Belgium Cyprus
Kyrgyzstan Japan Saudi Arabia
Sierra Leone Austria Greece
Armenia Ireland Korea (Republic of)
Nepal Finland Czech Republic
Ecuador Bahamas
Uruguay Italy
Moldova (Republic of)
Nicaragua
Chad
Haiti
Romania
Morocco
Mauritania
Nigeria
Guyana
Mauritius
Côte d'Ivoire
Madagascar
16
Lao People's Democratic Republic
Honduras
Egypt
Mozambique
Bulgaria
India
Cameroon
Tunisia
Malawi
Niger
Guatemala
Jamaica
Dominican Republic
Swaziland
Hungary
Ukraine
Namibia
Central African Republic
Croatia
Brazil
Russian Federation
China
South Africa
42 5 7
One-way ANOVA: HDI value_2 versus Cluster2 Source DF SS MS F P Cluster2 2 0.7711 0.3855 20.20 0.000 Error 51 0.9736 0.0191 Total 53 1.7447 S = 0.1382 R-Sq = 44.20% R-Sq(adj) = 42.01% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- 1 42 0.5590 0.1531 (--*--) 2 5 0.8736 0.0168 (-------*--------) 3 7 0.8247 0.0446 (------*------) ------+---------+---------+---------+--- 0.60 0.75 0.90 1.05 Pooled StDev = 0.1382
One-way ANOVA: Carbon dioxide emissions_2 versus Cluster2 Source DF SS MS F P Cluster2 2 592.36 296.18 46.32 0.000 Error 51 326.09 6.39
17
Total 53 918.45 S = 2.529 R-Sq = 64.50% R-Sq(adj) = 63.10% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 42 2.171 2.537 (-*--) 2 5 10.420 1.469 (-------*------) 3 7 9.929 2.986 (-----*-----) -----+---------+---------+---------+---- 3.0 6.0 9.0 12.0 Pooled StDev = 2.529
One-way ANOVA: Expected Years of schooling_2 versus Cluster2 Source DF SS MS F P Cluster2 2 195.70 97.85 13.90 0.000 Error 51 359.04 7.04 Total 53 554.74 S = 2.653 R-Sq = 35.28% R-Sq(adj) = 32.74% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 42 10.879 2.839 (---*--) 2 5 16.200 1.269 (---------*--------) 3 7 14.814 1.925 (-------*-------) +---------+---------+---------+--------- 10.0 12.5 15.0 17.5 Pooled StDev = 2.653
One-way ANOVA: Expenditure on education_2 versus Cluster2 Source DF SS MS F P Cluster2 2 0.000467 0.000234 0.74 0.481 Error 51 0.016061 0.000315 Total 53 0.016529 S = 0.01775 R-Sq = 2.83% R-Sq(adj) = 0.00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 42 0.03933 0.01906 (----*-----) 2 5 0.04940 0.00344 (---------------*---------------) 3 7 0.03886 0.01362 (-------------*------------) -----+---------+---------+---------+---- 0.030 0.040 0.050 0.060 Pooled StDev = 0.01775
One-way ANOVA: GDP per capita_2 versus Cluster2 Source DF SS MS F P Cluster2 2 5488600180 2744300090 151.21 0.000 Error 51 925600560 18149031 Total 53 6414200740
18
S = 4260 R-Sq = 85.57% R-Sq(adj) = 85.00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- 1 42 6857 4607 (*) 2 5 35772 2274 (---*---) 3 7 26895 2405 (--*--) ----+---------+---------+---------+----- 10000 20000 30000 40000 Pooled StDev = 4260
One-way ANOVA: Life expectancy at birth_2 versus Cluster2 Source DF SS MS F P Cluster2 2 1979.0 989.5 12.71 0.000 Error 51 3971.3 77.9 Total 53 5950.3 S = 8.824 R-Sq = 33.26% R-Sq(adj) = 30.64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 42 64.681 9.761 (---*---) 2 5 80.860 1.313 (-----------*----------) 3 7 77.929 3.107 (--------*---------) --+---------+---------+---------+------- 63.0 70.0 77.0 84.0 Pooled StDev = 8.824
One-way ANOVA: Mean years of schooling_2 versus Cluster2 Source DF SS MS F P Cluster2 2 161.55 80.78 12.27 0.000 Error 51 335.81 6.58 Total 53 497.36 S = 2.566 R-Sq = 32.48% R-Sq(adj) = 29.83% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- 1 42 6.402 2.795 (---*---) 2 5 10.760 0.777 (-----------*----------) 3 7 10.414 1.475 (---------*---------) --+---------+---------+---------+------- 6.0 8.0 10.0 12.0 Pooled StDev = 2.566
Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,
podemos considerar que a média populacional das variáveis dos conglomerados são diferentes, com exceção da variável Expenditure on Education. As variáveis HDI value,
19
Cabon dioxide emissions, Expected Years of schooling, Life expetancy at birth e Mean years of schooling, apesar de ter o p-value menor ou igual a 5%, não possuem médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.
- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per
Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.
0.90
0.75
0.60
321
10
5
0
18
15
12
5.0%
4.0%
3.0%
40000
20000
0321
80
70
60
321
10.0
7.5
5.0
HDI v alue_2
Cluster2
C arbon dioxide emissions_2 Expected Years of schooling_2
Expenditure on education_2 GDP per capita_2 Life expectancy at birth_2
Mean y ears of schooling_2
Boxplot of HDI value_2; Carbon dioxi; Expected Yea; Expenditure ; ...
Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, conforme já explicado anteriormente.
20
Expe
nditu
re on
educ
ation
_2
GDP p
er ca
pita_
2
Carbo
n diox
ide em
ission
s_2
Life e
xpec
tancy at
birth
_2
Mean y
ears
of sc
hool i
ng_2
Expe
cted Y
ears
of sc
hooli
ng_2
HDI v
alue_
2
70.02
80.01
90.01
100.00
Variables
Sim
ilari
tyDendrogram
Single Linkage; Correlation Coefficient Distance
Pelo dendrograma podemos observar um comportamento similar à amostra 1, em que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas, as variáveis Carbon dioxide emissions e GDP per capita também estão correlacionadas, e a variável Expenditure on education possui baixa correlação com as outras variáveis. 4.3 Amostra 3 – Tamanho 50
Cluster 1 Cluster 2 Cluster 3
Belgium Cameroon Bahamas
Iceland Kazakhstan Saudi Arabia
Japan Zimbabwe Korea (Republic of)
Denmark China
Netherlands Lithuania
Madagascar
Botswana
Philippines
Turkmenistan
Belize
Egypt
Ukraine
Burkina Faso
Nigeria
Morocco
21
The former Yugoslav Republic of Macedonia
Sri Lanka
Rwanda
Jamaica
Ghana
Zambia
Mauritius
Syrian Arab Republic
Senegal
Fiji
Angola
Central African
Republic
Mexico
Tunisia
Belarus
Russian Federation
Niger
Albania
Thailand
Panama
Gambia
Myanmar
India
Brazil
Congo
Guatemala
Mauritania
South Africa
5 43 3
One-way ANOVA: HDI value_3 versus Grupo3 Source DF SS MS F P Grupo3 2 0.5563 0.2781 12.72 0.000 Error 48 1.0493 0.0219 Total 50 1.6056 S = 0.1479 R-Sq = 34.65% R-Sq(adj) = 31.92% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 0.8752 0.0110 (--------*--------) 2 43 0.5639 0.1574 (--*--) 3 3 0.8043 0.0649 (-----------*----------) -----+---------+---------+---------+---- 0.60 0.75 0.90 1.05
22
Pooled StDev = 0.1479
One-way ANOVA: Carbon dioxide emissions_3 versus Grupo3 Source DF SS MS F P Grupo3 2 364.32 182.16 19.07 0.000 Error 48 458.49 9.55 Total 50 822.81 S = 3.091 R-Sq = 44.28% R-Sq(adj) = 41.96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 9.600 1.241 (-------*-------) 2 43 2.700 3.117 (--*-) 3 3 10.733 4.706 (----------*---------) -----+---------+---------+---------+---- 3.5 7.0 10.5 14.0 Pooled StDev = 3.091
One-way ANOVA: Expected Years of schooling_3 versus Grupo3 Source DF SS MS F P Grupo3 2 155.28 77.64 10.42 0.000 Error 48 357.58 7.45 Total 50 512.87 S = 2.729 R-Sq = 30.28% R-Sq(adj) = 27.37% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ 1 5 16.560 1.161 (---------*---------) 2 43 10.988 2.838 (--*--) 3 3 13.967 2.631 (------------*------------) ---------+---------+---------+---------+ 12.5 15.0 17.5 20.0 Pooled StDev = 2.729
One-way ANOVA: Expenditure on education_3 versus Grupo3 Source DF SS MS F P Grupo3 2 0.001141 0.000570 3.52 0.038 Error 48 0.007784 0.000162 Total 50 0.008925 S = 0.01273 R-Sq = 12.78% R-Sq(adj) = 9.15% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- 1 5 0.05380 0.00823 (-----------*----------) 2 43 0.03860 0.01283 (---*---) 3 3 0.04633 0.01739 (-------------*--------------) --------+---------+---------+---------+- 0.040 0.050 0.060 0.070
23
Pooled StDev = 0.01273
One-way ANOVA: GDP per capita_3 versus Grupo3 Source DF SS MS F P Grupo3 2 4544867404 2272433702 129.83 0.000 Error 48 840167093 17503481 Total 50 5385034497 S = 4184 R-Sq = 84.40% R-Sq(adj) = 83.75% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 5 35709 3101 (---*--) 2 43 6749 4332 (-*) 3 3 26474 2609 (---*----) -----+---------+---------+---------+---- 10000 20000 30000 40000 Pooled StDev = 4184
One-way ANOVA: Life expectancy at birth_3 versus Grupo3 Source DF SS MS F P Grupo3 2 1570.6 785.3 8.88 0.001 Error 48 4242.6 88.4 Total 50 5813.2 S = 9.401 R-Sq = 27.02% R-Sq(adj) = 23.98% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- 1 5 80.920 1.753 (---------*----------) 2 43 63.991 10.007 (---*---) 3 3 75.833 3.479 (-------------*------------) ----+---------+---------+---------+----- 64.0 72.0 80.0 88.0 Pooled StDev = 9.401
One-way ANOVA: Mean years of schooling_3 versus Grupo3 Source DF SS MS F P Grupo3 2 97.90 48.95 7.55 0.001 Error 48 311.08 6.48 Total 50 408.98 S = 2.546 R-Sq = 23.94% R-Sq(adj) = 20.77% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- 1 5 10.800 0.524 (----------*----------) 2 43 6.767 2.679 (---*---) 3 3 10.167 2.065 (--------------*--------------) +---------+---------+---------+--------- 6.0 8.0 10.0 12.0
24
Pooled StDev = 2.546
Os valores P-value das análises de variância acima nos confirmam que: - Tendo como parâmetro o p-value menor ou igual a 5% para a rejeição da hipótese nula,
podemos considerar que todas as médias populacionais das variáveis dos conglomerados são diferentes. As variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, apesar de terem o p-value menor ou igual a 5%, não possuem médias entre os conglomerados tão diferentes, conforme pode ser observado visualmente.
- Pela análise do valor F, percebemos que a maior diferença aparece na variável GDP per
Capita. Veremos abaixo o Box-Plot que nos permite visualizar mais claramente estas grandes diferenças entre os três conglomerados.
0.90
0.75
0.60
321
16
8
0
18
15
12
6.0%
5.0%
4.0%
40000
20000
0321
80
70
60
321
10.0
7.5
5.0
HDI v alue_3
Grupo3
C arbon dioxide emissions_3 Expected Years of schooling_3
Expenditure on education_3 GDP per capita_3 Life expectancy at birth_3
Mean y ears of schooling_3
Boxplot of HDI value_3; Carbon dioxi; Expected Yea; Expenditure ; ...
Fica bastante notória as diferenças que separam os três conglomerados nas 7 variáveis analisadas, com exceção das variáveis HDI value, Cabon dioxide emissions, Expected Years of schooling, Expenditure on education, Life expetancy at birth e Mean years of schooling, conforme já explicado anteriormente.
25
Expe
nditu
re on
educ
ation
_3
Carbo
n diox
ide em
ission
s_3
GDP p
er ca
pita_
3
Mean y
ears
of scho
oling
_3
Life e
xpec
tancy
at bi
rth_3
Expe
cted Y
ears
of sc
hooli
ng_3
HDI v
alue_
3
72.88
81.92
90.96
100.00
Variables
Sim
ilari
tyDendrogram
Single Linkage; Correlation Coefficient Distance
Pelo dendrograma podemos observar um comportamento um pouco diferente das amostras anteriores, em que as variáveis HDI value, Expected years of schooling, Mean years of schooling e Life expectancy at birth estão correlacionadas. Já as variáveis GDP per capita, Carbon dioxide emissions e Expenditure on education possuem baixa correlação com as outras variáveis. 5. ANÁLISE DISCRIMINANTE A variável dependente de nossa análise será o conglomerado e para tentar explicar em qual conglomerado um determinado país cai, utilizamos as 7 variáveis de indicadores relacionados ao desenvolvimento humano dos países do mundo. 5.1 Amostra 1 – Tamanho 50 Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... Linear Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1; Expected Years of schooling_1; Expenditure on education_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group
26
Put into Group 1 2 3 1 17 2 0 2 0 24 0 3 0 0 11 Total N 17 26 11 N correct 17 24 11 Proportion 1.000 0.923 1.000 N = 54 N Correct = 52 Proportion Correct = 0.963 Squared Distance Between Groups 1 2 3 1 0.0000 4.8164 50.4604 2 4.8164 0.0000 26.4172 3 50.4604 26.4172 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -33.14 -34.74 -66.75 HDI value_1 -160.32 -157.19 -182.59 Carbon dioxide emissions_1 -0.02 -0.11 0.18 Expected Years of schooling_1 1.04 1.10 -0.05 Expenditure on education_1 158.43 150.36 223.07 GDP per capita_1 0.00 0.00 0.00 Life expectancy at birth_1 1.79 1.71 2.04 Mean years of schooling_1 3.10 3.37 4.53 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 7** 2 1 1 5.375 0.766 2 7.743 0.234 3 48.747 0.000 10** 2 1 1 10.83 0.768 2 13.22 0.232 3 39.01 0.000
Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... HDI value_1 is highly correlated with other predictors in group 1. HDI value_1 is highly correlated with other predictors in group 3. Expected Years of schooling_1 is highly correlated with other predictors in group 3. Life expectancy at birth_1 is highly correlated with other predictors in group 3. Mean years of schooling_1 is highly correlated with other predictors in group 3. Quadratic Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1;
27
Expected Years of schooling_1; Expenditure on education_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 25 0 3 0 1 11 Total N 17 26 11 N correct 17 25 11 Proportion 1.000 0.962 1.000 N = 54 N Correct = 53 Proportion Correct = 0.981 From Generalized Squared Distance to Group Group 1 2 3 1 -2.7 15.1 953.3 2 1209.1 8.0 206.8 3 14997.8 53.4 3.0 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 12** 2 3 1 2417.20 0.000 2 16.66 0.268 3 14.65 0.732
A utilização da função quadrática ajustou melhor os dados, uma vez que aumentou a proporção de acerto de 96,3% para 98,1%. Veremos o que ocorre se excluirmos as variáveis com alto valor de p, utilizando a função quadrática: Discriminant Analysis: Grupo1 versus HDI value_1; Carbon dioxide e; ... HDI value_1 is highly correlated with other predictors in group 1. HDI value_1 is highly correlated with other predictors in group 3. Life expectancy at birth_1 is highly correlated with other predictors in group 3. Quadratic Method for Response: Grupo1 Predictors: HDI value_1; Carbon dioxide emissions_1; Expected Years of schooling_1; GDP per capita_1; Life expectancy at birth_1; Mean years of schooling_1
28
Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 25 0 3 0 1 11 Total N 17 26 11 N correct 17 25 11 Proportion 1.000 0.962 1.000 N = 54 N Correct = 53 Proportion Correct = 0.981 From Generalized Squared Distance to Group Group 1 2 3 1 5.9 24.2 619.6 2 1126.5 17.1 156.7 3 13811.7 60.9 13.3 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 12** 2 3 1 2184.12 0.000 2 23.79 0.199 3 21.00 0.801
Não houve mudança no poder explicativo e o modelo fica mais simples, com seis variáveis ao invés de sete. Veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo ainda mais simples e intuitivo: Discriminant Analysis: Grupo1 versus GDP per capita_1 Quadratic Method for Response: Grupo1 Predictors: GDP per capita_1 Group 1 2 3 Count 17 26 11 Summary of classification True Group Put into Group 1 2 3 1 17 0 0 2 0 26 0 3 0 0 11 Total N 17 26 11 N correct 17 26 11 Proportion 1.000 1.000 1.000
29
N = 54 N Correct = 54 Proportion Correct = 1.000 From Generalized Squared Distance to Group Group 1 2 3 1 13.31 22.64 31.46 2 120.54 16.11 24.44 3 1189.85 51.05 17.76
O poder explicativo aumentou, chegando a uma proporção de acerto de 100% e a análise fica ainda mais simples com apenas uma variável explicativa. 5.2 Amostra 2 – Tamanho 50 Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... Linear Method for Response: Cluster2 Predictors: HDI value_2; Carbon dioxide emissions_2; Expected Years of schooling_2; Expenditure on education_2; GDP per capita_2; Life expectancy at birth_2; Mean years of schooling_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 42 0 0 2 0 5 0 3 0 0 7 Total N 42 5 7 N correct 42 5 7 Proportion 1.000 1.000 1.000 N = 54 N Correct = 54 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 60.8599 32.2712 2 60.8599 0.0000 7.3591 3 32.2712 7.3591 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -47.89 -95.67 -73.19 HDI value_2 -231.32 -279.91 -251.80 Carbon dioxide emissions_2 0.60 1.43 1.69 Expected Years of schooling_2 4.30 2.39 2.21 Expenditure on education_2 141.77 197.23 124.32 GDP per capita_2 0.00 0.00 0.00 Life expectancy at birth_2 2.39 3.01 2.80 Mean years of schooling_2 2.10 3.08 2.96
30
Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... * ERROR * Mean years of schooling_2 is highly correlated with other predictors in group 2. * ERROR * Calculations for discriminant analysis cannot be done.
Não foi possível calcular utilizando a função quadrática. Porém a utilização da função linear já ajustou os dados em uma proporção de acerto de 100%. Veremos o que ocorre se excluirmos as variáveis com alto valor de p, utilizando a função linear: Discriminant Analysis: Cluster2 versus HDI value_2; Carbon dioxi; ... Linear Method for Response: Cluster2 Predictors: HDI value_2; Carbon dioxide emissions_2; Expected Years of schooling_2; GDP per capita_2; Life expectancy at birth_2; Mean years of schooling_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 42 0 0 2 0 5 0 3 0 0 7 Total N 42 5 7 N correct 42 5 7 Proportion 1.000 1.000 1.000 N = 54 N Correct = 54 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 60.1135 32.1973 2 60.1135 0.0000 6.0691 3 32.1973 6.0691 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -45.45 -90.95 -71.32 HDI value_2 -222.60 -267.77 -244.14 Carbon dioxide emissions_2 0.75 1.64 1.83 Expected Years of schooling_2 4.12 2.13 2.05 GDP per capita_2 0.00 0.00 0.00 Life expectancy at birth_2 2.34 2.93 2.76 Mean years of schooling_2 2.39 3.48 3.22
31
Não houve mudança no poder explicativo e o modelo fica mais simples, com seis variáveis ao invés de sete. Veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo ainda mais simples e intuitivo: Discriminant Analysis: Cluster2 versus GDP per capita_2 Linear Method for Response: Cluster2 Predictors: GDP per capita_2 Group 1 2 3 Count 42 5 7 Summary of classification True Group Put into Group 1 2 3 1 40 0 0 2 0 5 0 3 2 0 7 Total N 42 5 7 N correct 40 5 7 Proportion 0.952 1.000 1.000 N = 54 N Correct = 52 Proportion Correct = 0.963 Squared Distance Between Groups 1 2 3 1 0.0000 46.0677 22.1238 2 46.0677 0.0000 4.3419 3 22.1238 4.3419 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -1.295 -35.254 -19.928 GDP per capita_2 0.000 0.002 0.001 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 45** 1 3 1 8.106 0.089 2 15.525 0.002 3 3.447 0.909 50** 1 3 1 5.646 0.471 2 19.458 0.000 3 5.417 0.528
Há uma redução muito pequena no poder explicativo, reduzindo a proporção de acerto de 100% para 96,3% e a análise fica ainda mais simples com apenas uma variável explicativa.
32
5.3 Amostra 3 – Tamanho 50 Discriminant Analysis: Grupo3 versus HDI value_3; Carbon dioxide e; ... Linear Method for Response: Grupo3 Predictors: HDI value_3; Carbon dioxide emissions_3; Expected Years of schooling_3; Expenditure on education_3; GDP per capita_3; Life expectancy at birth_3; Mean years of schooling_3 Group 1 2 3 Count 5 43 3 Summary of classification True Group Put into Group 1 2 3 1 5 0 0 2 0 43 0 3 0 0 3 Total N 5 43 3 N correct 5 43 3 Proportion 1.000 1.000 1.000 N = 51 N Correct = 51 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 66.4936 11.4588 2 66.4936 0.0000 32.3375 3 11.4588 32.3375 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -81.07 -34.74 -57.02 HDI value_3 -143.48 -86.34 -119.78 Carbon dioxide emissions_3 -0.05 0.06 0.70 Expected Years of schooling_3 0.84 1.23 -0.06 Expenditure on education_3 190.57 150.34 150.83 GDP per capita_3 0.00 0.00 0.00 Life expectancy at birth_3 1.93 1.47 1.83 Mean years of schooling_3 0.68 0.60 0.98
Discriminant Analysis: Grupo3 versus HDI value_3; Carbon dioxide e; ... * ERROR * Mean years of schooling_3 is highly correlated with other predictors in group 1. * ERROR * Calculations for discriminant analysis cannot be done.
33
Não foi possível calcular utilizando a função quadrática. Porém a utilização da função linear já ajustou os dados em uma proporção de acerto de 100%. Com não foram encontradas variáveis com alto valor de p, veremos o que acontece se considerarmos apenas a variável GDP per capita, variável com maior diferença entre os conglomerados. O objetivo é termos um modelo mais simples e intuitivo: Discriminant Analysis: Grupo3 versus GDP per capita_3 Linear Method for Response: Grupo3 Predictors: GDP per capita_3 Group 1 2 3 Count 5 43 3 Summary of classification True Group Put into Group 1 2 3 1 5 0 0 2 0 43 0 3 0 0 3 Total N 5 43 3 N correct 5 43 3 Proportion 1.000 1.000 1.000 N = 51 N Correct = 51 Proportion Correct = 1.000 Squared Distance Between Groups 1 2 3 1 0.0000 47.9157 4.8728 2 47.9157 0.0000 22.2281 3 4.8728 22.2281 0.0000 Linear Discriminant Function for Groups 1 2 3 Constant -36.425 -1.301 -20.020 GDP per capita_3 0.002 0.000 0.002
O poder explicativo se manteve em 100% de proporção de acerto e a análise fica muito mais simples com apenas uma variável explicativa. 6. CONSIDERAÇÕES FINAIS De acordo com todas as análises acima, podemos constatar que a função linear se mostrou mais adequada em duas das três amostras, porém vale constatar que nessas duas amostras, não foi possível calcular utilizando a função quadrática. Também foi possível constatar que utilizando-se somente a variável GDP per Capita para divisão dos países das amostras em conglomerados chegou-se a índices de proporção de
34
acerto de 100% em duas amostras e 96,3% na outra amostra. Portanto podemos concluir que entre as variáveis de indicadores de desenvolvimento humano, a variável GDP per Capita é a mais significativa e somente a sua utilização já é suficiente para dividir os países das amostras em conglomerados. As demais variáveis muito pouco ou nada acrescentam. Assim, fica um alerta para os países do BRICS, incluindo o Brasil, que um importante caminho para a melhoria do desenvolvimento humano parece passar necessariamente pela melhoria no índice de GDP per Capita.