panorama de pesquisas em análise de dados na ufpb
DESCRIPTION
Uma panorama sobre as pesquisas que estamos desenvolvendo na área de Análise de Dados na UFPBTRANSCRIPT
Um Panorama das Pesquisas em Análise de Dados em Andamento na
UFPB
Alexandre Duarte
alexandre[.@]ci.ufpb.br
CiênciaFinanciamento de Pesquisa e Mérito Científico
PolíticaEleições, Eleitores e Eleitos
Financiamento de Pesquisa e
Mérito Científico
Financiamento de Pesquisa e Mérito Científico: Edital Universal
Financiamento de Pesquisa e Mérito Científico: Edital Universal
Fato #1: 10 dos 51 Comitês concentram 40% dos projetos aprovados
Fato #2: O Comitê da Computação foi o 9º mais contemplado em 2014 (3,2%)
Financiamento de Pesquisa e Mérito Científico: Edital Universal
Financiamento de Pesquisa e Mérito Científico: Edital Universal
Fato #3: 20 instituições concentram 52.7% de todos os projetos universais aprovados em 2014
Fato #4: 20 instituições concentram 72.7% de todos os projetos universais aprovados em 2014 na Computação
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
0%
1%
2%
3%
4%
5%
6%
7%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Área
Distribuição das Bolsas de Produtividade em Pesquisa por Área
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
0%
1%
2%
3%
4%
5%
6%
7%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Área
Distribuição das Bolsas de Produtividade em Pesquisa por Área
35%
Fato #5: 10 (das 105) áreas concentram 35% das bolsas de produtividade em pesquisa do CNPq
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
14.00%
16.00%
18.00%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Instituição
Distribuição das Bolsas de Produtividade em Pesquisa por Instituição
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
14.00%
16.00%
18.00%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Instituição
Distribuição das Bolsas de Produtividade em Pesquisa por Instituição
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
Fato #6: 10 (das 334) instituições contempladas concentram 52% dos bolsistas de produtividade em pesquisa do CNPq
52%
0.0%
2.0%
4.0%
6.0%
8.0%
10.0%
12.0%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Instituição
Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
0.0%
2.0%
4.0%
6.0%
8.0%
10.0%
12.0%
Pe
rce
ntu
al d
e B
ols
as e
m A
nd
ame
nto
Instituição
Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição
Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade
Fato #7: 7 (das 63) instituições contempladas concentram 50% dos bolsistas de produtividade em pesquisa do CNPq na área da Computação
50%
COMO EXPLICAR QUANTITATIVAMENTE TAIS CONCENTRAÇÕES?
Motivação
“Diz-me com quem andas e dir-te-ei quem és. Saiba eu com que te ocupas e saberei também no que te poderás tornar.”
Goethe
Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração
Profundidade 1: 70 nós e 137 arestas
Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração
Profundidade 2: 982 nós e 2821 arestas
Financiamento de Pesquisa e Mérito Científico: Redes de Colaboração
Profundidade 2: 7784 nós e 25797 arestas
Financiamento de Pesquisa e Mérito Científico: Projetos em Andamento
• Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais (Ayslânya Wanderley)
• Contando a História da Pós-Graduação no Brasil (Luiz Carlos)
• Quem sou eu no Mundo Acadêmico: Um Sistema para Visualização Comparativa de Produção Científica (José Leandro)
É POSSÍVEL PREVER O DESEMPENHO DE UM PESQUISADOR POR MEIO DE SUA INTERAÇÃO EM UMA REDE DE COLABORAÇÃO CIENTÍFICA?
Predição do Sucesso Científico de Pesquisadores Através de Métricas deAnálise de Redes Sociais
Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Metodologia
Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Modelo Preditivo
Matriz de Confusão a
Observado
Status_Pesquisador = 0 Status_Pesquisador = 1
Predito
Status_Pesquisador = 0 193 (TN) 58 (FN)
Status_Pesquisador = 1 74 (FP) 209 (TP)
Desempenho %
Sensibilidade 78,3
Especificidade 72,3
VPP 73,9
VPN 76,9
Acurácia 75,3
Estimativa Desvio Padrão Teste de Wald P-Valor Limite Inferior Limite Superior
Intercepto 2,944618 0,763316674 3,857662275 0,0001 1,448544747 4,440691128
Authority -6,73936 2,407871902 -2,79888634 0,0051 -11,45870198 -2,020017567
Degree_Centrality 0,017243 0,007735031 2,229224744 0,0258 0,00208274 0,032403506
PageRank -4,83117 1,681259247 -2,873540896 0,0041 -8,126374773 -1,535959629
Clustering_Coefficient -4,29246 1,218407018 -3,523010611 0,0004 -6,680494725 -1,904426979
a O ponto de corte é 0,5
COMO EVOLUÍRAM OS PROGRAMAS DE PÓS-GRADUAÇÃO NO BRASIL AO LONGO DOS ANOS?
Contando a História da Pós-Graduação no Brasil
Contando a História da Pós-Graduação no Brasil
A network framework of cultural historyMaximilian Schich, Chaoming Song, Yong-Yeol Ahn, Alexander Mirsky, Mauro Martino, Albert-László Barabási, Dirk Helbing
Science 1 August 2014: vol. 345 no. 6196 pp. 558-562 DOI: 10.1126/science.1240064
Contando a História da Pós-Graduação no Brasil
• Caracterizar a evolução histórica da formação de pesquisadores e dos programas de pós-graduação no Brasil
• Identificar os centros de influência nas diferentes área de pesquisa no País
• Fazer uma análise da correlação entre o local/período de formação dos pesquisadores e o conceito dos programas de pós-graduação onde estes pesquisadores atuam
• Status: • Baixamos o Lattes! (3.9 milhões de currículos em XML)• Começando a extração (e normalização) dos dados
Contando a História da Pós-Graduação no Brasil
UM SISTEMA PARA VISUALIZAÇÃO COMPARATIVA DE PRODUÇÃO CIENTÍFICA
Quem sou eu no Mundo Acadêmico
Quem sou eu no mundo acadêmico?
• Desenvolvimento de uma ferramenta para comparação visual de currículos lattes
• Permitir diferentes tipos de análises (visuais) a partir de conjuntos de currículos lattes• Detecção de tendências
• Detecção de outliers
• Superposição de currículos
• Possíveis sub-conjuntos de interesse• Bolsistas de Produtividade
• Pesquisadores de uma determinada área/idade/instituição/programa de pós
• Status• Começando a extração dos dados
CiênciaFinanciamento de Pesquisa e Mérito Científico
PolíticaEleições, Eleitores e Eleitos
Eleições, Eleitores e Eleitos
Não vote nos Parentes
Fonte: “Clãs políticos no Congresso Nacional“ - ONG Transparência Brasil
Não vote nos Parentes
Coeficiente de Correlação = -0.34 (pearson)
• Correlação = -0.34 (Pearson)
Não vote nos Parentes
Coeficiente de Correlação = -0.34 (pearson)
• Correlação = -0.62 (Pearson)
Não vote nos Parentes
Coeficiente de Correlação = -0.34 (pearson)
• Correlação = 0.77 (Pearson)
Não vote nos Parentes
• Somos pobres, subdesenvolvidos e analfabetos porque alimentamos as oligarquias
• Alimentamos as oligarquias porque somos pobres, subdesenvolvidos e analfabetos
• Correlação não implica em causalidade
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ?
Se com um crescimento de 1.76% no número de candidatos líderes religiosos de 2006 para 2010 o número de eleitos nesta área aumentou em 91.7%, o que vai acontecer em 2014, com um contingente 34.73% maior de líderes religiosos disputando cargos eletivos ?
Política + Religião = ?
Eleições, Eleitores e Eleitos: Projetos em Andamento
• Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão entre parlamentares em votações nominais (Vitor Baptista)
• Infografia Interativa utilizando Dados Eleitorais (Lucas Lacerda, Filipe Araújo e Ed Porto)
• Um Mapeamento da Genealogia Política no Brasil (Maria Clara)
É POSSÍVEL IDENTIFICAR EVENTOS POLÍTICOS SIGNIFICATIVOS ATRAVÉS DO MONITORAMENTO DA COESÃO PARLAMENTAR ?
Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão entre parlamentares em votações nominais
Coesão Parlamentar: Questões de pesquisa
• É possível identificar mudanças na coesão parlamentar baseando-se nos resultados das votações da Câmara?
• Escândalos, manifestações populares e eventos históricos impactam, de alguma forma, a coesão parlamentar?
Coesão Parlamentar: Metodologia
• Extração e mineração de dados através de uma API da página da Câmara dos Deputados
• Criação de API própria para otimizar coleta de dados relevantes
• Criação de um grafo não direcional com arestas ponderadas pelo Índice de Rice
• Criação de uma ferramenta de visualização para os dados
Coesão Parlamentar: Estudo de caso -Mensalão
Coesão Parlamentar: Estudo de caso -Mensalão
2001
Coesão Parlamentar: Estudo de caso -Mensalão
2002
Coesão Parlamentar: Estudo de caso -Mensalão
2003
INFORMAÇÃO É LEGAL! INFORMAÇÃO INTERATIVA É AINDA MAIS LEGAL!
Infografia Interativa utilizando Dados Eleitorais
Infografia Interativa utilizando Dados Eleitorais
Infografia Interativa utilizando Dados Eleitorais
Infografia Interativa utilizando Dados Eleitorais
Infografia Interativa utilizando Dados Eleitorais
DESCOBRINDO A REDE GENEALÓGICA DOS POLÍTICOS BRASILEIROS
Um Mapeamento da Genealogia Política no Brasil
Um Mapeamento da Genealogia Política no Brasil
?
Crowdsourcing!
Um Mapeamento da Genealogia Política no Brasil
LABORATÓRIO DE TRANSPARÊNCIA PÚBLICA E BUSINESS ANALYTICS
Laboratório de Transparência Pública e Business Analytics
• LABTRANSP (Nome em construção!)
– 21/11/2014
• Parceria da UFPB (Departamento de Tecnologia em Gestão, Departamento de Finanças e Contabilidade+ Centro de Informática) com a OnCase
• Treinamento Pentaho e seleção de bolsistas em Dezembro/2014 e Janeiro/2015
Obrigado!