análise de redes em mídias sociais: começando sem erros #codabr
TRANSCRIPT
ANÁLISE DE REDES EM MÍDIAS SOCIAIScomeçando sem erros
Tarcízio Silva
Mestre (UFBA) e doutorando (UMESP) em Comunicação. Diretor de Pesquisa em Comunicação no IBPAD. Experiência anterior em agências digitais, ferramentas de monitoramento e pesquisa aplicada de inovação (Social Figures, Flagcx, Coworkers e outras).
Atendeu a clientes e marcas como Ideia Inteligência, Rede Globo, Petrobras, Grupo Informe, Inter-American Development Bank, Unilever, Sebrae, TCE-PE, Netshoes, Accor Hotels, 99, Discovery e outros.
Professor convidado de especializações (Digicorp-USP, Unisinos, FBB etc) e pesquisador acadêmico com diversas publicações, incluindo a organização de livros como Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações (2016), Para Entender o Monitoramento de Mídias Sociais (2012) e Mídias Sociais: Saberes e Representações (2012).
tarciziosilva.com.br
A ideia de rede é muito útil para pensar
diferentes fenômenos naturais e sociais.
A análise de redes parte do princípio que mais informação pode ser gerada a partir da
compreensão de como os elementos de um conjunto estão ligados entre si.
Redes por todos os lados
Redes por todos os lados
Ecologia
Redes por todos os lados
EcologiaTransportes
Redes por todos os lados
EcologiaTransportes
Personagens
Redes por todos os lados
EcologiaTransportes
Personagens
Produtos Culturais
Redes por todos os lados
EcologiaTransportes
Personagens
Produtos Culturais
Ingredientes
Redes por todos os lados
EcologiaTransportes
Personagens
Produtos Culturais
Ingredientes
Relações Sexuais
Redes por todos os lados
EcologiaTransportes
Personagens
Produtos Culturais
Ingredientes
Relações SexuaisJogos de Futebol
Por que visualizar redes?
Descobrir e idear tipos de relações entre indivíduos, objetos e coisas
Descobrir grupos e suas interações
Identificar nós engajados em trocas e fluxos de informação e valores
Identificar nós de influência na rede na emissão oucirculação de informação
Investigar fenômenos de interferência “estratégica” ounociva na rede
Redes como fatos públicos / noticiáveis
http://www.nytimes.com/2008/04/06/world/middleeast/06iranblog.html
Redes como fatos públicos / noticiáveis
https://www.revistaforum.com.br/2013/06/17/mapeamento
Redes como fatos públicos / noticiáveis
http://www.bbc.co.uk/portuguese/noticias/2013/07/130710_protestos_tweets_hashtags_cc_mdb
Do que é composta uma rede?
• Nós: elementos individualizáveis que podem se conectar direta ouindiretamente a outros.
Exemplos: pessoas, animais, websites, aeroportos, personagens, palavras, ingredientes, estações, livros, perfis, hashtags
Nó / Vértice Nó / Vértice
Do que é composta uma rede?
• Nós: elementos individualizáveis que podem se conectar direta ouindiretamente a outros.
Exemplos: pessoas, animais, websites, aeroportos, personagens, palavras, ingredientes, estações, livros, perfis, hashtags
• Arestas: conexões entre os nós da rede. Materiais ou imateriais; explícitas ouimplícitas; intencionais ou observadas.
Exemplos: relação predatória, vôos, amizade, parentesco, relações sexuais, hyperlink, retweet, co-ocorrência, proximidade
Nó / Vértice Nó / Vértice
Laço / Aresta
É difícil montar uma rede?
Lista de Arestas (Relações)
É difícil montar uma rede?
Lista de Arestas (Relações)
Planejando usar redes de mídias sociais
Como usar redes de mídias sociais em uma reportagem ou artigo?
1. Definir problema de investigação
2. Organizar a coleta de dados
3. Interpretar os resultados
4. Visualizar e apresentar
Por que visualizar redes?
Descobrir e idear tipos de relações entre indivíduos, objetos e coisas
Descobrir grupos e suas interações
Identificar nós engajados em trocas e fluxos de informação e valores
Identificar nós de influência na rede na emissãoou circulação de informação
Investigar fenômenos de interferência“estratégica” ou nociva na rede
Por que visualizar redes em mídias sociais?
Descobrir relações entre perfis, indivíduos e grupos
Mapear comunidades de interesse, afiliação e trocaonline
Identificar ativadores, agitadores ou “engajados” emtemas
Analisar públicos de mídia, entidades ou empresas
Identificar influenciadores em temas oucontrovérsias públicas
Investigar fenômenos como bots, fakes e ciborgues
1. Definir problema de investigação
Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi
http://visualsocialmedialab.org/projects/the-iconic-image-on-social-media
1. Definir problema de investigação
Foto do menino Aylan Kurdi publicada por jornalista Michelle Demishevich - 33 retweets em uma hora
1. Definir problema de investigação
664 retweets na segunda hora, com o papel de Diretor da Human Rights Watch
1. Definir problema de investigação
Fase Global: jornalista da Washington Post gera 7421 retweets
1. Definir problema de investigação
Mainstream: mais de 500 reportagens em veículos do mundo todo, incluindo EUA e Reino Unido - 20 mil tweets/hora
1. Definir problema de investigação
Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi
Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook
http://blogs.oglobo.globo.com/na-base-dos-dados/post/quem-sao-os-politicos-que-lideram-nas-midias-sociais.html
1. Definir problema de investigação
Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook
http://blogs.oglobo.globo.com/na-base-dos-dados/post/quem-sao-os-politicos-que-lideram-nas-midias-sociais.html
1. Definir problema de investigação
Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi
Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook
Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres
https://publications.iadb.org/handle/11319/8501
1. Definir problema de investigação
Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres
https://publications.iadb.org/handle/11319/8501
1. Definir problema de investigação
Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi
Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook
Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres
Quero observar mudança de foco nas controvérsiaspolíticas online?Ex: Polaridade Política
1. Definir problema de investigação
Quero observar mudança de foco nas controvérsiaspolíticas online?Ex: Polaridade Política
Brazil’s electorate: still polarised but in a new way, reportagem na Financial Times (Fevereiro de 2015)http://on.ft.com/1D9lB03
Brazil’s election: as polarized as can be (Novembro de 2014) http://on.ft.com/1Shyf3x
erro comum: se preocupar com dados tarde demais
A coleta de dados deve ser iniciada o maisrápido possível
Coleta retroativa pode ser cara, complexa ouimpossível
Levar em conta a exclusão de publicações
Coleta continua de territórios relevantes para o jornalista/pesquisador
“Tô preparando reportagem sobre
os acontecimentos da semana
passada e preciso de dados”.
“Estou chegando na qualificação e
preciso coletar dados das jornadas
de junho de 2013... Como eu os
consigo?”
2. Organizando a coleta de dados
Mas como coletar dados nas mídias sociais?
2. Organizando a coleta de dados
Mas como coletar dados nas mídias sociais?
Identificar quais são os elementos das redes, seus nós e relações possíveis e o que significam
em cada contexto
2. Organizando a coleta de dados
Mas como coletar dados nas mídias sociais?
Identificar quais são os elementos das redes, seus nós e relações possíveis e o que significam
em cada contexto
Pragmaticamente, aprender e valiar o que é possível de ser coletado nas plataformas com
as ferramentas disponíveis
Nós e arestas comuns nas mídias sociais
NÓS
CONEXÕES
PerfisHashtags
MentionsRT
SeguirCo-ocorrência
PerfisHashtags
Co-HashtagSeguir
PerfisPáginas
LikesCo-Comentários
Tagging
Amizades
BlogsSites
Links
CanaisUsuários
InscriçãoCo-comentários
2. Organizando a coleta de dados
Monitoramento de publicações
Extração / Scraping de Relações
2. Organizando a coleta de dados
Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.
Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região
Extração / Scraping de Relações
2. Organizando a coleta de dados
Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.
Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região
Extração / Scraping de RelaçõesExtração ou raspagem de relações mais permanentes, que possam indicar redes de apoio, afiliações ou influência.
Exemplos:• relações de likes entre páginas de um grupo de interesse• hyperlinks entre sidebars de blogs políticos
2. Organizando a coleta de dados
Monitoramento de publicações• Definição de temas e ambientes• Construção de queries de busca
(no Twitter, busca booleana)• Configuração de ferramenta• Tratamento da coleta• Análise e interpretação
Tema:Minha Ciência em um Tweet
Queries:#MinhaCienciaEmUmTweet OR “minha ciência em um tweet”
Ciência AND (Brasil OR twitter OR pesquisa)Universidades AND (Brasil OR Twitter OR pesquisa)
2. Organizando a coleta de dados
https://netlytic.org
2. Organizando a coleta de dados
https://netlytic.org
2. Organizando a coleta de dados
https://netlytic.org
Nó / Vértice Nó / Vértice
Laço / Aresta
07CleaMe DrJorgeMelendez
Retweet
2. Organizando a coleta de dados
Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.
Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região
Extração / Scraping de RelaçõesExtração ou raspagem de relações mais permanentes, que possam indicar redes de apoio, afiliações ou influência.
Exemplos:• relações de likes entre páginas de um grupo de interesse• hyperlinks entre sidebars de blogs políticos
2. Organizando a coleta de dados
Extração/Scraping de relações• Definição de temas e escopo• Levantamento de sites/páginas seed• Snowball sampling
2. Organizando a coleta de dados
twitteRRfacebookThinkToStartR
Ferramentas
Coleta de Dados
Coleta + Visualização
Naoyun
COSMOS
twitteRRfacebookThinkToStartR
Ferramentas
Coleta de Dados
Coleta + VisualizaçãoVisualização / Processamento
Naoyun
igraph
COSMOS
twitteRRfacebookThinkToStartR
Ferramentas
Coleta de Dados
Coleta + VisualizaçãoVisualização / Processamento
Social ListeningNaoyun
igraph
COSMOS
Métricas de Redes
Grau de Centralidade: contabiliza o número de conexões totais; conexões enviadas (Saída) ou recebidas (Entrada)
Centralidade Autovetor: uma medida que analisa não só a quantidade de conexões recebidas por um nó, mas se estas conexões são feitas por outros nós também conectados. Pode ser utilizado para medir a influência, em alguns casos.
Intermediação: a métrica de intermediação permite calcular quantas vezes um nó está presente entre os menores caminhos possíveis entre dois nós da mesma rede. Pode representar a possibilidade um nós ser um “intermediário”, como o nome diz, na circulação de algum dado ou informação na rede, por exemplo.
Métricas de Redes
Grau de Centralidade: contabiliza o número de conexões totais; conexões enviadas (Saída) ou recebidas (Entrada)
Grau 6Grau de Entrada 4Grau de Saíde 2
Grau 5Grau de Entrada 2Grau de Saída 3
Métricas de Redes
Grau de Centralidade:Grau de Entrada Grau de Saída
scienceblogsbr 133
nilmoretto 117
moiraleao 99
erickjr_silva 94
jessica7duarte 95
patrickkalt 87
foliveira_astro 83
franciscoicmc 76
iaravps 56
iserrapilheira 58
scienceblogsbr 49
paulusantana 43
rafazenni 37
lyzbeltrame 30
licunhag 29
aguilaniulab 26
minasfazciencia 21
homem100medo 20
lucas_maxado_ 19
carloshotta 17
Métricas de Redes
Centralidade Autovetor: uma medida que analisa não só a quantidade de conexões recebidas por um nó, mas se estas conexões são feitas por outros nós também conectados. Pode ser utilizado para medir a influência, em alguns casos.
O algoritmo PageRank, utilizado por Larry Page para o rankeamentono Google, é um exemplo do tipo.
Simplificação da lógica do PageRank
Métricas de Redes
Intermediação: a métrica de intermediação permite calcular quantas vezes um nó está presente entre os menores caminhos possíveis entre dois nós da mesma rede. Pode representar a possibilidade um nós ser um “intermediário”, como o nome diz, na circulação de algum dado ou informação na rede, por exemplo.
A Definition, Meta-Methology, & Practical Purpose for Evaluation http://bit.ly/1VNGDqP
A: maior IntermediaçãoB: maior Grau
Métricas de Redes
Densidade: a métrica de densidade mede o quão próxima de estar totalmente conectada uma rede está. Uma rede contendo todas as conexões possíveis entre todos os nós teria densidade 1.
Rede com 50 nós e 374 arestas, densidade
0.305Rede com 50 nós e 712 arestas,
densidade 0.581
3. Interpretar os resultados
Pontos de foco
Controvérsias e posições
Disrupções e conflitos
Reapropriações
Atores x Grupos
Densidade
Centros e Periferia
Clusters / Comunidades
Agrupamentos identificados através da conexão entre perfis.
Clusters são grupos de perfis mais conectados entre si do que em relação à rede como um todo.
Quando são clusters de pessoas, podem indicar comunidades de pessoas que interagem entre si com frequência.
Austráliahttps://pt.slideshare.net/Snurb/exploring-emotions-on-auspol-polarity-and-public-performance-in-the-twitter-debate-on-australian-politics
Estados Unidoshttp://cs.wellesley.edu/~pmetaxas/Research/coRT-Political-Polarization.pdf
Brasilhttps://www.digitalrightslac.net/pt/polarizacion-y-resaca-electoral-en-brasil
https://publications.iadb.org/handle/11319/8501
http://cmsimpact.org/resource/beyond-hashtags-ferguson-blacklivesmatter-online-struggle-offline-justice
erro: mostrar parte da rede
Mostrar apenas parte da rede pode levar a interpretações errôneas.
Em 2014 vazou documento de escritório de advocacia acusando ação estratégica de tuiteiroscontra candidato.
http://ibidem.org.br/aecio-neves-aciona-judicialmente-o-twitter-para-que-dados-de-66-usuarios-sejam-revelados
“
Limites das redes
REDES EGO-CENTRADAS REDES SOCIO-CENTRADAS REDES DE SISTEMAS ABERTOS
Limites das redes
REDES EGO-CENTRADAS
Redes construídas em torno de umponto de partida e suas conexões.
Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.
REDES SOCIO-CENTRADAS REDES DE SISTEMAS ABERTOS
Rede-ego 1.5 de uma única página de Facebook
Limites das redes
REDES EGO-CENTRADAS
Redes construídas em torno de umponto de partida e suas conexões.
Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.
REDES SOCIO-CENTRADAS
Redes dentro de um “limite” definido,com número total de nós conhecido.
No caso das mídias sociais: rede deinterações dentro de um grupo doFacebook.
REDES DE SISTEMAS ABERTOS
Rede-ego 1.5 de uma única página de Facebook
Rede de co-comentários entre usuários dentro de uma única página de Facebook
Limites das redes
REDES EGO-CENTRADAS
Redes construídas em torno de umponto de partida e suas conexões.
Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.
REDES SOCIO-CENTRADAS
Redes dentro de um “limite” definido,com número total de nós conhecido.
No caso das mídias sociais: rede deinterações dentro de um grupo doFacebook.
REDES DE SISTEMAS ABERTOS
Redes nas quais os limites não sãoclaramente definidos ou conhecidos.
Exemplo nas mídias sociais:influenciadores sobre um determinadosegmento, a partir de monitoramento dekeywords.
Rede-ego 1.5 de uma única página de Facebook
Rede de co-comentários entre usuários dentro de uma única página de Facebook
Rede baseada nas interações sobre a keywords employment AND #SDG durante evento
erro comum: usar métricas inadequadas
Compreender as métricas adequadas para o fenômeno observado
Centralidade no debate?Intermediação de informação?Engajamento ou Impacto?
Softwares com visualização gráfica online tendem a limitar a customização de métricase layouts
Seguir para softwares mais potentes para processamento e visualização (Gephi)
4. Visualizar e apresentar
Clareza sobre a coleta e limites dos dados
Padrões sobre variáveis:• Tamanho dos nós: variáveis quantitativas como
centralidade, intermediação, autovetor• Geralmente variáveis nominais são visualizadas
com cores, como módulos/comunidades ou origem geográfica
Compartilhamento de datasets completo dificultado por ToS
Visualizações interativas como sigmajs
http://www.ibpad.com.br/redes/direita-esquerda
http://www.ibpad.com.br/redes/primeiroassedio
http://www.ibpad.com.br/redes/instagrambr
O livro Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações reúne colaborações de uma rede de profissionais e pesquisadores que atuam em universidades, empresas e agências. Temas basilares, mas ainda controvertidos, como análise de sentimento, atendimento ao consumidor ou etnografia somam-se a aplicações e inovações que vão de reconhecimento de imagem a estudos sobre memes, compondo contribuição sólida ao campo.
IBPAD
bit.ly/livroibpad
redesEcologia http://www.oupcanada.com/catalog/9780195188165.html
Personagens http://moviegalaxies.com
Livros https://www.facebook.com/notes/facebook-data-science/books-
that-have-stayed-with-us/10152511240328859/
Ingredientes http://www.ladamic.com/wordpress/?p=294
Rede de Relações Sexuais http://bit.ly/1gmRsQs
Futebol http://bit.ly/2hTIrkp
Insights from Social Media on Gender in Latin America
https://publications.iadb.org/handle/11319/8501#sthash.xyoBuDPv.dp
uf
Leia e Estude +
Iniciação a Redes - NetSciEd
Livro Monitoramento e Pesquisa em Mídias Sociais
Curso ONLINE gratuito de Netlytic
ferramentasChorus http://chorusanalytics.co.uk
Cosmos http://socialdatalab.net/software
Flocker flocker.outliers.es
Gephi https://gephi.org
Igraph igraph.org
Issuecrawler http://issuecrawler.com
Netlytic netlytic.org
Netvizz https://apps.facebook.com/netvizz
NodeXL https://nodexl.codeplex.com
Naoyun http://matthieu-
totet.fr/Koumin/tools/naoyun
Onodo https://onodo.org
Polinode https://polinode.com
Pajek http://mrvar.fdv.uni-lj.si/pajek
SNAP http://snap.stanford.edu/snap/
VOSON http://uberlink.com/services/voson
UCINET
sites.google.com/site/ucinetsoftware/home