Outils de recherche et de veille sur l'actualité (news, médias sociaux...)
14 octobre 2014
Marie-Laure Malingre, Alexandre SerresURFIST de Rennes
2
Plus de 30 outils à utiliser
3
PLANSOMMAIRE
• Quelques repères
– 1/ Introduction : données, enjeux… sur la recherche d’information d’actualités
– 2/ Les outils : périmètre, typologies, principes
• Comment cerner et surveiller un sujet d’actualité sur le Web ?– 3/ Méthodologie de recherche– 4/ Quelle actualité du sujet – 5/ Comment trouver des
journaux, des journalistes, des sites de presse ?
– 6/ Quels médias, quelles sources sur le sujet ?
– 7/ Quels acteurs concernés ?
– 8/ Quelles données factuelles ?
– 9/ Quelles interventions publiques filmées ?
– 10/ Quel impact dans la blogosphère et les réseaux sociaux ?
– 11/ Quelle évolution dans le traitement du sujet sur le web ?
Introduction : données, enjeux, questions sur la recherche d’information d’actualités
5Source : Baromètre TNS-SOFRES 2013
INTRODUCTION : repères sur les pratiques médiatiques en France
6
INTRODUCTION : repères sur les pratiques médiatiques en France
Source : Baromètre des médias 2014, TNS-SOFRES
• Un intérêt important pour l’actualité, mais en légère baisse : 69 % des Français
• Médias utilisés pour « avoir des nouvelles » : (en 2013)• La télévision : 69 % • La radio : 33 %• Internet : 27 % (+ 20%
depuis 2004)• La presse écrite : 24 % ;
• Forte progression d’Internet : • pour approfondir un sujet (+25%)• avoir plusieurs points de vue
(+24%)
• Quelle confiance envers les médias ?• Crédibilité globale
moyenne • La radio : média jugé le
plus crédible (58 %)• Confiance en légère
hausse envers Internet :• Confiance : 37 % (35 en
2013)
7
INTRODUCTION : données sur les sites d’information
• Sites de presse et d’information parmi les plus visités :• le Figaro et le Monde, en octobre 2014
• 14ème et 15ème sites les plus consultés en France, selon Alexa• 5ème et 6ème (sur les sites français) ,selon l’OJD
• Près de la moitié des internautes européens consultent les sites d’information (voir l’étude de Comscore, janvier 2012) :
• Novembre 2011 : sur les 379 millions d’Européens ayant consulté internet, + de 181 millions de visiteurs uniques sur les sites d’information
• Internet premier média d’information pour une part croissante de la population
8
INTRODUCTION : quelles sources de trafic vers les sites d’actualité ?
• En France, en 2012:• Etude d’AT Internet,
en août 2012, sur 19 sites d’actualité français
• Google : 39,7 % !• Facebook et Twitter
à l’origine de < 4 % du trafic
En France, janvier 2014 :• Google : 39 %• Facebook : 7,1%
INTRODUCTION :quelles sources de trafic vers les sites d’actualité ?
Source : JournalduNet
10
INTRODUCTION : les outils de recherche comme sources de trafic
• « Effet Saint-Matthieu » :• Renforcement de la visibilité
des principaux sites d’information français (Le Monde, le Figaro, Nouvel Obs…) sur Google News
• Selon une étude (octobre 2012) de Résonéo
Les outils : périmètre, typologies, principes
12
PérimètreCartographie des producteurs d’information médiatique en lignehttp://www.ardepmp.com/IMG/pdf/
producteurs_d-info_en_ligne.pdf
13
Périmètre
Diversification des portes d’entrée d’un article >Article de Marco Bertolini : Ecrire pour la presse web
14
• 2 champs principaux :– Les outils de recherche sur les médias d’actualité
• Les articles de presse• les dépêches d’agence, les communiqués• les ressources audio-visuelles
– Les outils de recherche sur les ressources du web social > « l’information en temps réel »
• blogs• Twitter• …
Périmètre
15
• Prise en compte et mixage éventuel de 4 types de spécialisations :– Le contenu :
• Recherche sur l’information d’actualité
– Le type de ressource internet :• Portails de presse, moteurs d’actualités, moteurs de blogs,
de tweets, plateformes de curation…
– Le média : • Texte, images, podcasts, vidéos…
– La fonction :• Indexation, filtrage de l’information• Analyse de l’information
Périmètre
16
• Annuaires, répertoires, portails– Annuaires de presse– Portails spécialisés– Navigation et recherche dans une sélection de
ressources
• Moteurs de recherche d’actualités– Modules spécialisés des moteurs de recherche du
web– Outils ciblés– Indexation automatique d’un corpus spécialisé
Typologie et principes des outils
17
• Agrégateurs et bases de données de presse– Accès à des sources spécifiques de presse ou à
un ensemble de sources de presse agrégées sur des plateformes unifiées
• Outils d’analyse de l’actualité– Fonctionnalités spécifiques de traitement de
l’information d’actualité • Extraction, synthèse, cartographie, visualisation de
tendances, de relations…
Typologie et principes des outils
18
• Outils et ressources du journalisme de données :– Journalisme centré sur la recherche, l’exploration,
le traitement et la visualisation d’ensembles de données.
– S’intègre dans le mouvement du big data,visant à mettre à disposition des collections diversifiées de données
– Sites ressources proposant des corpus de données
– Outils de traitement et de visualisation
Typologie et principes des outils
19
• Outils du web social
– Moteurs de blogs : • Recherche de blogs via les moteurs généralistes du
web• Outils spécialisés, permettant la recherche de blogs
– Recherche sur les réseaux sociaux• Outils dédiés à la recherche sur Twitter, sur Facebook…
• Moteurs de recherche temps réel sur les réseaux sociaux > métamoteurs
Typologie et principes des outils
Méthodologie de recherche sur un sujet d’actualité
21
• Défricher le sujet, trouver des mots-clés • Voir les derniers événements, l’actualité du sujet :
• les moteurs de recherche d’actualités, les outils d’analyse (Google News, NewsBrief)
• Trouver des journaux, des journalistes, des sites de presse :• Les annuaires et portails spécialisés de presse
• Qui parle de quoi ? Recherches sur les médias, les sources :• Les moteurs de recherche d’actualités, les outils d’analyse (Google
News, Pickanews)• Quels sont les acteurs concernés par le sujet ?
• Les agrégateurs de presse (Europresse), les outils d’analyse de l’actualité (NewsExplorer)
• Quelles données brutes relatives à un sujet ?• Les sites et outils de data journalism
Démarche méthodologique
22
• Retrouver des vidéos et des déclarations d’acteurs du sujet• Utiliser Voxalead News
• Quel impact dans la blogosphère ? • Quel impact sur Twitter, les réseaux sociaux, les plateformes
du web social ? • Les outils de recherche dans les réseaux sociaux (Twitter Search,
Topsy)• Quelle évolution dans le traitement du sujet ?
• Google Trends, News Explorer• Retrouver des archives sur le sujet
• Archives Google News• Faire de la veille sur le sujet
• Les alertes, les flux RSS, les pages personnalisables, les outils de curation
Démarche méthodologique
Cerner un sujet d’actualité sur le web : Quelle actualité du sujet ?
24
• Modules ou services proposés par les outils de recherche
• Agrégation de multiples sources d’actualité :
• Presse, blogs, sites web…• Revues de presse automatisées
• Services gratuits : alertes…
• Nombreux moteurs d’actualité : • Précurseur : Google News• Modules spécialisés : Yahoo News,
• Concurrence aiguë, enjeux économiques importants
• Problèmes et conflits juridiques
Les moteurs de recherche d’actualités
25
• Google News (Actualités) : - Créé à la suite du 11/09/01, en décembre 2001 (par Krishna Bharat)- Lancement officiel en 2003. Diffusion en continu d’infos sur l’actualité - Sélection de 55 000 sources indexées tous pays confondus
• + de 500 sources sur la version française- Plus de 72 versions nationales en 30 langues différentes - Automatisation complète ; collecte et analyse de chaque source par
un robot ; classement automatique des informations dans des rubriques prédéfinies
- Visibilité des sites de presse dans Google News : étude 2012 de la société Resoneo, cf. Abondance, novembre 2012
- Google et l’édition de presse- Nombreuses controverses au cours des dernières années- Actions d’apaisement de Google en direction des acteurs de la
presse
Les moteurs d’actualités : Google News
26
• Google News (Actualités) : - Fonds pour l’innovation numérique de la presse de
100 millions d’euros
Les moteurs d’actualités : Google News
16 millions d’euros à 23 médias de la presse française en 2013 (près de 2 millions chacun)
Source : Libération Ecrans
27
• Google News (Actualités) (source Café référencement : Google Actualités : quoi de neuf en 2014 ? )
• Le public :• 1 Mrd d’utilisateurs voient des résultats News sur Google chaque
semaine• 6 Mrds de clics envoyés vers les sites de news chaque mois
• L’algorithme• Classement selon : sujet, cluster, période de l’année, de la journée,
signaux sociaux• Utilisation du News sitemap• Respect du fichier Robots.txt
• Trafic• Baisse de trafic en visiteurs uniques sur Google News• Augmentation du trafic news sur google.fr via les résultats d’actualité• Indexation par le spider Google (il n’y a plus de spider spécifique)
Les moteurs d’actualités : Google News
28
• Google News (Actualités) : • Quoi de neuf pour 2014 ? (source :
http://www.cafe-referencement.com/, rubrique Google Actualités)• Google News en version Web App Mobile, lancée en décembre
2013
• Une version pour tablette
• Lancement aux USA d’une possibilité pour les éditeurs d’envoyer un flux Choix des rédactions pour des catégories spécifiques en plus du flux global
• Nouvel outil pour les éditeurs : Media Tools
• Autres fonctions récentes : « In-Depth Articles », blocs d’actualité extensibles
Les moteurs d’actualités : Google News
29
• Google News : 10 critères principaux de pertinence– Source : Actualités du site Abondance ( + 10 critères négatifs)
– 1. L'autorité d'un site sur un sujet précis.– 2. La présence des mots clés demandés dans le titre de la page.– 3. L'autorité du nom de domaine en termes SEO.– 4. Les partages sociaux.– 5. Le fait d'être parmi les premiers à publier un article sur le
sujet.– 6. Le nombre de citations par d'autres sites.– 7. Le fait que l'article soit unique et original.– 8. Le taux de clics dans les résultats de Google News.– 9. La qualité du contenu.– 10. L'utilisation d'un Sitemap spécifique de Google News
Les moteurs d’actualités : Google News
30
Les moteurs d’actualités : Google News
Google Actualités Onebox Actualités de Google web
31
• Les fonctionnalités : – La personnalisation :
• Choix dans l’affichage des rubriques
• Création de rubriques personnelles
• Recherches d’informations locales
• Paramétrer la fréquence des sources
– La veille : • Syndication de fils RSS • Abonnement gratuit aux
alertes : – par thèmes...
Les moteurs d’actualités : Google News
32
Menu déroulant pour la recherche avancée depuis la fenêtre de saisiede la recherche simple
Les moteurs d’actualités : Google News
33
• Syntaxe de recherche : • intitle: et allintitle: : dans le titre des articles• intext: et allintext: : dans le texte des articles• inurl: : dans un site particulier• source: : sur une source précise
• Source:Libération• location: : dans un pays précis
• Location:Algérie• + date d’ajout dans Google Actualités
• Option prédéfinie, archives ou intervalle personnalisé
Les moteurs d’actualités : Google News
34
Les moteurs d’actualités : Google News
• Recherche d’articles sur le sujet de la transition énergétique– Requête sur la phrase
« transition énergétique »– Personnalisation des
rubriques Actualité (colonne de gauche) : sélectionne les contenus récents dans le domaine
• Créer une alerte (en bas de la page)– Nécessite un compte Google
35
• NewsBrief : l’information en temps réel• Moteur développé par l’Union Européenne• Collecte sur + 4300 sources :
• 1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 60 langues
• Surveillance quotidienne : • Mises à jour toutes les 10 mns
• Classement des informations• Graphique des 10 derniers événements marquants• Clustérisation : par thèmes, par Directions Générales de
l’UE• Possibilité d’abonnements RSS, mais pas par rubriques• Index de > 20 millions d’articles
Les moteurs d’actualité : News Brief
36
News Brief : voir l’actualité du sujet
• Sur NewsBrief :• Voir si la transition énergétique
est à la une (Dépêches)
• Vérifier si le sujet était présent à la une la veille (Dernières 24 heures)
• Voir les Domaines de politiques européennes (EU Policy Areas) et les Thèmes dans lesquels le sujet de la transition énergétique est présent
• Consulter la liste des sources (Sources list)
37
News Brief : voir l’actualité du sujet
• Sur NewsBrief :• Requête avancée
• Retrouver les articles consacrés à la transition énergétique parus :
• dans Le Monde, Libération,Alternatives économiques,Huffington Post
• depuis le 1/10/14
• Intérêt principal de NewsBrief :– Les événements les plus
récents, l’actualité« chaude »
38
• Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne
• Collecte, analyse, cartographie… de très nombreuses sources d’information, en 60 langues
• Trois portails complémentaires :• NewsBrief : actualité en temps réel• NewsExplorer : analyse de l’information• MediSys : information médicale• + EMM-Labs
Europe Media Monitor et NewsBrief
39
• QWANT :• Moteur généraliste frrançais lancé en janvier 2013
• JM Rozan, Société Pertimm, E. Leandri +entrée de Axel Springer en 2014
• Positionnement comme moteur de recherche de découverte
• 500 millions de recherches en 2013 (1200 milliards pour Google), 1,2 milliard / estimations pour 2014
• Fondé sur plusieurs technologies big data
• Politique annoncée de respect de la vie privée
• Contenus : texte, photos, vidéos, actualité, presse
• Présent dans 25 pays et accessible en 15 langues
• Possibilité de géolocaliser une recherche
• Prise en compte du contexte social des contenus : Twitter, Facebook, Google+ et LinkedIn ; utilisation de filtres
Les moteurs d’actualité : Qwant
(Voir JDN)
40
• QWANT :• Originalité dans la présentation des résultats
•Affichage sur une seule page en 5 colonnes : • Web, actualités, Qnowledge graph, social, shopping
• Onglet Médias• Lancement du “carnet de notes” avec système de Follower
Les moteurs d’actualité : Qwant
41
• Anglophones : • Yahoo News • Topix : 2004, agrégateur
d’actualités localisées
• Européens :• Eufeeds / European
Journalism Centre
Les moteurs d’actualités : autres outils
• Francophones :– Yahoo France Actualités– Webplanete news :
• 884 sources d’information francophones
– Twikle :• Agrégateur d'actualités et de
contenus lancé en octobre 2012
• Indexe les contenus les plus partagés sur les réseaux sociaux
• Recherche dans les tweets
42
• Répétition automatique d’une requête à chaque mise à jour d’une source d’information
• Résultats adressés périodiquement à l’utilisateur– par messagerie ou sous forme de flux RSS
• L’alerte permet, sans avoir à réinterroger la source d’information, de surveiller :– L’évolution d’un thème– Les travaux d’un auteur ou d’une institution– Les nouveaux articles de la revue que l’on suit
• Sur le sujet de la transition énergétique :– Créer une alerte sur Google Actualités
Faire de la veille sur un sujet d’actualité : les alertes
Comment trouver des journaux, des journalistes, des sites de presse ?
44
3. Recherches d’actualités : Annuaires de la presse et des médias
• Pour trouver des journaux dans le monde entier :– Newspapermap.com (http://newspapermap.com/FR.html) :
• annuaire cartographique de la presse mondiale• Plus de 10 000 journaux géolocalisés• Option de traduction par Google Translate
• Guide Presse :– annuaire de la presse francophone en ligne
• Journaux et magazines
• Giga-Presse :– Annuaire francophone de la presse en ligne
• 612 journaux francophones sélectionnés• Giga Presse Internationale :
10 000 journaux et magazines internationaux dans la rubrique « Monde » (beaucoup sont extraits de l’ODP)
> Exercice : rechercher des titres de magazines professionnels français sur l’environnement et l’énergie
Trouver des journaux et sites de presse
45
3. Recherches d’actualités : Annuaires de la presse et des médias
Retrouver des « Unes » de journaux :
• SPQR :– Les unes du jour des journaux régionaux français sur
le site du Syndicat de la Presse quotidienne régionale
• Newseum :– Plateforme américaine– Partenariat avec plus de 2000 journaux dans le
monde– Tri par région, carte, « unes » archivées
Trouver des journaux et sites de presse
46
• Categorynet.com (portail de la presse et des médias) : – Créé en 1998 par Greg Manset ; entreprise de presse et
réseau de journalistes• Comprend un annuaire de liens
– Pour trouver des annuaires de journalistes
• AnnuaireJournalistes Réseau de pigistes :– Annuaire de près de 8700 journalistes freelance– Possibilité de recherche par thématiques
> Exercice : trouver des journalistes spécialisés sur les questions d’énergie et d’environnement
Trouver des journalistes
47
3. Recherches d’actualités : Annuaires de la presse et des médias
• PQR :– Portail du Syndicat de la PQR– Toutes les informations sur la PQR
• Info.presse.fr :– Portail commercial tous publics ; vente d’abonnements– Plus de 1000 titres de presse disponibles à l’abonnement
Autres annuaires et portails de la presse et des médias
Cerner un sujet d’actualité sur le Web :quels médias, quelles sources sur le
sujet ?
49
• Google News (Actualités) :– Filtrage possible sur la source > un
titre particulier– Filtrage sur le lieu
– Personnalisation relative aux sources (compte Google)
• Personnalisation en augmentant la fréquence pour la catégorie choisie ou créée (énergie)
• Ajuster la source / Ajuster la fréquence d’une source d’actualité, avec un compte Google
• Paramètres : personnalisation sur les blogs / les communiqués de presse
– Après connexion, création d’une rubrique personnalisée Energie par requête, filtrage sur le pays des sources, sur l’édition ou la langue
Recherche sur les sources avec Google Actualités
Rubrique Energie sur les sources françaises
50
• Pickanews :
– Edité par Press Index, société spécialisée sur la veille et les médias
• Lancé en mai 2010
– Moteur plurimédia sur + de 50 000 sources d’information en Europe :
• Presse écrite : > 30 000 titres• Web : > 40 000 sites d'information et blogs• Radio et TV : > 200 chaînes de radio et télévision• Réseaux sociaux : 3 (Facebook, Twitter, YouTube)
– Outil à la fois gratuit et payant :• Consultation gratuite des résumés• Abonnements payants pour texte intégral des articles,
fonctions de veille...
Un moteur d’actualités : Pickanews
51
Un moteur d’actualités : Pickanews
• Fonctionnalités gratuites intéressantes : • Filtrages possibles sur :
• Les médias
• La période (2 derniers mois)
• Le sujet
• Un titre de presse
• Un pays
• Graphiques sur :
• L'évolution des citations
• La ventilation des résultats par types de média
• Le top des citations :
• Le top des sources
• Recherches sur un nom, une marque, une société
Pour en savoir plus, voir Veille presse avec Pickanews
52
Recherche sur les médias et les sources
• Sur Pickanews :
• Faire une recherche sur la transition énergétique en France
• Tester différentes requêtes
• Identifier :
• les médias
• les sources sur internet
• Les radios
• Les télévisions
• Les journaux
• qui ont le plus parlé du sujet depuis deux mois
• Repérer les périodes où l’on a le plus parlé du sujet
• Retrouver des émissions de radios
• Chercher les articles de la presse locale sur le sujet
53
3. Recherches d’actualités : Annuaires de la presse et des médias
• VoxEurop :– Site d’information créé par un consortium de 4 magazines
européens, spécialisés dans l’actualité internationale (dont « Courrier international »)
– Créé en 2009 à Paris, sous le nom PressEurop– Soutien de la Commission européenne– Sélection d’articles dans plus de 200 titres de la presse
internationale– Charte éditoriale : « participer au développement du débat
démocratique informé au sein de l’UE »• TP sur VoxEurop :
– Chercher des articles de la presse européenne sur la transition énergétique
Recherche sur les sources avec VoxEurop
54
• Forte croissance des agrégateurs de presse et de veille médias depuis quelques années (Etude SerdaLab 2009/2010 L’information numérique professionnelle en France : Le marché et les tendances en 2009-2010.)
• Diversification des prestations proposées– Services d’agrégation et de
recherche dans les contenus presse
– Prestations de services autour de ces contenus
– Secteur de la e-réputation
• Extension du périmètre des sources– Presse, internet, télévision,
radio
• Personnalisation de l’offre
• Quelques grands acteurs :– Europresse– Factiva
Les agrégateurs de presse
55
• Europresse: www.europresse.com – Agrégateur canadien (Cedrom-SNI)– 10231 sources reconnues – Plus de 3000 titres de presse de près de
100 pays (dominante : Etats-Unis, Canada, France ; langue anglaise 80%)
– Plus de 25 ans d’archives– Actualité internationale, nationale,
régionale, locale + BDD entreprises et profils biographiques
– Presse généraliste / spécialisée, communiqués,blogs thématiques, sites web...
en accès gratuit : recherche de sources possible
Les agrégateurs de presse : Europresse
56
Les agrégateurs de presse : Europresse
57
• Recherche sur les sources dans Europresse :
– Filtrage sur les types de sources
– Filtrage par source spécifique
– Filtrage sur les sources de régions spécifiques
– Filtrage sur la date
– Possibilité de tri des résultats par sources
– Recherche de journaux sous format PDF
• Faire une recherche sur la transition énergétique et identifier les sources qui en ont le plus parlé
– Presse nationale, régionale, presse spécialisée
– Titres
Les agrégateurs de presse : Europresse
58
• FACTIVA / Dow Jones : http://www.factiva.com/– “Factiva propose aux entreprises actualités et
informations essentielles avec des outils et services de livraison de contenu. La base Factiva (...) inclut l’association exclusive Wall Street Journal, Financial Times®, DJ et Reuters, AFP, AP… » (Journal du Net)
– 35 000 sources , 900 fils d’agences, 200 pays, 28 langues : presse papier et web, 35 ans d'archives
– Accessible par abonnement
Les agrégateurs de presse : Factiva
59
• Nombreuses possibilités :– requêtes complexes : – Filtrage sur la langue, les dates..– Affinement sur type de sources, de documents, dates,
sujets… – Alertes
• Voir Guide Formadoct sur l’utilisation de Factiva (dernière mise à jour décembre 2012)
Les agrégateurs de presse : Factiva
Cerner un sujet d’actualité sur le Web :quels acteurs concernés par le sujet ?
61
• Europresse, http://www.europresse.com/
• Recherche biographique :
• Par nom ou mot clé
• Dans différentes sources
• Possibilité de recherche avancée dans une source donnée
Europresse
62
• NewsExplorer : analyse multilingue• Produit également par Europe Media Monitor
• Couplage avec NewsBrief
• Analyse de l’information une fois par jour• Résumé des 20 faits marquants • 21 langues
• Nombreuses fonctionnalités : • Carte des lieux de l’actualité
• Analyse des actualités : tous les articles sur un sujet…
• Chronologie des événements
• Fiches sur personnalités
• Visualisation des relations entre personnes
• Recherche rétrospective sur les événements majeurs d’un pays
Les outils d’analyse de l’actualité : News Explorer
63
• NewsExplorer : • Recherches sur le thème de la transition
énergétique :• Nécessité de passer par les mots-clés
de l’outil• Chercher le thème dans les sujets
récemment traités, ou essayer différents mots-clés
• Explorer les différents clusters
Les outils d’analyse de l’actualité :News Explorer
64
Les outils d’analyse de l’actualité : NewsExplorer
Exemple de requête sur Edward SnowdenExplore Relations :visualisation despersonnes ou desorganisations les plus fréquemmentassociées à la personne affichée
Related People : personnes les plusfréquemment mentionnéesdans les clusters sur le sujet,avec le nombre de mentions
Associated People :personnes mentionnéesen même temps que la personne affichée dans le cluster
65
Les outils d’analyse de l’actualité : NewsExplorer
Other Names :noms d’organisations ou d’événements les plus mentionnés autour d’un événement, d’une date…
Quotes from :citations de la personne, dans différentes langues
Quotes about :citations à propos de la personne, dans différentes langues
Related Stories :autres clusters d’actualités, dans lesquels la personne est le plus souvent citée
66
• News Silobreaker :– Outil d’analyse en temps réel de l’actualité– Possibilité de requêtes avancées– Analyse des relations (Network) entre des entités
nommées (personnes, pays, villes…) : • Cartographie des relations de co-occurrence entre
entités• Analyse du volume de contenus
– Analyse de tendances (Trends) : • Nombre d’articles sur un sujet, une entité…
– Analyse des points chauds (Hot Spots)
• Voir article de C. Deschamps
Les outils d’analyse de l’actualité : News Silobreaker
• Newsmap :– Application de visualisation de l’actualité– Développée par un ingénieur designer
américain, Markos Wescamp– Représentation des actualités de 15 pays,
sous forme de vignettes proportionnelles au nombre d’articles ;
– Accès aux articles de presse
Les outils d’analyse de l’actualité : News Silobreaker
Les outils de visualisation de l’actualité : Newsmap
Infomous :– Permet de naviguer visuellement dans différentes sources
– Détection des tendances de l’actualité
•Fonctionnement :– Collecte des informations, à partir de différentes sources :
• Fils RSS
• Site web
• Requête sur un mot-clé : sur Twitter, Facebook, Google…
– Génération de cartes sémantiques à partir de ces sources :
• Représentation des principaux mots-clés, des liens
• Affichage de la source
Les outils de cartographie de l’actualité : Infomous
• Possibilité de créer soi-même des nuages de mots-clés :Infomous
Les outils de cartographie de l’actualité : Infomous
Quelles données brutes sur un sujet ? Le journalisme de données
72
• Définition :• « Le journalisme de données (data journalism en anglais), ou
journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation et la mise à la disposition du public de données statistiques » (Wikipedia)
• Repères : • Des origines anciennes :
• La carte du choléra à Londres en 1854, par John Snow.
• Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale.
• Essor récent du journalisme de données, symptôme du « Big Data »
• 2006 : 1ère apparition du terme, par Adrian Holovaty, créateur d’EveryBlock
• Août 2010 : 1ère conférence internationale du datajournalism
• 2010 : utilisation des données massives de Wikileaks, par les grands quotidiens internationaux (ex. du Guardian)
Chercher des données : le journalisme de données
73
• Exemples de datajournalisme :• Très nombreux exemples, sur tous les sujets, dans tous
les domaines, sur toutes les données
• Voir dans le Guide du datajournalisme :
• la base de données des salaires des fonctionnaires gouvernementaux développée par The Texas Tribune
• De la visualisation :
• Voir « La carte du déclin du communisme municipal dans les banlieues » sur Le Monde
• Datajournalisme et visualisation de données : des exemples
• Des analyses de corpus de textes :
• L’analyse des discours de la campagne présidentielle de 2012
Chercher des données : le journalisme de données
74
• Exemples de datajournalisme :• L’utilisation des données d’ameli.direct.fr (voir sur Guide du
datajournalisme)
Chercher des données : le journalisme de données
75
• Guardian DataBlog :
• Mise à disposition sur le blog :
• de données brutes
• d’outils de recherche et d’exploration des données
• d’outils de visualisation des données
• Exemples :
• Elections US
• Notes de frais des députés anglais
• La révolution ukainienne avec 13 000 photos Instagram
• Dépenses gouvernementales
Chercher des données : le data journalisme
76
• OTMedia, Observatoire transmedia
• Projet de recherche national (financement ANR)
• Novembre 2010 – Novembre 2013
• Partenariats multiples : INA, INRIA, AFP, Sorbonne nouvelle…
• Exploitation de données des médias
• Objectifs :
• « …mettre en place une plateforme d’analyse des différents flux médiatiques pour détecter, circonscrire, suivre, mesurer, analyser et étudier la propagation des évènements médiatiques et leurs dérivés »
• Exemple :
• « La crise syrienne, une vue de France au printemps 2012 »
Chercher des données : le data journalisme
77
Deux sites de visualisation de statistiques mondiales :•GapMinder :
• Outil de visualisation de statistiques mondiales, sur la santé publique
• Créé par Hans Rosling, professeur de santé publique
• Consultation et utilisation interactive de statistiques mondiales
• Exemple du graphique sur l’évolution de l’espérance de vie dans le monde, depuis 1800
• Nombreux usages pédagogiques
• Ressources sur ThotCursus
•WorldMapper :
• Données démographiques
• Cartes interactives
Chercher des données : la visualisation de données mondiales
78
• Ressources :• Guide du datajournalisme
• définition et repères sur le datajournalism• Exemples, études de cas, modes de
fonctionnement• GlobalVoices,
un manuel du journalisme de données• INA global : le journalisme de données• Géoconfluences : Datajournalisme
et visualisation de données• Liste du Guardian Datablog
Chercher des données : le data journalisme
Cerner un sujet d’actualité sur le Web :quelles interventions publiques filmées ?
80
• Apport des outils de recherche vidéo pour retrouver de l’information d’actualité
• Voxalead News, http://voxaleadnews.labs.exalead.com/ • Création en collaboration avec Vecsys et le CNRS-LIMSI dans
le cadre du projet Quaero.
• Recherche dans les vidéos et fichiers audios de chaînes d’information
• Affichage possible de l’actualité récente par graphiques et tags
• Chaînes : CNN, france 24, iTélé, LCI, BBC, BFM, Europe 1, etc.
• Adaptation du moteur de recherche Exalead
• Recherche dans un grand nombre de podcasts (plus de 150 000 mis à jour quotidiennement)
• 9 langues : Français, Anglais, Mandarin, Arabe, Russe, Espagnol, Italien, Allemand et Hollandais.
Les moteurs d’actualités : recherches vidéos
81
• Combine des technologies de reconnaissance de la parole et d’indexation texte
• Transcription et séquençage : permet de sélectionner un passage précis de la vidéo
• Affinement : chaînes spécifiques, termes associés, personnes, organisme, évènement, localisation
• Différents types d’affichage et d’accès
Les moteurs d’actualités : recherches vidéos
82
Les moteurs d’actualités : recherches vidéos
Recherche par mot dans la vidéo
Voxalead
Texte de la vidéo et séquençage : passages cliquables amènent directement à l’endroit choisi dans la vidéo (déficiences possibles dans la transcription)
Requête sur Keith Alexander
83
TexMix• Projet INRIA, IRISA, CNRS, INSA, Quaero, Université
Rennes 1• Structuration, navigation dans une collection de
journaux TV
• Le principe de l’application • Segmentation thématique à partir de transcription de la parole
• Caractérisation des segments obtenus
• Extraction de mots clés
• Enrichissement des séquences par des informations sur les personnes ou les locutions citées
Les moteurs d’actualités : recherches vidéos
84
• Les modules de recherche de vidéos des moteurs généralistes
• Exalead Vidéo
• Google Vidéo
• Yahoo Vidéo
• Les plateformes spécialisées
• Youtube• Blinkx
Les moteurs d’actualités : recherches vidéos
Cerner un sujet d’actualité sur le Web :quel impact dans la blogosphère et les
réseaux sociaux?
86
• Tendances :– Baisse d’intérêt des grands moteurs de recherche pour les blogs :
• Exemples de Google Blog Search ou de Technorati : plus de recherche vraiment spécifique sur les blogs
• Sur Google, intégration récente de l’onglet Blog dans Google Actualités– Un métamoteur intéressant : IceRocket– Quelques petits moteurs de recherche :
• Un moteur personnalisable : Keyblog• Les annuaires de blogs :
– Une liste d’annuaires de blogs : LesAnnuaires, section Blogs– Quelques annuaires francophones, tous publics :
• Annuaire de Blogs ADB :– 50 000 blogs recensés
• Tout le monde en blogue– Des outils propres aux plateformes de blogs :
• L’annuaire des blogs sur OverBlog• Pour les blogs scientifiques :
– Hypothèses : en SHS
Outils de recherche de blogs
87
• Module spécialisé du métamoteur IceRocketIceRocket, outil de veille : recherche dans les blogs, les actualités, Twitter, Facebook
• Pour la recherche sur les blogs– Recherche avancée : auteur, recherche de posts, sur le titre du post,
sur le tag du post, filtrage sur blog spécifique, sur lien du post, sur la date
– Présentation des résultats de la recherche par dates
– + résultats des posts publiés dans un intervalle de dates
– Tri des résultats par langue
– Fil RSS de la recherche
– Fonction Trends > graphique de la popularité des mots clés utilisés
Moteurs de recherche de blogs : IceRocket
88
• Méthodes de recherche des tweets :– Moteur de Twitter : Twitter Search
• >1000 tweets reçus par seconde (2010)• Traitement de 12 000 requêtes par seconde
– Moteurs de recherche spécialisés, en temps réel : Topsy, SnapBird, twXplorer
– Moteurs de recherche généralistes : Google…• Intégration des tweets dans les résultats
– Applications autour de Twitter
Recherche sur Twitter
89
• Moteur de Twitter, racheté en 2008
• Nombreuses fonctionnalités : • Interface de recherche
booléenne• Recherche sur les
hashtags• Recherche sur un
utilisateur• Recherche géographique• Recherche sur les
smileys
Recherche sur Twitter : Twitter Search
90
• Recherche sur Twitter Search :– Termes de requêtes :
• Hashtag : #transitionenergetique• Mot clé : transition energetique
• Observer les réactions sur Twitter • Chercher un compte Twitter spécialisé • Comparer les résultats avec Topsy
Recherche sur Twitter
91
Recherches booléennes
Recherche sur un site, un utilisateur
Classement par pertinence, par date
Recherche sur anciens tweets
Recherche sur Twitter : Topsy
92
• Plusieurs possibilités de filtrage des résultats :• Par périodes de
publication • Par types de supports• Par « Experts » :
utilisateurs ayant le plus cité le mot-clé
Recherche sur Twitter : Topsy
93
• twXplorer :– Nouvel outil spécialisé sur Twitter, lancé en 2013
– Développé par le Knight Lab, de la Northwestern University of Illinois
– Outil puissant, toujours en phase beta
– 13 langues proposées
– Nécessité de se connecter avec son compte Twitter
– Requête sur un mot-clé ou un hashtag :• Sélection des 500 derniers tweets sur le sujet
• Exclusion des doublons
• Affichage des 100 premiers tweets
– Tableau de bord avec des possibilités d’affinement :• Sur des termes, des hashtags
– Affichage des liens contenus dans les tweets
– Voir “twXplorer nouveau moteur de recherche pour Twitter” et “twXplorer, la recherche intelligente sur Twitter”
Recherche sur Twitter : twXplorer
94
• Le tableau de bord de twXplorer :
Recherche sur Twitter : twXplorer
95
• Information de dernière minute, rapidité d’indexation
• Essor des moteurs en temps réel, avec : – Syndication de contenus, News des médias, Réseaux sociaux,
Twitter et micro-blogging
• Nombreux moteurs autonomes, intervention des géants Google, Yahoo, Bing
• Demande d’instantanéité : – Mais effets pervers du temps réel
Moteurs de recherche en temps réel
96
• Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps :
– Nombre et type de sources collectées (« multimoteurs »)– Représentation graphique des données :
• Graphiques de tendances…– Possibilité d’abonnement aux flux RSS par requêtes– Défilement de l’information en temps réel
Moteurs de recherche en temps réel
97
• Suivi de l’actualité en temps réel : – Exemple sur SocialMention, Samepoint, 48ers…
• Suivi d’un thème sur Twitter, les réseaux sociaux…
• Outils de veille sur un sujet, une personne…
• Analyse, représentation de l’information
Moteurs de recherche en temps réel
98
• Social Mention, moteur social de recherche en temps réel, veille sur les réseaux sociaux
– Diversité et nombre de sources indexées : • Blogs • Microblogging• Commentaires de blogs• Plateformes de partage de signets • Sites de news généralistes• Sites d’événements• Images / Vidéos / Audio• Questions-réponses• Réseaux sociaux
Moteurs de recherche en temps réel : Social Mention Search
99
• Interface de recherche– Interface de recherche
simple
• Filtrage possible par les catégories de sources
• Filtrage par les sources elles-mêmes
Moteurs de recherche en temps réel : Social Mention Search
100100
• Interface de recherche– Interface de recherche avancée
• Affichée à la suite d’une première requête
Moteurs de recherche en temps réel : Social Mention Search
Cerner un sujet d’actualité sur le Web :Quelle évolution dans le traitement ?
102
• Google Trends – Permet de voir l’évolution de la fréquence des termes de recherche
– Exemple sur la transition énergétique :
Repérer les tendances : Google Trends
103
• Google Trends : fonctionnalités
– Chiffres indiqués : • Pas le nombre exact de requêtes• mais le rapport entre la quantité de recherches pour un terme
donné, par rapport au nombre total de recherches effectuées sur Google au cours de la même période
– Filtrages possibles sur :• Les modules de Google (Web, Actualités, Images…)
• Les dates
• Les pays
• Les catégories
• Les mots-clés associés
Repérer les tendances : Google Trends
104
Repérer les tendances : Google Trends
Exemple sur « energy transition »
105
• Google Flu Trends :– Suivi en temps réel de deux épidémies
mondiales : la grippe et la dengue– Application de Big Data développée par
Google :• Analyse des millions de requêtes des internautes
sur la grippe et la dengue• Localisation, détection des tendances• Application reconnue par les épidémiologistes
Suivre une épidémie : Google Flu
106
• La recherche sur les archives :
• Sur Google News : – Archives de presse : http://news.google.com/newspapers – Lancé en 2006, généralisé en 2008 – Recherche dans 200 ans d’archives de journaux– Mais en 2011 : arrêt du projet de numérisation des archives– Actuellement, restent disponibles : 3,5 millions de
publications issus de plus de 2000 journaux dans le monde, remontant jusqu’à 1752
Recherche d’archives avec Google News Archive
107
• European Library :• Données des bibliothèques nationales européennes• Accès à leurs ressources numériques et bibliographiques• Rubrique “Historic Newspapers” pour les archives de journaux
Recherche d’archives : European LIbrary
• Pour retrouver les ressources explorées :
– Liste Diigo « Veille Actualités »
Ressources