analyse de données sociales

24
Analyse de données sociales Pablo Jensen IXXI, LP ENS Lyon financé par IXXI – Mastodons MI CNRS collaboration avec médialab, Sciences Po (Paris) merci gephi.org !

Upload: trinhnhan

Post on 05-Jan-2017

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analyse de données sociales

Analyse de données sociales

Pablo Jensen

IXXI, LP ENS Lyon

financé par IXXI – Mastodons MI CNRScollaboration avec médialab, Sciences Po (Paris)

merci gephi.org !

Page 2: Analyse de données sociales

IXXI  : favoriser collaborations, émergence communautés recherche interdisciplinaire (info, maths, physique... bio, santé, SHS)

Priorité  : Révolution numérique, changement sociaux majeurs : données = pétrole du XXIème siècle.

• équilibre liberté individuelle / bien commun ?

• Importance économique des systèmes d’intermédiation, qui contrôlent les fux et ont l’exclusivité sur les données secondaires ?

• Pourquoi l’Europe incapable de produire Google ou Facebook, alors que la Chine a su créer des systèmes qui rivalisent avec les géants américains ?

Page 3: Analyse de données sociales

F Puech (LET)C Baume, B Gagnaire (Chambre Commerce)G Duranton (Toronto)J Fraîchard (INSEE) J Michel (ENS Lyon, Maths)

Comprendre (prédire?) la localisation des commerces

Page 4: Analyse de données sociales

Déterminants de la localisation

– type de produit vendu – surface du magasin (loyer)– environnement commercial (effet Pimkie)– caractéristiques de la clientèle locale– accessibilité (voiture, transports en commun)– marché spécifique (musique près Conservatoire)– type de produit vendu (alimentaire ou non)

date d'implantation, opportunité (angle), rue passante

Trop compliqué pour un physicien !

Page 5: Analyse de données sociales

• Quantifying interactions between activities

• Basic idea : interactions between activities A and B can be deduced from relative locations of A and B stores.

• Spatial quantification adapted to the inhomogeneities of urban regions (no stores in parks, rivers...): Duranton (2005), Puech (2006)

**

*

**

*

*

*

*

Page 6: Analyse de données sociales

• Exemple : magasins de chaussures

• concentrés !

Page 7: Analyse de données sociales

• Exemple : boulangeries à Lyon

• Répulsion r < 150m

Page 8: Analyse de données sociales

• Quantifier la qualité d'un emplacement

• Philosophie : si autour de x,y “amis” de boulangerie et pas d'ennemis, alors bon emplacement pour boulangerie

QA (x,y) = ∑

B a

B A N

B(x,y)

Q bon indicateur qualité ?

Nb de magasins B voisins en x,y

Page 9: Analyse de données sociales

Boulangerie

★ Point chaudCarte de Lyon indiquant (en rouge) les bons sites potentiels pour ouvrir des boulangeries

Page 10: Analyse de données sociales

• Nouvelles boulangeries : implantées sur les bons sites

Bon indicateur qualité ?

Page 11: Analyse de données sociales

• Faillites des boulangeries : plutôt localisées sur de mauvais emplacements

Bon indicateur qualité ?

Page 12: Analyse de données sociales

• Développement d'un logiciel avec la CCI et AID Observatoire

– Points forts : rapide, embrasse toute la ville

– Points faibles : bases données incomplètes, interprétation

– http://www.lyon.cci.fr/site/cms/33912/Lokeo--un-outil-geomarketing-gratuit-d-aide-a-l-implantation-commerciale-?id=33912

Aide à la décision

Page 13: Analyse de données sociales

Draw (and govern?) scientific institutions through scientometrics

dessine-moi l'ENS...

How to draw an institution on a sheet of paper ?

Web of Science search on address Several global maps Less reductionist than indicators (as h) Distinction between reliable knowledge

on metrics (formally robust indicators) and socially robust knowledge on metrics use (deliberation between stakeholders)

Not so big data, big / relevant ?

Page 14: Analyse de données sociales

● Matériau de départ : articles (Web of Science, peu SHS) + traitements pour extraire masse infos

● Communautés thématiques (> 10 000 articles) – Domaine de recherche : systèmes complexes– France entière, 2007-2010

● Réseaux hétérogènes détaillés (< 10 000 articles)

● Recherches en cours :● Indicateurs topologiques des rôles des noeuds,

interdisciplinarité● dynamique

Page 15: Analyse de données sociales
Page 16: Analyse de données sociales

Bibliographic coupling

Page 17: Analyse de données sociales

L is the total number of linksls links inside module s, ds total degree of nodes in module s.

Page 18: Analyse de données sociales

Structure de la recherche en France(320 000 articles publiés 2007 - 2010)

Page 19: Analyse de données sociales

Exemple : complex networks (482 articles)Subject (JSC) %Computer Science 24Engineering 12Physics, Math 11Telecomm 9Physics, Multidisc 9Information Systems 7Mathematics 7…Biology 3Infectious Disease 2Public Health 2Business 1Sociology 1

Integration très forte3ème, après Économétrie/énergie (160 art)Management (1100 art)

Page 20: Analyse de données sociales

ENS de LyonGephi.org

Page 21: Analyse de données sociales

Institut pluridisciplinaire Hubert Curiens

“Créé en 2006, l'IPHC estun exemple de réussite de la pluridisciplinarité : trois laboratoires de culture scientifique différente (physique subatomique, chimie et eco-physiologie)regroupés en un institut unique.”

Unité scientifiqueou administrative ?

Page 22: Analyse de données sociales

Discussion

● What knowledge generated from these studies?Compare to usual social sciences, Actor-Network theory :-(

● Useful for :● scientists in the labs? ● CNRS/Labex (iMust)/Idex (Grenoble) policy?

● Help centers or individuals (both?) ● Big data = global vision from the center, already

in 19th century, birth of strong States● Favor refexivity!

Page 23: Analyse de données sociales
Page 24: Analyse de données sociales

La recherche en France (2010)Web of Science, 70 000 articles

Noeud = articleLien = co-référenceGroupes : modularité