réseaux sociaux: une analyse centrée sur l'individu alina stoica orange labs & liafa

38
Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Upload: ines-quentin

Post on 03-Apr-2015

108 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Réseaux sociaux: une analyse centrée sur l'individu

Alina STOICAOrange Labs & LIAFA

Page 2: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 2LIP6 10/06/2010Alina Stoica

Laboratoire SENSE: Sociologie des usages

Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives

Approche "quantitative": études des traces d'usages• Communications par téléphone mobile• Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter,

développées par Orange etc.)

Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc.

Page 3: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 3LIP6 10/06/2010Alina Stoica

Bases de données (1)

Téléphonie mobile:

liste des communications entre les clients d'Orange en Belgique

Numéros chiffrés => identifiants Toutes les communications (appels et SMS) impliquant un ou deux clients Un mois de communication Données sociodémographiques (âge et sexe)

Page 4: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 4LIP6 10/06/2010Alina Stoica

Bases de données (2) Plateformes en lignes:

aspirations de profils à partir de quelques profils initiaux

BFS Toutes les informations du profil Liens déclarés avant l'aspiration

Page 5: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 5LIP6 10/06/2010Alina Stoica

Caractérisation des clients: analyse des usages

Téléphonie mobile: Nombre d'appels, durée, fréquence, nombre de SMS etc. Croiser avec les données sociodémographiques

Plateformes en lignes: Nombre de commentaires, quantité de contenu publié etc. Croiser avec les autres informations du profil

Page 6: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 6LIP6 10/06/2010Alina Stoica

Caractérisation des clients: analyse du réseau social

On modélise les relations observées

entre des personnes par

un graphe (réseau social)

les nœuds: les individus les liens correspondent aux relations observées

Page 7: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 7LIP6 10/06/2010Alina Stoica

Caractérisation des clients: approche centrée sur l'individu

Décrire comment chaque nœud (individu) est connecté dans le réseau

Analyse de la structure locale du réseau, autour de chaque nœud

Gros volumes de données

mesures avec petite complexité

Page 8: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 8LIP6 10/06/2010Alina Stoica

La méthode proposée Etape1: calcul du réseau égocentré d'un nœud (ego)

lister les triangles contenant ego

Eg(ego)

Page 9: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 9LIP6 10/06/2010Alina Stoica

Etape 2: énumération des patterns dans le réseau égocentré

Page 10: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 10LIP6 10/06/2010Alina Stoica

Exemple

10 nœuds: 4 isolés 5 liens: 1 isolés 2

1

1

Page 11: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 11LIP6 10/06/2010Alina Stoica

Description des liens formés par ego (positions de ses voisins)

Après étape 2: description de la façon dont ego est connecté dans le réseau

Etape 3: calcul des positions occupées par les contacts d'ego

Plusieurs positions dans un pattern:

Page 12: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 12LIP6 10/06/2010Alina Stoica

Etape 2: énumération des patterns dans le réseau égocentré Etape 3: calcul des positions dans les patterns

Page 13: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 13LIP6 10/06/2010Alina Stoica

Un autre exemple Etape1: calcul du réseau égocentré d'un nœud (ego)

Page 14: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 14LIP6 10/06/2010Alina Stoica

Page 15: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 15LIP6 10/06/2010Alina Stoica

Avantages

Applicable à tout réseau Connaissance locale du réseau Rapide

Motifs caractéristiques Description de la structure locale

Ego Les contacts d'ego (les liens d'ego)

Page 16: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)

Page 17: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 17LIP6 10/06/2010Alina Stoica

La base de données

Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006

Un enregistrement: Les identifiants (anonymisés) des deux personnes L'heure La durée Le type (appel vocal ou SMS)

Pour chaque jour, 10 millions communications avec plus de 3 millions clients

Page 18: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 18LIP6 10/06/2010Alina Stoica

Le réseau social

Les nœuds: les clients de Mobistar Un lien entre deux nœuds:

au moins une communication dans chaque sens

3 millions de nœuds 6 millions de liens

Page 19: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 19LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (1) Un pattern est "caractéristique" si:

Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné

Page 20: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 20LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (2) Un pattern est "caractéristique" si:

Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné

Page 21: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 21LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (3) Un pattern est "caractéristique" si :

Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement

Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1]

[1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006

Page 22: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 22LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego

Page 23: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 23LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la fréquence des appels

En moyenne, pour chaque motif:

Le contact qui parle le plus souvent avec ego

Les contacts suivants et

Le contact qui parle peu avec ego

Page 24: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 24LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la fréquence des appels

Page 25: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 25LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la durée des appels

En moyenne, pour chaque motif:

Le contact qui la plus grande fréquence d'appel

Le contact qui la plus grande durée d'appel et

Le contact qui parle peu avec ego

Page 26: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 26LIP6 10/06/2010Alina Stoica

Commentaires sur les résultats Licoppe C., Smoreda Z., 2005, “Are social networks

technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335

Deux registres de communication: Présence connectée Présence intermittente

Page 27: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne

Page 28: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 28LIP6 10/06/2010Alina Stoica

L'artiste MySpace, entrepreneur de sa notoriété

Nb de visites de la page

Nb de commentairesNb d'amis

"marketing de soi-même"

Page 29: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 29LIP6 10/06/2010Alina Stoica

Construction des données

Nb. total de profiles (artist ou fan) 21 153Nb. de profiles artist 13 936Nb. total de liens 143 831

Nb. de liens entre artistes 83 201

Réciprocité des liens 40.1%

Artists avec label “Major” 3 422

Artists avec label “Indie” 7 069

Artists sans label 3 445

Aspiration BFS à partir de 7 profils initiaux

Page 30: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 30LIP6 10/06/2010Alina Stoica

Clustering des artistes à partir de la popularité en ligne

On caractérise chaque artiste par un vecteur: Nb. de visites de sa page

audience Nb. de commentaires laissés sur sa page Nb. de gens l'avoir déclaré comme meilleur ami (autorité) Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) Réciprocité de ses liens Label: "Major" (=3), "Indie" (=2) ou "Other" (=1)

On groupe les individus avec Kohonen SOM

Page 31: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 31LIP6 10/06/2010Alina Stoica

Résultat SOM

Page 32: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 32LIP6 10/06/2010Alina Stoica

Clustering des cellules

k-means clustering + expectation maximization algorithm

5 clusters

Page 33: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 33LIP6 10/06/2010Alina Stoica

Description des clusters Vert (3): superstars, avec le plus de notoriété, à la fois influents et

autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels

Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music.

Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale

Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante

Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active

Nord

Sud

Ouest Est

Audience + Autorité

Réciprocité

Page 34: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 34LIP6 10/06/2010Alina Stoica

A degré égal

Page 35: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 35LIP6 10/06/2010Alina Stoica

A nombre de liens égal

Page 36: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 36LIP6 10/06/2010Alina Stoica

Caractérisation des liens

En utilisant les positions dans les patterns:

Clusters 1 et 4: liens sortants vers 3

Cluster 2: liens réciproques avec lui-même

Cluster 3: liens réciproque avec lui-même dans les positions centrales et intermédiaires liens entrants avec 4 dans les positions périphériques

Cluster 5: liens réciproques avec 2 et 5 dans les positions centrales liens sortant vers 3 dans les autres positions

Page 37: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

– p 37LIP6 10/06/2010Alina Stoica

On peut envisager de

Faire des catégories de nœuds pour grouper les nœuds qui se connectent de la même façon au réseau

rôle identifier les nœuds "spéciaux"

nœuds influents, leaders sociaux comparer à des caractéristiques exogènes au réseau

prédiction

Mesurer l'évolution

Page 38: Réseaux sociaux: une analyse centrée sur l'individu Alina STOICA Orange Labs & LIAFA

Merci!