réseaux sociaux: une analyse centrée sur l'individu alina stoica orange labs & liafa

Post on 03-Apr-2015

108 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Réseaux sociaux: une analyse centrée sur l'individu

Alina STOICAOrange Labs & LIAFA

– p 2LIP6 10/06/2010Alina Stoica

Laboratoire SENSE: Sociologie des usages

Etudes du comportement de l'utilisateur (du client): Approche "qualitative": entretiens, enquêtes qualitatives

Approche "quantitative": études des traces d'usages• Communications par téléphone mobile• Utilisations des plateformes sociales en ligne (MySpace, Flickr, Twitter,

développées par Orange etc.)

Connaissance des clients: développement de services, offres adaptés, ciblage de clients etc.

– p 3LIP6 10/06/2010Alina Stoica

Bases de données (1)

Téléphonie mobile:

liste des communications entre les clients d'Orange en Belgique

Numéros chiffrés => identifiants Toutes les communications (appels et SMS) impliquant un ou deux clients Un mois de communication Données sociodémographiques (âge et sexe)

– p 4LIP6 10/06/2010Alina Stoica

Bases de données (2) Plateformes en lignes:

aspirations de profils à partir de quelques profils initiaux

BFS Toutes les informations du profil Liens déclarés avant l'aspiration

– p 5LIP6 10/06/2010Alina Stoica

Caractérisation des clients: analyse des usages

Téléphonie mobile: Nombre d'appels, durée, fréquence, nombre de SMS etc. Croiser avec les données sociodémographiques

Plateformes en lignes: Nombre de commentaires, quantité de contenu publié etc. Croiser avec les autres informations du profil

– p 6LIP6 10/06/2010Alina Stoica

Caractérisation des clients: analyse du réseau social

On modélise les relations observées

entre des personnes par

un graphe (réseau social)

les nœuds: les individus les liens correspondent aux relations observées

– p 7LIP6 10/06/2010Alina Stoica

Caractérisation des clients: approche centrée sur l'individu

Décrire comment chaque nœud (individu) est connecté dans le réseau

Analyse de la structure locale du réseau, autour de chaque nœud

Gros volumes de données

mesures avec petite complexité

– p 8LIP6 10/06/2010Alina Stoica

La méthode proposée Etape1: calcul du réseau égocentré d'un nœud (ego)

lister les triangles contenant ego

Eg(ego)

– p 9LIP6 10/06/2010Alina Stoica

Etape 2: énumération des patterns dans le réseau égocentré

– p 10LIP6 10/06/2010Alina Stoica

Exemple

10 nœuds: 4 isolés 5 liens: 1 isolés 2

1

1

– p 11LIP6 10/06/2010Alina Stoica

Description des liens formés par ego (positions de ses voisins)

Après étape 2: description de la façon dont ego est connecté dans le réseau

Etape 3: calcul des positions occupées par les contacts d'ego

Plusieurs positions dans un pattern:

– p 12LIP6 10/06/2010Alina Stoica

Etape 2: énumération des patterns dans le réseau égocentré Etape 3: calcul des positions dans les patterns

– p 13LIP6 10/06/2010Alina Stoica

Un autre exemple Etape1: calcul du réseau égocentré d'un nœud (ego)

– p 14LIP6 10/06/2010Alina Stoica

– p 15LIP6 10/06/2010Alina Stoica

Avantages

Applicable à tout réseau Connaissance locale du réseau Rapide

Motifs caractéristiques Description de la structure locale

Ego Les contacts d'ego (les liens d'ego)

Application Le réseau de téléphonie mobile Mobistar (Orange en Belgique)

– p 17LIP6 10/06/2010Alina Stoica

La base de données

Les communications (appels et SMS) des clients de Mobistar pendant octobre 2006

Un enregistrement: Les identifiants (anonymisés) des deux personnes L'heure La durée Le type (appel vocal ou SMS)

Pour chaque jour, 10 millions communications avec plus de 3 millions clients

– p 18LIP6 10/06/2010Alina Stoica

Le réseau social

Les nœuds: les clients de Mobistar Un lien entre deux nœuds:

au moins une communication dans chaque sens

3 millions de nœuds 6 millions de liens

– p 19LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (1) Un pattern est "caractéristique" si:

Définition 1: son nombre d'occurrences dans les réseaux égocentrés est supérieur à un seuil donné

– p 20LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (2) Un pattern est "caractéristique" si:

Définition 2: le nombre de réseaux égocentrés le contenant est supérieur à un seuil donné

– p 21LIP6 10/06/2010Alina Stoica

Patterns caractéristiques (3) Un pattern est "caractéristique" si :

Définition 3: son nb d'occurrences dans les réseaux égocentrés est supérieur au nb d'occurrences dans des réseaux générés aléatoirement

Pour chaque réseau égocentré, plusieurs générations en utilisant Orbis [1]

[1] P. Mahadevan, D. Krioukov, K. Fall and A. Vahdat, “Systematic topology analysis and generation using degree correlations,” SIGCOMM, 2006

– p 22LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego

– p 23LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la fréquence des appels

En moyenne, pour chaque motif:

Le contact qui parle le plus souvent avec ego

Les contacts suivants et

Le contact qui parle peu avec ego

– p 24LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la fréquence des appels

– p 25LIP6 10/06/2010Alina Stoica

Positions des contacts d'ego: la durée des appels

En moyenne, pour chaque motif:

Le contact qui la plus grande fréquence d'appel

Le contact qui la plus grande durée d'appel et

Le contact qui parle peu avec ego

– p 26LIP6 10/06/2010Alina Stoica

Commentaires sur les résultats Licoppe C., Smoreda Z., 2005, “Are social networks

technologically embedded? How networks are changing today with changes in communication technology,” Social Networks, vol. 27, no. 4, pp. 317–335

Deux registres de communication: Présence connectée Présence intermittente

Application Le réseau des artistes sur MySpace: Analyse de la popularité en ligne

– p 28LIP6 10/06/2010Alina Stoica

L'artiste MySpace, entrepreneur de sa notoriété

Nb de visites de la page

Nb de commentairesNb d'amis

"marketing de soi-même"

– p 29LIP6 10/06/2010Alina Stoica

Construction des données

Nb. total de profiles (artist ou fan) 21 153Nb. de profiles artist 13 936Nb. total de liens 143 831

Nb. de liens entre artistes 83 201

Réciprocité des liens 40.1%

Artists avec label “Major” 3 422

Artists avec label “Indie” 7 069

Artists sans label 3 445

Aspiration BFS à partir de 7 profils initiaux

– p 30LIP6 10/06/2010Alina Stoica

Clustering des artistes à partir de la popularité en ligne

On caractérise chaque artiste par un vecteur: Nb. de visites de sa page

audience Nb. de commentaires laissés sur sa page Nb. de gens l'avoir déclaré comme meilleur ami (autorité) Nb. d'artistes l'avoir déclaré comme meilleur ami (autorité artistique) Réciprocité de ses liens Label: "Major" (=3), "Indie" (=2) ou "Other" (=1)

On groupe les individus avec Kohonen SOM

– p 31LIP6 10/06/2010Alina Stoica

Résultat SOM

– p 32LIP6 10/06/2010Alina Stoica

Clustering des cellules

k-means clustering + expectation maximization algorithm

5 clusters

– p 33LIP6 10/06/2010Alina Stoica

Description des clusters Vert (3): superstars, avec le plus de notoriété, à la fois influents et

autoritaires; élites MySpace, avec une forte stratégie marketing online, populaires dans les medias traditionnels

Bleu foncé (2): artistes influens avec une notoriété plus faible que les superstars mais avec une stratégie marketing efficace; souvent trendy, avant-garde music.

Orange (5): artistes dynamiques d'un point de vue social, avec audience faible; groupes d'artistes non-professionnels bien intégrés dans des scènes locale

Bleu (1): artistes avec une audience moyenne, faible autorité et peu de liens réciproques; sans stratégie MySpace importante

Rouge (4): artistes anonymes avec peu d'audience et sans pratique sociale active

Nord

Sud

Ouest Est

Audience + Autorité

Réciprocité

– p 34LIP6 10/06/2010Alina Stoica

A degré égal

– p 35LIP6 10/06/2010Alina Stoica

A nombre de liens égal

– p 36LIP6 10/06/2010Alina Stoica

Caractérisation des liens

En utilisant les positions dans les patterns:

Clusters 1 et 4: liens sortants vers 3

Cluster 2: liens réciproques avec lui-même

Cluster 3: liens réciproque avec lui-même dans les positions centrales et intermédiaires liens entrants avec 4 dans les positions périphériques

Cluster 5: liens réciproques avec 2 et 5 dans les positions centrales liens sortant vers 3 dans les autres positions

– p 37LIP6 10/06/2010Alina Stoica

On peut envisager de

Faire des catégories de nœuds pour grouper les nœuds qui se connectent de la même façon au réseau

rôle identifier les nœuds "spéciaux"

nœuds influents, leaders sociaux comparer à des caractéristiques exogènes au réseau

prédiction

Mesurer l'évolution

Merci!

top related