gestion des donnees personnelles
Post on 19-Dec-2014
5.607 Views
Preview:
DESCRIPTION
TRANSCRIPT
Gestion des données
personnellesLyon-Montréal.
13 Mai 2011
Olivier Ertzscheid // Maître de conférences// Sciences de l’information et de la communication //
Université de Nantes // IUT La Roche sur YonSite : http://www.affordance.info
Moteurs et réseaux sociaux
Quelle clef de voûte pour une architecture de l’information ?
Le pitch
• CONSTAT.– Le web : un gigantesque entrepôt de données en mouvement.– Dont des données « personnelles ». Beaucoup.– Les moteurs et les réseaux sociaux s’en nourrissent. – Nous les alimentons sans cesse.
• QUESTIONS.– Pourquoi ? – D’où viennent ces données ? – Comment sont-elles traitées ? Dans quel but ? – Comment les « données personnelles » en sont-elles venues à occuper
une telle place dans un média de masse numérique ? – Que changent-elles dans « les » pratiques documentaires ? Dans nos
représentations de la documentation et de l’information ?2
PRÉAMBULE1934. 1978. 2011.
3
1934. Paul Otlet. Traité de documentation.
4Architecture de l’information = « traitement documentaire »
1978. Le projet SAFARI
• projet des années 70 d’interconnexion des administrations à partir d’un matricule commun dont le rejet avait été à l’origine de la loi "Informatique, fichiers et libertés" du 6 janvier 1978.
• http://www.legalis.net/breves-article.php3?id_article=870 5
INTERCONNEXION
6
2011. La famille des données documentaires s’agrandit ...
Plus qu’interconnectées, des données réunifiées
1995
2005
2011
Web public
Web privéWeb « invisible »
Web personnel(Desktop)
Web intime(Mail)
Web public Web privé
Web personnel(Desktop)
Web intime(Mail)
Web extime(blogs)
Web public Web privé
Web personnel(Desktop)
Web intime(Mail)
Web extime(blogs)
indexé
non-indexé
7
Dérive des continents documentaires, des « gisements de données »
ARCHITECTURE DE
L’INFORMATION
8
Architecture ?
9
« L’architecture, c’est ce qui reste de l’édifice, une fois la pierre ôtée. » Plotin.
Architecture de l’information ?
10
« L’architecture de l’information, c’est ce qui reste une fois l’information ôtée. »
du systèmede la navigationde la recherchede l’infrastructuredes données
du systèmede la navigationde la recherchede l’infrastructuredes données
Archi de l’info selon Google
• Une architecture de serveurs (datacenters)• Une architecture de pages (PageRank)• Une architecture de relations (liens entre
les pages)• Lectures industrielles
• Ecosystème ouvert (galaxie de services) et entonnoir central
• Une indexation d’info documentaires + ingénierie « de popularité » (procède par agglutination)
11
Archi de l’info selon Facebook
• Une architecture de serveurs (datacenters)• Une architecture de profils (graphe social) • Une architecture de relations (liens entre les
profils)• Industrialisation de l’intime
• Ecosystème fermé avec droit de douanes pour services tiers.
• Une collecte d’informations personnelles déclaratives + ingénierie virale (procède par contamination)
2 écoles ?
Similarités Différences
12
Navigation
Données
Serveurs &Datacenters
Degré zéro de l’architecture de l’info
Services
13
Architecture de l’info 2.0
Architecture de l’info 1.0
Le portail du visible
La clé vers l’invisible
Données
Données ???
Architecture de l’info 2.0
14Navigation
Datacenters
Serveurs
15
Architecture de l’info 2.0
Services
Services
Services
16
Architecture de l’info 2.0
Données
Données
Données
Données
17
Entre design ...(services, navigation, etc.)
Et industrie lourde(infrastructures, datacenters, gisements de données etc.)
Architecture de l’information
DESIGN & FOUILLE DE DONNÉES
18
Design visible• Ravalement de façade• Logos (colorés), Coins (arrondis),
Couleurs (pastels), Polices (typos), etc.
19
Design invisible• Ergonomie « souterraine »• Rich snippets, Microformats,
RDF• Web-Services• Web socio-sémantique
Expérience utilisateur. Clic gagnant
+
LOOK... and ... FEEL
20
Design de données (exemples)
« Journalisme de données » http://data.owni.fr
Générateur de visualisations.http://www-958.ibm.com/software/data/cognos/manyeyes/
Nouvelle(s) expérience(s) documentaire(s)
Fouille de données : du datamining au web-mining
21
Mr Google
Mr Facebook
données
Privacy zone
22
Les nouvelles mines sont ... dans les nuages
Données sont aussi des métadonnées
23
• Géolocalisation sur Foursquare + partage dans Facebook
– Données : latitude, longitude, horaire, nom du bar lounge.
– Métadonnées : comportementales
• Recherche d’info sur Google– Ma requête sur Google = donnée « mot-
clé »– Toutes mes requêtes sur Google
(historique) = métadonnées documentaires
Question de point de vue
Avant, pendant, après. Des données sur tout. Des données partout. Des données pour tout.
24
A. Mes données et leur historique(déclaratives, comport. et techniques)
B. Les données de mes prochesCouche Ingénieries relationnelles
C. Les données de tout le mondePassage à l’échelle (statistique)
Mes données et celles de mes proches
(A and B)
Mes données ou celles de mes proches et
celles de tout le monde(A or B) and C
Mes données et celles de tout le monde
(A and C)
Les données de mes proches et celles de tout le monde
(B and C)
Sur un site marchand AMAZON.COM
Données « natives »« intentions d’achat »,
« préférences »
Sur un site marchand AMAZON.COM
Données « natives »« intentions d’achat »,
« préférences »
Sur un site social FACEBOOK.COM
Données « captives »Rétention
« amis, groupes, réseaux »
Sur un site social FACEBOOK.COM
Données « captives »Rétention
« amis, groupes, réseaux »
Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL
Données natives et « moissonnées »
Dans 1 écosystème ouvert de sitesGOOGLE / YOUTUBE / GMAIL
Données natives et « moissonnées »
Que possèdent-ils ?? Des donnéesQue possèdent-ils ?? Des données
Qu’en font-ils ?? Des croisementsQu’en font-ils ?? Des croisements
Comment procèdent-ils ?? Par captationComment procèdent-ils ?? Par captation
Que produisent-ils ? D’autres données, de la richesse et de la redocumentarisationQue produisent-ils ? D’autres données, de la richesse et de la redocumentarisation
1er exemple.
25
26« Données »
1. Documents d’identité
27
2. Documenter l’identité
« Information »
28
3. « Redocumentariser » l’identité
« Redocumentariser, c’est documentariser à nouveau un document ou une collection en permettant à un bénéficiaire de réarticuler les contenus sémiotiques selon son interprétation et ses usages. » Manuel Zacklad in « Eléments théoriques pour l’étude des pratiques grand public de la documentarisation : réseaux et communautés d’imaginaire »
« connaissances »
Redocumentarisation par l’exemple :Facebook EST L’interface
« 1 » identitédocumentéedocumentaire
« n » profils
« x » profondeurs
29
LA GUERRE DES DONNÉES
30
Données personnelles ?
31
DES DONNEES « Ensemble des informations qui permettent sous quelque forme que ce soit, directement ou
non, l’identification des personnes physiques auxquelles elles se rapportent ». DES TRAITEMENTS « toute opération ou ensemble d’opérations portant sur des données à caractère personnel,
quel que soit le procédé utilisé ». Collecte, enregistrement, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction »
Lionel MAUREL
Techniques : Adresse IP, Cookies ...
Déclaratives : mon profil facebook, date de naissance ...
Navigationnelles : requêtes, types d’achats ...
Comportementales (diachroniques) : historique de recherche
C’est la loi
32
INFORMATION. La loi impose d’informer les personnes « fichées » que des données nominatives les concernant sont collectéesDROIT DE RETRAIT. NON-DIVULGATION À DES TIERS.DATE LIMITE DE VALIDITÉ.
SOURCE : LIONEL MAUREL
C’est le business
Pot de terre des législations nationales contre ...(jack)pot de fer de la dérégulation des marchés
Fichiers « log »A chaque fois qu’un utilisateur se connecte, le
serveur enregistre un log.
33
123.45.67.89 - 25/Mar/2007 10:15:32 - http://www.google.com/search?q=flowers - Firefox 2.0.0.7; Windows NT 5.1 - dac465aa86edd2dc
• « This idea that a cookie is nonpersonal information no longer really applies in this digital age. You don't need to know a person's name to know a person — to understand their likes and their dislikes, the contents of what they read, what they put in their shopping cart. It's really personal now. » Jeff Chester, directeur exécutif du Center for Digital Democracy
• Personna numerique VS DATA
COOKIES
De 2003 à 2005, Google cookie expirant en 2038 ...Préconisations G29 (rassemblement CNIL européennes) : 6 moisGoogle : Adresse IP « anonymisée » au bout de 9 mois (2 derniers chiffres seulement) Cookies supprimés au bout de 18 moisMicrosoft : cookies supprimés au bout de 6 mois
Petites machineries entre amis.
Pacte Faustien ??
• Pourquoi cette quête de données personnelles ?– Pour lutter contre l’infobésité (personnalisation)– Pour maintenir un modèle économique (marketing ciblé, pub. contextuelle)– Pour améliorer l’expérience utilisateur (personnalisation) 34
Participation
active ...
35
et massive
!!!
Base de donnée des intentions (John Battelle)
36
« We don’t need taxonomy of knowledge. We need taxonomy of desire, a marketplace of intent » Prabhakar Raghavan.
Head of Research and Strategy chez Yahoo! Sept. 2008
Le carré magique des usages
37
SHOPPING (digital
cameras)
HEALTH (Diabetes)
TRAVEL (United 875)
LOCAL (French
Restaurant)
Rech
erch
e U
nive
rsel
le :
le p
rinci
pe
38
• Données « personnelles, sociales » (mes amis, mes amours, mes emmerdes) ? Territoires de socialisation
• Données intentionnelles (achat, déplacement, sorties, restaurant) ? Territoire du marketing
• Données documentaires (textes, statuts, articles, photos, vidéos, tags ...) ? Territoire de la qualification 39
La guerre des données ?
40
2ème exemple.
41
La guerre des carnets d’adresses
• Mais d’abord une devinette.• Bataille Google / Facebook. • Enjeu : amorçage.• Résultat : olivier.ertzscheid@facebook.com• Courriel = cheval de troie idéal de nos
pratiques connectées. Pourquoi ?– "synthétise" notre réseau relationnel (nos "contacts"),– point d'entrée le plus aisé vers le cloud computing– "intime", "personnel » (pub contextuelle)– point pivot autour duquel hiérarchiser l'ensemble des
autres données
42
3ème exemple. Le cas Facebook 43
Facebook privacy policy timeline(cf http://www.eff.org/deeplinks/2010/04/facebook-timeline/)
44
« No personal information that you submit to Thefacebook will be available to any user of the Web Site who does not belong to at least one of the groups specified by you in your privacy settings »
2005 « Moi et les miens »
45
We understand you may not want everyone in the world to have the information you share on Facebook; that is why we give you control of your information. Our default privacy settings limit the information displayed in your profile to your school, your specified local area, and other reasonable community limitations that we tell you about.
2006
Moi et ma communauté étenduePrivauté « par défaut »
2007
Profile information you submit to Facebook will be available to users of Facebook who belong to at least one of the networks you allow to access the information through your privacy settings (e.g., school, geography, friends of friends). Your name, school name, and profile picture thumbnail will be available in search results across the Facebook network unless you alter your privacy settings.
Arrivée du « search »Arrivée de l’opt-out
Certain categories of information such as your name, profile photo, list of friends and pages you are a fan of, gender, geographic region, and networks you belong to are considered publicly available to everyone, including Facebook-enhanced applications, and therefore do not have privacy settings.
46
Information set to “everyone” is publicly available information, may be accessed by everyone on the Internet (including people not logged into Facebook), is subject to indexing by third party search engines, may be associated with you outside of Facebook (such as when you visit other sites on the internet), and may be imported and exported by us and others without privacy limitations. The default privacy setting for certain types of information you post on Facebook is set to “everyone.” You can review and change the default settings in your privacy settings
Nov.2009
Abolition de la frontière « plateforme »Opt-out systématique et étendu
Abolition pure et simple de la privauté « profilaire », « identitaire »
Déc.2009
4ème exemple. Syndrome de Blanche-Neige
© http://www.radidesigners.com/miroir1.htm
47
L’illusion de la page blanche
48
Le syndrôme de Blanche-Neige
49
Attention !!!!!
50
Pêché originel
cherche …
51
Moi …
52
CONSÉQUENCES
53
Pour ...
Mon nom est personne
• Personnalisation :– « Invisible »– « Persistante »– « Participative »
54Pour l’individu
Une « universalité »
trèstrèstrès
« personnalisée »
ALGORITHMIE AMBIANTE
55Pour « la société »
Facebook comme nouveau panopticon.
56
Surveillance ET sous-veillance.LITTLE SISTERS
Pour les « communautés »
Cocktail explosifPersonnalisation
+ « universalité » des recherches+ Migration dans les nuages+ Massification (des accès)+ Communautarisation (des pratiques)+ Économie de l’attention+ Confusion des pratiques
57
=Pour les enjeux documentaires
• Ce que l’on savait déjà :– Explosion de la masse documentaire
• Ce que l’on ne savait pas : – Bombe à fragmentation
• Fragmentation– Des documents (world wide web)– Des usages– Des synchronicités (world life web)– Des modalités
• de diffusion, d’appropriation, d’édition …
BOUM !
58Pour les enjeux documentaires
59
5ème et 6ème exemples.
60
Moteur de recherche « de voisinage »
61
Everyblock.com / http://chicago.everyblock.com/news/
Adresse / numéro de sécurité sociale / historique déménagements et changements d'adresse depuis 10 ans / Date de naissance / Casier judiciaire / Diverses amendes / Dates mariages et divorces / le nom et n° tél voisins / Montant du bien immobilier qu'il possède (sa maison), sa date d'achat et le nom de celui qui lui a vendu / la taille du "lot" (cadastre) sur lequel elle (sa maison) est implantée / une vue satellite de chez lui / Âge moyen des femmes et des hommes habitant dans son voisinage / Nombre de meurtres, de viols, de vols de véhicule et autres larcins dans son quartier / Composition ethnique du quartier / Niveau d'éducation et les langues parlées / les permis qu'il possède (permis de conduire mais aussi permis bateau, avion, moto, etc ...)
http://www.Intelius.com
62
"Nous cherchons dans des milliards de données publiques pour vous aider à trouver ce que vous cherchez. Nous analysons des listes de vente, des commandes sur catalogue, des abonnements à des magazines, des enregistrements d'adresse, des enregistrements de propriété immobilière, des arrêts de cour (...) et toute une série d'autres enregistrements publics et de sources publiques pour vous."
CONCLUSION
1 constat. 1 morale. 2 questions. 3 conseils.
63
64
information
connaissanceconnaissance
Documents
individus
DONNÉESDONNÉES
Changement de perspective
"nous sommes en train de passer d'un web de documents connectés à un web de données connectées." John Markoff. NY Times. 12 No. 2006 http://www.nytimes.com/2006/11/12/business/12web.html
DONNÉES
Traitement documentaire Traitement computationnel
Moralité ?
• Pour les moteurs …• Pour les réseaux sociaux
« un document »
Indexable, cherchable, Profilable, « monétisable » …
65
66
« L’antilope qui court dans les plaines d’Afrique ne peut être considérée comme un document…»
« Mais si elle est capturée… et devient un objet d’études, on la considère alors comme un document. Elle devient une preuve physique. » Suzanne Briet
67
Quelle clé de voûte pour l’architecture de l’information ?
?
requêtes
profils
usages
Documents
informations
Individus
d o n n é e s
d o n n é e s
d o n n é e s
d o
n n
é e
s
d o n n é e s
d o n n é e s
d o n n é e s
d o n n é e s
d o n n é e s
Quel écosystème informationnel ?
Indexation
Mer des pratiques
Moteurs & réseaux sociaux
Monétisation
Océan des données
Collaboration, participation,
User Generated Content
Résultats
Technologies de la capillarité
Comportements, profils 69
Moteurs & réseaux sociaux
70
Et 2 conseils de lecture
Le mien• Le web, TOUT le web, est un espace public. AUCUNE « intimité » n’y est
possible. Au mieux peut-on espérer quelques infimes zones de privauté sur quelques parcelles d’espace semi-publics.
• « Quand la technologie devient l’architecte de notre intimité ». Hubert Guillaud in Internet Actu. En ligne : http://www.internetactu.net/2011/01/19/quand-la-technologie-devient-larchitecte-de-notre-intimite/
• « Scroogled » de Cory Doctorow. Trad. Française « Engooglés »
.Merci..?. questions .?. questions .?.
SAV : olivier.ertzscheid AT gmail.com
71
top related