aggate - actu environnement · régis! directeurgénéral ! apca! durand! patrice! directeur!...
Post on 10-Nov-2018
215 Views
Preview:
TRANSCRIPT
Octobre 2016
MISSION
Jean-‐Marc BOURNIGAL
AgGate
Portail de données
SOMMAIRE
5
6
7
9
15
16
1_ 17
1.1_ 18
1.2_ De plus en plus de données générées 19
1.3_ Le portail de données agricoles 19
1.4_ 22
2_ 29
3_ 31
3.1_ La démarche 32
3.2_ Origine des données 32
3.3_ 34
3.4_ Accessibilité des données 34
3.5_ Les aspects juridiques de la donnée 34
4_ 39
4.1_ 40
4.2_ 43
4.3_ 44
4.4_ 46
4.5_ 48
5_ 51
5.1_ « Cloud agriculteurs » : espace d’hébergement des données privées des agriculteurs 52
5.2_ Le « magasin numérique » 53
5.3_ 53
5.4_ Espace d’échange entre acteurs de la profession agricole 54
5.5_ Conclusion 55
6_ 57
6.1_ 58
6.2_ Interconnexion 62
6.3_ 63
6.4_ 66
6.5_ Ergonomie, design et charte graphique 66
7_ 67
7.1_ 68
7.2_ 68
7.3_ Convaincre les producteurs et fournisseurs de données 69
7.4_ Liens avec la recherche 70
8_ 73
8.1_ Calendrier 74
8.2_ 75
9_ 79
9.1_ Les enjeux du portail 80
9.2_ Facteurs de succès et risques principaux 80
9.3_ 83
10_ ANNEXES 85
10.1_ 86
10.2_ 89
10.3_ 95
10.4_ 120
10.5_ 122
10.6_ Annexe 6 -‐ La structure juridique d’un portail de données 123
5
Remerciements conduit par une équipe mise en place au
rstea :
Véronique Bellon-‐Maurel, Directrice du Département Ecotechnologies Pascal Odot, Directeur des affaires juridiques Laurence Freyt-‐Caffin, Adjointe au directeur des affaires juridiques Céline Delmas, Juriste Emmanuelle Jannes-‐Ober, Directrice adjointe déléguée et Charles Moszkowicz de la société ENEO à laquelle il a été fait appel pour une assistance à
maitrise d'ouvrage dans la réalisation de la mission.
pour ses conseils avisés, à la Direction de la Information Scientifique et Technique pour son apport
documentaire aux membres du comité de pilotage de la mission.
Je tiens à remercier les parties prenantes -‐ éditeurs de logiciels, agro-‐équipementiers, agriculteurs, stituts techniques, organismes de recherche, ministères -‐ réunies en atelier
le 22 juin dernier.
Pou en nous aidant à affiner notre vision. Je tiens à
adresser toute ma gratitude à plusieurs personnes avec lesquelles les interactions ont été répétées et fécondes (Catherine Migault et Isabelle Serrot, du Crédit Agricole, Muriel Monteiro et Natalia Danon-‐Boileau, de la société Bearing Point, Pierre-‐Olivier Gibert de la société Digital Ethics, Gaylord Marchesseau de la société OpenDataSoft), mais également celles qui nous ont aidées à dresser
d'information au Ministère de l'agriculture, de l'agroalimentaire et de la forêt , Agnès Salaün, chargée de mission chez Arvalis, GIS GC HP2E).
Enfin, merci aux spécialistes de la donnée qui nous ont éclairés sur les subtilités de ces nouveaux territoires et sans lesquels nous aurions pu nous perdre, en particulier Romain Tales, mission ETALAB, Patrick Valduriez et Marie-‐ nria, Catherine Roussey, François Pinet et Jean-‐Pierre Chanet Irstea à Clermont-‐Ferrand.
6
Membres du comité de pilotage
Noms Prénoms Fonctions Organismes
BADUEL Valérie Inspectrice générale de la santé publique vétérinaire
DGER (MAAF)
BAILLE
Annick Conseillère pour l'enseignement agricole, la recherche et les relations sociales
Cabinet agriculture
BELLON-‐MAUREL Véronique Directrice du département Écotechnologies
Irstea
BOURNIGAL Jean-‐Marc Président Irstea
DUBARRY Cécile Chef du service des nouvelles
de la communication
DGE (MAAF)
KAO Cyril Sous-‐directeur de la recherche, de l'innovation et des coopérations internationales
DGER (MAAF)
MAHE Sylvain Chargé de mission Direction générale de la recherche
(MENESR)
METEYER Hervé chef du bureau Logiciel DGE (MAAF)
MONTUSCLAT Sébastien responsable sectoriel numérique BPI France
NORDEN Gary Chargé de mission DGE (MAAF)
ODOU Grégoire Conseiller auprès de la Secrétaire
TALES Romain Responsable du recensement des données publiques
Etalab
TURENNE Julien Chef du service compétitivité et performance environnementale DGPE (MAAF)
VERGES Elisabeth Chef du Secteur environnement, agronomie, écologie, sciences du système Terre et de l'univers
DGRI (MENESR)
VOYATZAKIS Ariane Responsable du secteur Agroalimentaire
BPI France
7
Liste des personnes rencontrées
Noms Prénoms Fonctions Organismes
BABINET Gilles Commission européenne
BARBE Eric Directeur adjoint UMR TETIS Irstea
BARDOU Aida Commerciale Orange
BARRAQUE Gabrielle FNSafer
BEULIN Xavier Président FNSEA
BOSCHET Agnès WIKANE
BRAULT Michel Directeur général CCSMSA
BUCHE Patrice UMR IATE INRA
CHAPALAIN Catherine Directrice générale ANIA
CORBEAU Bertrand Directeur général adjoint Crédit Agricole S.A.
DANON-‐BOILEAU Natalia Bearing Point
DAVID Xavier Directeur ALLICE
DELAGE-‐PAGANINI
Fabrizio Account manager SIGFOX
DESPREY François Directeur général GS1 France
DUBARRY Cécile MEIM
DUBOURG Régis Directeur général APCA
DURAND Patrice Directeur FNEDT
FAURAX Clément Directeur général adjoint FNSEA
FERRAND Rémi Délégué aux affaires publiques SYNTEC
FOG HANSEN Nicolai Digital Business Manager Seges
GIBERT Paul-‐Olivier Président CEO Digital Ethics
GIRARD Jean-‐Philippe Président ANIA
GOZAL Muriel Directrice générale FNSafer
HAEZEBROUCK Théo-‐Paul Chargé de mission -‐ Projets numériques, Animateur plateforme API-‐AGRO ACTA
HERMAN Mathias Technico-‐commercial Orange
HUNAULT Jean-‐Louis Président SIMV
HUYGHE Christian directeur scientifique adjoint Agriculture INRA
LAURENT François membre du Directoire Opérationnel du GIS GC HP2E Arvalis
LE PALLEC Sylvie Responsable des relations institutionnelles GS1 France
LEGRAIN Claire Chef du Service Entreprises et Marchés FranceAgriMer
LEVEAU Valérie animatrice du groupe « Connaissance des pratiques » du GIS GC HP2E Arvalis
8
À cette liste s'ajoutent toutes les personnes interviewées pour établir l'inventaire des bases de données (cf Annexe 3).
LHERMITE Serge Délégué aux IAA MAAF
LION Catherine Directrice générale FNSEA
LONGO Aldo Directeur -‐ Direction générale de
Commission européenne
MARCEL Stéphane Directeur général SMAG
MARCHESSEAU Gaylord Account manager OpenDataSoft
MARTEL Laurent DG Pôle Agriculture INVIVO
MIGAULT Catherine Responsable des affaires agricoles FNCA
MOLLER Jens Directeur DKE
MONTEIL Jean-‐Luc Directeur général FNCUMA
MONTEIRO Muriel Bearing Point
MUGNIER Marie-‐Laure Directrice GraphIK LIRMM-‐INRIA
MUNIER-‐JOLAIN Nicolas Animateur Agrosyst INRA Dijon
PELC Alain Directeur des études des répertoires et des statistiques CCSMSA
PERAULT Régine Commerciale Orange
PILLAUD Hervé Agriculteur-‐éleveur -‐-‐
RIVIERE Loic CEO TechInFrance
ROUDAUT Françoise Directrice des Systèmes d'Information Irstea
SALAUN Agnès Chargée de mission « Connaissance des pratiques » du GIS GC HP2E Arvalis
SINE Mehdi Responsable Agriculture Numérique Arvalis
SUCEVIC Perica Conseiller juridique Secrétariat général pour la modernisation de l'action publique (SGMAP)
TALES Romain Responsable data.gouv.fr ETALAB
THATCHER Mary Kay Responsable AgDataCoalition Farm Bureau (US Agriculture Department)
THOMOPOULOS Rallou Chercheur INRA, UMR IATE
TIFFIN Richard Chief Scientific Adviser Executive Management Team Agrimetrics
VALDURIEZ Patrick Directeur de recherche Inria
VINE Pascal Délégué général Coop de France
WAINSTAIN Jérémie Président TheGreendata
9
Résumé
onomie ont confié à Jean Marc Bournigal1 une préparer la mise en place opérationnelle d portail de données agricoles
es du portail.
Comme dans les autres secteurs économiques, il y a en agriculture un enjeu fort à collecter et à
desquels développer des services nouveaux.
à de telles ressources dans les mains de quelques acteurs génère des inquiétudes quant à
produit, et qui
seront favorisées.
de connaissances, d
Lors de cette mission visant à instruire la mise en place opérationnelle de ce portail, ont été plus particulièrement étudiés: la gouvernance, la structure juridique, les jeux de données à mobiliser, les fonctionnalités attendues, les points techniques critiques (sécurisation, accès, interconnexion,
facteurs de risque et des facteurs de réussite, des propositions concrètes sont faites. Cette synthèse présente les points essentiels de ce travail.
1 Lettre de mission du 15 Avril 2016 (cf Annexe 1)
10
Les fonctionnalités : le « guichet unique
Si
ce jour sont les suivantes :
1-‐ Un « Guichet Unique » privées, qui restent stockées sur les plateformes de leurs propriétaires ; ce guichet assurera
ouvertes sous conditions, par exemple avec des licences spécifiques ou contre rétribution ; 2-‐ Un « Magasin Numérique » pour un retour rapide vers les fournisseurs de données ; cet
espace offrira des outils simples de traitement (statistiques, géostatistiques) ou de ; il pourra donner accès à des référentiels par
; 3-‐ Un "Cloud Agriculteurs" pour héberger les données professionnelles des agriculteurs ;
4-‐ Un « » entre acteurs de la profession agricole, pour partager expériences, savoir-‐faire, idées, etc. ;
5-‐ Une « Vitrine d'OAD » utils Aide à la Décision (OAD) et les services existants sur le marché seront présentés et évalués
ou commentés par les utilisateurs (un concept dénommé "TripAdvisor des OAD »).
Ces diffé -‐à-‐vis du portail, et contribuent à son modèle économique. Elles ont été identifiées suite aux entretiens avec des représentants de la profession agricole, à un atelier de 50 utilisateurs potentiels du portail (le 22 Juin 2016), et à un benchmark sur des initiatives approchantes. Parmi la demi-‐douzaine de
structures ont des points communs avec le portail : le Seges (Danemark), société gouvernée par les agriculteurs, qui collecte leurs données et les valorise sous forme de modèles et de services, le projet API-‐ rentiels agricoles à ses membres via des API, la mission Etalab, qui a le même objectif de réutilisation des données mais qui diffère quant aux données offertes (exclusivement publiques et non spécifiquement agricoles), la AgDataCoalition
du réseau Dephy et les réutilise dans des projets de recherche. Si chaque dispositif a un ou deux points de convergence avec le portail, aucune ne conjugue simultanément « collecte de données à vocation agricole », « ouverture », « interconnexion » et « animation du portail ». La gouvernance
deux cas (le Seges et la AgDataCoalition).
11
Structure et gouvernance
valorisation au servmobilisation du monde agricole. Ainsi, il est essentiel que ce projet soit porté par un consortium de quelques acteurs économiques du monde agricole (coopératives, filières, banques, assurances,
préconisée ; si la mutualisation est effective (à savoir si aucune grande entreprise ne détient plus de 25% du capital), celle-‐ci pourra être reconnue « » et bénéficier État
; ntants de la recherche (INRA, Irstea, ACTA), des représentants des ministères
. L s de la création du portail pourraient utilement être validés .
Les données à mobiliser : bâtir une gouvernance des données et une protection juridique appropriée pour exploiter des gisements immenses
Le portail a pour objet de mettre à disposition du public des données et services numériques. Créer , , de respecter un certain formalisme juridique,
incluant la mise en ligne de mentions légales sur le site et, d
via un cadre contractuel définissant les modalités de mise à disposition et de réutilisation des données publiques ou privées qui alimenteront le portail, pour chaque utilisateur privé ou public. Une attention particulière doit être portée à la gouvernance des données. Deux dispositifs sont
et édictent les
de données. Un fournisseur de données souhaitant rendre ses données accessibles devra te accorder sur ses données, en choisissant le type
de licence approprié. Les données agricoles peuvent, pour partie, être géo-‐référencées (parcellaire), et donc être raccordables à une personne physique, ce qui nécessite son accord avant diffusion. Les données seront, sauf accord du titulaire, anonymisées avant leur diffusion. Un inventaire des données à mobiliser a été dressé. Isoixantaine de bases « qualifiées -‐à-‐dire bien décrites du point de vue des métadonnées), publiques ou privées, le double avec des bases non décrites. Cet inventaire devra être régulièrement mis à jour.
12
Les points-‐clés techniques : concilier performance du moteur de recherche, anonymisation et sécurité
Un cahier des charges a été dressé pour lister les fonctions nécessaires aux 3 acteurs du portail : les administrateurs, les fournisseurs et les utilisateurs de données. Au-‐delà de ce cahier des charges qui décrit des fonctions assez classiques de portails de données, il convi point durs
conjuguer rapidité de mise en place et efficacité du portail, est la fédération des bases de données -‐à-‐dire de données qui resteront stockées chez les différents fournisseurs. Cette
approche, dite « médiateur », consiste à créer un dispositif de « traduction » de chaque base de données (
transparent base de données. Cela exige de connaître les métadonnées et les schémas de données des
de la part des fournisseurs de données (éditeurs de logiciels, agro-‐équipementiers, services de ion, la performance du portail pourra être accrue en mettant en
-‐ci est réclamée. De nombreuses in -‐référencées), ce qui
: accroissement de la granularité, confidentialité différentielle, brouillage (par décalage aléatoire) des coordonnées géographiques.
il
différentes (par exemple données météo, données pédologiques, données de rendement), sur la base de leurs identifiants spatiaux (géoréférencement) et tem
bases de données distribuées » est un atout car elle évite de gérer la sécurité des bases de données, qui relève de chacun des fournisseurs. En
« cloud agriculteurs » nécessitera de considérer cette question. L'accès au système devra être sécurisé et ne pas présenter de faille de sécurité connue, avec des mises à niveau régulières du dispositif de sécurité. Les échanges monétaires devront être tout particulièrement sécurisés.
13
« acquérir du trafic »
nées, qui considère que les données acquièrent une valeur nouvelle (au-‐delà de celle pour laquelle elles ont été collectées)
connaissance via des traitements appropriés. Cette vision est en rupture avec une vision protectionniste des données, qui considère la donnée comme un bien matériel, qui perd de la valeur
il par une animation visant à sensibiliser les producteurs et fournisseurs de données à ce nouveau paradigme et à attirer les spécialistes du traitement de la donnée (data sciences) vers les enjeux de
à une communication efficace et une collaboration avec les fournisseurs et les producteurs de données : co-‐construction des fonctionnalités du portail dans un approche de design thinking, information régulière sur les nouveautés du portail (par exemple dans le magasin numérique), statistiques de production pour les agriculteurs, voire activités plus ludiques (concours, crowd-‐organisations agricoles, que le portail devra largement ass
Côté « utilisateurs de données », un programme sera élaboré pour générer rapidement des
public-‐ : appels à projets, concours de
startups, hackathons, compétition numérique, challenge numérique, etc. Des fonds spécifiques devront être levés pour accompagner ces événements.
recherche dédiée, à financer par la structure porteuse du portail. Deux champs de questions ont été identifiés : la question des ontologies -‐ essentielles pour améliorer la performance du moteur de recherche -‐ et celle de la chaîne de valeur de la donnée (agricole). Outre ces recherches destinées à préparer les versions futures, le portail sera en relation directe avec des grands programmes ou projets de recherche sur des thèmes connexes Convergences en agriculture numérique #DigitAg, des Laboratoires projets seront soit sources de données nouvelles, soit utilisateurs de données pour créer des OAD et services promus sur le portail.
Construction du portail : calendrier et modèle économique
Le temps nécessaire à la mise en place du portail est estimé à 3 ans avec une première phase de construction (12-‐15 mois) et une phase de lancement (21-‐24 mois). La « phase de construction » est
s fonctionnalités centrales (a minima le « guichet ,
ouverture. La « phase de lancement » a vocation à développer les modules complémentaires et à
14
nombreuses dans le domaine agricole sera déterminant.
Les ressources nécessaires à la mise en place du portail sont des ressources humaines pour
de prestations (infrastructure, assistance juridique, business plan, communication recherche pour préparer les versions ultérieures. La mise en place du portail nécessite un
devrait équilibrer via la contribution des actionnaires et des recettes
diverses (publicités, stockage de données dans le « cloud agriculteurs », sponsoring privé).
En conclusion, facteurs de réussite et facteurs de risques
Les enjeux-‐clés pour la réussite du portail sont données
la confiance nnée, la marque de ce portail doit être
transparence, doit fdes organisations agricoles et des fournisseurs de données est essentielle.
15
Lexique API : "Application Programming Interface". Une API est une interface de programmation qui
permet de se "brancher" sur une application pour échanger des données. Une API est ouverte et proposée par le propriétaire du programme.
Donnée publique : les documents produits ou reçus, dans le cadre de leur mission de service public, par l'Etat, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d'une telle mission
Licence copyleft : Le copyleft est une méthode générale pour rendre libre un programme (ou iger toutes les versions modifiées ou étendues de ce programme à
être libres également. Licence ouverte : La licence ouverte / open licence est une licence libre française créée par la
is. Cette licence, présentée le 18 octobre 2011, a été voulue comme une licence compatible avec les licences Open Government Licence (OGL) du Royaume-‐Uni, Open Data Commons Attribution (ODC-‐BY) de l'Open Knowledge Foundation et Creative Commons Attribution 2.0 (CC-‐BY 2.0) de Creative Commons. La Licence Ouverte n'est pas une licence copyleft puisqu'elle n'impose pas d'utiliser une licence identique sur les travaux dérivés des données couvertes.
Métadonnées : Une métadonnée est une donnée servant à définir ou décrire une autre donnée quel que soit son support (papier ou électronique). Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées GPS du lieu où elle a été prise.
Propriétaire de la donnée : -‐1 du code de la propriété intellectuelle).
Titulaire de la donnée : le détenteur des droits sur la donnée.
16
Introduction Une mission, intitulée « Portail de données agricoles », a été confiée à JM. Bournigal par les Ministres
é agriculture et de la r enseignement supérieur (cf. Lettre de mission en Annexe 1). Elle fait suite aux recommandations de la Mission Agriculture Innovation 2025 (volet agriculture numérique).
Cette mission doit étudier les points suivants :
1. La structure juridique du portail et le modèle économique associé 2. La gouvernance du portail 3. Les jeux de données nécessaires pour le développement de services innovants 4. 5. 6.
Pour répondre aux points 3, 4 et en partie 5, un cahier des charges fonctionnel approfondi est proposé dans ce document. Il décrit les fonctionnalités attendues pour la construction du portail
et services agricole un dispositif Le document porte sur la création de ce portail, sa maintenance évolutive ainsi
jout éventuel, a posteriori, de nouvelles briques de services.
1
18
Contexte et enjeux : le d1.numérique
-‐performante 1.1répondan -‐écologie
big data ». Les enjeux de la transition numérique en agriculture sont nombreux avec un champ des possibles très vastes :
réduction des coûts et des impacts environnementaux réduction de la charge de travail et de la charge mentale, en particulier en élevage, culture
pérennes et maraîchage modification en profondeur de la rela la filière aval nouvelles approches de traçabilité et de lutte contre la contrefaçon (ex : vin) modification en profondeur des pratiques de service technique ou financier :
conseil technique et/ou aide à la décision stratégique, tactique et opérationnelle, assurance,
numérique doit tout à la fois de forte pression foncière et environnementale, er -‐écologie, et de contribuer au
Autre exemple, dans le domaine , la gestion de très grands « lacs de données »2 -‐données
stockées sans structuration-‐ . Concernant le tissement en agriculture, de nouvelles modalités, faisant notamment appel au financement participatif, deviennent également possibles via le numérique.
société française, et au-‐ LOI n° 2016-‐1321 du 7 octobre 2016 pour une République numérique (encore en cours à la date de rédaction du présent rapport), service public de la donnée. A ce titre, il faut souligner la forte attente des opérateurs vis-‐à-‐vis de
2 inie au moment du stockage.
19
De plus en plus de données générées 1.2
Les données vont être générées de manière massive par un nombre croissant de capteurs et objets connectés, qui se multiplient tous secteurs confondus, cf. étude IDATE Digiworld). Fixes (installés dans les parcelles ou les
fournissent des données qui complètent les informations satellite, météo, celles des fournisseurs des exploitations. La conjonction du développemmassive de données et des capacités de stockage et de traitement informatique embarqué ou déporté (puissances de calcul importantes accessibles par des réseaux de communication sans fil très haut débit) rend possible l
décision (OAD), la précision et la pertinence avant tout de valoriser ces données à différentes échelles.
La mutualisation à grande échelle (nationale ou internationale) peut permettre une valorisation via des travaux de prospective ou , la généralistes visant les marchés globaux ou en appui aux prises de décisions politiques, économiques et stratégiques.
À la valorisation des données visera plutôt et conseil optimisation
énergétique de itation et des externalités, ou au choix des agro-‐produits adaptés aux contraintes et enjeux technico-‐économiques locaux, sur la base de modèles biotechniques ;
une plus grande réactivité face aux pressions parasitaires et environnementales ; une mutualisation et un partage des expériences.
Ces données peuvent également être valorisées à une échelle plus fine, dans le système de culture, s une agriculture de haute précision (gestion des animaux).
en améliorant la traçabilité des produits et des modes de production, mais aussi à
valorisation.
Le portail de données agricoles 1.3
1.3.1
Pour accélérer la création de services innovants en agriculture et garantir la meilleure redistribution de la valeur vers les acteurs nationaux, notamment agricoles, le dispositif le plus adapté semble être
gouvernance partagée entre les acteurs de la profession agricole. Ce portail est intégré dans un projet plus vaste domaine agricole, proposé dans le rapport « Agriculture Innovation 2025 » et qui comprend trois volets :
20
à vocation agricole : le portail.
développer des objets et services plus innovants (tels que des différentes échelles, de nouvelles ouvant se baser sur ce
institut #DIGITAG, Instituts Convergences » (Février 2016), sera
ure numérique.
économiques, polyvalents, biocapteurs) et les réseaux de communication nécessaires. endre et le
1.3.2 Objectifs du portail
Le Big Data agricole est une masse de données générées par diverses sources (capteurs, machines connectées, données de traçabilité, stockées dans de nombreuses bases de données réparties chez différents acteurs du monde agricole , la coopérative, les
s jules services publics. Aucun de ces acteurs a la capacité, seul, à valoriser le Big Data. Avec la mise en
rôle pour mieux valoriser la donnée, en la réutilisant ; ces derniers seront en outre incités à concevoir des outils de production de la donnée pensés dès le départ avec cet objectif de réutilisations multiples.
du portail est de permettre l'accès, et l'exploitation d'un ensemble important de données agricole. Il permettra de recenser et mettre à disposition ces données, publiques ou privées, qui sont stockées sur les plateformes de leurs propriétaires. Cela concerne aussi bien des données publiques, par exemple la plateforme nationale www.data.gouv.fr (développée par ETALAB), que des données privées, qui seront rendues accessibles sous conditions, dans la mesure où leur propriétaire accepte leur partage.
Le portail devra aussi mettre en avant et donner accès à des OAD et services dédiés, et permettre la mise en relation entre les acteurs de la filière agricole.
À terme, ce portail Cette option
devra être prise en compte dès la création du portail.
21
1.3.3 Les attendus : 5 briques fonctionnelles à implémenter
Le portail sera développé sur 3 ans. Cinq briques fonctionnelles ont été identifiées, elles seront mises
acquisition rapide de trafic. Le portail agricole sera une plateforme web accessible sur les navigateurs couramment utilisés (Internet Explorer, Firefox, Chrome, Safari, et versions « mobiles »). La figure 1 donne un rapide aperçu des attendus, qui seront détaillés dans la suite du document. Le portail devra démarrer avec la brique fonctionnelle « Guichet unique », qui est sa fonction n°1, accompagnée
-‐à-‐dire attirer un maximum d'utilisateurs sur le portail).
Le guichet unique
Il s'agit en priorité de proposer un guichet unique, un espace permettant de référencer, de
la possibilité d'exploiter et de valoriser les données disponibles : entreprises de data science, de conseil, institutions publiques, recherche, associations, voire agriculteurs et citoyens etc.
es données.
données ouvertes et/ou à vocation agricole voire agro-‐alimentaire.
Le « magasin numérique »
Le « magasin numérique » est un espace qui permettra des retours rapides vers les fournisseurs de données, sous forme de petits outils, d s de résultats mis en forme avec une visée informative et attractive, de traitements très primaires mais immédiatement disponibles des données du portail, utiles. Ce pourrait être par exemple la visualisation de données géographiques sur une carte, le calcul de statistiques (moyenne, écart-‐type, min-‐max,) à différentes échelles (de la région à la parcelle), etc.
Figure 1 -‐ Schéma des principales fonctionnalités attendues du portail agricole
Portail agricole
Guichet unique pour l'accès à des jeux de données à vocation agricole.
Espace de stockage de données des agriculteurs (cloud)
Espace d'échange entre acteurs de la profession agricole
Outils d'aide à la décision : vitrine et évaluation participative (dit « TripAdvisor » des OAD)
Le « magasin numérique », mise à
données
22
Cloud agriculteurs
La mise à disposition un espace de stockage des données pour les agriculteurs (dit « cloud agriculteurs ») est une demande qui émane des syndicats agricoles : les données sont sécurisées chez un tiers gouverné par la profession agricole, elles peuvent être ouvertes aux personnes autorisées.
s
À cela s'ajouterait également un espace d'échanges entre les acteurs de la profession agricole et des métiers associés pour partager expériences, expertise, savoir-‐faire et idées. Cet espace pourrait prendre la forme d'un forum / wiki / « réseau social » pouvant participer activement à la dynamique
priorisation.
valuation participative
Une réflexion doit également être engagée quant au développement d'un espace de présentation , de services et "TripAdvisor des OAD")
OAD et services existants sur le marché sont présentés et sur lesquels les utilisateurs peuvent faire des commentaires voire donner une note.
Revue des dispositifs existants en lien avec l de données 1.4agricoles
Les démarches d'innovation ouverte à partir de données se font de plus en plus présentes dans de multiples domaines en France comme à l'étranger. Le benchmarking des initiatives déjà lancées a plusieurs avantages. Il permet de réutiliser le travail qui a été mené au sein de certains de ces projets, ,
des pontages possibles. -‐dessous concernent e.
1.4.1 France : AGROSYST
accueille et met à disposition (des collectifs impliqués) les données issues du réseau des fermes DEPHY. Développé dans le cadre du programme national Ecophyto, il vise prioritairement à faciliter l'identification des systèmes de culture économes en pesticides les plus performants, et à agriculteurs. des données sur les systèmes de culture afin de faciliter leur valorisation et leur analyse transversale. Le système d'information assure les fonctions suivantes :
et l'hébergement de données de natures différentes (succession des cultures, interventions pratiquées sur les cultures, règles de décision, mesures, observations, etc.),
Le calcul de variables de synthèse, de bilans, de différents indicateurs, de rapports, etc. de schémas décisionnels, avec d'autres systèmes via une interface dédiée.
23
1.4.2 France : API Agro
API-‐AGRO (http://www.api-‐agro.fr/) «recherche finalisée», réunissant la majorité des Instituts Techniques Agricoles (ITA) et quelques partenaires de la Recherche & Développement (INRA, Agro-‐Transfert Ressources et Territoires) au niveau national. Ce projet vise à co-‐construire une plateforme informatique
de références agronomiques communes mises à disposition par les partenaires. Opérationnelle depuis juin 2016, la plateforme API-‐Agro est une interface de programmation (API pour Application Programming Interface) qui met à disposition des services web standards souhaitant accéder à des référentiels ou des services agronomiques (comme clients) ou les diffuser (comme fournisseurs).
plateforme viable économiquement
volontairement limitée à ce stade, API-‐AGRO est doté de fonctionnalités proches de celles tre valorisée dans le projet
et son articulation avec le portail numérique accès aux données devra être trouvée.
1.4.3 Danemark : SEGES
Le SEGES est né de la fusion du Knowledge Centre for Agriculture et du Danish Pig Research Centre, essais, fort de 650 personnes, gouverné par la
profession agricole. Il effectue environ 1 000 essais par an et plusieurs projets de recherche, en collaboration avec le DLBR (the Danish Agricultural Advisory Service). Il couvre tous les aspects de l'agriculture et de la gestion agricole : de production agricole (environnement, élevage, agriculture biologique, etc) au financement, la législation fiscale, l'architecture informatique, la comptabilité, les ressources humaines, la formation.
Concernant les données, le SEGES collecte depuis une vingt années des données à vocation agricole. (LandbrugsInfo) qui comprend plus de 120 nalyses et des informations sur la réglementation. La base de données, organisée en 700 catégories, contient plus de 280 000 références croisées et reçoit 50 000 visites par mois. Les informations sont soit disponibles directement, sans inscription, soit via un abonnement annuel de 270 euros à 670 euros. La base est utilisée à 90% comme une base de connaissance. Le SEGES utilise ces données pour mettre au point
ès lors que leur propriétaire donne son accord, mais la base
mais reste à destination préférentielle du SEGES.
À côté de Landbrugsinfo, environ 20.000 agriculteurs utilisent le portail « landmand.dk » aussi géré par SEGES. Le portail et LandbrugsInfo sont étroitement interconnectés, et les données issues des fermiers sont utilisées pour personnaliser le contenu de LandbrugsInfo : par exemple un fermier qui
ra des alertes et des infor à partir de LandbrugsInfo, quand il se connecte à landmand.dk.
24
1.4.4 Allemagne : Data Hub DKE
Numérique] -‐ http://www.dke-‐data.com/fr/), (majoritairement des constructeurs de machines agricoles) basées en Allemagne, développe
ndépendante. Ses clients : le transport de données sûr et indépendant de toute
machine associée. Le lancement officiel de cette plateforme se fera en 2017. Selon DKE la plateforme permettra de réduire substantiellement les problèmes de conversion lors de la communication de
entreprises de travaux agricoles. Le transport des données se financera par les contributions des faservices.
avec le concept de portail de données à vocation agricole.
1.4.5 Etats-‐Unis : The Agricultural Data Coalition (ADC)
En 2013-‐adhérents du fait que les données de leurs exploitations étaient « captées » par les fournisseurs (intrants, agro-‐équipementiers), via des contrats peu explicites sur la politique de gestion des données. Le Farm bureau a réagi avec 3 actions successives :
Une charte stion des données, établie en concertation avec les agro-‐fournisseurs3;
Le label « AgData transparent agricoles et des agrofournisseurs, pour renseigner les producteurs sur les contrats qui les
. Ce label se base sur un outil, le « AgData transparency evaluator », qui analyse le contrat, sur une base de 10 questions concernant le type de données collectées, leur propriété données, la gestion de la , les niveaux de sécurité, etc. (voir encadré ci-‐dessous) ;
3 http://www.fb.org/tmp/uploads/PrivacyAndSecurityPrinciplesForFarmData.pdf
25
1-‐Quelles catégories de données le produit ou service recueille-‐t-‐il chez moi, l'agriculteur? 2-‐Est-‐ce que la conventioque mes données ont été transférées? 3-‐Si le FAE contracte avec d'autres entreprises pour fournir des données pour des services connexes, est-‐ce que le FAE exige que ces entreprises adhèrent à la politique de confidentialité que l'ATP a mis en place avec moi? 4-‐Est-‐ 5-‐Après avoir téléchargé mes données chez le FAE, me sera-‐t-‐il possible de récupérer mon jeu de données complet d'origine dans un format original ou équivalent? 6-‐Est-‐ 7-‐Est-‐ce que le FAE me préviendra en cas de violation de la sécurité des données, se traduisant par la divulgation de mes données à un tiers? 8-‐Mon jeu de données d'origine peut-‐il être supprimé chez le FAE, à ma demande, lorsque mon contrat avec le FAE se termine? 9-‐Est-‐ce que la convention avec le FAE établit la durée pendant laquelle mes données d'origine seront conservées ? 10-‐Est-‐ce que la convention avec le FAE traite du devenir de mes données si le FAE est vendu à une autre société?
La AgData coalition (ADC)
L'ADC (http://agdatacoalition.org/) a été créée pour aider les agriculteurs à mieux contrôler et gérer leurs données -‐ et la mise en forme -‐ pour stocker ces données dans des espaces sécurisés et les ouvrir à la demande de
des tiers autorisés. L'objectif de l'ADC est de construire une base de données agricoles neutre et indépendante dans laquelle les agriculteurs pourront stocker leurs données en toute sécurité et de manière pérenne : informations collectées chaque jour dans leurs parcelles par leurs machines et autres outils d'acquisition (imagerie aérienne par exemple). Ces données peuvent alors être nettoyées, synchronisées et transmises d'une manière efficace et uniforme à des tiers, qu'ils soient chercheurs, assureurs, responsables gouvernementaux, gestionnaires agricoles, fournisseurs d'intrants ou tout autre acteur autorisé par l'agriculteur. qui choisira la personne avec qui il souhaite partager et la faible : 250$ par an. La plateforme choisie est "Onsite" de AgIntegrated4.
1.4.6 Royaume-‐Uni : Agrimetrics
Agrimetrics est une société à but non lucratif, financée par le gouvernement du Royaume-‐Uni dans le cadre de sa Stratégie Agritech. Son ambition est d'être un centre d'excellence sur le Big Data en agriculture et en agro-‐alimentaire : data sciences, modélisation... Il s'appuie sur quatre organisations fondatrices (Rothamsted Research, l'Université de Reading, l'Institut National de Botanique Agricole / NIAB et le Collège Rural d'Ecosse / SRUC) -‐ et plus de 50 entreprises et organisations environnementales et académiques.
Agrimetrics est de bâtir une plate-‐forme de données et un écosystème associé pour
soutenir l'intégration, la modélisation et l'analyse des données et fournir l'accès à des données
4 http://www.agintegrated.com/onsite-‐platform/
26
provenant d'un large éventail de domaines pertinents pour le secteur. us que sur la production primaire. Le projet a débuté début 2016
avec u (construction de la plateforme, collecte des données, traitement de la donnée). La plateforme sera partiellement opérationnelle en 2017 et devra être autosuffisante au bout de 3 ans. Un enjeu-‐clé est que les entreprises du secteur agricole et alimentaire comprennent l'impact que les données peuvent avoir sur leur organisation, fournissent des données et puissent accéder aux produits d'Agrimetrics. A terme, Agrimetrics proposerait aussi un coffre-‐fort de données.
Agrimetrics :
-‐ Créer un « data-‐hub » (plateforme de données) pour les secteurs agricole et alimentaire : Créer un grand répertoire de données agricoles et alimentaires interconnectées (« linked data défis de la production agricole et alimentaire
-‐ Construire des outils intégrants des données et une expertise associée pour une meilleure prise de décision fondée sur des données
-‐ Créer un réseau pour mettre en relation les différentes entreprises du domaine -‐ Construire la confiance et partager la valeur : en développant une culture de partage des
données et des décisions fondées sur les données, dans l d'une intensification durable de la collecte.
1.4.7 Conclusion
Les différents dispositifs présentés ci-‐t de relater en
France : Data.gouv (mission ETALAB)
Etalab (https://www.etalab.gouv.fr/publics pour faciliter la réutilisation la plus large possible des données publiques. Etalab administre le portail interministériel data.gouv.fr destiné à rassembler et à mettre à disposition librement
souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées Etalab collabore étroitement avec les services chargés de la
Le portail national data.gouv.fr donne accès à plus de 13.000 informations publiques gratuites et réutilisables. Etalab dispose donc de données
Leforme
es initiatives a permis de mettre en évidence des expériences du portail, mais elle aucune
futur portail AgGate, en particulier dans son objectif de favoriser Voici un tableau qui caractérise ces projets selon trois critères :
27
Voici les similitudes et les différences de ces initiatives:
Etalab : -‐ Similitude : recensement de données dans le but de les rendre publiques pour les
réutiliser -‐ Différence : uniquement données publiques, no , vocation limitée
animation de . Le Seges
-‐ Similitude : collecte de données à vocation agricoles -‐ Différence en interne par Seges
Agrosys -‐ Similitude réutiliser
(transfert de savoir-‐ -‐ Différence
API-‐AGRO -‐ Similitude : collecte et mise à disposition de référentiels agricoles générés par des
acteurs de la R et D agricole, dans le but de les réutiliser, ouverture dans un premier temps au collectif du projet, puis plus largement
-‐ Différence interconnexion de données
Agrimetrics -‐ Similitude : collecte de mise à disposition de données agricoles et alimentaires dans le
but de les réutiliser ; interconnection des données ; -‐ Différence :
Au final, aucune des initiatives ne combine « ouverture des données agricoles » / « interconnexion de données » / « », triptyque de base pour créer un
st la plate-‐forme Agrimetrics, la seule différence étant un aspect « animation » (organisation de challenge, hackathons etc) moins développé. Un intérêt a été émis par le contact de la plateforme Agrimetrics étudier les pontages possibles avec la démarche AgGate.
Objectif Ouverture Animation
Etalab Réutilisation des données Public Non Agrosyst Réutilisation des données Ouvert au Collectif Non API-‐Agro Réutilisation des données Ouvert au Collectif
(puis plus large ?) Non
SEGES Stockage et Réutilisation des données
Limité au producteur, SEGES et tiers autorisés
Non
Agrimetrics Réutilisation des données (et stockage, à terme)
Ouvert Oui
AgDataCoalition Stockage des données Limité au producteur et tiers autorisés
Non
AgGate Réutilisation des données (et stockage si option « cloud »)
Ouvert Oui
Gouvernance
2
30
Gouvernance et structure juridique 2. principal étant de mobiliser les données des exploitations agricoles pour en assurer la
valorisation à leur service, la gouvernance retenue doit privilégier la confiance mais aussi la mobilisation des acteurs du monde agricole. Dans cette notion de confiance et de mobilisation des
accès ouvert et large aux données publiques reste un des enjeux.
Agriculture Française mobilise les acteurs et a innovation agriculture 2025 »
par les acteurs économiques et syndicaux du monde agricole et des ministres en charge de
La strula SAS. En charge du montage et de la gestion opérationnelle du portail, elle mobilisera quelques acteurs économiques opérationnels du monde agricole (coopératives, filières, banques, assurances, entreprises orrespondant à une mutualisation, elle reconnue comme « » au titre des critères du CGI,
coûts pour sa mise en place. Pour cela, il est souhaitable de créer un actionnariat diversifié, en cherchant à ce grande entreprise ne détienne plus de 25% du capital.
Pour sa gouvernance stratégique, rientation stratégique numérique,
mais aussi de l concernées pour une écoute et une anticipation des besoins exprimés par les professionnels et les organismes publics. Il devra rassembler au moins, les représentants des syndicats agricoles, lCOOP de France, la CNMCCA, des représentants du secteur de (AXEMA, UFS, UIPP, UNIFA ; ), des représentants de la recherche (INRA, Irstea, ACTA) et des représentants des ministères en charge de numérique. ncipes de la création du portail pourraient
du ministère en charge de pour en conforter la légitimité.
affinée du temps en fonction de -‐alimentaire. Beaucoup
ont manifesté un intérêt dans le portail, la FNSAFER, la MSA, les centres de gestion, des
3
32
Les jeux de données à intégrer 3.Un travail d'inventaire a été lancé pour identifier les bases de données à vocation agricole existantes en France. Ce travail a plusieurs objectifs :
Identifier les fournisseurs disposant de données, Impliquer ces fournisseurs dans le projet et comprendre leurs attentes éventuelles, Identifier les thématiques agricoles pour lesquelles des données existent, Caractériser plus finement les données et leur structuration afin d'identifier les éventuelles
contraintes auxquelles le guichet unique devra répondre.
La démarche 3.1
Les bases de cette démarche ont été établies en collaboration avec Etalab qui réalise ce genre d'inventaire pour les données d'origine publique. Dans cette mission, nous ne nous sommes pas limités aux données publiques et avons également recherché les fournisseurs potentiels de données privées (par exemple, éditeurs de logiciels, agro-‐équipementiers La démarche est la suivante, une fois une source potentielle identifiée :
1. Contact avec le potentiel fournisseur de données afin d'identifier le référent ressource. 2. Envoi d'un questionnaire (cf Annexe 2) afin que le référent prépare les réponses. 3. Entretien semi-‐directif avec le référent en prenant le questionnaire comme guide. 4. Rédaction du compte-‐rendu de l'entretien. 5. Renseignement du tableur qui résume l'ensemble des entretiens réalisés.
Origine des données 3.2
fournisseurs de données et en élaborant une méthodologie pour identifier et décrire les bases de
Plusieurs fournisseurs de données ont été référencés (cf Annexe 3), mais le portail devra pouvoir Les
fournisseurs sont des administrations publiques, des agro-‐équipementiers, des éditeurs de logiciel de traçabilité, des éditeurs d'outils d'aide à la décision, des centres de recherche, etc. Les agriculteurs pourraient également déposer directement leurs données sur le site grâce à la mise à disposition d'un cloud agricole, qui est une des déclinaisons du portail. Cette brique fonctionnelle sera abordée ultérieurement dans ce document.
Certaines données publiques sont en partie accessibles depuis les portails nationaux, notamment "data.gouv.fr" en France. Néanmoins nombreuses sont encore les données publiques qui ne sont pas disponibles sur des portails. L mise en place du portail AgGate a permis d'initier le travail d'inventaire et de mise à disposition de ces données. Voici quelques exemples de données publiques: parcellaire, occupation du sol, données du recensement agricole, données Eurostat, données économiques sur les marchés, météorologie Météo France, topographie IGN.
D'autres données seront d'origine privée (entreprises, . Elles seront rendues accessibles par une participation volontaire de leurs propriétaires à la démarche. Ceux-‐ci
33
décideront données visibles et/ou téléchargeables), d des licences associées à la réutilisation de leurs données, et d t/ou aux services développés dans le respect du cadre légal (cf Annexe 6).
Liste des données disponibles
Dans le cadre de l'inventaire, une vingtaine d'entretiens en direct ont été réalisés (présentiel ou par téléphone), majoritairement avec des acteurs privés. Ces entretiens ont permis d'identifier et de « caractériser » une trentaine de bases de données, c'est-‐à-‐dire d'en appréhender le contenu (type de données, moyen de collecte, étendue spatiale, etc). Le questionnaire a été transmis au sein des ministères. À ce jour les retours ont permis de caractériser également une trentaine de bases de données. L'inventaire devra régulièrement être remis à jour et amendé avec les nouvelles bases de données identifiées5.
Plusieurs acteurs ont par ailleurs initié le recensement de bases de données agricoles, dans différents :
Le Groupement d'Intérêt Scientifique GC HP2E, dans le cadre des missions du groupe thématique « » co-‐animé par
INRA, un travail de recensement des bases de données valuation des performances en grandes cultures. Cette démarche
a pour but d'én sur les pratiques des producteurs de grandes cultures permettant
Près de 130 bases de données « réseaux, enquêtes et observatoires » ont été identifiées et environ 80 ont été caractérisées. Il est à noter que le questionnaire utilisé est quasiment identique à celui utilisé pour le portail agricole.
Le Groupement d'Intérêt Scientifique sur l'Elevage a également réalisé un inventaire des bases de données se rapportant à cette thématique en 2012. Une vingtaine de bases a été identifiée et caractérisée.
Le travail pourra être valorisé dans le portail agricole.
A ce stade, nous avons caractérisé près de 110 bases de données (dont certaines très importantes dans leur étendue la quantité « » reportés ou leur profondeur). La liste des bases identifiées ou caractérisées est présentée en Annexe 3. La caractérisat pas toujours complète : il reste souvent quelques caractéristiques à préciser. Par exemple, l'étendue temporelle des données n'est pas toujours bien connue du fournisseur, de même que la projection géographique utilisée ou la volumétrie de la base de données.
D'autre part, certaines ressources sont déjà accessibles sur des portails Web et pourront être référencées au sein du portail agricole. C'est notamment le cas de certaines ressources présentes sur
5 Il serait intéressant de prévoir une mise à disposition en
34
le portail API-‐Agro (http://www.api-‐agro.fr/), sur www.data.gouv.fr ou sur www.open-‐data.europa.eu. Le site AgriOntology (https://sites.google.com/site/agriontology/home) recense également de nombreuses ressources en agriculture, environnement et géographie accessibles en France et à l'étranger.
Caractérisation des données et métadonnées 3.3
Les jeux de données disponibles via le guichet unique sont de nature hétérogène de par :
Leur qualité, qui peut varier selon la précision de la mesure, le capteur utilisé ou
Leur échelle spatiale (pour les données géolocalisées) -‐parcellaire (type et
de peuplement, de rendements et de qualité des récoltes, etc.) aux données globales (météo, cartographie géologique, carte topologique, etc).
Leur temporalité : date d . Leur nature : données cartographiques, photos, informations génétiques, référencement
de produits phytosanitaires et fertilisants, etc.
Ces différentes caractéristiques ne sont qu'une partie des métadonnées que le guichet unique devra prendre en compte et utiliser pour mettre les données à disposition de manière efficace. Les méta La description des métadonnées envisagées sera abordée dans la partie "6. Points techniques critiques".
Certaines données ont un caractère personnel ou relèvent du secret des affaires. Leur diffusion ne (consentement éclairé) ou après
anonymisation. Il est donc également important de maitriser les notions d'anonymisation, aussi bien d'un point de vue juridique -‐ anonymat) que d'un point de vue technique. Ces points cruciaux seront également abordés dans la partie "6. Points techniques critiques" et dans
étude juridique ».
Accessibilité des données 3.4
Les données qui seront disponibles sur le guichet seront soit conservées chez le fournisseur, soit stockées sur le cloud « agriculteurs ». Le guichet unique devra proposer des solutions aux fournisseurs pour leur permettre de rendre leurs données accessibles en minimisant le coût de cette mise à disposition. Pour cela, des aménagements techniques seront nécessaires ; si le fournisseur dispose tail les référencera, dans le cas contraire, il pourra (« magasin numérique »). Une collaboration entre les administrateurs du portail et les fournisseurs sera nécessaire pour mettre en place les solutions d aux données, décrites dans la partie "6. Points techniques critiques".
Les aspects juridiques de la donnée 3.5
Un portail web communauté spécifique. ouvrir une « » sur un large choix de
35
ressources et de services accessibles par Internet. Plus précisément, ce portail a pour objet de mettre à disposition du public des données et services numériques pour une agriculture française compétitive, ouverte et souveraine.
suppose, , de respecter un certain formalisme juridique, dont la mise en ligne de mentions légales sur le site de protéger juridiquement les données accessibles sur l un cadre contractuel permettant de définir les modalités de la mise à disposition et de la réutilisation des données publiques ou privées qui alimenteront le portail, pour chaque utilisateur privé ou public.
Les problématiques juridiques figurent dans le schéma ci-‐après (Figure 2). Une étude détaillée figure en Annexe 6.
Figure 2 Problématiques juridiques relatives au portail AgGate
36
De manière synthétique, il faut retenir les points suivants :
Lors de la collecte de la donnée :
-‐ accord pour rendre les données visibles ;
des personnes pouvant être identifiées par ces données préalablement à leur collecte. La notamment
porter sur la finalité de la collecte. A ce titre, il sera indiqué à ces personnes pour quelle -‐à-‐dire à des fins
Ces données à caractère personnel ne seront en aucun cas rediffusées sans leur accord.
toute rediffusion.
Sur ce sujet des données à caractère personnel, il convient de souligner, au moment où est rédigé le présent rapport, que « ». Elaborés en concertation avec les acteurs d'un secteur d'activité, les packs de conformité il y en trois à ce jour sont, selon les propres termes de la CNIL, un nouveau mode de régulation. Ils visent à définir et diffuser les bonnes pratiques pour un secteur, tout en simplifiant les formalités administratives des acteurs qui s'y conforment. Ils peuvent ainsi contenir des mesures de simplification des formalités, des guides pratiques et pédagogiques, des tests de vérification de conformité à la loi.
Dans la mesure où le pack de conformité « open data » aura été effectivement publié avant la mise sera utile référer.
Gouvernance des données
Une attention particulière doit être portée à la gouvernance des données ; pour cela, deux dispositifs adressent aux fournisseurs de données et édictent
utilisateurs de données.
Pour le fournisseur, les CG devront notamment préciser :
-‐ la nature des données mises à disposition ; -‐ Ses droits et obligations (notamment un engagement de titularité du jeu de donnée) ; -‐ Les droits de propriété intellectuelle afférant aux données ; -‐ sée (accès,
; -‐ ; -‐ -‐ Les obligations relatives à la « loi Informatiques et libertés » (sur les données à caractère
personnel) -‐ Le droit applicable.
37
Un fournisseur de données souhaitant rendre ses données accessibles devra préalablement types de licence seront
proposés, par exemple : o les licences fixées par décret conformément à la loi « pour une république numérique ». o les licences spécifiques demandées par les fournisseurs eux-‐
o les licences commerciales précisant les modalités financières.
Pour :
-‐ la nature des données mises à disposition ; -‐ Les droits de propriété intellectuelle afférant aux données ; -‐ -‐ s types de licence proposée (accès,
;
-‐ Les droits et obligations des fournisseurs de données (notamment un engagement de titularité du jeu de donnée) ;
-‐ ; -‐ Les obligations relatives à la « loi Informatique et libertés » (sur les données à caractère
personnel) -‐ Le droit applicable.
4
Au cœur du portail,
le guichet unique
40
A 4.Conformément à la description des grandes fonctionnalités (1.3.3) la première brique fonctionnelle du portail sera le guichet unique, qui permettra de recenser et mettre à disposition les données publiques et privées stockées sur les plateformes de leurs propriétaires ou sur le « cloud agriculteurs » (une des fonctionnalités du portail décrite en 5. « Les autres fonctionnalités indispensables au portail »). Nous décrirons ci-‐dessous les utilisations et utilisateurs du portail/guichet, puis les fonctionnal
Utilisateurs et usages du guichet 4.1
4.1.1 Les utilisateurs du portail
s-‐acteurs du portail ont été identifiés :
Le consommateur de données : il vient sur le guichet unique pour rechercher, visualiser, utiliser et télécharger des données.
Le fournisseur de données : il propose l'accès à des données dont il est titulaire. L'administrateur : il modère l'utilisation du guichet, il anime les outils de communication
t les statistiques, gère les droits, etc.
À savoir, ces rôles ne sont pas exclusifs : un fournisseur de données peut également être consommateur d'autres données et vice-‐versa.
Les utilisateurs potentiels du portail sont des coopératives, des entreprises de data science et de conseil, des institutions publiques, la recherche, des agriculteurs, des associations, des citoyens, etc. Chacun de ces acteurs pourra être intéressé par des données différentes et exprimera ses propres exigencsouhaiterait voir développer. Les data scientists, chercheurs et informaticiens utiliseront davantage le guichet pour y trouver des données brutes et des API. Les autres utilisateurs (agriculteur, institutions) se dirigeront plus naturellement vers bas. La Figure 3
41
Figure 3 -‐ Schéma simplifié des fonctionnalités disponibles sur le guichet pour le consommateur et le fournisseur
4.1.2 Vocation des données
Les données peuvent avoir deux vocations, en fonction de l'utilisation qu'en fait le consommateur :
"Product building" : le consommateur va chercher des données diverses (par exemple itinéraires techniques, météo, données de sol, modèles numériques de terrain, etc.) qu'il pourra traiter dans une démarche de R&D, de "data analysis", dans le but de construire
L'utilisation des données peut se faire soit via une API, soit en téléchargeant directement les jeux de données en local.
"Product running" : le consommateur accède et télécharge les données dans le but de faire tourner des modèles déjà construits qui sont intégrés dans des produits en phase de commercialisation. Un exemple pourrait être l'accès à des données météo en temps réel dans un outil d'aide à la décision pour l'irrigation. Pour garantir des données toujours à jour et un accès en temps réel, l'utilisation des données ne peut se faire que via une API, en direct à partir du fournisseur.
Ces deux modes d'utilisation impliquent des fonctionnalités, une architecture et des contraintes techniques différentes qui seront abordées ultérieurement.
42
4.1.3 Scénarios d'utilisation
Ces scénarisations présentent deux utilisations possibles du portail pour opérer une requête via le moteur de recherche et télécharger des jeux de données ou déposer des jeux de données. Ils
pourront être réellement développées. Ces deux
Consommateur de données
Je suis le dirigeant d'une start-‐up de conseil. J'ai créé un prototype de modèle pour diagnostiquer le risque de mildiou en région bordelaise à partir de la météo, du type de sol, de l'itinéraire technique et des antécédents parasitaires de la parcelle sur 5 ans. Je veux extrapoler ce modèle à d'autres zones viticoles. Pour cela j'ai besoin de ces mêmes données dans d'autres régions viticoles.
Je cherche dans le portail de données les jeux combinant la météo, type de sol, itinéraire technique et antécédents parasitaires de la parcelle sur 5 ans
Le portail de données répond "150 parcelles répondent à vos critères" :
Région LR: 100 parcelles Région Bourgogne: 30 parcelles Région Alsace: 20 parcelles météo (résolution spatiale et temporelle) type de sol (résolution spatiale)
et donne pour chaque jeu de données (licence, coût, fournisseur
Je choisis de télécharger les jeux de données sous forme brute (avec coordonnées géographiques) ou interconnectées (jointes) par le portail obligations inscrites dans le contrat de licence associé à ce jeux de données par « un double clic ».
Le portail accède aux données, et les interconnecte/ agrège / anonymise en fonction
le téléchargement.
Je télécharge les données.
43
Fournisseur de jeux de données
Je suis un éditeur de logiciel de conseils. Je suis titulaire de données stockées sous format MS-‐Excel et je souhaite les rendre accessibles sur le portail.
Je crée un compte « fournisseur CG.
Je vais dans mon espace "fournisseur". Je dépose un premier jeu de données sous forme de fichier MS-‐Excel
Le portail notifie de la bonne réception du fichier.
Je renseigne les métadonnées de mon jeu de données (nom, description, projection, fréquence d'acquisition, licence, etc) et valide la demande d'ajout.
Le portail vérifie la complétude des métadonnées obligatoires et notifie de l'ajout du jeu de données au portail.
J'ai maintenant accès à espace de gestion de mon jeu de données (mise à jour, gestion des consommateurs, statistiques).
pas exhaustifs des usages ou
Fonctionnalités communes à tous les utilisateurs 4.2
4.2.1 S'inscrire, créer un compte
Le portail sera ouvert à tous. Par défaut tout utilisateur aura accès en visualisation aux données disposant d'une licence de type "licence ouverte" sans authentification. La création d'un compte est nécessaire pour accéder aux autres données, télécharger ou utiliser des données, fournir des données.
La création d'un compte demande de renseigner un nom d'utilisateur, une organisation, un type une liste sera proposée), une adresse mail et un mot de passe. L'utilisateur doit
s'engager à respecter les conditions générales d'utilisation. Il reçoit un mail d'activation pour valider
44
sa demande de création de compte. sont enregistrés pour faciliter les utilisations ultérieures.
Un ins critères (objectif .
4.2.2 S'identifier
Un système de connexion permettra à chaque utilisateur inscrit (consommateur comme fournisseur) au portail et à son compte personnel. L'utilisateur pourra ainsi modifier ses informations
personnelles (organisation, mot de passe, nom, prénom) et gérer ses inscriptions aux newsletters du portail.
4.2.3 Mettre des commentaires sur le guichet
Le guichet comportera un espace de commentaires afin que les utilisateurs puissent donner leurs avis concernant l'utilisation du guichet et leurs besoins. Cela permettra de faire évoluer le guichet unique pour qu'il réponde au mieux à leurs attentes.
4.2.4 Choisir la langue
Le guichet devra à terme proposer une interface distincte en plusieurs langues : français, anglais, allemand, espagnol. Cela suppose une gestion des dictionnaires, des concepts reposant sur des outils sémantiques standards et ouverts (compatibilité vocabulaire agronomique-‐
Fonctionnalités pour le consommateur de données 4.3
4.3.1 Explorer les jeux de données
Les jeux de données présents sur le guichet unique sont référencés et indexés en utilisant des métadonnées. Une mise en page cohérent qui ne dépendra pas du nombre de jeux de données accessibles sur le guichet.
Le consommateur a la possibilité de filtrer le catalogue de jeux de données en utilisant les principales métadonnées (la liste des métadonnées est abordée dans la partie "6. Points techniques critiques"), par exemple :
sources et accès (publiques, privées, gratuites, payantes, licence, fournisseur)
La liste des standards, ontologies, schémas et référentiels relatifs est donnée en Annexe 5.
45
Des fonctionnalités de tri seront proposées au consommateur pour lui permettre de trier les résultats en fonction de ses attentes, par exemple :
la notation attribuée par l'ensemble des consommateurs du jeu de données (nombre de téléchargement, nombre d'applications
connectées).
4.3.2 Rechercher des jeux de données
En complément des filtres, l'utilisateur a la possibilité de rechercher des jeux de données suivant de multiples critères via le moteur de recherche :
recherche par mot-‐clé (Ex : « céréales ») recherche par mots-‐clés et opérateurs booléens (ET, OU, mot à exclure, expression exacte),
les mots-‐ clés les plus fréquents pouvant être suggérés recherche géographique (par un encart cartographique ou les coordonnées d'une étendue) recherche temporelle enregistrement des recherches précédentes
Deux types de résultats seront proposés :
Des jeux de données indépendants Des jeux de données interconnectées (par exemple, grâce à leurs composantes spatio-‐
temporelles )
Voici un exemple présentant les résultats de la recherche "parcelles + météo + sol" en précisant l'étendue géographique de l'Hérault et une fenêtre de temps correspondant à l'année 2013 :
Jeux indépendants : "3 jeux de données trouvés"
-‐ Jeu n°1 : météo de la
-‐
-‐ Jeu n°3 : parcelles et cultures dans l'Hérault en 2013
Données interconnectées : "150 parcelles correspondent" -‐ Un jeu de données interconnectées comportant des informations sur 150 parcelles
de l'Hérault disposant de données météo et sol en 2013.
L'interconnexion apporte un service à haute valeur ajoutée à l'utilisateur. Les jeux de données qui en sont issus pourraient être proposés en service payant. L'interconnexion sera abordée plus techniquement dans la partie "6. Points techniques critiques".
46
4.3.3 Visualiser des données
le guichet unique proposera des outils de visualisation (tableau, graphiques, cartes, statistiques) avec a minima un extrait du jeu de données. Le consommateur aura accès aux principales métadonnées du jeu de données, y compris une description détaillée.
4.3.4 Consommer des données
Le guichet devra permettre des données selon les conditions fixées par leurs fournisseurs. Le consommateur pourra télécharger des données sous un format exploitable (xls, csv, json, rtf) afin de les valoriser ultérieurement (dans un cadre de "product building" par exemple). Il pourra également consommer les données via des API s'il souhaite utiliser les données directement dans un autre système informatique (dans un cadre de "product running").
4.3.5 Payer en ligne
de données soient mises à disposition librement et gratuitement. Cependant les fournisseurs souhaitant monnayer leurs données (ou une certaine quantité de données sur le mode du freemium) auront accès à un module permettant de gérer les paiements en ligne.
Le guichet devra donc disposer des garanties en matière de sécurisation des paiements et de modularité pour permettre la mise en place de différents modèles de paiement. Il devra gérer tous les échanges monétaires de façon transpar
4.3.6 Echanger avec le fournisseur de données
Le consommateur pourra échanger avec le fournisseur d'un jeu de données, par exemple pour demander des détails quant à l'origine du jeu, son utilisation, etc. Cela contribuera à améliorer la qualité de la documentation et des métadonnées des jeux présents sur le guichet.
4.3.7 Evaluer des jeux de données
Le consommateur pourra évaluer rapidement le jeu de données grâce à un formulaire en ligne comportant un espace de commentaires. Il pourra ainsi apporter son avis concernant par exemple la complétude ou la qualité du jeu de données.
Fonctionnalités pour le fournisseur de données 4.4
Le guichet unique devra permettre à tout utilisateur inscrit de mettre à disposition un jeu de données et de le gérer via une interface "fournisseur".
47
4.4.1 Ajout d'un jeu de données
Deux choix sont proposés au fournisseur pour mettre ses données à disposition sur le guichet :
S'il dispose d'une API il peut la proposer sur le guichet. Concrètement il renseignera l'URL d'accès à ses données. Dans ce cas il aura accès à un espace de test de son API afin de vérifier qu'elle est effectivement accessible.
S'il ne dispose pas d'API il peut déposer le jeu de données sur le guichet dans un format exploitable (json, csv, xls) ou portail. Un service ou un module permettant de monter une API à partir de ce jeu de données sera proposé.
Dans les deux cas le fournisseur devra remplir les métadonnées caractérisant les données qu'il met à disposition. Il devra en particulier choisir la licence qui régira l'utilisation des données, parmi celles proposées par le portail. Les métadonnées renseignées, il pourra soumettre sa demande d'ajout. L validera et le jeu de données et/ou l'API sera alors visible sur le catalogue.
4.4.2 Gestion des jeux de données
Le fournisseur pourra accéder facilement et de façon intuitive aux différents outils de gestion de ses jeux de données et API :
Gestion des licences : le fournisseur pourra définir la licence à attribuer à chaque jeu de données ou aux données issues de son API parmi un choix de licences proposé sur le portail. Un descriptif détaillé de chacune des licences sera à disposition.
Gestion des business model : le fournisseur pourra sélectionner pour chaque jeu de données ou API (niveau de détail de la requête) un business model existant parmi une liste prédéfinie ou concevoir ses propres business models à partir de paramètres disponibles (par exemple : n s, fréquence s, requêtes possible, etc.).
Gestion des cycles de vie : le fournisseur pourra versionner ses jeux ou API. Un engagement sur la durée minimale de mise à disposition des API est indispensable (voir charte du fournisseur).
Gestion de la documentation : le fournisseur pourra accéder à une interface de rédaction n et/ou décrire des
exemples Il pourra aussi télécharger des documents. Gestion de la facturation : le fournisseur pourra suivre les différentes factures par client et
jeu et API. En fonction de la solution de monétisation retenue, cette interface pourra également être le lieu de déclenchement des différentes factures.
Gestion des clients tokens » personnels permettant de relier le consommateur à son identité. Chaque appel sera ainsi tracé et le fournisseur pourra consulter des statistiques (liste non exhaustive : nombre de consommateurs de ses données, nombre de requêtes sur tel ou tel jeu de données, nombre d'appels moyen/consommateur, nombre d'appels/requête, répartition horaire des appels, etc.). La plateforme permettra au fournisseur de contacter l consommateurs
48
de ses données par email pour les évolutions à venir, avaries, ou pour tout autre échange (sondage
s, que ses données personnelles soient transmises au fournisseur de ce jeu de données via les CGU. Le
« Informatique et Libertés ». Gestion technique : La plateforme un système de « ping » pour vérifier à
intervalle régulier (à définir) la pleine disponibilité des API du fournisseur. En cas de défaillance de ces vérifications, en fonction de seuils à définir, pourra personnaliser, la plateforme enverra de façon automatique un email au fournisseur.
disponibilité et de réactivité (temps de réponse) de ses API effectués par la plateforme. Gestion des droits : le fournisseur peut donner des droits de gestion à un ou plusieurs autres
du jeu et : éditer la documentation, accéder aux statistiques, etc.).
Fonctionnalités d'administration du portail et gestion des droits 4.5
-‐office du portail,
données.
aux données seront variables suivant les catégories d'utilisateurs. Voici les grandes catégories envisagées, et qui devront être affinées :
Interne (administrateur du site) Acteurs publics (organismes de formation, de recherche, ministères) Entreprises et organismes privés Agriculteurs et professions agricoles Grand public
4.5.1 Monitoring et contrôle
a conformément aux dispositions des CGU, er les jeux de données des comptes utilisateurs ne respectant pas les CGU) de la plateforme.
vérifier les engagements de qualité de service des bases fournissant les données. Dans le cas de jeux de données ou de fonctionnalités (services, API etc.) qui ne fonctionneraient plus ent pas été mis à jour pendant une certaine durée, ceux-‐ci pourraient voir leur visibilité réduite en les transférant ; cela permettrait de les laisser accessibles aux utilisateurs les ayant déjà utilisées et faciliterait une éventuelle réintégration.
49
4.5.2 Animation
et de mise en page de certaines pages de la plateforme (modification bannières/news/etc. ...). Il modérera portail le cas échéant. A ce titre, les modalités de contrôle des avis mis en ligne seront précisées dans les mentions légales ou les CGU (cf. Annexe 6). Il pourra enfin contacter un ou plusieurs utilisateurs (groupes) par email (newsletter par exemple).
4.5.3 Support utilisateur
avoir un accès aux contenus du portail et sur la
API).
5
indispensables au portail
52
Les autres fonctionnalités indispensables au portail 5.Les fonctionnalités et les exigences techniques décrites ci-‐dessus correspondent au
un niveau de trafic satisfaisant, soit pour faire évoluer le portail vers plus de services. La priorisation de ces projets sera faite par la gouvernance. Rappelons ces 4 fonctionnalités :
Cloud agriculteurs Le magasin numérique
« Cloud agriculteurs » : espace d'hébergement des données privées des 5.1agriculteurs
Les syndicats agricoles ont identifié le fait qu'il pourrait être utile de proposer aux agriculteurs un espace de stockage de données. En effet à l'heure actuelle l'agriculteur qui veut stocker les données relatives à son exploitation a deux possibilités :
Stocker ses données chez le prestataire qui lui propose des services (éditeurs de logiciels de traçabilité, éditeurs d'OAD, agro-‐équipementiers, etc).
Stocker ses données sur une solution d'hébergement individuelle (ordinateur, serveur externe, etc.), souvent pas ou peu adaptée à l'utilisation et la valorisation des données.
Le projet serait de proposer un cloud agricole afin que l'agriculteur puisse y déposer ses données et les valoriser en utilisant notamment les fonctionnalités présentes dans le guichet unique. Il faut rappeler que ce service est identique à celui qui sera proposé par l'AgDataCoalition à ses membres (cotisation annuelle prévue de 250 $, voir 1.4.5). Le détail de la structuration et des fonctionnalités de ce cloud seront à définir ; elle pourra se baser sur celles proposées par l'AgDataCoalition aux USA, ou par le Seges (landmark.dk) et sur le dispositif AGROSYST (voir 1.4).
Sur ce sujet, il est à noter que, dans le cadre du plan « Cloud computing » (Nouvelle France Industrielle), est en train
Ce label, dénommé « Secure cloud » comporte 2 niveaux de qualification : « Secure cloud » et « Secure cloud + ». Les
Le label « Secure cloud » impose des exforte avec mots de passe hachés et salés, chiffrement logiciel et hébergement des données en Europe. Le label « Secure cloud + » ira plus loin, imposant une authentification multi-‐facteurs, un chiffrement matériel (via HSM, Hardware Security Module) ou encore un hébergement en France ou
Européenne.
Au regard des enjeux liés à la protection des données privées des agriculteurs, poser comme recommandation ou exigence que le prestataire choisi pour le cloud agricole soit labélisé « Secure cloud » voire « Secure cloud + » apparaît comme éminemment souhaitable.
53
Enfin, il est à noter que le « cloud agriculteurs » est un service offert par le portail pour garantir : les agriculteurs faisant appel à des gestionnaires de données
trouveront un via le cloud. Mais le cloud e « passage obligé » par lequel les agriculteurs mettront leurs données à disposition ; en effet, les agriculteurs ayant stocké leurs données chez un gestionnaire de données pourront lui demander de les ouvrir au portail dans un approche de type « bases de données distribuées » (voir 6.1 intégration de données).
Le « magasin numérique » 5.2
magasin numérique Les utilisateurs à attirer en priorité sont les fournisseurs de données car les consommateurs de données devraient être prioritairement intéressés par le guichet unique.
Voici quelques idées de services qui permettraient d'attirer les fournisseurs (non exhaustif) :
Mise en forme des données « fournisseur » sous forme de graphiques ou de cartes Widget graphique et cartographique à intégrer dans un site externe par une simple URL Convertisseurs de coordonnées géographiques Calculateurs simples, Accès à des API de calcul proposées par des prestataires extérieurs (Instituts techniques
agricoles par exemple) Statistiques locales (sur la base des données du portail) Statistiques par secteur ( Météo agricole Avertissements agricoles
La conception et le développement de ces fonctionnalités pourraient faire l'objet d'un hackathon. Dans un second temps, cet espace pourrait évoluer . Il pourrait donc aussi contenir des éléments de « teasing » envers les agriculteurs (voir chapitre « animation »), comme par exemple les statistiques de fourniture de données, par région, ou par secteur, ou bien encore des concours, des jeux, etc..
Espace vitrine des outils et services 5.3participative
Le portail pourra être un lieu de présentation (vitrine)
Présentation : offrir aux entreprises de présenter et décrire leurs produits (objets dans une interface de type « vitrine » organisée par « grands thèmes »
(fertilisation, irrigation, protection des cultures, cultures sous abris, monitoring des cultures .
54
Evaluation : il est remonté lors des entretiens que les OAD et services proposés par des tiers peuvent susciter la méfiance de la profession agricole. Les agriculteurs manquent de retours quant à l'efficacité de ces outils, leurs limites, leurs coûts, leur ergonomie, etc. Ils pourraient même être sensibles à une « certification de qualité ». Il est proposé à la communauté des utilisateurs de ces outils de faire office d u secteur hôtellerie-‐restauration via le site "TripAdvisor". Les agriculteurs pourraient commenter et noter les outils et services numériques qu'ils utilisent, indiquer . Les éditeurs y trouveraient un avantage en identifiant les besoins et améliorations à apporter à leurs produits. Le tout serait modéré par le portail et donc impartialement.
Espace d'échanges entre acteurs de la profession agricole 5.4
L teurs de la profession pour accélérer la diffusion du savoir, des pratiques et des idées en agriculture. Les différents acteurs de la profession agricole, au premier rang desquels les agriculteurs, pourraient partager leurs expériences, expertises, savoir-‐faire, idées, interrogations et besoins sur ce portail. Les besoins qui émergeraient ainsi pourraient
Cette fonctionnalité -‐Agri (http://www.openagrifood-‐orleans.org/fr/les-‐projets/367-‐projet-‐hub-‐agri.html)... Et de nombreux autres portails. Un espace de type forum/ wiki/ réseau social est envisageable, avec classement des interventions par grands thèmes.
55
Conclusion 5.5
En accompagnement du guichet unique, les services « Cloud » (offre de stockage) et « Magasin numérique » semblent tout-‐à-‐fait intéressants pour générer du trafic. Le service « Cloud » peut également générer des recettes pour conforter le modèle économique. La mise en place de cet
hébergement se traduit par des contraintes en termes de responsabilités et de rôles comme décrites dans les figures 4 et 5.
Figure 4 -‐ Le partage des responsabilités en fonction des fonctionnalités choisies pour le portail (choix 1 : portail/guichet seul ; choix 2 : portail/guichet + hébergement) .
Figure 5 -‐ portail/guichet seul ; choix 2 : portail/guichet + hébergement) .
6
Points techniques
58
Points techniques critiques 6.Le portail agricole AgGate sera une plateforme web accessible sur les navigateurs couramment utilisés (Internet Explorer, Firefox, Chrome, Safari et versions « mobiles »). La technologie utilisée devra respecter les standards du web. Il sera notamment nécessaire de préciser des mentions légales et d'insérer un bandeau relatif à l'utilisation des cookies. Les éléments exportables devront reposer sur des standards en vigueur principalement basée sur des technologies favorisant
Le portail devra donc être évolutif. Au-‐delà de ces considérations générales, plusieurs points sont apparus comme particulièrement critiques.
Recherche des données, intégration, métadonnées et sémantique 6.1
6.1.1 Intégration de données
Le moteur de recherche doit être capable de proposer les résultats d'une recherche en un minimum de temps, alors que les sources de données sont diverses et hétérogènes. Ainsi, une approche d données doit être mise en place6. L un accès uniform homogène) à des sources
multiples autonomes (sans affecter leur comportement, indépendant des autres sources ou du
hétérogènes (différents modèles et schémas de données) structurées (ou semi-‐structurées).
voie » le portail comme un guichet unique. La technologie offrant une capacité d'intégration intelligente et automatique constitue un accélérateur et un facilitateur important (figure 6).
6 Özsu, M.T., Valduriez, P. (2011) Principles of Distributed Database Systems, Springer, 846 p. http://www.springer.com/fr/book/9781441988331
59
Figure 6 -‐ Accès à des sources distribuées (à gauche) versus intégration de données (à droite)
Logique « entrepôt » : les données sont moissonnées chez les fournisseurs, puis entreposées dans une base qui est gérée par le portail ; on parle de données « persistantes » car elles sont conservées par le portail ;
Logique « virtualisation des données » : les données sont stockées dans des bases distribuées chez les fournisseurs de données ;
homogènes : le guichet sera capable, à la demandeles différentes bases, mêmes hétérogènes, et de les fédérer.
On trouve également des hybrides de ces 2 modes. A noter que si la fonctionnalité « espace de stockage/cloud agriculteurs » est retenue, le portail deviendra également fournisseur de données via ses propres bases de données.
Accès à des sources distribuées Intégration de données
60
Les avantages et inconvénients de ces 2 approches sont décrits dans le tableau suivant :
Entrepôt Bases de données Distribuées Fédérées
Avantages Maîtrise complète de la donnée Accès ultrarapide
Adapté à un contexte « Big Data », à savoir où les données nouvelles ne sont pas connues a priori, et où les données sont hétérogènes
Sécurité et qualité des données de la responsabilité du fournisseur
Inconvénients Difficulté de faire évoluer la structure de
contient de très grosses masses de données (moins adapté au big data)
Qualité et sécurité sont de la responsabilité du portail
Double stockage (chez le fournisseur et sur le portail), coût du stockage
Accès un peu moins rapide (mais reste temps réel) grâce aux technos Big Data)
Disponibilité de la donnée soumise à la politique et à la technologie du fournisseur
Il apparaît que la hétérogènes est cell médiateur ». « médiateur », les données restent dans les sources, les requêtes sont exprimées sur le schéma global, puis décomposées en sous-‐requêtes sur les sources et les résultats des sources sont combinés pour former le résultat final. Le moteur de recherche se base sur les métadonnées du schéma global (Figure 7).
Celle-‐ci exige la construction d intermédiaires : un « médiateur » qui gère le catalogue global, et traduit les requêtes pour les sources données, et « » (en général, un pour chaque source) qui reçoit les requêtes du médiateur et les traduit dans le langage
mettant en un modèle global. Les métadonnées, qui contiennent les modèles de données, mais aussi des informations sur les licences, droits d'accès, de réutilisation et de propriété des données, par exemple, sont donc essentielles. Il est indispensable de s'assurer de la complétude de ces métadonnées pour assurer la performance du service. L'ensemble des métadonnées pressenties figure en Annexe 4.
61
Figure 7 -‐ (source : D Vodislav, ENSEA)
: si les API ne sont pas disponibles, il aura accès à leurs schémas de données et leurs référentiels (des valeurs prises par chacun des champs, par exemple les valeurs « blé », « maïs », « orge » pour le champ « culture »). La création du médiateur et des adaptateurs devra être prise en charge par
er sur leurs résultats : le format choisi par la mission ETALAB est JSON-‐LD, avec l'utilisation du vocabulaire standard CSVW (du W3C).
6.1.2 Vers une ontologie des domaines « agriculture » et « environnement »
médiateur » apparait dans un premier temps comme la meilleure voie pour mettre en place rapidement un guichet unique, il peut être envisagé, pour améliorer le service de recherche
ntiques et les standards W3C. Il serait notamment très utile de construire des ontologies car leur utilisation permet un requêtage plus précis (on peut préciser la sémantique)
uniquement le schéma du médiateur. Une ontologie est une formalisation logique, structurée et idéalement exhaustive7 des connaissances pour un domaine donné, réalisée en fonction d'un usage spécifique. Elle permet une communication entre hommes, entre machines ou hommes/machines. L'ontologie du domaine est utilisée pour représenter un domaine (par exemple,
) sous forme de base de connaissances, en utilisant des concepts-‐clés, les attributs, les instances relatifs au domaine. Les ontologies, qui manipulent des concepts et leurs relations, peuvent être liées à une terminologie du domaine (définie par exemple par un thésaurus), ce qui permet de faire le lien avec la langue naturelle (on peut penser par exemple à passer de requêtes en langue naturelle dans un vocabulaire contrôlé construit sur la terminologie à des
7 Plus exactement « exhaustives vis-‐à-‐ »
62
de domaine est donc un dispositif très efficace
La création et l'utilisation d'une ontologie ad hoc passeraient la spécialisation et de ressources existantes (voir par exemple du LIRMM, en encadré). On
environnement, dans le cadre de la création de ce portail. -‐tourisme, le
Les données du portail et la communauté rassemblée par le portail seront mises à profit pour faire de la recherche sur les ontologies, par exemple, extraction
(cf chapitre « Animation », lien avec la recherche).
Focus sur l'Agroportal du LIRMM
L'agroportal (http://agroportal.lirmm.fr/) développé par le LIRMM (Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier) met à disposition un ensemble de ressources pour les chercheurs en agriculture et agronomie voulant partager leurs données, dans les formats du web sémantique : thésaurus (SKOS), schéma de données (ontologie OWL), schéma avec données associées (jeux de données RDF). Un format CSV est aussi mis à disposition pour le téléchargement. Ce portail utilise une technologie déjà Stanford Stanford). Le portail permet de rechercher des ressources, de les visualiser, de les commenter, de les télécharger, de décrire les projets les utilisant. Le portail décrit chaque ressource en calculant un certain nombre d'indicateurs (nombre d'éléments dans la ressource, nombre de visites, etc). Chaque ressource peut être associée à un projet qui l'utilise afin de bien définir son usage dans un système d'information. Des outils sont mis à disposition sur le portail, par exemple un annotateur pour identifier les éléments d'une ressource apparaissant dans un texte fourni par l'utilisateur ou encore un outil pour visualiser les correspondances entre ressources. Le portail contient aussi une page pour présenter des indicateurs calculés sur l'ensemble des ressources mises à disposition. Pour faire évoluer leur portail et permettre à leurs utilisateurs de tester de nouvelles fonctionnalités le LIRMM a organisé un premier agrohackathon en juin 2016 à Montpellier.
Interconnexion 6.2
L'interconnexion envisagée dans le portail concerne la fusion de données de natures différentes provenant de plusieurs sources de données. Par exemple, une donnée de « qualité de sol » est fusionnée avec des données de rendement sur une parcelle. L'interconnexion ne concerne pas le regroupement d'individus de même nature (par exemple des parcelles) présents dans des sources différentes dans une même structure, mais la mise en relation de données de natures différentes.
Ces données doivent donc être mises en correspondance et interconnectées via un référentiel commun. Concernant les cultures, ce référentiel correspond aux coordonnées spatio-‐temporelles des données. Cela sous-‐entend que les données géographiques et temporelles sont interopérables d'un jeu de données à l'autre. Il est donc nécessaire de disposer des métadonnées caractérisant les
63
référentiels spatio-‐temporels utilisés (la projection et le fuseau horaire par exemple). Dans le cas de production animale, c'est l'identifiant de l'animal qui servira de référentiel.
Le "sas d'interconnexion" est un outil distinct du moteur de recherche, qui vient en complément. Les jeux de données et API identifiés par la recherche sont "envoyés" et utilisés dans ce sas pour réaliser l'interconnexion. rconnexion est une opération complexe car dans la plupart des cas, les références spatiales et/ ou temporelles des différentes bases de données à fusionner ne correspondront pas exactement ; on tombera alors sur un cas classique de fusion de données spatiales.
Suite à l'interconnexion, les coordonnées spatio-‐temporelles des jeux de données pourront être transformées (par translation, rotation ou autre méthode) pour les anonymiser (voir chapitre suivant). Il est important de bien valider le caractère anonyme des données suite à une interconnexion. En effet, le fait d'interconnecter des données peut accroitre le risque de ré-‐identification : plus une position géographique sera documentée par le croisement des données, plus elle correspondra à un lieu unique.
Anonymisation 6.3
6.3.1 Pourquoi anonymiser ?
Les lois qui protègent la vie es données à caractère personnel, à moins que s soit remplie (cf. Annexe 6) :
le consentement des personnes concernées a été recueilli après leur bonne information sur la finalité du traitement et les modalités de la communication ou de la réutilisation des données les concernantdétiennent (ex : droit de rectification de destinataires des données,
les données sont anonymisées -‐à-‐dire ne permettant pas, compte tenu de leur niveau ;
la réutilisation est autorisée par un texte législatif ou réglementaire.
er des données à caractère personnel et à ce titre, elles devront être anonymisées sauf à obtenir le consentement des personnes concernées sur la rediffusion de ces données.
Une exploitation agricole est une entreprise qui peut se prévaloir de la protection de ses secrets
les « » sont des « informations dont non seulement la divulgation au public mais également la simple transmission à un sujet de droit différent de celui qui
-‐ci ».8 En se fondant sur cette jurisprudence, -‐ et notamment
-‐ pourrait divulguer des informations
8 Tribunal de première instance des Communautés européennes dans son arrêt du 18 septembre 1996, Postbank c. Commission (affaire no T-‐353/94, Rec., II, p. 921, point 87)
64
susceptibles de nuire au détenteur/ producteur des données.
L'anonymisation consiste à modifier le contenu ou la structure de données afin qu'il ne soit plus possible de ré-‐identifier les personnes physiques ou morales auxquelles elles sont rattachées. L'enjeu est de trouver le bon compromis entre anonymisation et utilité des données. En effet, retirer trop
: par exemple en agrégeant spatialement des grains supérieurs à la parcelle (ex . Il
-‐identification par une analyse préalable. Le niveau de risque acceptable sera fixé par la gouvernance.
Il faut néanmoins noter que toutes les données n'ont pas vocation à être anonymisées par le portail ; par exemple les données ne comportant aucune donnée à caractère personnel, ou les données que les fournisseurs accepteront de partager telles quelles (avec leurs données géographiques explicites) ne seront pas anonymisées.
6.3.2 Comment anonymiser ?
De nombreuses données agricoles sont référencées temporellement et géographiquement (par
valeur et de leur fort potentiel de ré-‐identification. Pour les jeux de données dynamiques, leur potentiel de ré-‐identification est susceptible de varier dans le temps. Il est pertinent de le mesurer régulièrement.
montre 3 familles de solutions :
généralisation) ; au sens de la loi n° 51-‐711 du 7 juin 1951 modifiée sur le « secret statistique » publiques);
Des techniques de « confidentialité différentielle » basées sur la perturbation des données par données fictives ;
La réécriture des requêtes pour intégrer requête qui demanderait la coordonnée géographique serait réécrite).
La 3ème . 6.3.3 « quand anonymiser »). Les 2 premières familles de solutions sont particulièrement adaptées, comme décrit ci-‐dessous :
Changement de granularité. Le « secret statistique » créé par un accroissement de granularité (agrégation par moyennage de données en changean est le résultat de la loi n° 51-‐711 du 7 juin 1951 modifiée. Son des personnes physiques sur leur vie personnelle et familiale et des entreprises sur le secret commercial. Les informations publiées sur le site agreste ( http://agreste.agriculture.gouv.fr) en sont un exemple.
65
Pour les données agricoles, le changement de granularité (agréger les données sur plusieurs parcelles ou plusieurs communes), le temps (agréger des données sur la date de semis ou de traitement sur plusieurs jours) ou les individus (moyennes sur les animaux issus différentes)
Confidentialité différentielle. Cette méthode injecte une proportion connue de données fictives (mais réalistes) dans une population. On peut alors calculer les estimateurs de la moyenne ou de la
fausses « plausibles », et où les fonctions qrestent utiles (en particulier la densité et la distance).
Le référencement spatiotemporel de la donnée pose un véritable problème car un grand nombre de données de ce portail seront référencées géographiquement et temporellement. De manière générale, cette coordonnée ne sera pas révélée (sauf avec le consentement de son propriétaire) car
(vor risques identifiés en Annexe 6). Une des v
transformation par translation, rotation ou autre).
En conclusion, rappelons que p chnique, éventuellement combinée avec une autre doit -‐identification du jeu de données.
6.3.3 Quand anonymiser ?
rôle d'un "tiers de confiance" : dans les bases de données que les fournisseurs ont ouvertes, il a accès
s réponses (métadonnées), mais sans révéler de données à caractère personnel ou de données protégées par le secret des affaires. Les données
un téléchargement, après une analyse du risque de ré-‐identification.
6.3.4 Conclusion
: en fonction des problèmes, elle rendra impossible la réutilisation de ces données conjointement avec une autre source de données que le consommateur de données pourrait avoir à sa disposition. En effet, le référentiel spatiotemporel qui permettrait de faire le lien entre ces données aura été supprimé ou modifié. L'intérêt pour le consommateur peut donc être fortement réduit. De plu interconnexions de données ayant des références géographiques non superposées, elle demandera un service supplémentaire au portail de mise en correspondance géographique (et qui pourra être payant). Un des enjeux du portail est donc de
66
collecter le plus fréquemment possible des données dans lesquelles la coordonnée géographique peut être ouverte. Cependant plusieurs niveaux sont possibles dans le brouillage du
technique :
Certaines données pourront être fournies avec le géo-‐référencement, par exemple,
physique ou ne contreviennent pas au « secret des affaires » ou si cela est autorisé par un texte réglementaire,
données de production concernant la protection des cultures, la fertilisation etc) seront anonymisées vis-‐à-‐vis du géoréférencement, soit par agrégation, soit par brouillage du géoréférencement, en fonc
Sécurisation 6.4
via un médiateur, ce guichet unique pourra conserver des données (service cloud) contenant des informations personnelles. Il fera pour cela l'objet d'une déclaration à la CNIL (cf. Annexe 6).
L'accès au système devra être sécurisé. Le système devra être sûr et ne pas présenter de faille de sécurité connue. La mise à niveau régulière du dispositif de sécurité devra être intégrée. Les échanges monétaires devront être tout particulièrement sécurisés.
Médiateur » réduit le risque de sécurité par rapport à une approche « Entrepôt ». « cloud agriculteurs » rendra les problèmes de sécurité plus prégnants.
Ergonomie, design et charte graphique 6.5Une attention particulière sera portée à l'ergonomie. Celle-‐ci devra être la plus simple et intuitive possible afin de ne pas rebuter les utilisateurs et de ne pas nécessiter de former les différents publics. Les interfaces pourront aussi être pensées et construites différemment selon les cas d'utilisation du guichet (utilisateur fournisseur, utilisateur consommateur de données). Le moteur de recherche sera im
Un système de FAQ pourra être mis en plac
nalisée qui sera décidée en lien avec le prestataire.
7
68
Animation du projet 7.
7.1
recenser les données accessibles et leur pertinence, négocier , faire évoluer les capacités techniques du portail, communiquer autour du portail y compris en organisant des évènements ciblés.
Une des missions de l'équipe d'animation sera d'accompagner les fournisseurs dans la mise à disposition de leurs données, aussi bien d'un point de vue juridique (sur les problématiques de propriété/titularité des données) que d'un point de vue technique (pour accéder aux modèles de données et construire les adaptateurs).
7.2
écosystème -‐privé la dynamique « French
Tech » : appels à projets, concours de startups, hackathons, compétition numérique, challenge numérique, renforcement des transferts technologiques depuis
C3challenge greentech verte, lancée 2015-‐2016 (http://c3challenge.com/), :
1-‐ Vision Camp : ativité collectives pour faire émerger les besoins et les rêves partagés des parties prenantes ;
2-‐ Challenge workshop les défis auxquels on veut répondre.
3-‐ Innovation Jam solutions innovantes aux défis posés.
On peut également envisager des financements plus conséquents de projets dans le cadre de Hackathon, sujets aux étapes 1 et 2.
exemples de modèles ou de services créés à partir de données, dès re du portail9. Les hackathons peuvent concerner (non exhaustif):
la mise au point de modèles / services à partir des données du portail ;
9 Pour cela, une première équipe « ad hoc » sera constituée à partir de collaborateurs des sociétés qui portent le projet de création de la SAS ; elle sera rattachée opérationnellement au porteur de projet.
69
la mise au point de petits applicatifs pratiques pour le « magasin numérique » ; la création gies et de référentiels communs.
Le portail valorisera les nouveaux services ainsi développés, notamment auprès des agriculteurs qui auront acce
Convaincre les producteurs et fournisseurs de données 7.3
leurs données acteurs décision. Ce -‐mise sur les données agricoles par des agro-‐fournisseurs dominants ou de grands acteurs de la donnée (les GAFA). :
de construire la confiance en un système qui sera gouverné par la profession agricole, et qui ne dévoilera pas leurs données sensibles aux tiers non-‐autorisés ;
partagée,
pour que les agriculteurs soient volontaires dans le partage de leur données.
parmi lesquels :
La co-‐construction des activités du portail avec les agriculteurs, en particulier pour identifier les fonctionnalités prioritaires à implémenter, les outils attendus dans le magasin numérique,
toucher différentes filières et identifier des fonctionnalités nouvelles pour le portail dans une approche « design thinking » ;
chronique trimestrielle et bilan annuel), et de leur propres données (information systématique, statistiques annuelles etc), pour conserver le lien avec les agriculteurs ;
statistiques contextualisées, à etc)
Une information régulière sur les nouveaux outils du magasin numérique ou les OAD mis en ligne sur le portail (quand la fonctionnalité sera ouverte)
Des approches plus ludiques : palmarès du dépôt de données, de la réutilisation de données, concours, etc
Un canal privilégié pour construire la confiance est celui des organisations agricoles, que le portail
La charte des fournisseurs de données et la charte des utilisateurs de données sont aussi des éléments cruciaux pour construire la confiance.
70
Liens avec la recherche 7.4
7.4.1 Une opportunité pour la recherche : trouver ou publier des données
Le portail est un outil exceptionnel dont la profession agricole va pouvoir se doter pour favoriser les innovations en agricrecherche est un autre utilisateur du portail qui est à la fois consommateur et fournisseur de données. Les données à vocation agricole-‐ produites pourront donc être déposées sur le portail et ouvertes, politique promue par l européenne, ce qui leur confèrera une visibilité exceptionnelle et une véritable facilité de réutilisation. Cette visibilité peut être accrue en publiant les données dans des data journals.
Comme ne recherche spécifique
alimentaire vernance). Une telle ontologie agricole est une attente forte de la profession agricole et des éditeurs de logiciels. Cette recherche préparera la nouvelle génération du portail, à savoir des performances de recherche accrue grâce à
in est une formidable opportunité de collaboration (1) avec la profession agricole, car une ontologie se travaille d'abord au sein de groupes de travail "métiers", ce qui renforce le lien avec les utilisateurs et les producteurs de données (2) avec d'autres projets en agriculture, d'autres acteurs, nationaux et internationaux. C'est aussi un important levier de compétitivité, car celui qui crée et gère l'ontologie est au du système, y compris en termes de standardisation et de normalisation industrielle. Enfin, il faut bien noter qu'il y a un consensus au sein de la communauté scientifique pour que la construction d'une ontologie soit un processus "ouvert", et pas propriétaire, ce qui est tout-‐à-‐fait cohérent avec les objectifs du portail.
Au-‐delà de cette action de recherche spécifique, qui serait à mener en parallèle avec la création du portail, les outils classiques de financement de la recherche peuvent être mobilisés. Sans chercher à être exhaustifs, nous présentons ci-‐dessous trois dispositifs de recherche structurants -‐ en partie issus des recommandations de la mission AI2025-‐ qui peuvent établir un lien fort avec AgGate, le portail de données.
7.4.2 Le programme CASDAR
Le CASDAR est un programme alimenté par la taxe sur les exploitations agricoles porté par le ministè (DGER) faire évoluer les pratiques des agriculteurs en vue de répondre aux enjeux liés à la transition agro-‐française. Il a par exemple servi à financer le projet API-‐AGRO (cf 1.4.3). La mission AI2025 a recommandé de lancer un programme sur les capteurs, en particulier pour la détection précoce des
71
maladies. Privilégiant les TRL10 élevés et la collaboration « instituts techniques / recherche », le CASDAR peut être utilisé pour encourager les projets ayant vocation à :
Développer des sys , ces données étant réutilisées dans le portail ;
Développer des applicatifs à partir des données du portail ; Développer des méthodologies et des dispositifs, amélior
portail, par exemple des ontologies, des systèmes de sécurisation/ anonymisation etc. ;
7.4.3 Convergences en agriculture numérique #DigitAg
Suite à la recommandation AI 2025 de créer un institut structurant la recherche en agriculture numérique, le projet #DigitAg (www.HDigitag.fr) instituts Convergences » de février 2016. Cet « institut Convergences en agriculture numérique », localisé à Montpellier, propose un programme de recherche et un programme de formation pour favoriser la
11 a été créée (mêlant sciences humaines et sociales, sciences du numériq ) et le lien avec les entreprises est établi, en particulier via la formation. Les flux entre le portail et #DigitAg seront bidirectionnels : le portail fournira aux chercheurs des données pour faire avancer des
calculer la valeur des bases de données. Les avancées méthodologiques seront intégrées dans Ie portail.
7.4.4 Les Livings Labs (ou laboratoires vivants)
Les Living Labs sont de nouveaux dispositifs de recherche, préconisés par la mission AI2025 dans lesquels une approche intégrée est développée en vraie grandeur des usages, des services et des outils. De nouvelles technologies, de nouvelles organisations, de nouveaux modes de production agricole au regard de leurs performances économiques tout en tenant compte des spécificités. Les living Labs seront de façon expérimentale des TICs (smartphones, objets connectés) territoire pour encourager leur mise en
. Les données ainsi collectées pourront alimenter le portail. Il serait souhaitable que les Living Labs agricoles incluent tous une dimension de collecte et mise à disposition de
Conclusion : Le portail peut alimenter la recherche ou être alimenté par la recherche, aussi bien en
en couplage éventuel avec des publications de données dans des « data journals », en particulier pour les données issues des Living Labs.
10 Technologies Readiness Level 11 Emploi Temps Plein
8
Mise
en œuvre
74
Mise en 8.
Calendrier 8.1
les 5 fonctionnalités identifiées (phases 1 et 2 ci-‐dessous). On distingue trois phases :
Phase 1 : C(12-‐15 mois)
Phase 2 : Lancement (construction des modules complémentaires, acquisition du trafic) et une phase de « croisière » avec un phasage de versions nouvelles et une animation (2 ans)
Des recherches sur les ontologies et sur la chaîne de valeur sont menées en parallèle des phases 1 et 2.
Phase 3 : Croisière, pha
Des échanges avec le cabinet de conseil Bearing Point ont permis de proposer un planning estimatif du travail de mise en de cette première phase.
Figure 8 -‐ à partir de sept 2016 (Source : Bearing Point).
75
La phase la plus cruciale est la première, à savoir la construction du guichet (12-‐15 mois). Différents chantiers ont été identifiés, avec l :
-‐ Chantier Juridique / économique
Benchmark, cadrage du modèle économique, modélisation
Mise en place des contrats, licences, chartes, audit de recevabilité
-‐ Chantier Organisation / gouvernance
Définition de la gouvernance institutionnelle
Définition de l'organisation cible
Définition des processus de fonctionnement / modes ops
-‐ Chantier Technique
s
AMOA et développement de la plateforme v1
-‐ Chantier Pilote
Préparation, animation et bilan du pilote
-‐ Chantier collecte données et services
Mobilisation des partenaires et préparation au partage de données
Achats de certaines données / ressources / apps
-‐ Chantier Communication / animation
Référencement initial (SEO)
Actions de communication et animation pour le lancement (conférence, hackaton, appels à projet, data days, publicité, emailing)
Evaluation économique préliminaire 8.2
8.2.1 Dépenses
être recrutée le plus rapidement possible en 2017. Elle doit intégrer entre 4 et 6 personnes, sur les profils suivants :
-‐ un directeur, bien intégré dans le milieu agricole gestionnaire, connaissances juridiques
-‐ un data management officer,
-‐ un marketeur /communication
-‐ un chef de projet informatique,
-‐ un gestionnaire
76
Le coût annuel de cette équipe-‐projet (salaires chargés, environnés) est estimé à 750-‐800 pour une implantation parisienne. Il peut y avoir du sens à installer cette équipe en province à proximité
des données en agriculture (ce qui se traduirait aussi par une réduction de 20% des coûts salariaux).
Phase 1-‐ Construction (2017)
Pendant la phase 1, les coûts additionnels sont estimés comme suit
-‐ Action de mise en place 700
(chantier juridique, économique, organisation, gouvernance, technique AMOA)
-‐ Actions d (vision camp, challenge,
En ajoutant les salaires, la phase de construction est donc estimée à 1,85 2,1
Phase 2 -‐Lancement (2018-‐2019)
Pendant la phase 2, les coûts sont estimés comme suit :
-‐ Prestation fournisseur de la pl 150-‐
-‐ Assistance juridique récurrente 5
-‐ Actions d 3
En ajoutant les salaires, la phase de lancement est donc estimée à 1,25-‐1,4 M /an soit 2,5 à 2,8
Phase 1 et 2-‐ Recherches ciblées (2017-‐2019)
Recherche sur la chaîne de valeur des données agricoles
.
Au total le coût de la construction du portail (avec accompagnement recherche sur les ontologies) est de 4 850 5
77
Phase 3-‐ Croisière (à partir de 2020)
Pendant la phase 3, la prestation fournisseur devra être adaptée au trafic, et les actions eront réduits, une fois le trafic acquis, et financés par le privé.
Pendant la phase 3, les coûts annuels sont estimés comme suit :
-‐ Prestation fournisseur de la 150-‐
-‐ Assistance juridique récurrente
-‐ Actions d (sponsoring): 15
En ajoutant les salaires, la phase de croisière est donc estimée à 1,1-‐ 1,25 / an
8.2.2 Recettes
Construction du portail (2017-‐2019)
Phase 1 (2017)
Contributions des actionnaires 1 400-‐1 800
Subvention pour les challenges (coût challenges + salaires)
SOUS-‐ TOTAL Phase 1 2 000 -‐ 2 4
Phase 2 (2018-‐2019)
Contribution des actionnaires 1 800 2 0
Subvention pour les challenges (coût challenges + salaires)
Publicité
SOUS-‐ TOTAL Phase 2 2 800 300
TOTAL RECETTES -‐ CONSTRUCTION (2017-‐2019) 4 800 -‐ 5 4
Cette phase de construction peut être accompagnée par des financements publics.
et cadre de France numérique par le CGI
78
assimilé à un « »12 dans le cadre du PIA, à hauteur de 50% des dépenses. Un projet pourra être déposé à France AgriMer
Dans ce dernier cas, le besoin en apport par les actionnaires (capital, cash et in kind) est de 3300-‐ sur 3 ans sous forme avance remboursable.
Croisière (2021-‐) Budget annuel (Recettes)
Sponsoring privé des challenges (incluant les salaires) 20
Paiement pour téléchargement de données intégrées et interconnectées
Cloud des données agriculteurs 5000 agriculteurs (a)
50% de réduction si 100% ouverture donnée : 50 * 3000 agriculteurs
1
CPC, CPA, CPM, CPL, CPV)
Pages pub dans la vitrine technologique
TOTAL RECETTES PHASE CROISIERE 1 15
(a) Ces chiffres ne proviennent
ire est assuré par un service de stockage sécurisé de la donnée ces publicitaires
; il repose sur s pour contribuer au modèle économique.
12 ; en particulier, aucun groupe ou ETI ne doit détenir plus de 25% du capital.
9
Conclusion
80
Conclusion 9.
Les enjeux du portail 9.1
Les enjeux du portail sont résumés dans le tableau ci-‐dessous. Les points clés en sont à savoir la capacité à retrouver des données pertinentes, 2) la maîtrise des risques techniques
s et 4) la maîtrise du modèle économique. Pour celui-‐ci, plusieurs approches sont proposées, qui peuvent éventuellement être mises en de manière hybridée.
Figure 9 -‐ ure du portail
Facteurs de succès et risques principaux 9.2
9.2.1 Appropriation et confiance
l conviendra notamment que les détenteurs de données publiques qu'il s'agisse des ministères, des organismes publics et para publics ou des entreprises détenant des données ayant fait l'objet de financements publics, au sens de la réglementation en vigueur, rendent leurs données librement accessibles via le portail.
De plus un producteur de données aura un intérêt à ddes
services offrant des retours rapides vers les producteurs (agriculteurs) et les fournisseurs (éditeurs). Ces services seront identifiés via des actions de « design thinking » avec les agriculteurs et avec les éditeurs. demandent à
81
leurs prestataires gestionnaires de données (éditeurs de logiciels, agro-‐leurs données au portail. Le rôle des acteurs de ce dispositif devra être clairement exposé pour être
recherche, les éditeurs de logiciels) peuvent être à la fois fournisseurs et utilisateurs de données. La figure 10 décrit les rôles des différents acteurs.
Figure 10 -‐ une réussite fondée sur une bonne répartition des rôles entre acteurs,
ation par chacun des acteurs et un jeu collectif
Enfin, les agriculteurs ne sont pas les seuls concernés par la production de données, les acteurs de la recherche ou des territoires génèrent également des données . La mise en place du portail peut être une opportunité pour ces acteurs publics de mieux valoriser les données.
Au-‐delà des agriculteurs, il est indispensable que les fournisseurs potentiels de données (éditeurs, agroéquipements) trouvent un intérêt dans la démarche. Les outils du magasin numérique sont une première réponse, mais ces acteurs peuvent être particulièrement intéressés par des actions de standardisation13.
optique et sera une excellente occasion de fédérer les
13 Rappelons que la société DKE-‐data créée par des agro-‐équipementiers en Allemagne décrites dans le benchmarking (1.4.5), qui sont précisément de créer un hub avec une standardisation des données pour faciliter les échanges.
82
9.2.2 Performance technique
Un autre critère de succès est technique et a trait aux utilisateurs de données ; il porte sur la capacité du moteur de recherche et des procédures d'interconnexion des données et des outils de traitement
différentes.
9.2.3 Les enjeux du partage de la valeur
OAD ou de services nouveaux. pas de création de valeur ette base que des question quant à la rémunération de la donnée, et ce dans tous les secteurs économiques. Concernant les données agricoles, comme la COPA-‐COGECA (association des agriculteurs et des coopératives européennes)14, ont pris position sur le fait qu important de veiller à ce que les agriculteurs obtiennent une part équitable de la valeur générée par les données agricoles ». Ce questionnement rejoint celui de la création de la valeur sur la chaine de la donnée. La chaîne de valeur de la donnée est la suivante15 : 1-‐ création de données 2-‐ stockage de la donnée 3-‐ analyse de la donnée pour en tirer une information (ou un service) 4-‐ par un système automatique (ou du service par un utilisateur). La valeur est créée à toutes les étapes de la chaîne, mais de manière non linéaire. La question de la quantification de la valeur (ajoutée) à chaque étape de la chaîne est complexe, ou plus simplement de la valeur de la donnée de base est complexe et peut être abordée de diverses manières. Les
être menées dans le cadre du montage du p Convergences #DigitAg.
14 COPA-‐COGECA (2016) Grands principes régissant la collecte, l'utilisation et l'échange de données agricoles, QJ(16)2689:5 DA/FG/mvs, position paper publié le 28-‐09-‐2016 sur http://www.copa-‐cogeca.be/Main.aspx?page=Papers 15 Gustafson T., Fink D. (2013) Winning within the Data Value Chain, http://www.innosight.com/insight/winning-‐within-‐the-‐data-‐value-‐chain/
83
Figure 11 : Les facteurs q (source : digital ethics)
certains -‐up
ou grand groupe).
Cependant, si la question du juste retour financier vers le producteur de données se pose, le coût
élevé onnées e que celui
-‐à-‐vis des fournisseurs.
Recommandations 9.3
Créer un portail unique au monde
1-‐Compléter la fonctionnalité « guichet des données utiles aux agriculteurs
s ; 2-‐ Référencer des données publiques, des données de la recherche et des données privées ; 3-‐ Faire du guichet un hub de données distribuées chez leurs fournisseurs, en travaillant en mode « réservoir de données/ médiateur » pour interconnecter les données issues de sources différentes ; 4-‐ Etablir un s, via la
; 5-‐ , en particulier au niveau européen.
lopper en
84
Gagner la confiance de la profession agricole et la :
6-‐ Créer une société indépendante, gouvernée par la profession agricole, pour gérer le portail ; 7-‐ Développer des services offrant un retour rapide vers le fournisseur de données (cloud, magasin numérique), en impliquant la profession agricole dans une démarche de design thinking; 8-‐ des données sensibles lorsque celui ci est demandé ou requis ; 9-‐ Assurer la sécurité du portail ; 10-‐ Sensibiliser la profession agricole à
; 11-‐ Mener des recherches complémentaires pour créer des ontologies et évaluer la valeur le long de la chaîne de valeur de la donnée agricole.
Animer le portail pour assurer sa visibilité, son utilité et sa pérennité 12-‐ Accompagner le portail de valorisation de la donnée mobilisant les utilisateurs (vision camp, compétitions, challenges, hackathons) et communiquer autour des résultats ; 13-‐ Communiquer régulièrement vers les fournisseurs de données, en particulier les agriculteurs ; 14-‐ Encourager les liens entre le portail et les dispositifs de recherche pour une fertilisation croisée ; 15-‐ Encourager la réutilisation entre le portail et les autres initiatives proches (Agrosyst, API AGRO) 16-‐ Choisir un modèle économique et travailler sur le partage de la valeur (recherche)
10
ANNEXES
86
ANNEXES
Annexe 1 -‐ Lettre de mission pour JM Bournigal 10.1
87
88
89
Annexe 2 Questionnaire pour la caractérisation des bases de données 10.2agricoles
Portail de données à vocation agricole
*** OBJECTIF ***
Bonjour,
Un des axes de la mission "Mise en place d'un portail de données à vocation agricole" consiste à élaborer un cahier des charges de ce futur portail, en particulier en formulant des propositions concrètes sur les « jeux de données nécessaires au développement de services innovants ». Dans cette optique, nous dressons un inventaire des données publiques et privées disponibles et pouvant être mobilisées : type de données, propriétaire, objectif du recueil, qualification des données (validation), fréquence de mise
*** COMMENT REPONDRE A CE QUESTIONNAIRE ? ***
Le questionnaire ci-dessous vous guidera afin de renseigner un maximum d'informations concernant les bases/jeux de données à vocation agricole dont vous disposez. Nous reprendrons contact avec vous par la suite si nous avons des questions complémentaires.
Si vous avez plusieurs bases/jeux de données merci de dupliquer ce fichier et de le renseigner plusieurs fois.
Pour les questions à choix multiples merci de compléter le champ "Autres possibilités, précisions, commentaires" avec le plus de détails possibles.
Je vous laisse mes coordonnées. N'hésitez pas à me contacter si besoin.
Merci d'avance pour votre participation.
Charles MOSZKOWICZ - société ENEO
06 79 92 50 79
charles@eneo.fr
90
1. CONTACT (plusieurs contacts possibles) Nom - Prénom - Structure - Fonction *
Email *
Téléphone
2. BASE DE DONNEES
Nom complet de la base de données (tel qu'il apparait dans les textes officiels pour les administrations)
Acronyme de la base de données s'il y en a un
Description de la base : contenu, taille et couverture de la base de données
ex : La base regroupe des données de traçabilité de l'itinéraire technique et rendement de 1000 exploitations uniquement dans le Sud-Ouest de la France de 2006 à maintenant.
Qui est le gestionnaire de la base de données? (pour les administrations merci d'utiliser le nom tel qu'il apparait dans l'annuaire des services publics)
Qui est/sont le(s) fournisseur(s) de données? Quels organismes alimentent la base?
La base contient-elle des données personnelles?
oui
non
Si oui, Fait-elle l'objet d'une déclaration CNIL ?
oui
non
Autres possibilités, précisions, commentaires
Textes : textes officiels publiés par des administrations faisant référence à la base de données. décret, arrêté, délibération, rapport, code, loi, réponse, convention, circulaire, article...
91
Quels sont les outils de collecte?
Logiciel
Capteur
Questionnaire
Guide d'entretien
Autres possibilités, précisions, commentaires
3. DONNEES
Données brutes présentes dans la base (le plus exhaustif possible). Merci de mettre ces informations les unes en dessous des autres.
ex : interventions effectuées dans chaque parcelle avec
- date
- numéro de parcelle
- type d'intervention
- durée
- type de produit
- dose
Granularité/finesse des données brutes. Les données brutes concernent quelle(s) échelle(s)?
individu (plante ou animal)
intraparcellaire
parcellaire
cheptel
lot
atelier
exploitation
groupement d'exploitations
échelle départementale ou régionale
échelle nationale
Autres possibilités, précisions, commentaires
La donnée est-elle géolocalisée? A-t-elle des coordonnées géographiques?
Si oui, merci de préciser la projection utilisée. Si non pouvez-vous préciser le référentiel géographique que vous utilisez éventuellement (cadastre, Registre Parcellaire Graphique...)?
92
oui
non
Autres possibilités, précisions, commentaires
Fréquence d'acquisition des données brutes
continu
horaire
quotidien
hebdomadaire
mensuel
annuel
Autres possibilités, précisions, commentaires
Fréquence de mise à jour des données dans la base
continu
horaire
quotidien
hebdomadaire
mensuel
annuel
Autres possibilités, précisions, commentaires
Délai moyen entre l'acquisition et la disponibilité de la donnée dans la base
Existe-t-il un système de vérification d'erreurs (de saisie, d'incohérence, de manques)?
Disposez-vous de métadonnées?
ex : précision de la mesure, précision de la géolocalisation, source de la donnée (capteur, manuelle), référentiel, ontologies
Avez-vous des données traitées, analysées, agrégées à partir de ces données brutes? Statistiques, calculs d'indices... ? Si oui, lesquels? Précisez l'échelle géographique et l'échelle de temps.
93
4. ACCES
Liberté d'accès aux données
Accès à tous : données accessibles au public
Accès restreint (dans ce cas merci de préciser la restriction)
Accès fermé : données non accessibles
Autres possibilités, précisions, commentaires
ex : accès autorisé seulement à certaines catégories de personnes, par exemple l'administration, les chercheurs, certains organismes professionnels
Coût d'accès aux données (pour un futur utilisateur du portail). Souhaitez-vous fournir ces données gratuitement ou contre rémunération?
Gratuit pour tous
Payant pour tous
Tarif selon le profil d'utilisateur (dans ce cas merci de préciser votre réponse)
Autres possibilités, précisions, commentaires
ex : gratuit seulement pour la recherche, prix plus accessible pour instituts techniques...
Format de mise à disposition des données
Exploitable : par exemple fichier tableur (CSV, Excel), JSON
Non exploitable : par exemple fichier PDF, consultation en ligne
Autres possibilités, précisions, commentaires
Si les données sont déjà accessibles sur un portail, les conditions de réutilisation sont elles explicitées?
Explicitées sans restriction :
conditions des fins commerciales, à la condition éventuelle de mentionner la source.
Explicitées avec restriction :
Non explicitées :
Autres possibilités, précisions, commentaires
Adresse URL d'accès aux données (lien profond si disponible)
94
Datasets : Il s'agit de la dernière partie de l'url du jeu, pouvant être trouvée en haut du navigateur. Ex : https://www.data.gouv.fr/fr/datasets/balances-comptables-des-communes/
Références : les éventuelles adresses web évoquant la base de données. Remarque : Il ne s'agit pas du portail officiel de la base, ce n'est pas l'URL d'accès aux données.
5. AUTRES
Donnez un extrait de la base à titre d'exemple (10 à 20 lignes) et/ou le schéma de la base si possible.
Commentaires et remarques éventuelles
ex : données manquantes mois de Juillet 2008 sur la Beauce
En tant qu'utilisateur (et non plus fournisseur de données), de quelles données souhaiteriez-vous disposer sur le portail?
95
Annexe 3 -‐ Extrait de l'inventaire des bases de données à caractère 10.3agricole
Comme précisé dans le paragraphe "3.2 Origine des données", les informations récoltées dans le cadre de l'inventaire sont issues de 4 sources :
Les entretiens menés en présentiel ou par téléphone par le groupe de travail de l'Irstea en charge du projet AgGate en utilisant le questionnaire présenté en Annexe 2. Ce travail a été réalisé entre mai et septembre 2016.
Une démarche d'identification et de caractérisation des bases de données publiques menée par le MAAF en s'appuyant sur ce même questionnaire. Ce travail a été réalisé entre mai et septembre 2016.
Les entretiens menés dans le cadre du groupe "Connaissance des pratiques" du GIS GC HP2E, réalisés en 2016 par Agnès SALAÜN, chargée de mission « Connaissance des pratiques » du GIS GC HP2E (a.salaun@arvalisinstitutduvegetal.fr). Ce groupe est animé par Valérie LEVEAU,
-‐ Economie -‐ Environnement, Arvalis Institut du végétal (v.leveau@arvalisinstitutduvegetal.fr) et Eric CAHUZAC, INRA Toulouse, US-‐Observatoire du Développement Rural (eric.cahuzac@toulouse.inra.fr). Les entretiens ont été menés en utilisant un questionnaire semblable à celui présenté en Annexe 2. Il est à noter que la personne enquêtée ne fait pas nécessairement partie de la structure qui possède la base de données.
Le document « GISEDSemParis120424-‐Recueilfiches.pdf » du GIS « Elevage Demain" qui regroupe les résultats d'un inventaire réalisé en 2012 par le Groupement d'Intérêt Scientifique sur l'Elevage en utilisant leur propre protocole.
La diversité des sources expliquent la possible hétérogénéité dans la manière dont les bases sont décrites.
Propriétaire(s) de la base
Personne enquêtée
Structure -‐ Fonction de la personne enquêtée
Nom de la base Description, objectifs de la base Source des informations
ACTA, le réseau des instituts techniques agricoles ;
Baudet Alice ACTA WebPhyto ACTA
Données à l'origine des index phytosanitaires ACTA paraissant chaque année : informations sur les caractéristiques des substances actives, des produits phytosanitaires, les conditions d'usages des produits.
Groupe «Connaissance des pratiques » du GIS GC HP2E
ACTOVI (et IDELE)
Technique Ovin viande
Données sur les appuis techniques
techniciens. En 2011, 7 371 éleveurs sont suivis
Individuel.
GIS Elevage Demain
96
Agence Bio Guhl Florent Directeur de l'Agence Bio
Base nationale des opérateurs de l'agriculture biologique
Données de notification et de certification des opérateurs de la bio en France
Inventaire MAAF
Agence de l'Eau Artois-‐Picardie
Thépaut Nolwenn
Agence de l'Eau Artois-‐Picardie
Observatoire des pratiques agricoles du bassin Artois-‐Picardie
Suivi de l'évolution des pratiques agricoles, en lien avec la ressource en eau dans le bassin Artois-‐Picardie : collecte annuelle de données (fertilisation et interculture) auprès d'un échantillon représentatif d'exploitations agricoles en GC, Polyculture-‐Elevage, Maraîchage.
Groupe «Connaissance des pratiques » du GIS GC HP2E
Agence de l'Eau Artois-‐Picardie Collectivités
Thépaut Nolwenn
Agence de l'Eau Artois-‐Picardie
Observatoire ORQUE : Observatoire pour les Opérations de la Reconquête de la QUalité de l'Eau
Enquête annuelle sur les pratiques agricoles d'exploitants du bassin Artois-‐Picardie. Données sur la fertilisation, l'interculture, le travail du sol, la protection des cultures et sur l'état environnant des parcelles.
Groupe «Connaissance des pratiques » du GIS GC HP2E
Agence de l'Eau Seine-‐Normandie
Ratiarson Jérôme
Agence de l'Eau Seine-‐Normandie
Observatoire des reliquats azotés Seine-‐Normandie
Description des pratiques des agriculteurs sur des parcelles de référence, de façon continue sur une période pluriannuelle, plutôt orientée fertilisation et pratiques phytosanitaires. Description globale des Systèmes de culture sur l'ensemble de l'exploitation (diagnostics agricoles au niveau des AAC du bassin Seine Aval)
Groupe «Connaissance des pratiques » du GIS GC HP2E
Agence Européenne de
SOeS
CLC : Corine Land Cover
Occupation biophysique des sols, échelle européenne, mise à jour tous les 5 à 10 ans, dans le cadre du programme européen
Copernicus.
Groupe «Connaissance des pratiques » du GIS GC HP2E
Agriculteur APCA
Masseran André
APCA Mes p@rcelles : pratiques, déclarations PAC, localisation des parcelles, plan
30 000 abonnés en France mais tous n'utilisent pas l'intégralité des fonctionnalités de l'outil.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Agriscope Fernandez Guillaume
Président Données des stations météo
23 Millions de données brutes 12000 capteurs
Entretien Irstea
97
ANSES Vigneron Julien
Chef de projet Internet
Ephy : Catalogue des produits phyto-‐pharmaceutiques et de leurs usages, des matières fertilisantes et des supports de culture autorisés en France
Informations sur les produits (produits phytopharmaceutiques, matières fertilisantes et supports de cultures, adjuvants, produits mixtes et mélanges) couverts par une Autorisation de Mise sur le Marché (AMM).
Entretien Irstea
ANSES ANMV Le Letty Laetitia
Chef de
enregistre-‐ment (dpt autorisation de mise sur le marché)
iRCP : Index des médicaments vétérinaires autorisés en France
Données sur les médicaments vétérinaires autorisés en France : résumés des caractéristiques du produit (RCP) et de son utilisation.
Entretien Irstea
APCA Pérès Jean-‐Luc
Matériels Agricoles
Référentiel sur les coûts de matériels agricoles en filières GC, viticulture, maraîchage et arboriculture, avec des hypothèses sur 3 niveaux d'utilisation différents : charges, amortissement, coût de réparation par ha.
Groupe «Connaissance des pratiques» du GIS GC HP2E
ARAA Vandijk Paul
Agri-‐Mieux Données sur les pratiques des agriculteurs sur un échantillon de parcelles, de façon discontinue (tous les 4-‐5ans), sur une période pluriannuelle, des systèmes de production.
Groupe «Connaissance des pratiques» du GIS GC HP2E
AREAS Richet Jean-‐Baptiste
Pesticeros : Observatoire des usages et des transferts de produits phytosanitaires dans les eaux de ruissellement du BV érosif de Bourville
Suivi exhaustif des pratiques, notamment phytosanitaires, depuis 2007 sur le BV de Bourville, en GC et polyculture-‐Elevage pour identifier les conditions d'un fort risque de transfert de matière active par ruissellement en contexte érosif
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Dubois Baptiste
Arvalis -‐ Institut du végétal SAEE
BASE MEQ Caractéristiques du matériel agricole (prix du matériel, débit de chantier, consommation en carburant en fonction du sol, de la parcelle).
Groupe «Connaissance des pratiques» du GIS GC HP2E
98
Arvalis -‐ Institut du végétal
Siné Mehdi
Arvalis -‐ Institut du végétal SSIM
BASE SOL Fiches descriptives de sols agronomiquement importants, rattachés à des petites régions agricoles, au niveau national. Caractéristiques du sol décrites pour chaque sol-‐type : texture, calcaire, profondeur,
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Verdier Jean-‐Luc
Arvalis -‐ Institut du végétal Actions Régionales
ECOHERMIP Grandes Cultures
Données expérimentales au niveau Systèmes de culture du réseau ECOHERMIP GC qui comprend 5 sites expérimentaux.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Deudon Olivier
Arvalis -‐ Institut du végétal SSIM
EOLE Données météorologiques de station météo d'Arvalis et de l'INRA (journalières ou hebdomadaires).
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Berrodier Marc
Arvalis -‐ Institut du végétal SAEE
Fermothèque GC
Données structurelles de pratiques et de performances de 30 fermes-‐types réparties sur les grandes zones de production céréalière française. Deux fermes types complémentaires pour représenter le même système de production : une ferme-‐type moyenne (MAJ tous les 3 ans) et une ferme-‐type annuelle (MAJ annuelle), sur les cultures suivantes : BT; BD, orge; pomme de terre; maïs.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Lauga Bruno
Arvalis -‐ Institut du végétal SSIM
FERTICOM Informations légales et de composition de nombreux produits fertilisants et amendements sur GC.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Toqué Clotilde
Arvalis -‐ Institut du végétal SAEE
Micro-‐fermes de Boigneville
Essais de Systèmes de culture menés sur la station expéri-‐mentale d'Arvalis à Boigneville (91) de 1990 à 2015 ; données de pratiques sur chaque parcelle et données d'observations. Cinq micro-‐fermes: production intégrée, production monoculture de blé, production raisonnée, augmentation de la productivité du travail, Agriculture Biologique (en place depuis 2008).
Groupe «Connaissance des pratiques» du GIS GC HP2E
99
Arvalis -‐ Institut du végétal
Lauga Bruno
Arvalis -‐ Institut du végétal SSIM
PHYTCOM Référentiel des caractéristiques AMM (composition, doses, usages, toxicité, efficacité,...) sur les fongicides, les herbicides, les ravageurs, les traitements de semences, les régulateurs de croissance et les adjuvants. Reprend en partie les données du référentiel LEXAGRI.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Le Souder Christine
Arvalis -‐ Institut du végétal SAEE
Pratiques de fertilisation azotée du blé tendre
Enquêtes Arvalis annuelles sur les pratiques de fertilisation azotée (et, depuis 2009, soufrée) sur BT avec 2 angles : pratiques et stratégie de raisonnement de la fertilisation.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal
Lauga Bruno
Arvalis -‐ Institut du végétal SSIM
VARCOM Caractéristiques des variétés de céréales à paille, pommes de terre, maïs et lin expérimentées à ARVALIS : identité de la variété, qualité technologique, note de résistance et agronomie. Mise à jour confiée aux experts métiers du pôle Variétés du SG3P
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal FranceAgriMer
Streiff Adeline
Arvalis -‐ Institut du végétal SQV
Enquête variétale au champ sur Blé
Enquêtes annuelles auprès d'agriculteurs sur la qualité, sanitaire et technologique de la récolte nationale de BT et BD, depuis 2010 : données de pratiques et analyse de la qualité technologique de la récolte. Environ 500 parcelles (BT et BD) enquêtées chaque année
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal ITB Terres Inovia
Vigicultures® Epidémio-‐surveillance des GC sur le territoire français : données d'observations de bioagresseurs (maladies et les ravageurs et depuis peu les adventices) et des pratiques sur la parcelle suivie, pour rédiger les Bulletins de Santé du Végétal (BSV). Depuis 2008. L'outil est utilisé au niveau de 16 régions françaises (anciennes régions avant 2016).
Groupe «Connaissance des pratiques» du GIS GC HP2E
100
Arvalis -‐ Institut du végétal Terres Innovia
L'Herbier Crystel
Arvalis -‐ Institut du végétal Actions Régionales
SYPPRE, volet Observatoire : SYstèmes de Production Productifs et Respectueux de l'Environnement, volet Observatoire
Enquête annuelle sur les pratiques et la structure des exploitations : données sur l'ITINÉRAIRE TECHNIQUE du BT, colza et orge d'hiver, sur les stratégies de raisonnement des pratiques et les caractéristiques structurelles de l'exploitation. Développé depuis 2014 par les ITA GC afin de suivre de façon pérenne l'évolution des pratiques agricoles et de leurs performances.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Arvalis -‐ Institut du végétal UIPP
Marks Perreau Jonathan
Arvalis -‐ Institut du végétal SAEE
Données PCQE Fontaine du Theil
Données très variées (hydrologie, analyses chimiques des eaux, audits d'exploitations, pratiques culturales) au niveau du BV de la Fontaine du Theil dans le cadre de son suivi entre 1998 et 2006 par Arvalis et l'UIPP. L'ITINÉRAIRE TECHNIQUE de chacune des parcelles du BV a été répertorié (cultures, date de semis, interventions phytosanitaires avec produit, dose, date, interventions mécaniques, fertilisation, rendement).
Groupe «Connaissance des pratiques» du GIS GC HP2E
ASP Gendre Cédric
INRA US ODR
Données ASP de paiements sur le PDRH
Données sur les engagements et paiements par dispositif de la PAC sur le PDRH, réalisés par l'ASP entre 2007-‐2013.
Groupe «Connaissance des pratiques» du GIS GC HP2E
ASP Gendre Cédric
INRA US ODR
Données ASP de paiements sur le PRDN
Données sur les engagements et paiements par dispositif de la PAC sur le PRDN, réalisés par l'ASP entre 2000-‐2006.
Groupe «Connaissance des pratiques» du GIS GC HP2E
ASP MAAF
Guislain Stéphanie
ASP RPG : Registre Parcellaire Graphique
Système de déclaration graphique annuelle des surfaces agricoles dans le cadre des aides PAC.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Axéréal Bouchie Jean-‐Michel
Axéréal Service Agronomie
EXPE Système GC Berry
Données expérimentales sur 3 Systèmes de culture du réseau EXPE Système GC Berry (1 site expérimental)
Groupe «Connaissance des pratiques» du GIS GC HP2E
BASF Guillaume Vigneron
BASF, Chargé de mission marketing
Atlas Désherbage : risques résistance aux herbicides
Données de risques de résistance aux herbicides. Modèle de calcul basé sur les pratiques agriculteurs et ses traitements herbicides : délivre un niveau de risque de
agro et chimiques. Tout le territoire français.
Entretien Irstea
101
BASF Guillaume Vigneron
BASF, Chargé de mission marketing
Atlas MB : risques maladies blé et orge
Données de risques maladies sur le blé tendre, blé dur et orge. Modèle de calcul de risque agronomique en morte saison et risque maladies en saison.
Entretien Irstea
BASF Guillaume Vigneron
BASF, Chargé de mission marketing
Observ'Online clients dans différentes régions : maladies et ravageurs.
Entretien Irstea
BASF Guillaume Vigneron
BASF, Chargé de mission marketing
Référentiel phyto
Données produits phytosanitaires / voir Phytodata pour avoir
Entretien Irstea
BD PORCS BD PORCS : Système
et de traçabilité chez les porcins
Données : -‐ dentification des porcins ; de surveillance sanitaire.
GIS Elevage Demain
Cap2020 Denis Boisgontier
Gérant Cap2020
Données de prévision
Données de prévision météo à l'échelle horaire à 6-‐7jours avec un maillage spatial de 3kmx3km
Entretien Irstea
Cap2020 Denis Boisgontier
Gérant Cap2020
Données des stations météo
Données météo (rayonnement global, pluie / données horaires, température, humidité relative, vent, texture du sol) fournies par l'agriculteur
Entretien Irstea
Centre National de la Propriété Forestière
Thomas Formery
CNPF, Directeur Général
ILEX : Référentiel des dispositifs expérimen-‐ taux installés et suivis par le CNPF
Données de traçabilité des dispositifs expérimentaux (essais, placettes de références...) installés et suivis par le CNPF (plus de 6 000 références au 31/12/2015)
Inventaire MAAF
Centre National de la Propriété Forestière
Thomas Formery
CNPF, Directeur Général
MERLIN : Statistiques annuelles sur les documents de gestion forestières durables
Données de traçabilité des propriétés forestières (suivi en nombre et en surface) concernées par les documents de gestion forestière durable (DGD) : plans simples de gestion (PSG) et codes de bonnes pratiques sylvicoles (CBPS)
Inventaire MAAF
CER France Varchavsky Marc
CER France Observatoire coûts de production de Grandes Cultures
Coûts de production de GC basé sur des données comptables. Créé en 1990.
Groupe «Connaissance des pratiques» du GIS GC HP2E
102
CER Meuse Données CER Meuse
Données de comptabilité analytique d'exploitations agricoles de la Meuse.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre d'Agriculture de la Drôme
Castel Laurie
Chambre d'Agriculture Drôme
VERtiCAL Données expérimentales de Systèmes de culture de 2 sites expérimentaux en AB.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre d'Agriculture de Vendée
Rattier Thierry
Service Auxil 2 Relevés biologiques sur certains ravageurs (limaces, pucerons des épis du blé) et auxiliaires du maïs et du blé (carabes, syrphes et chrysopes au stade larvaire et parasitoïdes), données de pratiques des parcelles enquêtées et description du paysage environnant la parcelle. Projet débuté à la campagne 2014 dans 5 départements (Vendée, Loire-‐Atlantique, Sarthe, Mayenne et Maine-‐et-‐Loire).
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture Aquitaine-‐Limousin-‐Poitou-‐Charentes
Minette Sébastien
Chambre Régionale d'Agriculture Centre-‐Val de Loire
Observatoire des pratiques et des systèmes en Poitou-‐Charentes
Systèmes de culture de la région Poitou-‐Charentes, permettant notamment de constituer des références adossées au RMT Systèmes de culture.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture d'Alsace-‐Champagne-‐Ardenne-‐Lorraine
Schaub Anne
ARAA INNOViPEST Données expérimentales des Systèmes de culture sur 8 sites dont 6 chez des producteurs, 1 en station expérimentale et 1 en établissement agricole.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture de Bourgogne-‐Franche-‐Comté
Petit Marie-‐Sophie
Réseau PI Données expérimentales des 9 Systèmes de culture sur 6 sites expérimentaux.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture de Bretagne
Giteau Jean-‐Luc
SGC Bretagne Données expérimentales des Systèmes de culture sur 2 sites expérimentaux.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture de Lorraine
Leclech Nathaël
EXPE Ecophyto Lorrain
Données expérimentales des 7 Systèmes de culture sur 4 sites expérimentaux.
Groupe «Connaissance des pratiques» du GIS GC HP2E
103
Chambre Régionale d'Agriculture des Hauts-‐de-‐France
Halama Patrice
ISA Lille Agriculture / Laboratoire BioGAP
DEPHY EXPE NPDC
Données expérimentales des Systèmes de culture sur 2 sites expérimentaux (Tillay et Lorgies).
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture des Hauts-‐de-‐France
Tosser Véronique
Arvalis -‐ Institut du végétal SAEE
Entomophages Données de suivi d'auxiliaires et de pratiques agricoles en GC au niveau de 3 régions (Picardie, Rhône-‐Alpes et Centre) pendant 3 ans.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture des Hauts-‐de-‐France
Preud'homme Rose-‐Line
MNHN Auximore Données de suivi d'auxiliaires des cultures et de pratiques (travail du sol, nombre de traitements par catégorie) sur des parcelles de GC (et autres) sur 15 départements à travers toute la France pendant 2 ans.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambre Régionale d'Agriculture du Centre-‐Val de Loire ; CRA des Hauts-‐de-‐France CRA d'Auvergne-‐Rhône-‐Alpes ; CRA Nouvelle Aquitaine
Agenis-‐Nevers Aude
APCA INOSYS GC : INnOvation SYStèmes Grandes Cultures
Observatoire des systèmes agricoles performants en GC : 140 fermes en GC qui sont suivies annuellement au niveau national. Édite des cas-‐types pour aboutir à des référentiels de performances techniques et économiques calculées grâce aux données de suivi de fermes et à l'expertise métier.
Groupe «Connaissance des pratiques» du GIS GC HP2E
Chambres
du Grand Ouest
Enquête avicole des Chambres
Données techniques et économiques sur les élevages avicoles.
GIS Elevage Demain
CLAAS Louis Jean-‐Noël
Directeur marketing CLAAS
Utilisation du matériel
Données des capteurs embarqués sur tracteurs.
Entretien Irstea
National Inter-‐professionnel de l'Economie Laitière
INFOLABO R (bovins, ovins, caprins) pour les laboratoires, les laiteries et les producteurs.
GIS Elevage Demain
CNRS ITSAP
Bretagnolle Vincent
CNRS Données Pollinov-‐Risq'API
Données de suivi des pratiques agricoles sur la zone atelier de Chizé, (notamment projets Pollinov et DEPHY Abeilles) sur des systèmes en GC et Polyculture-‐Elevage: travail du sol, fertilisation, protection des cultures, semis.
Groupe «Connaissance des pratiques» du GIS GC HP2E
104
DDT(M) Poupeau Philippe
SYLVA : Système de Gestion administrative des dossiers forestiers (arrêté du 27/02/2001)
Données cadastrales des propriétés forestières et les régimes d'autorisation ou droits afférents.
Inventaire MAAF
DGAL Rémy Sébastien
Chef du bureau d'appui à la surveillance de la chaîne alimentaire
Publication des résultats des contrôles officiels en sécurité sanitaire des aliments
Résultats des contrôles officiels en sécurité sanitaire des aliments : contrôles réalisés par les agents du MAAF et bientôt contrôles des autres administrations.
Inventaire MAAF
DGAL Commeau Natalie
Chef du bureau de
scientifique, de la recherche et des laboratoires
Laboratoire agréés pour les analyses visées au livre II du CRPM
Listes des laboratoires agréés pour une analyse donnée.
Inventaire MAAF
DGAL / SDPRAT / BMOSIA -‐
Pascal Deriu Frédéric Masson
Adjoint au chef de bureau Directeur de projet USAGERS
RESYTAL -‐ USAGERS
Gestion des USAGERS (entreprises et établissements) et des activités
regard de la réglementation liée aux contrôles sanitaires dans les domaines de la Santé et protection animale, sécurité sanitaire des aliments et santé qualité et protection des végétaux. Volumétrie : env. 2 millions d'usagers.
Inventaire MAAF
Ekylibre Sebastien Hemono
Responsable produit
Itinéraire technique et comptabilité
Données agriculteurs : de la comptabilité jusqu'à l'itinéraire technique
Entretien Irstea
FDSEA51-‐Conseil CDER
Carpentier Alain
INRA SMART
Données comptables de centres de gestion de la Marne
Données de comptabilité analytique d'exploitations agricoles de la Marne (en cours de construction).
Groupe «Connaissance des pratiques» du GIS GC HP2E
FNCUMA Stéphane Chapuis
Responsable BDD
Diagnostic de performance des tracteurs
Données de diagnostic sur la performance environnementale des tracteurs (10 000 tests).
Entretien Irstea
FNCUMA Stéphane Chapuis
Responsable BDD
Fiabilité du matériel
Données qualitatives sur la fiabilité des matériels (issues d'une enquête auprès de 200 CUMA et agriculteurs).
Entretien Irstea
105
FNCUMA Stéphane Chapuis
Responsable BDD
Matériel des exploitations
Données sur les adhérents, le matériel, la comptabilité liée au matériel, des données analytiques.
Entretien Irstea
France Conseil Elevage et France Bovins Croissance
contrôle de performances et de conseil bovins et caprins
Données du contrôle de performances des bovins et caprins.
GIS Elevage Demain
FranceAgriMer /MEP/BIE
Meizels Monique Seyer Philippe
Chef du service des bases d'information économique Chef de
structuration de données
Cotations 2 : Cotations animales
Données de volumes, de prix,
hebdomadaires des principaux abatteurs en France (veaux, bovins, ovins). Données de volumes, de prix,
bestiaux. Couverture : France métropolitaine Taille de la base de données individuelles : 6 Go.
Inventaire MAAF
FranceAgriMer Meizels Monique Seyer Philippe
Chef du service des bases d'information économique Chef de
structuration de données
Etats 2 : VISIOGrains (BdD) et VISIOBase (entrepôt de données décisionnel) NB2 : ce formulaire concerne les données françaises sur la collecte de céréales,
de protéagineux ainsi que celles sur les stocks de ces produits chez les collecteurs.
Données de recensement (tous les collectés enquêtés) sur les quantités de grains de céréales et
protéagineux collectées par les collecteurs déclarés auprès de FranceAgriMer , et les stocks de ces produits chez ces collecteurs. Couverture nationale. Depuis juillet 1998. Collecte : 1 500 000 enregistrements Stocks : 1 800 000 enregistrements VISIOGrains Etats 2 : 2,5 Go VISIOBase -‐ Etats 2 : 7 Go (contient les historiques)
Inventaire MAAF
FranceAgriMer Meizels Monique Seyer Philippe
Coûts de production blé tendre
Enquêtes annuelles entre 1995 et 2009 sur les ITINÉRAIRES TECHNIQUES de 100 parcelles dans 5 départements du grand Bassin Parisien.
Groupe «Connaissance des pratiques» du GIS GC HP2E
106
Fruition Sébastien Payen
CEO Fruition Données météo et irrigation vigne
Données météo depuis 2006. Données vigne uniquement (flux de sève et analyses labo sur baies) en Bordeaux, LR, Alsace, Champagne. Données ponctuelles
Entretien Irstea
GEOSUD et pôle Theia
Pierre Maurel
Irstea, Coordon-‐nateur projet GEOSUD + membre bureau exécutif pôle national Theia
Plateforme imagerie de la Terre GeoSud-‐Theia
Images satellites très haute résolution spatiale (50 cm à 6 m) : couvertures nationales annuelles depuis 2010, acquisitions ad-‐hoc monde entier depuis 2015. Licence tout acteur public français + acteur privé pour R&D après accord préalable. Archives SPOT 1-‐5 1986-‐2014. Images Sentinel 2 prétraitées depuis 2016. Produits bio-‐physiques dérivés des images.
Entretien Irstea
Geosys Chloé Cochais
Geosys, responsable produit
Imagerie basse résolution
Images observation de la terre en basse résolution 30 50 m public USGS + 5 -‐ 30m.
Entretien Irstea
Geosys Chloé Cochais
Geosys, responsable produit
Itinéraire technique carte de rendement (fournies par
l'agriculteur) + référentiel variété.
Entretien Irstea
Geosys Chloé Cochais
Geosys, resp produit
Météo Météo. Entretien Irstea
IFIP GTE-‐P : Gestion
Economique
Données techniques et économiques en élevage porcin : coût alimentaire et du renouvellement.
GIS Elevage Demain
IFIP GTE-‐TB : Gestion
Economique Tableau de Bord
Données pour prolonger GTE en gérant les autres postes du coût de production.
GIS Elevage Demain
IFIP GTTT : Gestion Technique des Troupeaux de Truies
Données de performances de
reproducteur (truies et verrats) : résultats de performances de reproduction globaux et critères permettant de les analyser. Méthode standardisée permettant la comparaison entre élevages. Couverture : tous les élevages détenteurs de truies, naisseurs et
GIS Elevage Demain
107
IGN /Direction des programmes civils
Elisabeth Leblanc Bruno Goupil
Service d'Appui aux Politiques Publiques, Chargée de relation avec les ministères Service Aménagement du Territoire, Directeur de programme
RGE® ALTI, BD ORTHO®, BD PARCELLAIRE®, SCANs 25®
RGE® ALTI http://professionel.ign.fr/sites/default/files/D L_RGE-‐ALTI_2-‐0.pdf BD ORTHO® http://professionel.ign.fr/sites/default/files/DL_raster_ORTHO.pdf BD PARCELLAIRE®: http://professionel.ign.fr/sites/default/files/DL_BDPARCELLAIRE_1_2.pdf SCANs 25®: http://professionel.ign.fr/sites/default/files/DL_raster_SCAN.pdf
Entretien Irstea
INERIS SIRIS Pesticides 2012
Caractéristiques chimiques et données toxicologiques de substances actives.
Groupe «Connaissance des pratiques» du GIS GC HP2E
INRA Bertrand Christine Milan Denis -‐ INRA -‐
Directrice du CTIG (centre de traitement de l'information génétique) Chef de Département Génétique Animale,
SNIG : Systèmes nationaux d'information génétique des espèces bovine, ovine, caprine et porcine. SIG (bovins), SIEOL et OVALL (ovins), SIECL (caprins) et BANAPOG (porcins).
SNIG : Ensemble des données zootechniques et de généalogie gérées en application de l'arrêté du 24 mars 2015, pour génétique officielle, la recherche et le suivi de et populations animales sélectionnées des espèces bovine, caprine, ovine et porcine.
Entretien Irstea
INRA Cellier Vincent
Rés0Pest Données expérimentales des 8 Systèmes de culture du réseau PI sur 8 sites expérimentaux.
Groupe «Connaissance des pratiques » du GIS GC HP2E
INRA -‐CNRS Réseau SEBIOPAG : Réseau de sites d'observation à long terme des Services Ecosystémiques assurés par la BIOdiversité dans les Paysages Agricoles
Données de suivis de pratiques sur 20 parcelles au niveau de 5 sites (dont 4 en GC et 1 en verger) en France sur 3 ans, en parallèle d'observations de prédateurs des cultures, de flore et de carabes (2 fois par an en 3 séries pour chaque session) sur les mêmes parcelles.
Groupe «Connaissance des pratiques» du GIS GC HP2E
108
INRA SMART Cariou Sylvain
Séries nationales de prix intrants
Données de prix sur l'énergie, les carburants, l'engrais et les aliments de 1990 à 2009.
Groupe «Connaissance des pratiques» du GIS GC HP2E
INRA SAD Paysage
Joannon Alexandre
Suivi des pratiques agricoles sur la Zone Atelier Armorique
Données de suivi sur 4 années des pratiques agricoles en GC et Polyculture-‐élevage pour environ 240 parcelles de cultures (6 exploitations les 2 premières années et 5 les 2 dernières) dans la Plaine de Fougères.
Groupe «Connaissance des pratiques» du GIS GC HP2E
INRA UMR Agroécologie
Munier-‐Jolain Nicolas
INRA System-‐Eco-‐Puissance4
Données expérimentales des 19 Systèmes de culture sur 4 sites expérimentaux.
Groupe «Connaissance des pratiques» du GIS GC HP2E
INRA Agence de l'Eau Seine-‐Normandie
Schott Céline
INRA SAD-‐ASTER
APOCA : Agricultural Practices of the Orgeval Catchement Area
Données sur les pratiques d'une vingtaine d'agriculteurs de GC du BV de l'Orgeval entre 1990 et 2011. Donnant naissance à la description de l'assolement parcellaire par exploitation de 1990 à 2011, estimation de l'assolement du BV de 1990 à 2011 et les ITINÉRAIRES TECHNIQUES moyens par culture et par an.
Groupe «Connaissance des pratiques» du GIS GC HP2E
INRA Agence de l'Eau Seine-‐Normandie
Puech Thomas
INRA SAD-‐ASTER
BdD ARSEINE : Base de Données Agricole Régionalisée sur le bassin SEIne-‐NormandiE
Données de pratiques représentatives (successions et ITINÉRAIRES TECHNIQUES) de régions agricoles homogènes en GC, polyculture-‐élevage et viticulture.
Groupe « Connaissance des pratiques » du GIS GC HP2E
(Unité de Recherche sur les Herbivores), Equipe EGEE (Economie et Gestion de
économique Bovins Viande et Ovins Viande
Données Bovins Viande : démarrage en 1971 avec 50 exploitations (Nièvre), intégration de 18 (Creuse) en 1980...
dont 10 en Agriculture Biologique et 1 exploitation de lycée agricole. Données Ovins Viande : démarrage en 1987 avec 50 exploitations (Montmorillonnais, Plateau de Millevaches, Margeride et Dôme). En 2010, 48 exploitations dont 12 en Agriculture Biologique.
GIS Elevage Demain
109
INSEE IPAMPA : Indice des prix d'achat des moyens de production agricole
Données sur les variations de prix des intrants (base 2010) pour: Produits de protection des cultures, Aliments des animaux, Matériel et petit outillage, Entretien et réparation, Produits et services vétérinaires, Semences et plants, Energie et lubrifiants, Engrais et amendements.
Groupe « Connaissance des pratiques » du GIS GC HP2E
INSEE IPPAP : Indice des prix des produits agricoles à la production
Données sur les variations des prix de production agricoles.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Institut de l'élevage
RECP : Réseaux
le Conseil et la Prospective
Données sur le fonctionnement technique et économique des
France et de leurs évolutions : 1420 fermes suivies en 2010 dans le cadre du socle national, complétées de 500 fermes suivies dans le cadre régional.
GIS Elevage Demain
Institut français du cheval et de l'équitation
de Cadolle Hubert
Adjoint au directeur général chargé du pilotage stratégique du système d'information
SIRE (système d'information relatif aux équidés).
Données relatives à la propriété, la détention et à l'identification des équidés nés ou détenus en France, et données sanitaires et zootechniques relatives à ces équidés : Nb de chevaux : 3 millions Nb de personnes : 1 million 1/ Base de données centrale
2015/262 de la Commission du 17 février 2015) 2/ Fichier national des équidés (code rural L212-‐9) 3/ Fichier central zootechnique des équidés (code rural D212-‐46)
Inventaire MAAF
Invivo Agrosolutions
Guillaume Py
Data scientist
FermesEcophyto Données de pratiques et parcellaires des agriculteurs engagés dans le réseau FERMEcophyto, indicateurs d'impact environnemental et de performance économique, des récoltes 2011 à 2015. En tout 2900 fermes dans le réseau, 150 à 320 fermes sont tracées chaque année.
Entretien Irstea
110
INVS ACTA Université Claude Bernard, Lyon 1
CIPA : Compilations des Index Phytosanitaires ACTA
Ensemble des données relatives aux substances actives et à leurs usages depuis 1961 et disponibles au sein des index phytosanitaires ACTA.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Irstea Vernier Françoise
Irstea Enquête Bassin versant du Né
auprès d'agriculteurs et d'experts agricoles : description des pratiques agricoles dans le BV du Né (viticulture+ GC sur le BV) en Charente. Données sur leur perception des évolutions de leurs pratiques.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Isagri Alexandre Diaz
Isagri, responsable Innovation
Gestion globale de l'exploitation
Données de gestion de l'exploitation. 110 000 licences.
Entretien Irstea
ITAVI Guillaume Coutelet
CUNIMIEUX : Réseau de fermes de références cunicoles
Données technico économiques sur les élevages cunicoles.
GIS Elevage Demain
ITAVI Observatoires économiques avicoles suivi des coûts de production
Données économiques sur les marchés avicoles.
GIS Elevage Demain
ITAVI Guillaume Coutelet
RENACEB RENALAP : Gestion
Economique cunicole
Références nationales techniques et économiques annuelles sur la production cunicole.
GIS Elevage Demain
ITAVI RENAPALM : Gestion
économique des éleveurs et gaveurs de palmipèdes à foie gras
Données et de gavage en filière longue, sur les performances zootechniques et les résultats économiques.
GIS Elevage Demain
ITAVI Réseau de fermes de références palmipèdes à foie gras
Données de caractérisation des systèmes de production
production nationale (main production
annexe,...).
GIS Elevage Demain
111
ITB Gouwie Céline
Enquête SITE (Suivi des Itinéraires Techniques)
Enquêtes annuelles sur les pratiques culturales en betterave; de la récolte du précédent à la récolte de betterave. Depuis 1997.
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITB Gouwie Céline
Amendements ITB
Caractéristiques générales des amendements utilisés par les betteraviers enquêtés dans le cadre de l'enquête SITE : fournisseur, type d'amendement, composition,... Données d'expérimentation.
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITB Gouwie Céline
Machinisme ITB
Liste de marques, modèles et caractéristiques techniques (taille,
agricoles utilisés par les betteraviers enquêtés dans le cadre de l'enquête SITE de l'ITB.
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITB Gouwie Céline
Produits phytosanitaires ITB
Caractéristiques (n°AMM, composition, fournisseur, usage,
utilisés par les betteraviers enquêtés dans le cadre de l'enquête SITE.
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITB Gouwie Céline
Variétés Betterave
Données descriptives sur toutes les variétés testées par l'ITB depuis une vingtaine d'années(classification d'inscription, distributeur, date d'inscription, lieux d'essai, évolution des classements dans le temps,code GEVES, obtenteur, prix standard,...).
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITB IRSTEA FNCUMA FNEDT
Blocaille Suzanne
ITB Service Agro-‐équipement et conservation
Perfbet Caractéristiques techniques des chantiers de récolte de betteraves classées dans différentes catégories : pneumatique,
vingtaine de chantiers de récolte référencés.
Groupe « Connaissance des pratiques » du GIS GC HP2E
ITK Philippe Stoop
ITK, directeur R&D
Assolement Données sur les cultures en place sur la parcelle.
Entretien Irstea
ITK Philippe Stoop
ITK, directeur R&D
Données de sol -‐ texture et profondeur de sol fournis par agriculteur -‐ carte de sol USDA
Entretien Irstea
ITK Philippe Stoop
ITK, directeur R&D
Etat hydrique et sanitaire
-‐ déficit hydrique -‐ état sanitaire (mildiou, oïdium, blé, septo, rouille) -‐ potentiel de rendement -‐ scénarios prospectifs
Entretien Irstea
112
ITK Philippe Stoop
ITK, directeur R&D
Météo Données météo. Entretien Irstea
Lasalle Beauvais
Grandgirard David
Lasalle Beauvais
SCA 0 pest Données expérimentales des Systèmes de culture sur 1 site (GC combinées à l'agroforesterie).
Groupe « Connaissance des pratiques » du GIS GC HP2E
MAAF CALAMNAT : Outil d'instruction des demandes d'indem-‐nisation au titre des calamités agricoles
Données nécessaires aux calculs des indemnisations et résultat de ces calculs. Lots de paiement.
Inventaire MAAF
MAAF Eveillard Philippe
UNIFA Livraisons d'engrais et d'amendements minéraux basiques
Statistique des livraisons correspondant aux déclarations
producteurs et des importateurs de fertilisants minéraux et organo-‐minéraux.
Groupe « Connaissance des pratiques » du GIS GC HP2E
MAAF INRA
Fried Guillaume
ANSES Laboratoire de la santé des végétaux, Unité d'Entomologie et Plantes invasives
Réseau Biovigilance Flore
Données de suivi des pratiques agricoles (l'ITINÉRAIRE TECHNIQUE, la topographie, le sol, la présence de haies et les cultures jouxtant la parcelle) et d la flore adventice au niveau national sur environ 1000 parcelles de 2002 à 2010. Mis en place par le Service de la Protection des Végétaux et l'INRA aujourd'hui géré par l'ANSES.
BdD de calculs d'indicateurs (IFT, ...).
Groupe « Connaissance des pratiques » du GIS GC HP2E
MAAF/DGAL BDNI : Système
de
et de la traçabilité des bovins
dentification des bovins et suivi des mouvements (
final).
GIS Elevage Demain
MAAF/DGAL OVINFOS : Système
de
et de la traçabilité des ovins et des caprins
dentification des ovins et caprins et suivi des mouvements dans surveillance sanitaire des cheptels
GIS Elevage Demain
113
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
ESEA : Enquête sur la Structure des exploitations agricoles
Données individuelles sur un échantillon de 53 000 exploitations agricoles: cultures, cheptels, main-‐de diversification, production sous signe de qualité, modes de production (irrigation, couvert), gestion (statut, mode de faire valoir).
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
ESEA-‐tableaux : Enquête sur la Structure des exploitations agricoles
Données régionales concernant les cultures, les cheptels, la main-‐
diversification, la production sous signe de qualité, les modes de production (irrigation, couvert), la gestion (statut, mode de faire valoir) des exploitations agricoles.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
IVER : Inventaire des vergers -‐ Enquête sur la structure des vergers
2013 : Enquête quasiment exhaustive sur les exploitations métropolitaines exploitant une surface >= un hectare en vergers de pommiers, pêchers, abricotiers, pruniers, kiwis, noyers, agrumes, ou d'au moins 50 ares en vergers de poiriers, cerisiers, raisin de table : données sur les structures, les superficies, les circuits de commercialisation. Enquête 2007 : enquête sur un échantillon de 6500 exploitations agricoles ayant des vergers de plus de 50 ares : structure des exploitations, variétés, pratiques culturales, commercialisation.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
IVER-‐tableaux : Inventaire des vergers -‐ Enquête sur la structure des vergers -‐ Tableaux
Données tabulées par région issues de l'enquête IVER 2013 (Enquête quasiment exhaustive sur les exploitations métropolitaines>=1 hectare en vergers de pommiers, pêchers, abricotiers, pruniers, kiwis, noyers, agrumes ou > 50 ares en vergers de poiriers, cerisiers, raisin de table : données sur les structures, les superficies, les circuits de commercialisation). Enquêtes par sondage de 1997, 2002 et 2007 (échantillon d'environ 6500 exploitations agricoles)
Inventaire MAAF
114
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
PKGC : Enquête sur les pratiques culturales en grandes cultures
Relevé des itinéraires techniques sur un échantillon de parcelles (Blé tendre 3000 ; Blé dur 900 ; Orge 2100 ; Triticale 2500 ; Colza 2100 ; Tournesol 1500 ; Pois protéagineux 1900 ; Maïs fourrage 2500 ; Maïs grain 2200 ; Betterave sucrière 800 ; Pomme de terre 900 ; Canne à sucre)
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
PKGC-‐tableaux 2011 : Enquête sur les pratiques culturales en grandes cultures tableaux 2011
Données tabulées par extrapolation des données de l'enquête relevant les itinéraires techniques sur un échantillon de parcelles (Blé tendre 3000 ; Blé dur 900 ; Orge 2100 ; Triticale 2500 ; Colza 2100 ; Tournesol 1500 ; Pois protéagineux 1900 ; Maïs fourrage 2500 ; Maïs grain 2200 ; Betterave sucrière 800 ; Pomme de terre 900 ; canne à sucre)
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
PKViti : Enquête sur les pratiques culturales en viticulture
Enquête portant sur un échantillon d'environ 6200 parcelles : Itinéraire technique, fertilisation, pratiques phytosanitaires.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
RA : Recensement agricole
Données individuelles sur les exploitations agricoles : cultures, cheptels, main-‐de diversification, production sous signe de qualité, modes de production (irrigation, couvert), gestion (statut, mode de faire valoir).
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
RA-‐données chiffrées : Recensement agricole données chiffrées
Données agrégées, par commune ou zonage plus large, sur les exploitations agricoles : cultures, cheptels, main-‐de diversification, production sous signe de qualité, modes de production (irrigation, couvert), gestion (statut, mode de faire valoir).
Inventaire MAAF
115
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Rica : réseau
comptable agricole
Données de comptabilité d'un échantillon d'exploitations agricoles représentatif de l'ensemble des exploitations agricoles de France métropolitaine, Etendu aux Dom depuis 2013 (Guadeloupe, Martinique, La Réunion). Sont disponibles les micro-‐données et également des données de synthèse.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
SAA : Statistique agricole annuelle
Séries longues historiques annuelles sur les productions en volume physique : végétales (surfaces, production, rendement) et animales (cheptels, production de viande, production de lait).
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Teruti-‐Lucas : Enquête sur l'utilisation du territoire : TERritoire UTIlisation Land Use/Cover Area frame Survey
Enquêtes annuelles associant photographies aériennes (base de sondage) et relevés de terrain effectués par des enquêteurs. A partir de 1982, enquête basée sur un échantillon national obligatoire constant. Occupation et utilisation du sol relevé sur 322 000 points en France métropolitaine, en Guadeloupe, à la Martinique, à La Réunion.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
VVT : Valeur vénale des terres
stimation du prix des terres, prés et vignes par petites régions agricoles ou regroupement de petites régions agricoles.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Bilan d'approvisionnement
Séries longues historiques annuelles sur les bilans exprimés en quantités : équilibre des ressources (stocks de début, production utilisable, importations) et des emplois (exportations, utilisations intérieures, stocks finals) pour un produit donné : Céréales -‐ Riz -‐ Pomme de terre (bilan interrompu en 2011) -‐ Protéagineux ; Sucres et produits sucrés ; Oléagineux -‐ Huiles et graisses ; Viandes -‐ -‐ Lait et produits laitiers ; Légumes -‐ Fruits ; Ressources fourragères.
Inventaire MAAF
116
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Bulletin mensuel de conjoncture
Séries longues historiques mensuelles depuis 1993.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Comptes régionaux de l'agriculture
Comptes de l'agriculture, en valeur (prix courants) et en volume (prix de l'année précédente).
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Enquête sur la structure de la production légumière
Enquête par échantillon auprès de 13000 exploitations >= 50 ares (20 ares et plus dans les DOM) de légumes frais ou pour la transformation, en plein air et sous abri bas ou ayant un abri haut : Données de SAU, superficies légumières, UTA, modes de culture, surfaces en abris hauts ou serres, mode de succession ou
commercialisation.
Inventaire MAAF
MAAF/SG/SSP Giroux Gisèle
Cheffe du bureau de l'information statistique
Enquête sur la structure de la production légumière -‐tableaux
Tableaux obtenus après extrapolation des données de l'enquête par échantillon auprès de 13000 exploitations >= 50 ares et plus (20 ares et plus dans les DOM) de légumes frais ou pour la transformation, en plein air et sous abri bas ou ayant un abri haut consacré aux légumes frais : données de SAU, superficies légumières, UTA, modes de culture, surfaces en abris hauts ou serres, mode de succession ou
commercialisation.
Inventaire MAAF
MAAF DGPE SGPAC SDGP SG/SM/SDSI/BSIP
Justin Willy
Chargé de projet informatique
de gestion et
des dossiers de contrôle des structures
Données relatives aux biens agricoles, objets des demandes
déclarations) effectuées via Logics (outil de télédéclaration des demandes). En cours de développement (généralisation de
).
Inventaire MAAF
117
MAAF / Sous-‐direction de la Performance environnementale et de la valorisation des territoires (SDPE)
Karine Belna
Chargée de mission stratégie environne-‐mentale dans les politiques agricoles ; Bureau du dévelop-‐pement agricole et des chambres d'agriculture (BDA)
Suivi GIEE Données de suivi des groupements
chaque appel à projet régional.
Inventaire MAAF
MNHN APCA
Preud'homme Rose-‐Line
MNHN Observatoire agricole de la biodiversité
Données de suivi au niveau de parcelles en GC, cultures pérennes et maraîchage, de différentes faunes (abeilles, papillons, invertébrés du sol), données paysagères sur l'environnement proche de la parcelle (occupation du sol, mode de conduite la parcelle).
Groupe « Connaissance des pratiques » du GIS GC HP2E
Multi-‐propriétaire, chaque organisme rentrant les données dans la BdD
Munier-‐Jolain Nicolas
INRA UMR Agroécologie
DEPHY Ferme GC
Données de pratiques des Systèmes de culture d'exploitations engagées dans le réseau DEPHY en GC, collecte des informations dans l'outil Agrosyst développé par l'INRA.
Groupe « Connaissance des pratiques » du GIS GC HP2E
NORMABEV NORMABEV Données de classement et de marquage des gros bovins, vérification de la présentation des carcasses et de la pesée fiscale des gros bovins dans
GIS Elevage Demain
ODEADOM Bouhnik Norbert
RSI Plusieurs bases de données par mesure d'aide : Banane, Canne, Végétal, Certificats d'imports
Données : coordonnées du bénéficiaire, montant de l'aide perçue, date du paiement, département concerné, produit imputé.
Inventaire MAAF
ONF BDN : données d'observation naturalistes
Inventaire MAAF
118
ONF Contour des forêts et des parcelles forestières des terrains relevant du régime forestier
Inventaire MAAF
ONF Contour des réserves biologiques
Inventaire MAAF
Organisme Stockeur
Simonin Pascal
Terres Inovia
DDP Colza Diester : Données Démarche de Progrès Colza Diester
Données des enquêtes annuelles sur les pratiques culturales menées par les OS depuis la campagne 2007-‐2008 dans le cadre de la Démarche de Progrès (DDP) de la filière Colza Diester : type de sol, travail du sol, fertilisation, rendement, mode de récolte,...
Groupe « Connaissance des pratiques » du GIS GC HP2E
SIABAVEChambre d'Agriculture Marne
Négri Ophélie
SIABAVE Observox : Observatoire orienté Xénobiotiques
Données de description des pratiques réelles sur toutes les parcelles des exploitations suivies en GC, viticultures et maraîchage, de façon continue sur une période pluriannuelle (questions orientées plus fertilisation et usages des produits phytosanitaires) au niveau du BV de la Vesle (Nord-‐Est du bassin de la Seine)
Groupe « Connaissance des pratiques » du GIS GC HP2E
SMAG Anthony Clenet
SMAG, directeur R&D
Itinéraire technique
Données d'itinéraires techniques depuis 2006-‐2007. 60 000 agriculteurs.
Entretien Irstea
SMAG Anthony Clenet
SMAG, directeur R&D
Référentiel phyto
Base phyto. Entretien Irstea
SPIE (association)
SPIE : Système Professionnel
en Elevage
Base de données nationales
exploitations ; mise en place et service de mise à
disposition de données auprès des partenaires des filières adhérents
; transmission de données réglementaires I.P.G. à la base de données nationale du
; toute action visant à permettre le recueil et la transmission de données de traçabilité et de valorisation des produits animaux.
GIS Elevage Demain
119
Terres Inovia Cadoux Stéphane
Terres Inovia
PHYTO-‐SOL Données expérimentales des 3 Systèmes de culture sur 3 sites expérimentaux.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Terres Inovia Lecomte Vincent
Terres Inovia
Pratiques culturales Chanvre
nquêtes annuelles sur les pratiques culturales en chanvre dans les principaux départements producteurs.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Terres Inovia Lecomte Vincent
Terres Inovia
Pratiques culturales Colza
nquêtes sur les pratiques culturales en colza réalisées tous les 2 ans dans les principaux départements producteurs
Groupe « Connaissance des pratiques » du GIS GC HP2E
Terres Inovia Lecomte Vincent
Terres Inovia
Pratiques culturales Lin
nquêtes sur les pratiques culturales en lin oléagineux dans les principaux départements producteurs.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Terres Inovia Lecomte Vincent
Terres Inovia
Pratiques culturales Soja
nquêtes sur les pratiques culturales en soja réalisées annuellement dans les principaux départements producteurs.
Groupe « Connaissance des pratiques » du GIS GC HP2E
Terres Inovia Lecomte Vincent
Terres Inovia
Pratiques culturales Tournesol
nquêtes sur les pratiques culturales en tournesol réalisées tous les 2 ans dans les principaux départements producteurs
Groupe « Connaissance des pratiques » du GIS GC HP2E
120
Annexe 4 -‐ Liste des métadonnées pressenties 10.4
Nom Type À remplir
Description -‐ Commentaire Compatibilité Open Data -‐ W3C
Titre Texte X Texte écrit par le fournisseur dct:title
Description Texte X Texte écrit par le fournisseur pour décrire le jeu de données
dct:description
Thème Liste X Libellés parmi une liste définie dcat:theme
Mots clés Texte avec proposition de mots
X Libellés donnés par le fournisseur (choix libre) dcat:keywords
Licence pressentie Liste X Ouverte, OpenData,... dct:licence
Business Model pressenti
Liste Auto ?
Suivi des modifications
Texte X Ex : "Le fichier de suivi des modifications est disponible à l'url http://www.blabla.fr/data/xxxx/suivi_modifs"
Périodicité MàJ Liste X Pluriannuel (Tri-‐annuel, Biannuel), Annuel, semestriel, trimestriel, bimestriel, mensuel, bihebdomadaire, hebdomadaire, ponctuel (mise à jour irrégulière et non prévisible), pas de mise à jour
dct:accrualPeriodicity
Fournisseur Texte avec proposition des personnes déjà inscrites
X Personnes morales ou physiques dct:creator
Distributeur Texte avec proposition des personnes déjà inscrites
X Si différent du fournisseur dct:publisher
Mail personne référente
email X
Emprise (couverture spatiale)
Liste ou coordonnées géographiques?
X France métropolitaine, Région administrative, département, Petite Région Agricole (PRA), commune
dct:spatial
Couverture temporelle
Dates X Début de l'évènement (campagne culture, salon thématique par exemple) ou de la durée administrative (année, mois, semaine) -‐ Fin de l'évènement
dct:temporal
Granularité géographique (précision)
Liste ou coordonnées géographiques?
X France, région, départements, Petite Région Agricole (PRA), commune, canton, BV, exploitation, parcelle, POI (points distincts)
dcat:granularity
Granularité temporelle (précision)
Liste X : seconde,
Langue du jeu de données
Liste X Français, Anglais, Allemand, Espagnol. dct:language
Modalité de diffusion des données
Choix multiples X API, téléchargement des données, les deux
Formats disponibles
Choix multiples Auto ? format tableur (.csv, .xls, .xls, .odf, .dbf), géoreférencés (.shp, .tab, .Gjson + .prj et autres fichiers connexes (.lyr)), standard d'échanges (.xml, .json) et autres (.txt, .pdf, .rtf)
dct:format
121
Description des libellés des champs
Texte X Ex : "Le guide de descriptions des champs est disponible à l'url http://www.blabla.fr/data/xxxx/descriptions_champs"
dct:references
Encodage Liste X Est-‐ce que l'encodage des données est connu et référencé ? Si oui, précisez l'encodage/le référentiel utilisé ? UTF-‐8, RGF 93 Lambert 93 (référentiel géographique), fuseau horaire (référentiel temporaire)
Conformité à certains standards
Texte X Compatible AGRO-‐EDI Europe, références utilisés dans un OAD etc.
Utilisation du jeu de donnée ou de l'API
Texte X La ressource est-‐elle déjà utilisée ? Si oui, par quels utilisateurs/applications ?
Identifiant unique Auto Sera créé automatiquement lors de la création du jeu de données
dct:identifier
Date de publication du jeu de données
Date Auto 01/01/2011 dct:issued
Dernière date de mise à jour
Date Auto 07/04/2014 dct:modified
Version du fichier Texte X v1.2, v2.4, version unique (1.0)
Date de création du jeu de données
Date X 01/01/1990 dct:created
Note de qualité des données
Nombre Défini par la communauté des consommateurs dcat:dataQuality
accessURL url Auto Pour accéder à la fiche du jeu de données dcat:accessUrl
downloadURL url Auto Pour télécharger le jeu de données dcat:downloadURL
webserviceURL url Auto Pour accéder au jeu de données par Web Service dcat:webServiceURL
Volumétrie Auto Nombre de lignes, nombre d'entités géographiques distinctes
dcat:size
122
Annexe 5 -‐ Listes des standards, ontologies, schémas et référentiels 10.5recommandés.
Liste : Agro EDI qui organise et normalise les échanges de données informatisées dans les secteurs
agricoles et agro-‐industriels Agroportal du LIRMM (incluant schémas + référentiels) (http://agroportal.lirmm.fr/) AgroXML, AgroRDF
http://agroxml.com/about/index.html Linked Open Vocabulary (LOV) (général) World Wide Web consortium W3C qui propose des groupes de travail thématique, des
ontologies et des bonnes pratiques de publication de données sur le web.
Des listes de schémas relativement généraux qui pourront être utiles : Représentations des données de capteurs dans Semantic Sensor Network (W3C)
COPAIN a réalisé la première publication de données utilisant ce standard en France. Cf Irstea.
PROV qui décrit la provenance dans les processus scientifiques (W3C)
Des listes de : Crop ontology, http://www.cropontology.org/ , voir
http://www.bioversityinternational.org/news/detail/harmonizing-‐crop-‐trait-‐data-‐crop-‐ontology/
Plant ontology , http://plantontology.org/
Concernant la description des données spatiales, plusieurs ontologies sont en cours, par exemple stSPARQL (http://www.strabon.di.uoa.gr/stSPARQL), il faudra suivre leur évolution et la position du
Des référentiels : taxref (GBIF) : référentiel plutôt scientifique des êtres vivants Le Sandre en partie -‐AGRO) GeoNames (www.geoname.org) jeu de données spatiales du monde
123
Annexe 6 -‐ La structure juridique 10.6
Sommaire
I.
A. La propriété du site Internet et du nom de domaine B. C. Les mentions nternet
II. Cadre juridique des données accessibles A. Principe de libre accès des données publiques et ses exceptions B. Les données personnelles et les obligations de déclaration auprès de la CNIL C. Cadre
124
Introduction
Cette note fait état du droit à ce jour et ne tient pas compte du règlement (UE) 2016/679 du parlement européen et du conseil du 27 avril 2016 relatif à la protection des personnes physiques à l'égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la directive 95/46/CE (règlement général sur la protection des données) qui devra être mis
Un portail web ruit pour une communauté spécifique. « » sur un large choix de ressources et de services accessibles par internet.
Plus précisément, ce portail a pour objet de mettre à disposition du public des données et services numériques pour une agriculture française compétitive, ouverte et souveraine.
suppose respecter un certain formalisme juridique, dont la mise en ligne de mentions légales sur le site utre part, de protéger juridiquement les
un cadre contractuel permettant de définir les modalités de la mise à disposition et de la réutilisation des données qui alimenteront le portail pour chaque utilisateur (II).
Le cahier des charges devra donc être adapté à ces obligations.
I-‐
librement (A), sur les obligations légales incombant
A. La propriété du site Internet et du nom de domaine 1. Le site Internet
Un site Internet est protéporte « » selon la jurisprudence).
-‐1 du code de la propriété intellectuelle dispose que « 'esprit
opposable à tous ». Ainsi, la personne qui réalise le site internet en est propriétaire (personne physique ou personne morale).
Si la réalisation du site est confiée à un prestataire, celui-‐ci en aura la propriété.
Par conséquent, , dans le contrat de prestation, une clause de cession des droits patrimoniaux du prestataire sur le site au profit du bénéficiaire afin que ce dernier puisse en disposer librement. Le prix de cette cession doit être clairement identifié dans le contrat.
125
A noter que la maintenance du site peut être faite par le prestataire, par le bénéficiaire ou par un tiers.
Il sera par ailleurs nécessaire que le prestataire respecte la « », publiée par la circulaire du Premier ministre relative à l'Internet de l'État, n° 5574, du 16 février 2012. Cette charte
(http://references.modernisation.gouv.fr/sites/default/files/Charte_Internet_de_l'Etat_v1.0.pdf).
2. Le nom de domaine
internet est créé, quel que soit son objet, il est nécessaire de donner à ce site un nom de domaine. Le nom de domaine permet la localisation et
-‐1 du code des postes et des communications électroniques : « Les noms de domaine sont attribués et gérés dans l'intérêt général selon des règles non discriminatoires et transparentes, garantissant le respect de la liberté de communication, de la liberté d'entreprendre et des droits de propriété intellectuelle ».
Le nom de domaine est constitué de plusieurs éléments : -‐ Le nom : Ex : portail1 -‐ : .fr
dans le cas de ce portail : -‐ un nom de domaine générique de premier niveau : .com, .net, .org et .info -‐ un nom de domaine qui est un code de pays : .fr pour la France
Il est également possible de choisir un sous-‐dans un secteur particulier (ex : .museum.fr pour un musée, .aero.fr pour un organisme du secteur
Une entité ne pourra pas prétendre à sous-‐
Le sous-‐domaine « .gouv.fr
obligatoire pour les sites crééGouvernement (SIG) accepte expressément une demande de dérogation.
:
(article L45-‐1 du code des postes et des communications électroniquesdomaine est payant.
La gestion technique des noms de domaine est confiée à et Corporation for Assigned
(renouvelé pour un mandat de 5 ans le 28 les adresses internationales.
126
dispon 16.
(agrementweb@premier-‐ministre.gouv.fr).
Avant tout enregistrement, il est nécessaire de vérifier si le nom de domaine existe déjà en effectuant une recherche par le biais du site d'une unité d'enregistrement ou en effectuant une recherche par un programme "Whois"17.
S -‐ci le fasse au nom et pour le compte du bénéficiaire
B. internet
La loi n° 2004-‐575 du 21 juin 2004 pour la confiance dans l'économie numérique (LCEN) et la jurisprudence qui a suivi définissent i . L est défini comme un intermédiaire technique.
, au sens juridique du terme, est celui qui contrôle le contenu de son site internet. En ce sens, pour un site internet, son rôle se confond généralement avec celui du directeur de publication chargé de rendre public le contenu éditorial. Tous deux sont responsables de ce qui est publié.
e égime de responsabilité allégé.
Un contenu manifestement illicite peut concerner des propos diffamatoires, une atteinte au droit à ou encore
internet, quel que soit le genre de ce contenu. Article 1382 du Code civil : « tout fait quelconque de l'homme, qui cause à autrui un dommage, oblige celui par la faute duquel il est arrivé à le réparer ».
Il existe un principe de responsabilité en cascade : le directeur de publication est responsable en 1er uteur du propos
fautif (ex : si le propos fautif a été mis en ligne par un internaute).
16 https://www.afnic.fr/fr/produits-‐et-‐services/services/whois/
17 Exemple pour les noms de domaine en .fr : https://www.afnic.fr/fr/produits-‐et-‐services/services/whois/.
127
Si collecte, modère ou diffuse des avis en ligne provenant de consommateurs, il est tenu de délivrer à ces consommateurs une information loyale, claire et transparente sur les modalités de contrôle des avis mis en ligne.
-‐5-‐3 du code de la consommation ajoutée par la loi n°2016-‐1321 du 7 octobre 2016 pour une « République numérique » du portail doit préciser si ces avis font
il doit indiquer les caractéristiques principales du
Il doit également indiquer aux consommateurs, , les raisons qui justifient ce rejet, et mettre en place une fonctionnalité gratuite qui permet aux responsables des données ,
.
Les obligations précitées ainsi que les rapports et les conflits pouvant naître entre l'éditeur du site et le visiteur peuvent être encadrés (cf. infra).
C. internet
18 : « tous les sites internet édités à titre professionnel, qu'ils proposent des ventes en ligne ou non, doivent obligatoirement indiquer les mentions légales suivantes » :
pour une société : raison sociale, forme juridique, adresse de l'établissement ou du siège social (et non pas une simple boîte postale), montant du capital social ;
adresse de courrier électronique et numéro de téléphone ; pour une activité commerciale : numéro d'inscription au registre du commerce et des
sociétés (RCS) ;: numéro individuel d'identification fiscale numéro de TVA intracommunautaire ;
nom et adresse de l'autorité ayant délivré l'autorisation d'exercer quand celle-‐ci est nécessaire ;
nom du responsable de la publication ; coordonnées de l'hébergeur du site : nom, dénomination ou raison sociale, adresse et
numéro de téléphone ; pour un site marchand, conditions générales de vente (CGV) : prix (exprimé en euros et TTC),
frais et date de livraison, modalité de paiement, service après-‐vente, droit de rétractation, durée de l'offre, coût de la technique de communication à distance ;
numéro de déclaration simplifiée Cnil, dans le cas de collecte de données sur les « clients » (non obligatoire, mais recommandé) (cf. infra).
part, le code de la consommation modifié par la loi « pour une république numérique » dispose que « tout opérateur de plateforme en ligne est tenu de délivrer au consommateur une
lisation du service odalités de référencement, de classement et de
18 https://www.service-‐public.fr/professionnels-‐entreprises/vosdroits/F31228
128
déréférencement des contenus » (article L111-‐5-‐1 du code de la consommation).
Aux « une information loyale, claire et transparente sur la qualité de l'annonceur et les droits et obligations des parties en matière civile et fiscale ». Un décret précisera le contenu que doivent revêtir ces informations et si cela est applicable au présent portail.
permettant de communiquer avec les fournisseurs de la donnée sur les informations suivantes : -‐ Les caractéristiques essentielles de la donnée ou du service ; -‐ Le prix de la donnée ou du service -‐ Les informations relatives à son identité, à ses coordonnées postales, téléphoniques et
électroniques et à ses activités, pour autant qu'elles ne ressortent pas du contexte, ainsi que, s'il y a lieu, celles relatives aux garanties légales, aux fonctionnalités du contenu numérique
garanties et aux autres conditions contractuelles.
La liste et le contenu précis de ces informations seront fixés par décret en Conseil d'Etat.
Les cookies
Selon les termes de la CNIL, un cookie est « internaute par le serveur du site qu'il visite. Il contient plusieurs données : le nom du serveur qui l'a déposé, un identifiant sous forme de numéro unique, éventuellement une date d'expiration. Ces
un serveur accède pour lire et enregistrer des informations ».
Si le site iles mentions légalessur le site, de faire de la publicité ciblée etc.
(article 5(3) de la directive 2002/58/CE modifié par la directive 2009/136/CE -‐ article 32-‐II de la loi du 6 janvier 1978 reprend ce principe).
La CNIL recommande de recueillir ce consentement en deux étapes : -‐
tallation du cookie.
serveur. -‐ par une information simple et lisible des moyens mis à sa disposition pour accepter ou
refuser tout ou partie des cookies, notamment via les mentions légales.
La durée de validité de ce consentement est de treize mois maximum.
129
Certains cookies sont cependant dispensés du recueil de ce consentement, notamment : -‐ les cookies " identifiants de session ", pour la durée d'une session, ou les traceurs persistants
limités à quelques heures dans certains cas ; -‐ les cookies d'authentification de l'internaute ; -‐ les cookies de session créés par un lecteur multimédia ; -‐ les cookies de session d'équilibrage de charge ;
Le manquement à l'une de ces obligations peut être sanctionné jusqu'à un an d'emprisonnement, 75 000 000
Aussi, il est nécessaire de prévoir dans le cahier des charges que le site internet présente, en page un lien visible sur les mentions légales répertoriant les points énumérés ci-‐avant ainsi
.
130
II-‐ Le cadre juridique des données collectées
La donnée est communément définie comme une information sur laquelle on peut fonder un raisonnement, ce qui est connu ou admis comme tel, qui sert de point de départ pour une recherche.
protégeable. La donnée brute peut ainsi être diffusée ou utilisée librement.
La base de données est « disposés de manière systématique ou méthodique (carte scannée, imagerie, etc.), et individuellement accessibles par des moyens électroniques ou par tout autre moyen » (art. L. 112-‐3
/ou par le droit sui generis.
La nature des données doit être identifiée de manière précise car elle détermine les conditions de la donnée. En effet, par principe, les données publiques doivent être
rendues accessibles au plus grand nombre (A) alors que les données personnelles ont un régime spécifique, précisé par la loi « Informatique et Libertés », et ne peuvent être mises à disposition du public librement (Bmanière claire et précise au sein du portail (C).
A. Le principe de libre accès des données publiques et ses exceptions
La C CADA) assimile la donnée à un document administratif. L300-‐2 du CRPA dispose que « sont considérés comme documents administratifs, au sens des titres Ier, III et IV du présent livre, quels que soient leur date, leur lieu de conservation, leur forme et leur support, les documents produits ou reçus, dans le cadre de leur mission de service public, par l'Etat, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d'une telle mission. Constituent de tels documents notamment les dossiers, rapports, études, comptes rendus, procès-‐verbaux, statistiques, instructions, circulaires, notes et réponses ministérielles, correspondances, avis, prévisions, codes sources et décisions. ».
La loi pour « une république numérique » ajoute que « constituent également de tels documents, les s territoriales ».
-‐2 du même code précise que cela ne concerne pas les documents préparatoires et non définitifs de .
être investie la SAS qui porterait le portail.
Selon la CADA, l entrent dans le champ de la loi du 17 juillet 1978 portant diverses mesures d'amélioration des relations entre l'administration et le public et diverses dispositions d'ordre administratif, social et fiscal.
Elles sont identifiée : -‐ e ; -‐ la nature des missions ; -‐ s ; -‐ ;
131
-‐ ; -‐ s de puissance
publique.
La mise à disposition et la publication de données de référence en vue de faciliter leur réutilisation constitue une mission de service public relevant de (art. L. 321-‐1. I du code des relations
istration (CRPA)). Si le portail met à disposition des données de référence, ce critère favorisera la qualification de la SAS en organisme privé public.
-‐1. I du CRPA ajouté par la loi pour une « république numérique », les données publiques qui : -‐ « constituent une référence commune pour nommer ou identifier des produits, des services,
des territoires ou des personnes ; -‐ sont réutilisées fréquemment par des personnes publiques ou privées autres que
-‐ nécessitent
termes de précision, de disponibilité ou de fréquence de mise à jour ».
de cet article ser .
Un organisme privé chargé sera soumis aux mêmes obligations rganisme public. Toutes les données produites ou reçues seront considérées
comme des documents publics et soumises aux règles y afférentes (cf. infra) dès lors que ces données sont liée exerce, données
propriété intellectuelle attachés aux données (L122-‐4 du CPI : toute représentation ou reproduction .
organisme public (cf. règles ci-‐après).
Aussi, si le portail est gouverné par une personne morale de droit public ou une personne morale de
considérées comme des documents administratifs et sont soumis aux règles y afférentes.
1-‐ Le principe de libre accès des données publiques
-‐à-‐territoriales, un établissement public ou une structure privée ayant une mission de service public, le
accès aux données. A ce titre, si la structure privée en charge de
principe lui sera applicable.
Inversement, les personnes morales privées et les personnes physiques ne sont pas tenues par les obligations ci-‐ ervice public.
:
132
-‐ les
administrations (Etat, collectivités territoriales, établissements publics ou privés ayant une mission de service public) sont tenues de publier en ligne dans un format ouvert et aisément réutilisable ou de communiquer les documents administratifs qu'elles détiennent aux personnes qui en font la demande (art. L.311-‐1 modifié par la loi « pour une république numérique »).
En outre, Les administrations précitées peuvent rendre publique les documents administratifs qu'elles produisent ou reçoivent (art. L312-‐1 du même code).
si un décret le prévoit expressément), les administrations précitées doivent publier en ligne -‐1-‐1
ajouté par la loi « pour une république numérique ») : ui en font la demande ainsi
que leurs versions mises à jour, Un répertoire des principaux documents dans lesquels les informations publiques
figurent. Ce répertoire doit être mis à jour chaque année (L.322-‐6 ajouté par la loi « pour une république numérique »),
Les bases de données qui Les données, mises à jour de façon régulière, présentant un intérêt économique,
social, sanitaire ou environnemental.
-‐ La directive INSPIRE (transposée donnance n° 2010-‐1232 du 21 octobre 2010 portant diverses dispositions d'adaptation au droit de l'Union européenne en matière d'environnement) impose aux autorités publiques de publier sur internet leurs données sous format électronique à référence géographique. Ces données doivent être mises à disposition du public et partagées librement avec toute autre autorité publique.
Plus précisément, la directive INSPIRE impose de : Recenser toutes les données géographiques régies par la directive ; Créer des métadonnées et les maintenir à jour ; Mettre les métadonnées et les données sous une forme interopérable ; Publier ces données sur internet avec :
o un service de recherche o un service de consultation o un service de téléchargement o o
Référencer les métadonnées dans le Géocatalogue Partager les données avec les autres autorités publiques
Ces deux régimes -‐ CRPA) et le régime spécial relatif aux -‐
principalement sur des points opérationnels.
Dans ce cas, le -‐dessous.
133
2-‐ Les exceptions au principe de libre accès des données publiques
Selon la CADA, « principe selon lequel les lois particulières dérogent aux dispositions des lois de portée générale (loi
du 17 juillet 1978 doivent être interprétées de ».
Ainsi, ne sont pas communicables :
1-‐ L.331-‐5 du CRPA (modifié par la loi « pour une république numérique »).
2-‐ Les documents administratifs dont la consultation ou la communication porterait atteinte (art. L.331-‐5 du même code) :
a) Au secret des délibérations du Gouvernement et des autorités responsables relevant du pouvoir exécutif ;
b) Au secret de la défense nationale ;
c) A la conduite de la politique extérieure de la France ;
d) A la sûreté de l'Etat, à la sécurité publique ou à la sécurité des personnes ;
e) A la monnaie et au crédit public ;
f) Au déroulement des procédures engagées devant les juridictions ou d'opérations préliminaires à de telles procédures, sauf autorisation donnée par l'autorité compétente ;
g) A la recherche, par les services compétents, des infractions fiscales et douanières ;
h) Ou sous réserve de l'article L. 124-‐4 du code de l'environnement, aux autres secrets protégés par la loi.
3-‐ Les données couvertes par un droit de propriété littéraire et artistique (L311-‐4 du CRPA). . Il se fera impérativement par écrit (Article L131-‐
3 du code de la propriété intellectuelle) indiquant les droits de représentation et de reproduction concédés, les couverts.
Le consentement également obligatoire lors de la collecte de la donnée couverte par un droit de propriété intellectuelle (art. L111-‐1 du code de la propriété intellectuelle (CPI) -‐ .
4-‐ Les données à caractère personnel et notamment les données « sensibles » (art. L312-‐1-‐2 modifié par la loi « pour une république numérique » et L 322-‐2 du CRPA) (cf. supra).
Pour être communicables, ces documents doivent avoir fa aitement permettant es mentions.
134
B. Les données personnelles et les obligations de déclaration auprès de la CNIL
1. Les données à caractère personnel
La loi n° 78-‐17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés (dite loi « Informatique et Libertés ») régit les traitements de données à caractère personnel.
constitue une donnée à caractère personnel toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou
sont propres » (ex : adresse mail, n° de sécurité sociale, adresse IP etc.).
identifiée ou identifiable.
Selon ce même article « pour déterminer si une personne est identifiable, il convient de considérer son identification dont dispose ou auxquels peut avoir
accès le responsable du traitement ou toute autre personne».
Un traitement de données à caractère personnel est toute « toute opération ou tout ensemble l que soit le procédé utilisé ».
il est obligatoire de déclarer auprès de la CNIL ladite collecte. La déclaration reprend toutes les informations permettant de connaitre les données traitées, peine de sanction pénale, à moins que ce traitement ne soit soumis à une dispense.
diffèrent en fonction de la nature des données traitées et de la finalité poursuivie par le traitement.
Cependant, les informations publiques comprenant des données à caractère personnel ne sont vante est remplie (repris par la loi «
-‐1-‐2 du CRPA) :
o le consentement des personnes concernées a été recueilli après leur bonne
information sur la finalité et les modalités de la communication ou de la réutilisation des données les concernant ;
o la réutilisation est autorisée par un texte législatif ou réglementaire o les données sont anonymisées19 -‐à-‐dire ne permettant pas, compte tenu de
;
Si les données sont anonymisées, elles ont préalablement été collectées. Une déclaration de collecte auprès de la CNIL est donc quand même nécessaire.
19 Aux termes de décret n°2005-‐1755 du 30 décembre 2005 « Lorsque la réutilisation n'est possible qu'après anonymisation des données à caractère personnel, l'autorité détentrice y procède sous réserve que cette opération n'entraîne pas des efforts disproportionnés. ».
135
Outre la déclaration auprès de la CNIL, il les personnes concernées de la finalité de la récolte de leurs données à caractère personnel et de leur droit
.
De manière générale, il est également indispensable de : -‐ prendre toutes précautions utiles pour préserver la sécurité des données et, notamment,
accès ; -‐ mettre à jour annuellement les données collectées.
Concernant la réutilisation des données autorisée par un texte législatif ou règlementaire :
Dans le cadre de ce portail, des données relatives au découpage parcellaire seront collectées.
L -‐ l'Etat, les collectivités territoriales ainsi que leurs établissements publics respectifs qui ont vocation à en établir peuvent constituer des bases de données numériques comprenant des informations relatives au découpage parcellaire ainsi qu'aux adresses des parcelles (en procédant à des interconnexions avec des fichiers détenus par d'autres personnes publiques ou privées et comprenant des données à caractère personnel).
Ils peuvent procéder à la diffusion, y compris par voie électronique, auprès de l'ensemble des personnes publiques et privées, des informations contenues dans ces bases de données géographiques nationales ou locales de référence.
Ces bases de données géographiques nationales ou locales de référence ne peuvent inclure aucune information à caractère personnel autre que le découpage parcellaire et les adresses des parcelles.
Le décret n°2011-‐223 du 1er comprennent (art. R127-‐ : -‐ Les données de localisation géographique relatives au découpage parcellaire cadastral :
référence des parcelles cadastrales, localisation de celles-‐ci, localisation de leurs contours ; -‐ Les données de localisation géographique relatives aux adresses des parcelles : localisation et, le
cas échéant, voie de situation, numéro dans la voie et compléments éventuels.
A ce titre, l'Etat, les collectivités territoriales ainsi que leurs établissements publics peuvent diffuser librement les données de localisation géographique relatives au découpage parcellaire cadastral et les données de localisation géographique relatives aux adresses des parcelles sans procéder à une
.
portail si le portail est gouverné par une SAS.
nonymisation et big data :
recommandé de saisir la CNIL au préalable afin de faire valider un tel processus des traitements importants.
136
Dorénavant, avec la loi pour « une république numérique », la CNIL peut certifier ou homologuer et publier des référentiels ou des méthodologies générales aux fins de certification de la conformité des à caractère personnel, notamment en vue de la
s mises en ligne (article 37 bis de la loi « Informatique et libertés » ajouté par la loi pour une « république numérique »).
Le G29, qui regroupe l'ensemble des CNILS européennes, propose 3 critères pour évaluer une bonne anonymisation :
-‐ « l ation : est-‐ ? -‐ La corrélation : est-‐il possible de relier entre eux des ensembles de données distincts
concernant un même individu ? -‐ nférence : peut-‐ ? »
Selon la CNIL, «
de ré-‐identification ».
traitement doit être irréversible.
La CNIL répertorie :
-‐ la substitution parfois appelée aussi « pseudonymisation » (procédé consistant à remplacer
l'identifiant d'une personne par un autre identifiant choisi arbitrairement) Selon l avril 2014 « il est nécessaire que, pour chaque personne, ce pseudonyme soit unique ».
-‐ la suppression ou le « masquage » (procédé consistant « à dégrader l'information initiale, en supprimant certaines données, ou, au contraire, en ajoutant des informations qui noient la donnée initiale identifiante »)
-‐ l'agrégation (procédé consistant « à rassembler plusieurs données de même type, afin de produire une donnée agrégée qui conserve l'information dont on a besoin, mais rend impossible l'identification de la part d'information agrégée qui correspond à un individu donné ». Selon l , la CNIL recommande de ne pas faire figurer de statistiques conçues à partir d'une agrégation inférieure à dix éléments.
masse de données de géolocalisation qui permettent à partir de quelques « points » de ré-‐identifier les personnes, exemple dans un article scientifique publié récemment : Arvind Narayanan and Vitaly Shmatikov « Robust de-‐anonymization of large datasets »
https://www.cs.utexas.edu/~shmat/shmat_oak08netflix.pdf.
137
16 avril 2014 confirme que les procédés d'anonymisation mis en place ne présentent pas tous la même efficience et que le risque de ré-‐identification n'est pas nul
20).
Les rapporteurs nuancent toutefois ce propos en estimant « qu'à ce jour, les dispositifs d'anonymisation utilisés ont été suffisamment robustes pour éviter toute diffusion accidentelle de données personnelles ».
, il est indispensable que le responsable de traitement contrôle régulièrement le caractère anonyme des données produites.
Etant donné que
de cause. (CGU).
2. Les données sensibles
, sont considérées comme sensibles les « données à caractère personnel qui font apparaître, directement ou indirectement, les origines
syndicale des personnes, ou qui sont relatives à la santé ou à la vie sexuelle de celles-‐ci ». Il est interdit de collecter ou de traiter de telles données. Le non respect de cette interdiction est passible de sanctions pénales. Néanmoins, il est possible de déroger à cette inteprécitée : -‐ Les traitements pour lesquels la personne concernée a donné son consentement exprès ; -‐ Les traitements nécessaires à la sauvegarde de la vie humaine, mais auxquels la personne
concernée ne peut donner son consentement ; -‐ -‐ les traitements nécessaires aux fins de médecine préventive et les traitements nécessaires à la
recherche dans le domaine de la santé ; -‐ Les traitements mis en oeuvre par une association ou tout autre organisme à but non lucratif et à
caractère religieux, philosophique, politique ou syndical pour la gestion de ses membres ou des tacts réguliers dans le cadre de son activité;
-‐ -‐
par la CNIL ; -‐ Les traitements de données ayant été rendues publiques par la personne concernée ; -‐
20 Le big data pose la question de la possibilité de ré-‐identification des personnes. L'appréciation de l'anonymisation a évolué au fil du temps pour aboutir l'anonymisation total (Article 29 « Data protection working Party » http://ec.europa.eu/justice/data-‐protection/article-‐29/documentation/opinion-‐recommendation/files/2014/wp216_en.pdf et sur le site de la CNIL https://www.cnil.fr/fr/le-‐g29-‐publie-‐un-‐avis-‐sur-‐les-‐techniques-‐danonymisation-‐0 ).
138
peut être levée par le consentement de la personne concernée. Il est alors impossible de déroger à cette interdiction.
C.
son autorisation afin de ne pas contrevenir au droit de propriété littéraire et artistique qui pourraient être grevés à la donnée (1) puis de préciser les conditions de réutilisation possibles (2).
accessibles applicables aux utilisateurs des données et des conditions générales (CG) applicables aux fournisseurs des données (3).
Les CGU permettront également de faire figurer le numéro de déclaration effectué auprès de la CNIL
conflits pouvant naître entre l'éditeur du site et le visiteur.
1. La propriété et la titularité des données
La propriété :
L. 111-‐1 du code de la propriété intellectuelle dispose que «
opposable à tous ».
Cependant, par principe, les données créées par un salarié dans le cadre de ses missions
Si les données ont été créées par un salarié hors de ses missions, deux cas de figure apparaissent : -‐
disposition : dans ce cas, le salarié est propriétaifaire attribuer sa propriété ou obtenir sa jouissance sous réserve de lui verser une contrepartie financière,
-‐ pas rattachable à son organisme : la propriété de la donnée lui appartient.
139
La titularité :
Pour disposer librement de la donnée grevée de droit de propriété littéraire et artistique, il ne
tre titulaire.
la plateforme. Pour cela, il sera nécessaire que le propriétaire de la donnée contrôle le contrat de licence tiers.
Ex ne pourra a priori pas la rendre accessible sur le portail.
Dans cette hypothèse, les données seront certainement soumises à la copropriété. Il faudra alors se référer au contrat qui lie ces partenaires afin de savoir si le propriétaire peut en disposer librement
pour les diffuser.
titulaire(s) des données grevées de droidonnées.
Spécificité des bases de données :
La protection des bases de données est régie par le code de la propriété intellectuelle (CPI) en son livre III, titre IV (article 342-‐1 et suivants).
-‐1 du CPI) : -‐ Par le droit sui generis : dans ce cas, il faut que la constitution, la vérification ou la
éventuelle protection de la base de données. -‐ : dans ce cas, le choix et/ou la disposition des matières utilisées par
pour constituer la base de données doit être original. Il faut pouvoir déceler une création intellectuelle de la part de son auteur.
forme » de la base de données qui va être protégée et non le contenu.
protection de la base. Le titulaire de la base est en principe lbase de données est
base tiative et paye le prix de la commande.
est le créateur de la base de données (de sa « forme »). Il détient les droits patrimoniaux et moraux sur la base. Sauf cession expresse, il en est le titulaire.
140
Par conséquent, lorsque le fournisseur souhaite rendre accessible ses données sur le portail, il est certifie en être titulaire afin de ne pas contrevenir aux droits de propriété littéraire
et artistique détenus par un tiers. s Générales (CG).
2. Conditions de réutilisation
:
devront être intégrés conjointement dans le cadre du portail.
:
données publiques :
Par principe, (article R324-‐1 du CRPA). Les données
-‐à-‐dire lisible par une machine » (art. L311-‐1 du code des relative
Le législateur impose aux administrations qui produisent des informations publiques de mettre à la disposition des usagers un « répertoire des principaux documents dans lesquels ces informations figurent » (art. L322-‐6). Ce répertoire doit recenser pour chacun des documents : leur titre exact, leur objet, leur date de création, les conditions de leur réutilisation et, le cas échéant, leur date et objet des mises à jour. Ce répertoire doit être accessible en ligne (art. R322-‐7) et mis à jour chaque année.
La réutilisation des données publiques :
La réutilisation des données publiques est le fait de donner la possibilité de réutiliser les
(L321-‐1 du CRPA -‐à-‐réutilisation à but commercial est possible (sauf exception).
-‐2 du CRPA, ne constitue pas une information publique les documents sur lesquels des tiers détiennent des droits de propriété intellectuelle.
L122-‐4 du CPI .
-‐3, ajouté par la loi « pour une république numérique » dans le code précité, dispose que les droits des administrations (hors administration ayant une mission de service publique à caractère commerciale soumise à la concurrence) ne peuvent faire obstacle à la
titre du droit sui generis -‐à-‐dire du droit des producd'une partie qualitativement ou quantitativement substantielle du contenu de la base.
141
Modalités de réutilisation
« sans altération, sans dénaturation et en mentionnant la source et la date de dernière mise à jour » (art. L322-‐1 du CRPA).
rticle L321-‐1 du CRPA, modifié par la loi « pour une république numérique », dispose que les informations publiques figurant dans des documents communiqués ou publiés par les administrations de la mission de service public pour les besoins de laquelle ces documents ont été produits ou reçus.
motifs d'intérêt général et de façon proportionnée. Ces restrictions ne peuvent avoir pour objet ou pour effet de restreindre la concurrence (art. L323-‐2 du même code).
services de consultation permettant au moins d'afficher des données, de naviguer, de changer d'échelle, d'opter pour une vue panoramique, ou de superposer plusieurs séries de données consultables et d'afficher les légendes ainsi que tout contenu pertinent de métadonnées » de
(art. L.127-‐7 du code de
En tout état de cause, il de ces données afin leurs conditions de réutilisation.
Principe de gratuité et exception
également être utilisables et réutilisables gratuitement (art. L324-‐1 du CRPA).
La loi « pour une république numérique » dispose que lorsque la réutilisation à titre gratuit donne -‐ci doit être choisie parmi une liste fixée par décret.
doit être préalablement homol s par décret.
Nb :
financière lorsqu'elles sont tenues de couvrir par des recettes propres une part substantielle des coûts liés à l'accomplissement de leurs missions de service public (art. L324-‐1 du CRPA).
Pour cela, il ces données à u
La redevance perçue ne doit pas dépasser le montant total des coûts liés à la collecte, à la production et à la mise à disposition au public. Le mode de calcul doit être public et transparent.
Ainsi, pour établir le montant des redevances, il faut tenir compte : Du coût de collecte Du coût de production
142
échéant, une part au titre des droits de propriété intellectuelle
Les redevances doivent être nécessaire au maintien des données et des services correspondants
Aussi, le produit total de la redevance ne doit pas être supérieur à la somme des coûts majorée de la
Ces conditions de réutilisations doivent être les mêmes pour des catégories comparables de réutilisation, elles ne doivent pas être discriminatoires.
électronique, via un contrat de licence (art. L.323-‐1 du CRPA). Dans le cas contraire, la réutilisation est considérée comme gratuite.
Le montant doit être révisé au moins tous les 5 ans (art. L324-‐3 code précité).
publiques sont possibles sous certaines conditions mais ils ne peuvent pas dépasser 10 ans et sont examinés tous les 3 ans.
La réutilisation des données privées
A contrario, les données privées, notamment les données grevées par un droit de propriété littéraire et artistique appartenant à un tiers privé, ne sont pas régies par ces conditions. Le fournisseur proposera la diffusion et la réutilisation de la donnée selon les conditions fixées par le titulaire de ladite donnée.
3. Le contenu des CG
Compte tenu de ce qui précède, il est nécessaire de prévoir dans le cahier des charges que le site Internet présente un lien facilement accessible sur les CG/CGU (CG du fournisseur et CGU de
Pour le fournisseur, les CG devront notamment préciser :
-‐ la nature des données mises à disposition ; -‐ Ses droits et obligations (notamment un engagement de titularité du jeu de donnée) ; -‐ Les droits de propriété intellectuelle afférant aux données ; -‐ Les droits en fonction des différents types de licence proposée (accès,
; -‐ ; -‐ Les obligations relatives à la « loi Informatiques et libertés » (sur les données à caractère
personnel) -‐ Le droit applicable.
143
s selon le jeu de donnée mis à disposition :
fournisseur de données souhaite rendre accessible ses données, il devra préalablement
une meilleure visibilité des droits accordés, il est préférable de proposer plusieurs types de licence : o les licences fixées par décret conformément à la loi « pour une république numérique ». o les licences spécifiques demandées par les fournisseurs eux-‐
o les licences commerciales précisant les modalités financières.
préciser :
-‐ la nature des données mises à disposition ; -‐ Les droits de propriété intellectuelle afférant aux données ; -‐ ; -‐ Les droits conféré en fonction des différents types de licence proposée (accès,
;
-‐ Les droits et obligations des fournisseurs de données (notamment un engagement de titularité du jeu de donnée) ;
-‐ ; -‐ Les obligations relatives à la « loi Informatiques et libertés » (sur les données à caractère
personnel) -‐ Le droit applicable.
III-‐ Points essentiels devant figurer dans le cahier des charges
o o Un lien sur les CG ( o Un lien sur les contrats de licence (et la possibilité de modifier ces accords a posteriori), o Un système de paiement si les données sont soumises à redevance, o
Par ailleurs, le contrat de prestation devra prévoir une cession des droits patrimoniaux du prestataire sur le site au profit du bénéficiaire. Le nom de domaine devra être déposé au nom et pour le compte de ce dernier.
Institut national de recherche en sciences et technologies pour l’environnement et l’agriculture
Direction générale1, rue Pierre-Gilles de Gennes CS 1003092761 Antony Cedextél. +33 (0)1 40 96 61 21 fax +33 (0)1 40 96 62 25www.irstea.fr
SUIVEZ-NOUS SUR :
Conc
eptio
n : D
CRP
- Irs
tea
- ©
Fot
olia
- n
ovem
bre
2016
top related