/
Maître Véronique Rondeau-Abouly > Questions / Réponses > Qu'est-ce qu'une donnée numérique ?

Qu'est-ce qu'une donnée numérique ?

Avec l’entrée en vigueur du RGPD au 25 mai 2018, la notion de « donnée personnelle » a fait son entrée dans notre vocabulaire mais le légitime et nécessaire intérêt de connaître le droit applicable à la « donnée personnelle », vue sous l’angle du RGPD, ne doit pas faire oublier que dans une économie digitale et une république numérique telle que la France en a fixé les règles dans la loi d’octobre 2016, la donnée au sens très large du terme et notamment celle qui est nécessaire à l’activité de l’entreprise, qu’elle soit une « donnée commerciale », et/ou issue de la « recherche » est un actif à part entière, et soumise à des règles juridiques .

 

S’interroger sur la définition de la donnée amène à constater que pour l’instant, la réglementation est éparse et protéiforme dans le contexte où la notion de « contenu numérique n’est pas non plus encore définie en droit ».

 

Une vague définition est donnée par l’article 2 paragraphe 11 de la Directive 2011-83/UE du Parlement Européen et du Conseil à propos de la protection des consommateurs pour la négociation de certains contrats qui définit le contenu numérique comme des « données produites et fournies sous forme numérique ».

 

En tout cas, la donnée ou data est une métanotion qui ne doit surtout pas être réduite à la donnée à caractère personnel.

 

La donnée ou data au sens large du terme, c’est une information sur quelque chose.

 

Donc outre sa définition, la question sur sa structuration est d’autant plus importante dans le mouvement actuel international d’ouverture de la science ouverte ou « Open Science » par :

 

  • L’Open Data,
  • L’Open Peer Review,
  • L’Open Access.

 

La donnée ou la data c’est quoi ?

 

L’inventaire est très large et selon liste non exhaustive c’est :

 

  • Image, son, vidéo sur support unique ou structuré en base de données,
  • Un fichier automatisé de traitement,
  • Un ensemble de données agglomérées en fichier portant des informations utiles en rapport avec des données sources ou un programme de traitement que l’on appelle aussi le « Data Mining».

 

Le « Data Mining » est la donnée issue d’un processus de recherche ou fouille.

 

Le « Texte Mining » est plus en rapport avec la fouille de texte.

 

« Texte Mining » et/ou « Data Mining » sont ainsi qualifiés de « données dérivées ou compilées », généralement constituées en base de données issue de la compilation d’un ensemble de données collectées, celles ainsi crées à partir du « Data Mining » ou « Texte Mining ».

 

Mais une donnée c’est aussi tout produit issu de l’observation (par exemple des données d’enquête), expérimentales, d’une recherche, bref d’une donnée produite à partir d’une source existante même si elle n’a pas été ensuite validée en résultat de recherche et qu’elle reste par exemple inutilisée (archives notamment).

 

La notion de donnée étant très large, tout producteur potentiel de données en particulier les entreprises doivent veiller à leur organisation, structuration, documentation, sauvegarde, stockage.

 

Et ce en suivant si possible les principes du « Findable Accessible Interopérable Réutilisable – Data  ou « FAIR-Data », qui est un ensemble de principes directeurs visant à rendre les données Accessibles Interopérables et Réutilisables.

 

Le « FAIR Data » s’est peu à peu installé comme l’un des moyens pour valoriser le « Big Data » et permettre ainsi d’imposer un modèle de comportement du « producteur de données » pour qu’il puisse les rendre trouvables et utilisables par tous en facilitant le sourçage par l’utilisateur de la donnée.

 

L’organisation interne des données selon le principe du « FAIR Data » présente en plus deux avantages.

 

D’abord pour le producteur de la donnée pour avoir une vision plus juste de la licéité de son portefeuille de données pour les utiliser notamment par des licences d’exploitation appropriées à délivrer aux tiers, et surtout pouvoir justifier pour lui-même de l’opposabilité de ses propres droits sur ses contenus numériques.

 

Ensuite, pour répondre aux exigences des financeurs qui pour financer les startups innovantes, et/ou tout projet de recherche, nécessitant des investissements demande de plus en plus la fourniture d’un « Data Management Plan » (DMP ou PGD) qui est un outil à mettre en œuvre dès le montage du projet par un document formel qui sera mis à jour en permanence et qui va :

 

  • Fixer l’objectif du projet,
  • Nommer le plan d’action,
  • Décrire les actions conduites pour structurer la donnée ou se l’approprier,
  • Planifier les étapes clés du montage du projet lié aux données.

 

Le DMP permet de justifier au tiers et notamment le cas échéant au financeur du projet les droits du producteur sur ses données.

 

Ainsi, tout projet de développement qui met en œuvre des données, et/ou des contenus numériques de plus en plus doit être établi avec l’aide d’un juriste spécialisé dans l’économie juridique de la data.

 

La licéité au sens très large de la donnée prend une signification de plus en plus grande notamment pour réussir un projet de développement lié à l’économie du digital et/ou mettant en œuvre l’intelligence artificielle.

 

Le cabinet de Véronique RONDEAU ABOULY peut vous aider, contact au 51, Rue Sainte 13001 à Marseille, tel : 04 91 55 52 61, mail : cabinet@rondeau-abouly.com.

 

 

 

Contactez-nous