Les Big Data – ou données massives – font parler d’elles depuis plusieurs années, compte tenu des nouvelles capacités d’explorations qu’elles permettent et des perspectives d’usages qu’elles ouvrent pour l’ensemble des secteurs d’activités : la santé (ex. Avis 130 du CCNE), la sécurité, le marketing, etc.
La science, qui produit et utilise de plus en plus de données, se retrouve au premier rang des acteurs du Big Data. Cette production exponentielle est due aux capacités technologiques contemporaines (informatiques, techniques) permettant de générer des données massives et d’en assurer le stockage. Quant aux usages, ils sont poussés par la “Science de la donnée” postulant que les questions de recherche peuvent être directement formulées à partir de données existantes ; renversant le paradigme prévalant jusqu’à lors de l’acquisition des données a posteriori de la formulation des hypothèses de recherche. Un défi majeur persiste pour assurer le traitement de ces données massives en toute fiabilité et sécurité, et de nouveaux outils devront être élaborés pour permettre leur usage et leur traitement de manière responsable et transparente (notamment grâce à l’intelligence artificielle). Ces enjeux techniques se doublent d’une politique de plus en plus fréquente de partage de ces données, de leur mise à disposition et donc de leur ouverture à l’ensemble de la communauté scientifique et de leur réutilisation. Ainsi, du fait notamment du volume et de la variété des données en présence, plusieurs questions éthiques et pratiques se posent pour collecter, stocker, utiliser ces données dans le respect des droits de l’homme, dans l’intérêt général et pour le bien commun.
Les ateliers de la Plateforme visent à aborder les questions éthiques, juridiques et pratiques des Big Data en tant que ressources indispensables au développement des biosciences* modernes, depuis la définition du concept des Big Data à la réalité de la recherche de terrain, au travers d’exemples de projets utilisant ces ressources et des débats qui suivront. Qu’appelle-t-on Big Data ? Quelles sont les opportunités d’usages et les enjeux éthiques liés aux Big Data ? Comment assurer un accès et une utilisation éthique des Big Data dans le domaine des biosciences ? Quels défis restent-ils à relever pour que les Big Data soient une ressource accessible et fiable ?
Ces réflexions s’articuleront autour de 3 volets, en présentant tout d’abord ce que sont les Big Data, leur définition et les concepts qui les entourent (volet 1) ; suivront ensuite des exemples pratiques de l’utilisation des Big Data dans le cadre des innovations thérapeutiques (volet 2) avant d’aborder la question des enjeux que soulèvent les Big Data en terme socio-économiques et éthiques (volet 3).
* Biosciences, ou sciences de la vie, c’est à dire l’ensemble des études et disciplines scientifiques qui s’intéressent à la vie, qu’elle soit animale, végétale, humaine (ex: la zoologie, la botanique, la génétique, l’agronomie, la paléontologie, la recherche médicale, l’écologie…) ou qui utilisent des êtres vivants dans différentes applications (ex : biotechnologies).
- Volet 1 – Définition des Big Data : mise en commun et partage
- Volet 2 – Big Data et innovations thérapeutiques
- Volet 3 – Enjeux socio-économiques des Big Data
La situation sanitaire nous a amené à réorganiser cette thématique sur 2020-2021