Une journée professionnelle sur les impacts juridiques, techniques et d’usages de l’IA sur les communs de données avait lieu à la Bibliothèque nationale de France (BNF), à Paris, le jeudi 11 décembre 2025.
Organisée par Nathalie Casemajor, professeure à l’INRS et Jean-Philippe Moreux, expert scientifique de la bibliothèque numérique Gallica de la BNF, elle s’inscrivait dans un plus large projet sur les communs du numérique et l’intelligence artificielle, financé par la Commission permanente de coopération franco-québécoise (CPCFQ) et de nombreux porteurs publics. Elle réunissait d’excellents panélistes (voir la liste en fin d’article) et a offert un niveau de conversation élevé.
Rappelons que les communs de données sont parfois publics, produits par les bibliothèques et les gouvernements ou sont collectifs, essentiellement dans les espaces contributifs de la fondation Wikimedia. Ce sont des espaces ouverts, où les données sont colligées par des bénévoles, ou par nos gouvernements et financés par nos impôts.
Ils ont pour vocation le partage du savoir et non pas la capture à des fins lucratives ou partisanes.
Premier constat : les pressions exercées sur les bases de données ouvertes par les robots de web-scraping sont en ce moment telles que les parties à la discussion sonnent ouvertement l’alarme et abandonnent toute langue de bois pour employer des termes comme saturation, extraction sauvage, prédation. Le jour même de l’événement, Rob Kaye de la la fondation Metabrainz, responsable notamment de la base communautaire Musicbrainz, lançait un avertissement sans ambiguïté. We can’t have nice things… because of AI scrapers.
En réponse à cela, la journée est beaucoup revenue sur l’idée que si les communs de données doivent par principe toujours demeurer ouverts, les infrastructures techniques et les efforts humains qui sous tendent leur existence représentent des coûts auxquels les utilisateurs commerciaux devront contribuer. À ce titre vient d’être créée WIkimedia Enterprise. C’est une évolution indéniable du cadre.
Le second constat clé a porté sur le fait que le développement de l’IA, dans un espace tel la francophonie, davantage limité sur le plan de ressources, devait adopter une approche éthique, éco-responsable et mieux circonscrite que celle qui prévaut du côté des grands modèles de langues anglo-saxons. Les projets pleias.fr, opsci.ai et LightOn.ia nous réconcilient avec une vision humaniste de l’IA. Ainsi, il faut optimiser les ressources des ordinateurs-calculateurs et pour cela, il faut nourrir les IA avec des données autoritaires enrichies et structurées, sémantisées plutôt que de s’imaginer que nous pouvons usurper le rôle des humains, synthétiser, inventer ou inférer des données manquantes. Cela correspond à l’idée même des communs, produits par les milieux de pratiques et une foule d’amateurs passionnés. C’est une évolution majeure par rapport à la mentalité privative promue par les grandes entreprises technologiques états-uniennes, évolution à laquelle les institutions franco-québécoises présentes semblaient adhérer.
Enfin, la gouvernance des communs de données, fiducies, data-trust et data-space a été mentionnée à demi-mot, mais nous savons que l’avenir du débat en dépend. Le jour même, l’actualité nous rattrapait encore avec l’annonce de la création de l’Agentic AI Foundation (Tarkowski 2025). Cette superstructure mise en place au bénéfice des multinationales de l’IA et pour l’élaboration du Model Context Protocol (MCP) n’a pas à ce jour cru bon d’inclure de représentants des communs, ni même des gouvernements, en vertu d’une logique qui apparaît de plus en plus nécessaire : la gouvernance collaborative de l’adoption des normes.
Malgré les évidents progrès constatés dans les échanges lors de la journée de réflexion, certains problèmes de contextualisation et de recentrage du débat sont peut-être apparus. Il faut impérativement et d’entrée de jeu rappeler la « Tragédie des communs » (Hardin et American Association for the Advancement of Science 1968) et le problème des Free Riders lorsque l’on aborde la question des communs, du partage du savoir. Ainsi, la problématique abordée n’est pas nouvelle. De plus, les enjeux de pression sur les communs par les IA ne doivent pas prendre le pas sur d’autres questions fondamentales concernant ceux-ci. Il faut reparler de l’importance d’une croissance de l’engagement citoyen et institutionnel dans la création des communs, de l’interopérabilité et des échanges des données publiques avec les espaces des communs.
Bibliothèque et Archives nationales du Québec (BAnQ) a présenté son projet d’étude de faisabilité visant à définir la désirabilité, la faisabilité et la viabilité financière d’une banque de données gouvernementales et culturelles québécoises pour se préparer à l’IA. L’institution a insisté sur la dimension co-créative de son processus, mais n’a peut-être pas suffisamment appuyé les constats de son rapport d’octobre 2025 qui valent la peine d’être mieux présentés, expliqués et associés aux objectifs plus étayés du Conseil de l’innovation du Québec (Gagnon-Turcotte et Roy 2024). L’enjeu d’assurer à BAnQ une expertise technologique adéquate pour mener le projet à bien est un éléphant dans la pièce.
Si les GLAM (bibliothèques, archives, musées et institutions culturelles patrimoniales) et acteurs du savoir libre échangent sur l’exploitation des communs pour entraîner les grands modèles de langage, les gouvernements et le secteur privé à but-non-lucratif de la culture ont aussi un rôle à jouer dans l’équation. Leurs voix étaient passablement absentes.
Les préoccupations professionnelles et culturelles que les communs peuvent contribuer à résoudre, telles la traçabilité des œuvres et ayant droits, la mesure de la découvrabilité, la documentation structurée enrichie, désambiguïsée et autoritaire – doivent être couvertes par le débat. À ce titre, qu’advient-il, par exemple, du graphe de données de la Cinémathèque québécoise, cité jadis comme pratique exemplaire par la communauté GLAM ? (https://data.cinematheque.qc.ca/)
Si les communs sont des moteurs pour la propagation du savoir, pour la mémoire et la promotion de nos cultures, dont la puissance ne doit pas être abandonnée à la seule logique de l’IA commerciale, nous devons continuer à réfléchir aux actions à entreprendre pour tenter d’y faire contrepoids, dans un pur esprit de David contre Goliath. En cela, les perspectives croisées impliquant homologues français et québécois semblent avoir toujours du mal à se cristalliser dans des projets précis.
À suivre.
Étaient panélistes : Paul Keller, de l’Open Future Foundation, sur le Paradoxe de l’ouverture des données; Julie Groffe-Charrier, université Paris Saclay; Camille Françoise, COMMUNIA et Wikimédia France; Brigitte Vézina, Creative Commons; Yannick Detrois, pleias; Alexandre Gefen, CNRS; Clément Bénesse, opsci.ai; Milo Rignell, LightOn; Valérie D’amours et Viriya Thach, Bibliothèque et Archives nationales du Québec; Isabelle Nyffenegger, directrice des Services et des réseaux et Tiphaine Vacqué, Bibliothèque nationale de France; Antoine Isaac, Europeana Foundation; Christian Gagné, Université Laval et MILA; Marie-Pierre Thibault, Commission de la santé et des services sociaux des Premières Nations du Québec et du Labrador; Benaset Dazéas, Congrès permanent de la lenga occitana; Lucie Gianola, Délégation générale à la langue française et aux langues de France (DGLFLF).
Le lien de l’enregistrement de la journée https://www.youtube.com/live/ROigWIj5bM8?si=pLs_biLv5nda5a02
Références
BAnQ. Octobre 2025. Un jalon important franchi pour la Banque de données gouvernementales et culturelles en français et en langues autochtones | BAnQ
Bienvenue sur la page GLAM de la Cinémathèque québécoise ! https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Cin%C3%A9math%C3%A8que_qu%C3%A9b%C3%A9coise
Gagnon-Turcotte, Sarah, et Réjean Roy. 2024. Prêt pour l’IA – Répondre au défi du développement et du déploiement responsables de l’IA au Québec. Conseil de l’innovation du Québec. https://conseilinnovation.quebec/wp-content/uploads/2024/02/Rapport_IA_CIQ-1.pdf
Hardin, Garrett et American Association for the Advancement of Science. 1968. The Tragedy of the Commons. Washington, D.C.: American Association for the Advancement of Science. https://search.worldcat.org/fr/title/28947274
Kaye, Rob (ruaok). 11 décembre 2025. We can’t have nice things… because of AI scrapers. MetaBrainz Blog. https://blog.metabrainz.org/2025/12/11/we-cant-have-nice-things-because-of-ai-scrapers/
Keller, Paul, et Alek Tarkowski. 2021. The Paradox of Open. Open Future Foundation. https://openfuture.pubpub.org/pub/paradox-of-open/release/1
LaCogency, Açaï, et SEIZE03. 2025. Façonner l’IA ensemble – Les résultats des ateliers de cocréation pour une banque de données gouvernementales et culturelles québécoises en français et en langues autochtones. Montréal (Québec) Canada: Bibliothèque et Archives nationales du Québec (BAnQ). https://www.banq.qc.ca/salle-de-presse/jalon-important-franchi-pour-la-banque-de-donnees-gouvernementales-et-culturelles/
Lapointe, Jean-Michel, et Marie D. Martel. 2025. Mouvement Wikimedia Au Canada: Communautés, Institutions Et Culture Libre. Montréal: Presses de l’Université de Montréal.
Poirier, Marjolaine, Cinémathèque québécoise et le Web sémantique /The Cinémathèque Québécoise and the Semantic Web, 2023. https://praxis.encommun.io/en/n/4gTZXzucKz9WCVD8hNACCsGrSVg/
Rayonnement de la culture : l’intelligence artificielle au service de la découvrabilité des contenus francophones (MCCQ, 9 décembre 2025)
Tarkowski, Alek. 2025. « Why Wikimedia Needs a Seat at the Agentic AI Foundation ». Open Future. https://openfuture.eu/blog/why-wikimedia-needs-a-seat-at-the-agentic-ai-foundation (17 décembre 2025).

One response
Le récent article de Alek Tarkowski est clé : « Why Wikimedia Needs a Seat at the Agentic AI Foundation ». Open Future. https://openfuture.eu/blog/why-wikimedia-needs-a-seat-at-the-agentic-ai-foundation