Le nombre d’algorithmes utilisés par le service public en France ne fait qu’augmenter depuis de nombreuses années. Pourtant, il est difficile d’en obtenir une vision d’ensemble. Un inventaire peut-il être une réponse ?
Les algorithmes occupent une place croissante dans nos quotidiens. Cet essor est porté par le développement rapide des techniques d’apprentissage automatique, aussi qualifiées d’intelligence artificielle (IA), boostées depuis le début du XXIe siècle par l’augmentation exponentielle des capacités de stockage et de traitement des données numériques. Le secteur public participe activement à cette évolution : en France, de nombreuses administrations se sont engagées dans l’expérimentation et l’utilisation d’outils algorithmiques, y compris dans des secteurs clés tels que la justice, les armées, l’éducation ou les finances publiques.
Aujourd’hui, de tels algorithmes servent à documenter, orienter, voire automatiser les décisions publiques. Leur utilisation soulève ainsi d’importantes questions en termes de responsabilité, de compréhension et d’égalité de l’action publique. Les administrations utilisant des algorithmes sont soumises à des obligations de transparence, instaurées en 2016 par la loi pour une République numérique. En 2021, la France a renforcé cet engagement en promettant de réaliser un inventaire des algorithmes publics dans le cadre du Partenariat pour un Gouvernement Ouvert.
Pourtant, en pratique, l’usage d’algorithmes par les administrations publiques reste encore opaque. Dans les cas, rares, où ces outils font l’objet de communications, les informations diffusées demeurent souvent incomplètes ou difficiles d’accès. Seules quelques administrations ont publié des inventaires des algorithmes qu’elles utilisent, par ailleurs partiels pour la plupart.
Un inventaire pour répondre à l’opacité de l’administration algorithmique
Ce manque de transparence nuit au contrôle démocratique de l’activité des administrations publiques. Il prive les citoyen·nes d’une vision globale de l’utilisation d’outils algorithmiques dans les services publics : dans quelles administrations des algorithmes sont-ils utilisés ? Avec quels objectifs ? Suivant quelles méthodes ? Dans quels contextes organisationnels ? Sont-ils développés par des prestataires privés ? Combien coûtent-ils ? Quels effets ont-ils sur les publics (personnes, entreprises) qu’ils visent ? Sans information claire, il est impossible de comprendre, analyser, et, le cas échéant, critiquer l’usage que les administrations font de ces outils algorithmiques.
C’est en réponse à ce vide informationnel que nous lançons un projet d’inventaire citoyen des algorithmes publics, avec deux objectifs :
- Recenser les algorithmes utilisés par les administrations, en centralisant l’information pour qu’elle soit utile aux associations et collectifs citoyens, professionnels, militants ou de recherche.
- Montrer que les algorithmes ne sont ni neutres ni autonomes, en mettant en évidence l’importance des choix et des contextes qui influencent leur fonctionnement.
Que documenter sur un algorithme public ?
« Algorithme » = « code informatique » ? En réalité, de nombreux autres éléments donnent forme à ces systèmes et aux résultats qu’ils produisent : les institutions qui les développent, les financements, les bases de données utilisées, la manière dont ils sont utilisés par les équipes de travail…
Pour chaque algorithme répertorié, l’inventaire fournit ainsi, si l’information est disponible, des éléments sur :
- Le contexte dans lequel l’algorithme a été conçu (institutions porteuses de projet, partenaires, budgets…), qui influence la portée et les limites de son utilisation.
- Les aspects techniques de l’algorithme (modèles, données d’entraînement) qui façonnent directement les résultats obtenus.
- Le cadre réglementaire en vigueur, qui guide ou restreint ses usages possibles.
- La documentation disponible (code source, articles, sites institutionnels, etc.).
- Les évaluations menées par l’administration elle-même ou par des personnes tierces.
Un manque criant d’informations
Les informations disponibles en ligne sur les algorithmes publics sont maigres. Les informations que nous répertorions proviennent des rares documents déjà publiés par certaines institutions, de rapports publics et de travaux issus des mondes associatifs et de la recherche. Malgré nos efforts, beaucoup des catégories de l’inventaire restent sans réponse. Moins de la moitié des algorithmes recensés soumis à l’obligation de transparence posée par le code des relations entre le public et les administrations (CRPA) respectent cette obligation. Seuls 4% des algorithmes répertoriés dans l’inventaire ont fait l’objet d’une évaluation interne diffusée publiquement. Il est également presque impossible de savoir combien ces systèmes ont coûté (3 projets seulement sur 72 ont diffusé un budget), sur quelles données ils ont été entrainés, ou pourquoi un algorithme a été choisi plutôt qu’un autre.
En mettant en lumière ces infrastructures et le manque criant d’informations à leur sujet, cet inventaire veut changer notre façon de voir les algorithmes publics. Il aspire à être un outil pour une critique éclairée de ces dispositifs, qui jouent un rôle croissant dans la prise de décision publique. En rendant visibles ces infrastructures, nous espérons offrir de nouvelles prises sur les algorithmes publics et les façons dont ceux-ci sont développés et encadrés.
Méthodologie et informations pratiques
Dans sa première version (novembre 2024), l’inventaire prend en compte :
- Tous types de systèmes algorithmiques, qu’ils reposent sur l’apprentissage automatique (machine learning, deep learning), des systèmes de règles (exemple : des fichiers de calcul), ou d’autres technologies, et qu’ils participent ou non à une prise de décision.
- Les algorithmes développés ou utilisés par les administrations centrales et agences d’État, à l’exclusion, pour le moment, des collectivités territoriales et de la fonction publique hospitalière.
- Les algorithmes qui sont documentés de manière publique : soit dans des documents des administrations elles-mêmes, soit par des tiers.
Les données de l’inventaire sont disponibles sur cette page et sur la plateforme data.gouv.fr.
Cet inventaire est réalisé dans une démarche citoyenne, faute de prise en charge de cette responsabilité par l’administration, à qui elle incombe pourtant légalement. Premier chantier de cet ordre à l’échelle nationale, l’inventaire des algorithmes publics s’appuie sur de nombreuses sources d’inspiration, tant en France qu’à l’étranger, qui feront l’objet d’un prochain article. Nous espérons qu’il ouvrira la voie à de futures collaborations avec le monde associatif et celui de la recherche : n’hésitez pas à prendre contact si ce projet vous intéresse !