Courrier des statistiques N4 - 2020

Poursuivant son exploration des métiers et méthodes de la statistique publique, ce numéro N4 s’intéresse d’abord à une pratique qu’on ne range pas habituellement dans ce domaine : la microsimulation, dynamique ou statique, pratiquée dans un INS ou dans des services ministériels. Deux modèles spécifiques sont détaillés : TRAJECTOiRE, sur le système de retraite et Ines, autour des politiques sociales et fiscales. Quatre papiers sont ensuite consacrés à des références pour le statisticien : en France d’abord, à travers la refonte de la nomenclature des PCS, le programme de refonte du répertoire d’entreprises Sirene et la mise au point du nouvel l’échantillon-maître. L’expérience suédoise ensuite, sur la modélisation des processus statistiques et son impact organisationnel, apporte l’éclairage externe que nous affectionnons. Enfin, un panorama sur le système d’information du logement en France, dans sa globalité, vient conclure ce numéro.

Courrier des statistiques
Paru le : Paru le 29/06/2020
Christophe Alviset, directeur du programme Sirene 4, direction des Statistiques d’Entreprises (DSE), Insee
Courrier des statistiques - Juin 2020
Consulter

La troisième refonte du répertoire SireneTrop ambitieuse ou pas assez ?

Christophe Alviset, directeur du programme Sirene 4, direction des Statistiques d’Entreprises (DSE), Insee

Longtemps au cœur du système statistique sur les entreprises, Sirene, le répertoire d’entreprises de l’Insee, a évolué en profondeur depuis 2005, date de sa dernière grande refonte : les grandes fonctionnalités ont été clarifiées, avec un répertoire des unités statistiques distinct (Sirus) et une mise à disposition déportée sur une interface (API). Sirene est maintenant consacré entièrement à la gestion administrative et aux échanges avec les partenaires de cette gestion.

La troisième refonte de Sirene est concomitante à d’importantes réformes administratives : la création d’un « guichet unique » et d’un « registre général » pour les formalités des entreprises, ainsi que le service d’identification électronique des personnes représentant les unités légales. Le programme vise d’abord à réduire les coûts de gestion du répertoire, dans un contexte d’augmentation régulière du volume de déclarations à traiter. Il doit aussi permettre d’améliorer l’évolutivité du répertoire, pour intégrer plus rapidement les modifications des formalités d’entreprise, et rendre un meilleur service aux partenaires et aux déclarants. Il s’appuie sur une analyse de l’urbanisation du système d’information, et sur une démarche qualité : la conduite agile des projets sur la période 2019-2023 facilite l’adaptation aux changements organisationnels, fonctionnels et techniques, susceptibles de se produire pendant leur déroulement, tout en répondant aux besoins des gestionnaires de l’Insee.

Le répertoire Sirene identifie les unités légales et les établissements en France depuis 1970 (Létoquart et Reffet, 1969). En près de 50 ans, le répertoire a connu deux refontes importantes : comme ses prédécesseurs Sirene 2 en 1986 et Sirene 3 en 2005 (Picard et Chazelas, 2003), le programme Sirene 4 modernisera la gestion du répertoire, cette fois-ci à l’horizon 2022-2023.

Sirene aujourd’hui, c’est 31 millions d’établissements, 4 millions d’événements traités chaque année, et plus de 10 000 utilisateurs réguliers. Faire évoluer un référentiel de cette importance suppose un certain nombre de précautions, que nous allons aborder dans cet article. Mais si la troisième refonte de Sirene répond à des préoccupations identiques à celles qui ont précédé – diminution des coûts de gestion, simplification administrative pour les entreprises, rationalisation des traitements et du système d’information – elle s’en démarque par son contexte : l’environnement administratif est traversé d’évolutions majeures, impulsées par le politique ; les institutions accélèrent leur adaptation à la révolution numérique ; les exigences des utilisateurs s’amplifient. Enfin, la statistique publique met en œuvre de nouvelles méthodes de développement de ses projets.

Le répertoire Sirene est un des référentiels majeurs de l’État

Le répertoire national d’identification des entreprises et des établissements concerne toutes les unités légales implantées sur le territoire national. Il a été créé par le décret du 14 mars 1973 et sa gestion confiée dès ce moment à l’Insee : l’institut a conçu et met à jour depuis près de 50 ans, le système Sirene (Système Informatique pour le Répertoire des ENtreprises et des Etablissements). À ce titre, il est un des rares instituts de statistiques, avec celui de la Suisse, qui tient un répertoire administratif des entreprises.

L’Insee attribue un numéro unique d’identification, le numéro Siren, aux personnes morales et aux entrepreneurs individuels et le numéro Siret à chacun de leurs établissements, c’est-à-dire à chaque implantation géographiquement distincte. L’usage généralisé de ce numéro unique par l’administration et par la statistique publique place le répertoire Sirene au cœur du dispositif d’information sur les entreprises.

Le répertoire concerne toutes les entreprises, quelle que soit leur forme juridique et quel que soit leur secteur d’activité, situées en métropole, ainsi que dans les tous les départements et certaines collectivités d’outre-mer. Les organismes publics y sont également répertoriés ainsi que les entreprises étrangères qui ont une représentation ou une activité en France. Les entreprises et établissements de Monaco ou en Andorre peuvent également demander à y figurer.

Sont donc inscrits au répertoire tous les entrepreneurs individuels ou les personnes morales immatriculées au Registre du commerce et des sociétés, ou au Répertoire des métiers, ou employant du personnel salarié, ou soumises à des obligations fiscales, ou bénéficiaires de transferts financiers publics.

Pour mettre à jour Sirene, l’Insee reçoit des informations du réseau constitué des 1 400 centres de formalités d’entreprises (CFE) : implantés au sein des institutions en charge des fichiers et registres cités plus haut, ces centres permettent aux entreprises de déclarer en un seul lieu les formalités nécessaires à leur prise en compte dans les systèmes d’information de l’ensemble des administrations concernées.

Pour que le principe à la base de la création des CFE puisse fonctionner, il faut non seulement réceptionner les informations, mais également les retransmettre. L’Insee communique en permanence les évolutions enregistrées dans le répertoire Sirene (créations, modifications, cessations d’activité, appelées aussi « mouvements ») aux associés et partenaires du répertoire : ces flux d’informations placent depuis longtemps Sirene au cœur d’un écosystème complexe (figure 1).

Le dispositif (identification unique, écosystème autour du répertoire) permet de constituer avec Sirene le référentiel français des entreprises et des établissements. Celui-ci irrigue les systèmes d’information de l’administration, mais également du secteur privé, évitant ainsi à chacun d’assurer son propre suivi de la vie des entreprises.

Toutefois, un référentiel n’est pas une base de données comme une autre. Le responsable de la tenue d’un référentiel se doit de suivre un certain nombre de bonnes pratiques (Bizingre, Paumier et Rivière, 2013). En France, l’État a confié à la direction interministérielle du Numérique (Dinum) la mission de définir ses propres critères (voir encadré 1 et (Disic, 2013)). Si la gestion du répertoire Sirene suit déjà la majorité des préconisations de la Dinum, le programme Sirene 4 sera l’occasion d’un pas supplémentaire dans cette direction, par exemple en matière d’historisation systématique des données d’identification (règle RA6).

Référentiel officiel pour servir une large palette d’utilisateurs institutionnels ou privés, Sirene est également un outil au cœur du système statistique public sur les entreprises. Or au fil du temps, il est apparu que la description purement juridique ne suffisait pas à représenter correctement l’activité des entreprises du point de vue économique.

 

Figure 1. L’écosystème Sirene

 

 

Encadré 1. Cinq obligations d’un référentiel, parmi les règles préconisées par la Dinum

(Cadre commun d’architecture des référentiels de données de la direction interministérielle du Numérique*)

(Règle RS3) Tout référentiel de données dispose d’un cadre de gouvernance à jour, accessible librement à tous, et aligné ou en cours d’alignement :

  • sur le présent corpus réglementaire interministériel (Cadre Commun d’Urbanisation, Cadre Commun d’Architecture des Référentiels de Données, Référentiel Général d’Interopérabilité),
  • sur la stratégie du système d’information de l’État,
  • sur les besoins opérationnels des utilisateurs des données de référence gérées,
  • sur la réglementation métier correspondante en vigueur. [...]

(Règle RS5) La qualité des données d’un référentiel est mesurée, suivie et publiée. Une démarche d’amélioration continue est en place pour atteindre le niveau de qualité attendu par les utilisateurs directs pour la performance de leurs processus métiers.

(Règle RM4) Chaque référentiel doit intégrer un dispositif d’alerte ou de signalement permettant à un utilisateur du référentiel de faire remonter au responsable du référentiel toutes anomalies sur les données détectées en aval (incomplétude, incohérence, doublon, amalgame, problèmes d’intégrité, etc.). Le processus de traitement des signalements doit être également décrit, à jour et publié. Il est recommandé également de rechercher son automatisation et donc son outillage.

(Règle RA2) Les données de référence encapsulées dans un référentiel ne sont accessibles que par des services documentés et catalogués, disposant de SLA** partagés et alignés sur les besoins des consommateurs des données. Les services réalisent les fonctionnalités définies (RF7). Le mode d’accès synchrone est recommandé ; le mode asynchrone n’est pas interdit, mais doit être limité et encadré.

(Règle RA6) Toute action sur les données d’un référentiel doit être tracée et journalisée. Les données sont historisées. Les instances des objets métiers sont versionnées en fonction de leur cycle de vie. Les données ne sont pas détruites, mais marquées comme non actives. La politique de conservation et d’archivage des données est définie.

 

* (Disic, 2013) La direction interministérielle du Numérique (Dinum), par le décret du 25 octobre 2019, prend la suite de la direction interministérielle du Numérique et du système d’information et de communication de l’État (Dinsic, auparavant Disic).

** Le Service Level Agreement, ou SLA est un contrat par lequel un prestataire informatique s’engage à fournir un ensemble de services à un ou plusieurs clients.

La mission statistique de Sirene : confiée à un répertoire dédié

Si l’Insee gère depuis les années soixante-dix le répertoire Sirene, c’est en partie parce que l’institut y avait un intérêt fort : la gestion du répertoire lui permet de se constituer la base de sondage indispensable à la conduite de ses enquêtes auprès des entreprises.

Mais l’extension progressive des sources d’informations a aussi alourdi le répertoire de tout un ensemble d’unités qui n’intéressent pas le statisticien, parce que dépourvues de consistance économique. De plus, l’évolution de l’organisation interne aux entreprises a rendu l’unité légale seule de moins en moins adaptée à la statistique économique.

Depuis 2012, l’Insee utilise le répertoire Sirene pour construire Sirus, son répertoire des unités statistiques (Béguin et Haag, 2017). Ces unités statistiques permettent de mieux décrire le tissu économique que les unités légales, en incluant les groupes, les réseaux et les entreprises profilées (Haag, 2019), mais aussi en mettant à disposition du service statistique public (SSP) un grand nombre de variables statistiques absentes de Sirene.

Sirus est aujourd’hui l’outil de référence pour vérifier les données d’identification dans les opérations statistiques impliquant la connaissance de variables relatives à des entreprises (au sens statistique du terme, voir (Haag, 2019)) ou des établissements. C’est également une base de données pour les études structurelles sur des zones géographiques plus ou moins fines ou sur certaines catégories d’entreprises.

Base de sondage des enquêtes de la statistique publique, le répertoire Sirus est utilisé notamment pour tirer les échantillons des enquêtes annuelles d’entreprises dans l’industrie, la construction, le commerce et les services. Sources privilégiées du suivi de la démographie des entreprises, les mises à jour enregistrées dans le répertoire Sirus permettent également d’élaborer les statistiques mensuelles de création d’entreprises publiées par l’Insee.

Pour les utilisateurs n’appartenant pas à la Statistique publique, l’accès au répertoire Sirene relève d’une approche spécifique, qui elle aussi a évolué au cours des années récentes.

La diffusion de Sirene : modernisée et distincte de la gestion

L’administration française est traversée régulièrement par des réformes portant des enjeux de simplification administrative pour les entreprises ; à leur création, Sirene et les CFE avaient d’ailleurs constitué des étapes importantes de ce mouvement. Plus récemment, plusieurs événements ont contribué à l’évolution de la diffusion du répertoire Sirene.

Lancé en 2013, le programme « Dites-le-nous une fois » prévoit que les données d’entreprises soient échangées entre administrations au lieu d’être demandées plusieurs fois aux entreprises. Dans un autre ordre d’idée, l’orientation de « l’État-plateforme » cherche à favoriser les services numériques pour accéder aux bases de données publiques, plutôt que la compilation de ces bases dans les environnements de leurs utilisateurs (SGMAP, 2020 ; Colin et Verdier, 2015 ; Dinsic, 2016 ; Biehl, 2016). In fine, ces deux actions de la puissance publique ont incité l’Insee à conduire en 2017 son propre projet de modernisation, celui de la diffusion de Sirene.

Dans le même temps, la direction de la Sécurité sociale demandait d’accéder directement à la totalité des données historiques du répertoire Sirene ; ceci a également contribué à restructurer fortement l’offre de l’Insee concernant Sirene.

En choisissant de développer une API (Application Programming Interface) pour mettre Sirene à la disposition de ses utilisateurs (encadré 2), l’Insee a contribué à séparer les deux fonctions autrefois intimement liées : la gestion et la diffusion du répertoire.

Ce faisant, on assiste à une petite révolution culturelle : du côté Insee, la technique des API diminue fortement la charge de conception des produits de diffusion ; du côté des utilisateurs des données, qu’ils soient ou pas partie prenante de la gestion des formalités d’entreprises, Sirus et l’API Sirene rationalisent la partie du système d’information consacrée à la mise à disposition des données Sirene (figure 2).

Avant même de lancer sa troisième refonte de Sirene, l’Insee avait donc déjà fait évoluer fortement le répertoire : en isolant dans Sirus la partie du référentiel utile aux statisticiens, en séparant la gestion du répertoire administratif de sa diffusion, en modernisant la technologie de la mise à disposition de Sirus et de Sirene. Dans ces conditions, on est conduit à s’interroger sur ce qui a justifié le lancement d’une nouvelle refonte, le programme Sirene 4.

Encadré 2. La diffusion de Sirene radicalement modernisée

  • 2017 : la loi pour République numérique se traduit par la mise en open data des données sur https://data.gouv.fr ;
  • 2018 : ouverture de l’API Sirene via https://api.insee.fr donnant accès à la totalité des données courantes et historiques du répertoire (22 millions d’unités légales, 31 millions d’établissements). Pour éviter la recopie de tout ou partie des données et des aléas dans la tenue à jour de ces copies, les API (interfaces de programmation applicative) permettent, avec quelques compétences de programmation, d’utiliser directement et quasi-immédiatement les données Sirene hébergées par l’Insee ;
  • la base Sirene des entreprises et de leurs établissements (SIREN, SIRET) est un des neuf jeux de données de référence du Service Public de la Donnée (https://www.data.gouv.fr/fr/reference), avec le répertoire national des associations, la base adresse nationale, le référentiel de l’organisation administrative de l’État, le plan cadastral informatisé, le registre parcellaire graphique, le référentiel à grande échelle, le répertoire opérationnel des métiers et des emplois, et enfin le code officiel géographique de l’Insee ;
  • pour un usage simple ou épisodique, le site https://sirene.fr permet de faire des recherches et d’obtenir des listes suivant les principales caractéristiques des établissements.

 

Figure 2. L’étude d’urbanisation de Sirene facilite la définition des périmètres

 

 

Sirene 4 a bénéficié (involontairement) d’une préparation approfondie

Sirene est une des opérations majeures de l’Insee, par sa finalité d’abord, mais aussi par l’ampleur des moyens que l’Insee consacre à sa gestion. L’institut revisite régulièrement les coûts engagés dans les opérations dont il a la charge : une revue concernant spécifiquement Sirene a débouché en 2013 sur des recommandations, dont certaines ont pu être mises en œuvre rapidement : rationalisation de l’accueil téléphonique, refonte de l’automate de traitement des déclarations, en vue de le rendre plus performant, etc.

Mais d’autres demandes nécessitaient une forte évolution applicative. Or, côté métier comme côté informatique, les équipes étaient largement mobilisées par un autre chantier, celui de la rationalisation de l’exploitation informatique de l’Insee, lequel s’est achevé fin 2017.

Ce délai, involontaire, a permis de conduire le projet d’API Sirene cité plus haut, mais également deux études qui se sont révélées importantes pour la préparation du programme Sirene 4.

  • L’étude d’urbanisation du système d’information Sirene : menée sur l’ensemble des activités de gestion et de diffusion, l’étude a permis de formaliser les principaux objectifs de la refonte et les a traduits en architecture fonctionnelle, applicative (figure 2) et technique. Elle s’inscrit dans les objectifs d’urbanisation du système d’information de l’État (Disic, 2012 ; Disic, 2013 ; Weill, Robertson et Ross, 2006).
  • Les nouveaux développements de la démarche Qualité Sirene, portant sur l’ensemble de la gestion et de la diffusion, sont venus compléter la démarche de 2005 (Rivière, 2005). Pour répondre aux préconisations de la Dinum en matière de tenue de référentiels (encadré 1), des objectifs chiffrés sont en cours de finalisation. Les indicateurs devraient à terme se focaliser sur la qualité de l’adresse, celle du code APE, ou de l’état administratif des unités référencées (fermé/actif). Ainsi, la mesure de la qualité pourra servir de contre-poids à la recherche d’économie de moyens.

Ces travaux préparatoires ont bien évidemment intégré les objectifs déjà cités (encadré 2) du gouvernement de l’époque, en matière de simplification et de sécurisation de la vie des entreprises, avec notamment la décision du comité interministériel de la Modernisation de l’action publique du 18 décembre 2013 faisant du répertoire Sirene la référence en matière d’identité des entreprises.

Leurs résultats devront être adaptés pour mettre en œuvre les décisions plus récentes, notamment la loi pour la croissance et la transformation des entreprises (PACTE), très structurante pour les entreprises (encadré 3). Mais à très court terme, un autre plan d’actions gouvernemental a un impact déjà mesurable sur le programme Sirene 4.

Encadré 3. La loi PACTE rationalise l’organisation des partenaires de la gestion de Sirene

La loi pour la croissance et la transformation des entreprises (PACTE), publiée en mai 2019, prévoit des changements substantiels dans le traitement des déclarations des entreprises :

  • mise en place d’un guichet unique électronique (Article 1er) ;
  • constitution d’un registre général des entreprises (Article 2), en maintenant distinct le répertoire Sirene ;
  • dématérialisation à terme de toutes les déclarations des entreprises (seulement 20 % aujourd’hui) ;
  • l’Inpi (Institut national de la propriété intellectuelle) unique opérateur pour gérer à la fois le guichet unique et le registre général.

Pour le programme Sirene 4, la mise en œuvre de cette loi pose quelques questions clefs :

  • quel positionnement du répertoire Sirene par rapport au guichet unique et au registre général ?
  • pour satisfaire la demande sociale, quels engagements de délais de traitement des formalités par l’Insee (et ses partenaires) ?
  • l’Insee doit-il, en plus de l’activité principale*, fournir pour chaque entreprise tout ou partie de ses activités secondaires éventuelles et sous quelle forme ?

En termes d’échéance, le démarrage du guichet unique est envisagé à compter de janvier 2021, et la mise en œuvre du registre général des entreprises pour une échéance plus lointaine, estimée à fin 2022.

 

* Outre sa fonction d’identification des entreprises, le répertoire Sirene confie à l’Insee le soin de coder une activité principale exercée (APE), dans la Nomenclature d’activité française (NAF). L’attribution de ce code répond à des finalités exclusivement statistiques, même si le code APE se révèle à l’usage structurant dans la mise en œuvre de réglementations pour les entreprises et leurs salariés.

Contribuer à la transformation numérique du service public

L’État a lancé en avril 2019 TECH.GOUV, un programme pour accélérer la transformation numérique du service public. Sa feuille de route distingue plusieurs missions, notamment « Idnum » dont un des projets est le « Développement et déploiement de ProConnect et de l’écosystème associé ». ProConnect est le pendant pour les entreprises de FranceConnect pour les particuliers ; ce sera un dispositif d’authentification des personnes physiques agissant pour le compte des unités légales.

Les premiers travaux sur ce projet 2019-2020 positionnent l’Insee, via le répertoire Sirene, comme un contributeur majeur. L’architecture fonctionnelle prévoit d’inclure les dirigeants des entreprises dans le répertoire (sans pour autant en faire une diffusion publique) et d’y distinguer les habilitateurs principaux qui, au sein des entreprises, sont responsables de l’attribution des droits d’accès aux différents portails des services publics, comme www.impot.gouv.fr ou www.net-entreprises.fr. Pour les habilitateurs principaux, le répertoire Sirene contiendra leur courriel et éventuellement leur téléphone mobile, qui seront mis à disposition de ProConnect. Ces données permettront de plus à toute administration de contacter l’entreprise par internet, évitant ainsi un courrier papier au siège social.

Après les orientations politiques, intéressons-nous maintenant aux utilisateurs opérationnels du répertoire Sirene.

Cerner les besoins des utilisateurs qui seront satisfaits

Dans la doctrine traditionnelle de conduite des projets, une bonne pratique consiste à synthétiser l’ensemble des besoins utilisateurs pour permettre la meilleure définition du projet. Plusieurs opérations ont permis d’illustrer concrètement certaines attentes.

En 2014, avec l’aide du secrétariat général à la Modernisation de l’action Publique (SGMAP), dans le cadre du programme « Dites-le-nous une fois », l’Insee a rencontré plusieurs administrations pour mieux comprendre leur usage des données de Sirene et leurs attentes. En voici trois illustrations :

  • fournir les coordonnées géographiques (dites « xy ») des établissements : retenue dans Sirene 4, la géolocalisation aujourd’hui devient indissociable de l’adresse géographique ;
  • identifier des locaux, des bâtiments ou des terrains et pas uniquement des établissements : la notion actuelle d’établissement convient pour les besoins de la sphère fiscale et de la sphère sociale ainsi que pour ceux de la statistique ; une extension du concept ou l’ajout d’un nouveau type d’unités nécessiteraient des moyens de gestion qui ne sont pas envisageables à l’Insee, en plus d’avoir un impact difficile à mesurer pour les déclarants et tous les utilisateurs des données ;
  • étendre le champ de Sirene à toutes les associations (Blein, 2014) : source de simplification pour les associations et les utilisateurs des données des associations, cette extension ne pourra être réalisée que lorsque les formalités administratives pour les associations seront suffisamment automatisées pour que le surcoût de gestion pour l’Insee soit acceptable ; une première étape a été franchie avec le portail https://lecompteasso.associations.gouv.fr/ ; il n’y a actuellement pas d’horizon temporel déterminé pour que Sirene contienne toutes les associations.

Dans le cadre de hackathons organisé par le SGMAP en 2016 ou l’Insee en 2018, d’autres besoins ont été notés en plus de ceux recueillis par l’enquête de satisfaction des utilisateurs des données réalisée dans le cadre de la démarche qualité en 2017 (Insee, 2017 ; Insee, 2018). Trois exemples peuvent être présentés :

  • l’amélioration de la qualité de l’information en matière de cessation d’activité : cette information n’arrive que très tardivement à l’Insee, quand elle arrive ; un garde-fou est mis en place par l’article 38 de la loi PACTE (« Si le travailleur indépendant est entrepreneur individuel, la radiation [...] emporte de plein droit celle des fichiers, registres ou répertoires tenus par les autres administrations »), mais ne suffit pas à épuiser ce sujet complexe ;
  • l’amélioration de la qualité des adresses : ceci est bien retenu dans le cadre de Sirene 4, sous réserve que les moyens de gestion nécessaires pour la résorption des écarts éventuels avec la BAN, base adresse nationale, à la fois pour le rattrapage du stock et le traitement courant des déclarations soient compatibles avec ceux de l’Insee (Faure-Muntian, 2018) ; à défaut, l’amélioration sera lissée sur plusieurs années ;
  • l’amélioration de la qualité des informations sur le secteur public : ce sujet est retenu dans Sirene 4, mais dépend également de la capacité des administrations partenaires à améliorer et moderniser leur contribution au répertoire Sirene.

Une fois passés en revue l’environnement du répertoire, le contexte politique du programme et certains besoins utilisateurs, il est temps d’aborder les objectifs de cette troisième refonte.

Les trois objectifs principaux du programme Sirene 4

Comme indiqué ci-dessus, tout usage des données en dehors de la sphère de gestion est renvoyé à la diffusion du répertoire Sirene (API Sirene https://api.insee.fr, https://data.gouv.fr/, https://sirene.fr). Pour les utilisateurs des données, les seuls changements envisagés à ce stade sont d’augmenter le nombre de variables historisées, de détailler un peu plus les composantes de l’adresse et d’être plus strict sur les valeurs admissibles.

Les objectifs de la refonte, par ordre décroissant de priorité, sont les suivants :

  • les gains en gestion : le travail quotidien des agents de l’Insee qui traitent les formalités n’ayant pu être traitées automatiquement ;
  • les gains en administration du répertoire : le pilotage du répertoire dans son ensemble et des échanges avec les partenaires ;
  • les gains pour les partenaires et les déclarants : le service rendu in fine par l’Insee.

Les gains en gestion relèvent majoritairement de l’Insee

L’Insee traite chaque jour 18 000 déclarations. Plus de 60 % sont traitées automatiquement. Le traitement manuel des déclarations est consacré à trois activités bien déterminées : l’identification de l’unité visée par la déclaration, la codification de l’activité principale de l’entreprise et le traitement d’anomalies, d’incohérences ou d’imprécisions dans la déclaration.

  • La question de l’identification est un sujet d’étude depuis longtemps (Fellegi et Sunter, 1969 ; Winkler, 2006). Pour Sirene, des études techniques ont montré en 2018 que des gains substantiels étaient possibles en matière d’identification, d’une part avec l’utilisation d’outils modernes de recherche (en l’occurrence, le moteur Solr), d’autre part en améliorant la qualité des données, y compris les données historiques. L’amélioration des données peut être faite par confrontation avec d’autres sources (base adresse nationale, répertoire national d’identification des personnes physiques, registre national du commerce et des sociétés, par exemple) ou par des enquêtes d’amélioration du répertoire ciblées sur des questions précises.
  • Il n’a pas été possible de mettre en évidence des gains accessibles en matière de codification de l’activité principale ; ce sujet nécessite encore des travaux méthodologiques pour profiter des avancées en matière d’apprentissage automatique (machine learning) ou d’autres techniques d’intelligence artificielle. Ces travaux ne pourront pas démarrer avant 2023, après la fin du programme Sirene 4.
  • Enfin, des simplifications en matière de traitements seront obtenues en éliminant ceux qui sont repris par le répertoire statistique ou la diffusion du répertoire. Ceci nécessite de passer au peigne fin la totalité des traitements.

Pour des gains en gestion supplémentaires, l’Insee dépend de ses partenaires. Le premier sujet est la qualité des données entrantes ; le deuxième est la capacité de confronter le répertoire Sirene aux autres registres et répertoire ; le troisième est la capacité à dématérialiser les relations avec les entreprises.

La qualité des données contenues dans les déclarations ou, pour le secteur public, fournies par les administrations, ne peut pas s’améliorer spontanément : avec des objectifs différents (la qualité des données du répertoire par opposition au traitement immédiat des déclarations) et des moyens en baisse dans toutes les organisations, il est nécessaire d’instaurer un dialogue régulier pour convenir petit à petit de contrôles plus stricts sur le contenu des déclarations, qui permettra la diminution du délai global de traitement. Le bouleversement des acteurs en matière de déclarations d’entreprises (par exemple les conséquences de la loi PACTE, voir encadré 3) peut être un accélérateur de cette évolution, ou un frein.

Deuxième sujet, la confrontation avec d’autres registres et répertoires est nécessaire pour rectifier certaines données divergentes (en général pour des raisons matérielles) et, au-delà, vérifier les procédures d’échanges et de traitements des données dans un environnement administratif complexe. Les travaux préparatoires à la mise en place du registre général des entreprises pourraient être l’occasion d’améliorer la qualité d’ensemble, si tous disposent des moyens d’instruire et de corriger les écarts.

Enfin, plus classiquement, certaines procédures spécifiques de l’Insee, comme la demande de modification de l’activité principale, pourraient être dématérialisées avec ProConnect, comme la demande de modification du statut de diffusion https://statut-diffusion-sirene.insee.fr/ l’a été avec FranceConnect. Ceci se fera progressivement, en fonction du calendrier de migration des entreprises à ProConnect.

L’objectif le plus important pour l’Insee, donc indirectement pour les partenaires et les entreprises, est de faire des gains en gestion. Cependant, les évolutions de l’organisation des partenaires et du contenu des formalités sont récurrentes, et parfois urgentes : il faut également être capable de les traiter de façon plus efficace.

L’Insee a un rôle de coordination des CFE

La commission de coordination des centres de formalités des entreprises (CCCFE) élabore et fait évoluer la norme fonctionnelle d’échanges automatisés d’information des CFE (EDI CFE) ; cette norme constitue la traduction en langage informatique des renseignements recueillis par les CFE et transmis à leurs divers partenaires. L’Insee préside cette commission, dont le secrétariat est assuré par la direction générale des Entreprises, et gère cette norme d’échanges EDI CFE avec l’agence centrale des organismes de sécurité sociale (ACOSS) à travers le groupe Norme de la CCCFE.

Les gains en administration du répertoire seront apportés principalement par la mise en place d’un outil de gestion de la norme : il permettra de vérifier la cohérence interne de la norme et d’en gérer les différentes versions ; cela concerne également la partie qui s’applique aux échanges de l’Insee avec les destinataires. Ce sera l’occasion de mettre en place des bonnes pratiques après concertation avec les parties prenantes.

En ce qui concerne le rôle de tenue du répertoire, l’objectif du programme Sirene 4 est de gérer plus facilement les évolutions en mettant en place un moteur de règles, ce qui, en complément de la gestion de la norme, permettra de standardiser les traitements et, ainsi, de faciliter leurs évolutions.

Enfin, il sera nécessaire de mettre en œuvre des études d’impact : pour ce faire, il faudra développer la capacité à faire tout ou partie des traitements en double, afin de mesurer la qualité des processus. De même, des environnements de simulation seront nécessaires pour étudier l’impact des changements sur les traitements et le poste de gestion.

Sirene 4 devrait ainsi permettre des gains réguliers en efficacité, seule réponse possible à l’accroissement annuel de la charge de travail, qui peut être assez fort : on l’a constaté récemment lors des changements juridiques concernant les micro-entrepreneurs, qui ont eu des conséquences importantes sur le volume des traitements dans Sirene.

Le recours aux techniques d’automatisation du développement et de l’exploitation informatique (DevOps) va également dans ce sens (Doerrfeld, van der Mersch, Sandoval et Wood, 2016). Outre la nouvelle application de gestion, c’est une véritable usine de développement logiciel qui est mise en place et servira pour les maintenances ultérieures.

Ce sont aussi les nouvelles architectures, sur la base de services indépendants, qui permettront de gérer plus facilement les évolutions.

Les gains en délai : une question d’architecture d’ensemble

La loi PACTE prévoit un guichet unique, mais derrière le guichet, que va-t-il se passer ? Le fonctionnement actuel des échanges entre les partenaires repose sur des traitements par lots en temps différé. Un fonctionnement typique est d’envoyer le lot des déclarations de la journée J à l’Insee le soir ; l’Insee l’intègre le lendemain et renvoie le soir même ce qui a été traité dans la journée, automatiquement ou par les gestionnaires ; le destinataire le reçoit donc à J+2 alors que le traitement pourrait être instantané pour les déclarations qui ne requièrent pas de traitement manuel.

En plus du traitement par lots, le programme Sirene 4 prévoit de permettre le traitement au fil de l’eau : le partenaire envoie une déclaration par service web, l’Insee renvoie immédiatement le résultat du traitement s’il peut être traité automatiquement. Même pour les déclarations qui doivent être reprises par un gestionnaire, tout le monde gagne deux jours de délai par suppression des temps morts.

La mise à disposition des déclarants de leur avis d’immatriculation au répertoire Sirene par support électronique permettra également de gagner le délai d’acheminement du courrier papier, dès que les entreprises auront des données de contact électronique sûres.

D’autres gains pour les partenaires et les déclarants seront également possibles via un bouquet de services fourni par l’API Sirene (pour le pré-remplissage de formulaires de modification), le répertoire national d’identification des personnes physiques pour la vérification de l’identité ainsi que par des API d’assistance à la saisie de données géographiques, par l’institut national de l’information géographique et forestière (IGN).

Après avoir décrit les trois objectifs de Sirene 4, quelle trajectoire pour les atteindre ?

La superposition des calendriers accroît les incertitudes

On a vu que certains objectifs de Sirene 4 ne dépendaient que des moyens de l’Insee tandis que d’autres nécessitaient la coopération d’acteurs externes qui ont leurs propres projets et leurs propres priorités. De plus, les missions de certains de ces acteurs vont être redéfinies par la mise en œuvre de la loi PACTE. Le biais de l’approche projet nous fait croire, ou nous fait espérer, que tous les changements interviendront dans le bon calendrier, celui du programme Sirene 4.

En fait, on peut distinguer plusieurs calendriers :

  • la convention avec la direction du Budget, qui nous demande d’obtenir des gains dès 2021 et de réaliser l’essentiel du programme pour 2022 ;
  • la mise en place de ProConnect, 2020-2021 ;
  • le guichet unique électronique et la suppression des centres de formalités des entreprises, 2021-2022 ;
  • le registre général des entreprises, 2022 ;
  • les simplifications administratives, notamment la directive sur l’utilisation d’outils et de processus numériques en droit des sociétés, qui doit être transposée en 2021.

Il n’est pas possible de connaître le détail de tous ces calendriers, et de leurs répercussions sur nos partenaires, avant d’organiser le programme Sirene 4. La conduite du programme devra s’adapter aux circonstances. Les méthodes actuelles de développement prônent l’agilité. Toutefois, l’agilité pour les grands projets n’est pas encore aussi bien établie.

Le fonctionnement agile doit être adapté à la taille du programme

Face aux incertitudes, la méthode agile (Schwaber et Sutherland, 2017 ; Reinertsen, 2009 ; Sutherland et Sutherland, 2014) suivie par la très grande majorité des projets de l’Insee permettra plus facilement de s’adapter aux circonstances ainsi qu’aux imprévus techniques (encadré 4). Les méthodes agiles privilégient l’adaptation aux changements de l’environnement, des besoins ou des technologies au suivi d’un plan « immuable ».

Toutefois, la taille de l’équipe (12 personnes en septembre 2019, une vingtaine en septembre 2020) ne permet pas d’utiliser telle quelle la méthode Scrum, bien adaptée à une taille d’équipe de trois à neuf membres. Une adaptation pragmatique sera nécessaire en s’appuyant sur différents éléments des méthodes de passage de l’agilité à l’échelle, comme Less (Larman et Vodde, 2016), Safe (Leffingwell, 2018) ou Scrum@Scale (https://www.scrumatscale.com/).

Ainsi, le programme pourrait être configuré en sous-équipes, le temps de quelques itérations, ou mettre en place une revue et une planification trimestrielle, pour mieux coordonner les projets entre eux.

En plus de l’association des utilisateurs internes aux démonstrations de l’avancement des travaux, l’Insee a mis au point une méthode originale de prise en compte de leurs besoins.

Encadré 4. Sirene 4 utilise Scrum, la méthode agile la plus répandue

Scrum est un cadre de travail pour le développement et la maintenance de produits complexes (Schwaber et Sutherland, 2017). Plutôt que de suivre un plan détaillé sur quatre ans, Scrum utilise une approche itérative et incrémentale pour optimiser la prédictibilité et pour contrôler le risque.

Trois piliers soutiennent la méthode : la transparence, l’inspection et l’adaptation.

Quatre types d’« événements Scrum » sont mis en œuvre : l’itération (3 semaines pour Sirene 4), la mêlée quotidienne (15’), la revue d’itération et la rétrospective (1 journée).

Pendant la réunion de revue d’itération, l’équipe Scrum et les parties prenantes (clients, encadrement, utilisateurs ou leurs représentants) échangent sur ce qui a été fait durant l’itération. Les participants collaborent pour déterminer les prochains items ayant le plus de valeur qui pourraient être réalisés.

La rétrospective est une occasion pour l’équipe d’inspecter son fonctionnement et de créer un plan d’amélioration qui sera mis en place au cours de l’itération suivante.

Les travaux sont priorisés par la valeur qu’ils apportent aux utilisateurs en produisant à chaque itération un résultat démontrable.

L’application Sirene adaptée aux gestionnaires de l’Insee

Pour les projets ayant un impact organisationnel potentiellement fort, l’Insee a recours à une méthode de détermination des rôles et des compétences (encadré 5). Les travaux préparatoires au programme Sirene 4 se sont largement concentrés sur les gains de productivité demandés, les besoins des gestionnaires, des experts et des responsables de site ou de pôle de compétence doivent être cartographiés.

Cette démarche en organisation du travail ne permet pas de faire l’économie des travaux d’ergonomie et d’expérience utilisateur, pour aborder plus en détail tel ou tel aspect de l’application.

Évidemment, un aspect important du changement pour les utilisateurs est de savoir quand et comment il aura lieu.

Encadré 5. Quand Sirene inspire un Maiol

Initialisée en 1998, la maîtrise d’œuvre locale en organisation du travail renvoie aux utilisateurs la responsabilité de concevoir l’organisation du travail, lorsqu’un projet impacte leur processus de production.

Maiol est une démarche « sur mesure », adaptée aux spécificités de l’Insee, qui s’insère dans le déroulement des projets, en harmonie avec la méthode de conduite de projet en vigueur. Elle doit permettre un atterrissage plus satisfaisant des applications dans les unités concernées, et garantit la cohérence avec la politique générale de l’Insee en matière d’organisation du travail dans les directions régionales.

La coopération des trois équipes statistique, informatique et organisation du travail responsabilise les acteurs, leur permet de confronter leurs points de vue et de choisir de nouvelles organisations performantes, motivantes et adaptées. L’évaluation des tâches à accomplir et des objectifs à atteindre contribue à créer les conditions de l’efficacité tant individuelle que collective.

Assez classiquement, un Maiol s’organise en trois phases : l’analyse de l’existant, l’élaboration des organisations cibles et l’accompagnement du changement (formations, communication, définition des fiches de poste, reconversion éventuelle).

La démarche est mise en œuvre pour Sirene 4 (de même qu’elle l’a été en 2002-2004 pour Sirene 3).

La stratégie de migration et de transition doit être finalisée

En ce qui concerne le premier objectif du programme, des gains en gestion, la stratégie de mise en place a été définie : des premiers changements seront réalisés en 2020 pour des gains, toutes choses égales par ailleurs, en année pleine dès 2021. Les autres gains mis en place en 2022 pour un effet en 2023.

Pour le reste du programme, des services périphériques seront disponibles régulièrement chaque année à partir de 2020, mais pour l’essentiel de la transformation du système d’information, et notamment le travail des gestionnaires, la stratégie n’est pas arrêtée sachant qu’en aucun cas il n’est possible de suspendre la gestion pour changer d’outil.

Un travail d’analyse conjoint Sirene 3 – Sirene 4 doit être réalisé pour la mi-2020 pour examiner la façon dont certains changements pourraient être mis en place progressivement et limiter, autant que faire se peut, les risques liés à une approche en big bang.

Au-delà de Sirene 4, une dynamique de changements réguliers

Pour ce qui est de la question posée dans le titre, un programme trop ambitieux ou pas assez, le lecteur jugera.

Au-delà de Sirene 4, plusieurs chantiers apparaissent déjà : la modernisation de la codification de l’activité principale, par exemple avec des techniques d’intelligence artificielle, éventuellement la mise à disposition des activités secondaires des entreprises, sans compter la poursuite régulière de l’amélioration de l’identification, l’impact de la dématérialisation des formalités des entreprises.

Fondements juridiques

Décret repris par les articles R. 123-220 à R. 123-234 du code de commerce.

Guadeloupe, Guyane, Martinique, la Réunion et Mayotte.

Saint-Barthélémy, Saint-Martin et Saint-Pierre-et-Miquelon.

Les entreprises et établissements de Monaco ou en Andorre peuvent également demander à y figurer.

Greffes des tribunaux de commerce et analogues, unions de recouvrement des cotisations de sécurité sociale et d'allocations familiales (URSSAF), chambres de commerce et d’industrie, chambres des métiers et de l’artisanat, chambres d’agriculture, services des impôts.

Il s’agit par exemple du ministère des Solidarités et de la Santé, des directions générales des Finances publiques et des Douanes.

Sirus ou Système d’immatriculation au répertoire des unités statistiques.

L’Insee et les services statistiques ministériels (SSM).

Voir la plaquette de présentation (SGMAP, 2013).

La demande a été formulée dans le cadre de la mise en place du Répertoire général des carrières uniques.

Le code d’activité principale exercée (APE) est attribué par l’Insee à chaque unité légale et à chaque établissement de ces unités légales, en référence à la nomenclature d’activité française (NAF).

Dites-le nous une fois, État-plateforme, loi pour une République numérique.

FranceConnect permet d’utiliser un compte des impôts ou de l’assurance maladie, par exemple, pour utiliser une téléprocédure sans devoir à chaque fois créer un compte spécifique. Lancé en 2014, il compte plus de 15 millions d’utilisateurs. FranceConnect relie une dizaine de fournisseurs d’identité et plus de 600 fournisseurs de services.

Le hackathon désigne le rassemblement d'informaticiens durant plusieurs jours et au minimum une nuit (souvent organisé sur un week-end) en vue de collaborer sur des sujets de programmation informatique pointus et innovants.

Le secrétariat général pour la modernisation de l'action publique (SGMAP) accompagne le gouvernement pour transformer les administrations et moderniser les services publics. Il est rattaché au Premier ministre.

Registre du commerce et des sociétés, répertoire des métiers, registre des actifs agricoles, notamment.

https://www.entreprises.gouv.fr/politique-et-enjeux/la-commission-coordination-des-centres-formalites-des-entreprises-cccfe.

https://www.cfe.urssaf.fr/static_cfe/NormesEDI-CFE/index.htm.

Pour en savoir plus

BÉGUIN, Jean-Marc et HAAG, Olivier, 2017. Méthodologie de la statistique annuelle d’entreprises. Description du système « Ésane ». [en ligne]. Octobre 2017. Insee Méthodes n°130. [Consulté le 26 mai 2020].

BIEHL Matthias, 2016. RESTful API Design. APIs your consumers will love. [en ligne]. Août 2016. API-University Press, série API-University, Vol. 3. [Consulté le 26 mai 2020].

BIZINGRE Joël, PAUMIER, Joseph et RIVIÈRE, Pascal, 2013. Les référentiels du système d’information : Données de référence et architectures d’entreprise. 3 juillet 2013. Édition Dunod. ISBN : 978-2-10-060124-0.

BLEIN, Yves, 2014. Simplifications pour les associations. [en ligne]. 9 octobre 2014. Rapport au Premier ministre. [Consulté le 26 mai 2020].

COLIN, Nicolas et VERDIER, Henri, 2015. L’âge de la multitude : Entreprendre et gouverner après la révolution numérique. 13 mai 2015. Édition Armand Colin. 2e édition. ISBN : 978-2-200-60343-4.

DIRECTION INTERMINISTÉRIELLE DU NUMÉRIQUE ET DU SYSTÈME D’INFORMATION ET DE COMMUNICATION (DINSIC), 2016. Plan d’Occupation des Sols du Système d’Information des Services Publics Français. [en ligne]. 25 juillet 2016. Version 3.1.1. [Consulté le 26 mai 2020].

DIRECTION INTERMINISTÉRIELLE DES SYSTÈMES D’INFORMATION ET DE COMMUNICATION (DISIC), 2012. Cadre Commun d’Urbanisation du Système d’Information de l’État. [en ligne]. 26 octobre 2012. Version 1.0. [Consulté le 26 mai 2020].

DIRECTION INTERMINISTÉRIELLE DES SYSTÈMES D’INFORMATION ET DE COMMUNICATION (DISIC), 2013. Cadre commun d’architecture des référentiels de données. Complément n°2 au Cadre Commun d’Urbanisation du Système d’Information de l’État version 1.0. [en ligne]. 18 décembre 2013. Version 1.0. [Consulté le 26 mai 2020].

DOERRFELD, Bill, VAN DER MERSCH, Vassili, SANDOVAL, Kristopher et WOOD, Chris, 2016. API driven DevOps: Strategies for Continuous Deployment. 6 juin 2016. Nordic APIs, Lean publication.

FAURE-MUNTIAN, Valéria, 2018. Les données géographiques souveraines. [en ligne]. Juillet 2018. Rapport au Gouvernement. [Consulté le 26 mai 2020].

FELLEGI, Ivan et SUNTER, Alan, 1969. A Theory for Record Linkage. In : The Journal of the American Statistical Association. [en ligne]. Décembre 1969. Vol. 64, n°328, pp. 1183-1210. [Consulté le 26 mai 2020].

HAAG, Olivier, 2019. Le profilage à l’Insee : une identification plus pertinente des acteurs économiques. In : Courrier des statistiques. [en ligne]. 27 juin 2019. N°N2, pp. 86-100. [Consulté le 26 mai 2020].

INSEE, 2017. Qualité du service rendu par les sites de gestion Sirene. Résultats de l’enquête menée en 2016. [en ligne]. 17 août 2017. [Consulté le 26 mai 2020].

INSEE, 2018. Enquête Qualité Sirene. Résultats de l’enquête menée en 2017. [en ligne]. 20 décembre 2018. [Consulté le 26 mai 2020]..

LARMAN, Craig et VODDE, Bas, 2016. Large-Scale Scrum: More with LeSS. [en ligne]. Août 2016. Édition Addison-Wesley. [Consulté le 26 mai 2020].

LÉTOQUART, Philippe et REFFET, Jean-Michel, 1969. Le projet « SIRENE » vise à unifier les procédures d’immatriculation des entreprises. In : Économie et Statistique. [en ligne]. Novembre 1969. N°6, pp. 67-68. [Consulté le 26 mai 2020].

LEFFINGWELL, Dean, 2018. SAFe 4.5 Reference Guide: Scaled Agile Framework for Lean Enterprises. Mai 2018. Édition Addison Wesley-Professional. 2e édition. ISBN : 978-0-13-489286-3.

PICARD, Hugues et CHAZELAS, Nicole, 2003. Identification interadministrative des entreprises et des établissements. De nouvelles avancées avec Sirene 3. In : Courrier des Statistiques. [en ligne]. Juin 2003. N°105-106, pp. 13-17. [Consulté le 26 mai 2020].

REINERTSEN, Donald G., 2009. The Principles of Product Development Flow: Second Generation Lean Product Development. Mai 2009. Édition Celeritas. ISBN : 9781935401001.

RIVIÈRE, Pascal, 2005. Indicateurs de qualité en matière de production de données : quelques éléments de réflexion. In : Courrier des statistiques. [en ligne]. Septembre 2005. N°115, pp. 34-40. [Consulté le 26 mai 2020].

SECRÉTARIAT GÉNÉRAL POUR LA MODERNISATION DE L’ACTION PUBLIQUE (SGMAP), 2013. « Dites-le nous une fois » : un programme pour simplifier la vie des entreprises. [en ligne]. 26 septembre 2013. Site internet. [Consulté le 26 mai 2020].

SECRÉTARIAT GÉNÉRAL POUR LA MODERNISATION DE L’ACTION PUBLIQUE (SGMAP), 2020. État Plateforme. Concevoir autrement les services publics numériques. [en ligne]. Site internet. [Consulté le 26 mai 2020].

SCHWABER, Ken et SUTHERLAND, Jeff, 2017. Le guide SCRUMTM – Le Guide de Référence de SCRUM : Les Règles de Jeu. [en ligne]. Novembre 2017. [Consulté le 26 mai 2020].

SUTHERLAND, Jeff et SUTHERLAND, J.J., 2014. Scrum: The Art of Doing Twice the Work in Half the Time. 30 septembre 2014. édition Penguin Random House. ISBN : 978-0-385-34645-0.

WEILL, Peter, ROBERTSON, David C. et ROSS Jeanne W., 2006. Enterprise Architecture As Strategy. Creating a Foundation for Business Execution. [en ligne]. Mai 2006. Harvard Business School Press. [Consulté le 26 mai 2020].

WINKLER, William E, 2006. Overview of Record Linkage and Current Research Directions. [en ligne]. 8 février 2006. Research Report Series, Statistical Research Division, U.S. Census Bureau. [Consulté le 26 mai 2020].

Définitions