Enquête sur le coût de la main-d'œuvre et la structure des salaires 2019

Ecmoss 2019

Sources
Paru le : Paru le 28/11/2022
Consulter

Traitement statistique

Fréquence de collecte des données

Annuelle

Collecte des données

Trois modes de collecte co-existent. Historiquement, les questionnaires sont adressés par voie postale aux établissements. Les grandes entreprises pour lesquelles plusieurs établissements sont interrogés peuvent fournir une réponse informatisée, via un fichier sous tableur. Enfin, depuis l'Ecmo 2016, le mode de collecte par Internet, via le portail de réponse aux enquêtes entreprises de l'Insee, est proposé à un sous-échantillon d'établissements pour lesquels le volet << salarié >> du questionnaire qui leur adressé porte sur peu de salariés.

Période de collecte

La collecte de l'Ecmo 2019 a eu lieu de mai à décembre 2020.

Mode de collecte

  • Par voie postale
  • Par Internet

Unité(s) enquêtée(s)

Établissement

Plan de sondage

L'échantillon est sélectionné selon un plan de sondage à deux degrés, stratifié à chacun des degrés. On procède d'abord à un tirage d'établissements, puis à un tirage de salariés au sein de ces établissements. Le taux de sondage est d'environ 3,5 % pour le niveau établissement et de 0,9 % pour les salariés. La stratification retenue est élaborée afin d'optimiser la précision du principal indicateur (le salaire horaire) selon les principales ventilations requises réglementairement (par secteur d'activité, taille d'entreprise, région notamment).
Le tirage des établissements s'effectue dans la base << tous salariés >> constituée à partir des déclarations sociales (DADS et progressivement DSN), croisée avec le répertoire Sirus. L'échantillon portant sur une année N est tiré dans les données au 31/12/N-1.
Les établissements enquêtés sont sollicités pour répondre à un questionnaire portant sur leur établissement et à des questionnaires portant sur des salariés identifiés (de 1 à 24 selon les cas). L'échantillon des salariés est différencié selon le statut (cadre/non cadre).
Les échantillons établissements d'Ecmoss font partie du processus de coordination négative entre les enquêtes entreprises à l'Insee.

Taille de l'échantillon

Environ 18 000 établissements sont interrogés pour 165 000 salariés

Documents de collecte

Les questionnaires de l'Ecmo 2019 sont les suivants :

Validation des données

Les résultats sont analysés et comparés avec d'autres indicateurs diffusés par l'Insee notamment dans le cadre du rapport qualité envoyé à Eurostat.

Élaboration des données

Les tables envoyées à Eurostat utilisent toujours deux enquêtes annuelles successives. Elles s'appuient donc sur des observations enquêtées au titre de l'année d'enquête (N) ainsi que des observations enquêtées au titre de l'année d'avant (N-1). Les variables de rémunération observées l'année N-1 sont actualisées (<< vieillies >>) pour être représentatives de l'année N, en leur appliquant l'évolution entre N-1 et N du salaire brut par heure rémunérée moyen (selon des strates), évolution estimée dans les fichiers << tous salariés >>.

Ajustement

Enrichissement avec les données administratives
A la fin de la collecte, le fichier des répondants est enrichi d'informations provenant de la base << tous salariés >> issu principalement des sources administratives (DADS ou DSN). On récupère ainsi notamment l'activité de l'établissement, la profession du salarié, les éléments administratifs sur sa rémunération, le temps de travail rémunéré, etc. Cet enrichissement d'informations issues des sources administratives est central dans le processus de l'enquête, à la fois pour compléter les données d'enquête, mais aussi pour vérifier la cohérence entre information administrative et information issue de l'enquête et décider de redresser le cas échéant.
Détermination du champ
La phase d'enrichissement sert aussi à repérer les cas << hors champ >>, afin de les différencier des non-répondants. On identifie les établissements hors champ (principalement ceux cessés depuis la constitution de la base de sondage) et les salariés hors champ (soit appartenant aux établissements hors champ, soit étant partis de l'établissement depuis la constitution de la base de sondage).
Apurement et correction de la non-réponse
Pour les questionnaires << salariés >> :
La Dares est responsable du redressement des questionnaires salariés. Les variables centrales de l'enquête (salaire brut et nombre d'heures rémunérées) sont contrôlées principalement à l'aide des données individuelles issues de la base << tous salariés >>. Les grands principes des opérations de redressement sont les suivants :
- La valeur collectée par le questionnaire est conservée même en cas d'incohérence avec la valeur DSN, dès lors que les réponses données aux différentes questions du questionnaire sont cohérentes entre elles ;
- Lorsque sont détectées des valeurs aberrantes ou manquantes ou encore des incohérences internes ou avec les données de la DSN, certaines variables sont redressées par imputations déterministes avec les variables de la DSN, d'autres sont redressées par modélisation (imputation statistique). Quelle que soit la source (questionnaire ou enrichissement) les données de rémunération sont considérées comme plus fiables que les données portant sur les durées ; ce sont donc les durées qui sont modifiées en cas d'incohérence.
En aval de ces redressements, la Dares calcule un premier jeu de poids << salarié >> corrigé de la non-réponse totale en réallouant les poids des unités non répondantes sur les répondantes appartenant à la même strate de tirage.
L'Insee effectue ensuite une seconde salve de redressements sur les données des salariés, pour satisfaire aux contraintes imposées par Eurostat. Notamment, un traitement particulier est réalisé pour les salariés au forfait, pour lesquels Eurostat souhaite que soient fournies un nombre d'heures rémunérées.
Ce travail d'expertise permet d'obtenir pour chaque année d'enquête la base redressée non calée qui, après le calage effectué à l'Insee devient la base annuelle de diffusion nationale.
Pour les questionnaires << établissements >>
Le redressement des questionnaires << établissements >> concerne particulièrement le format Ecmo où la partie établissement est essentielle pour répondre à Eurostat. On distingue tout d'abord les répondants selon leur niveau de réponse : ils peuvent en effet répondre parfois pour l'établissement ou pour l'entreprise lorsque l'information au niveau établissement n'est pas connue. La table établissements est ensuite apurée en éliminant les établissements pour lesquels on constate ou on considère une non-réponse totale. Sont considérées en non-réponse totale les établissements ne répondant pas à un bloc entier de variable ou à certaines variables dites << clés >>, comme celles portant sur les charges ou la masse salariale. Comme pour les questionnaires salariés, des premiers poids sont calculés, en réallouant les poids des unités non répondantes de manière homogène sur les unités répondantes appartenant à la même strate de tirage. Ensuite, les réponses manquantes ou mal renseignées aux questions autres que les questions << clés >> et qui conduisent à classer l'établissement en non-réponse totale sont redressées par imputation, notamment par hot-deck.
Traitement des unités influentes
Un traitement des unités influentes est effectué, qui permet de contrôler l' << influence >> d'individus qui, de par leur réponse et leur poids élevé - et sans que leur réponse ne soit erronée -- conduisent à des mesures certes toujours sans biais mais potentiellement bien moins précises des statistiques d'intérêt sur les domaines auxquels ils appartiennent. On applique pour cela une technique de winsorisation (méthode de Kokic et Bell) qui modifie le poids de l'individu influent sans pour autant perdre l'information de sa réponse.
Calages sur marges
1. On cale pour chaque enquête annuelle les variables directement issues du fichier << tous salariés >> exhaustif sur les marges de la population totale en emploi salarié issues de ce même fichier, selon de nombreux critères (catégorie sociale x sexe, localisation géographique, etc.).
2. Après concaténation des fichiers annuels pour le rendu Eurostat, on cale une deuxième fois l'ensemble sur les marges relatives à l'année de validité de l'enquête.
Chacun des calages sur marges est réalisé grâce à la procédure Calmar.
Rendu Eurostat
Les tables envoyées à Eurostat utilisent toujours deux enquêtes annuelles successives. Sur la base concaténée, des derniers redressements sont faits pour satisfaire aux contraintes imposées par Eurostat. Ces contraintes sont d'abord des bornes strictes pour plusieurs variables (temps de travail, valorisation des heures supplémentaires par exemple), ou l'absence de non-réponse partielle (suppression des individus dont certaines variables sont manquantes). En format Ecmo, on procède également à une dernière étape spécifique de mise en cohérence de certaines informations issues du questionnaire salarié et d'informations issues du questionnaire établissements.