# SNDS synthétique de la DNUM

SNDS Données synthétiques Base principale SNDS PMSI DCIR Formation

# Contextualisation

Ce jeu de données synthétiques (opens new window) a été créé dans le cadre des travaux visant à déployer l’expertise dans le traitement des données de la base principale du SNDS. Créé par Jérôme Brocca, Chef de projet Données de santé à la Direction du Numérique (DNUM), il constitue la base d’exercices associés aux deux premiers modules :

# Public cible

Le jeu de données synthétiques s’adresse aux débutants, primo-accédants utilisateurs de la base principale du SNDS.

# Méthodologie de création des données

Ce jeu de données synthétiques a été généré sans extraction préalable de données source de la base principale du SNDS, uniquement en répliquant des données du SNDS à partir d’un code SAS par un expert qui maîtrise les règles “métier” de ces données. Ces données présentent la même structure que les données SNDS source (librairies, tables, variables, codage…), le contenu des variables et la cohérence des informations ressemblent à ce qui est réellement observé dans les données source. Il contient :

  • 1 092 sujets distincts
  • des données de séjours hospitaliers PMSI MCO sur la période 2022-2023
  • des données de remboursement de soins de ville (médicaments, consultations, procédures) sur la période 01/01/2023 – 01/01/2025

# Tables et variables

Le choix de création des tables et variables créées est lié aux cas d’usage dans lesquels l’utilisateur va chercher à :

  • Cibler une population d’étude

    • comptabilisant le nombre de sujets ayant eu une délivrance d’antibiotiques en 2023
    • sélectionnant des sujets diabétiques en 2023 sélectionnant des sujets diabétiques en 2023 à partir de leurs diagnostics hospitaliers et leur consommation de médicaments
  • Pré-traiter et vérifier une extraction

    • calculant par type d’exécutant (PS/Etablissement), spécialité exécutant et prestation, le nombre d’actes de téléconsultation retrouvés dans le DCIR en 2023
    • recherchant le nombre de bénéficiaires ayant eu un séjour avec diabète en 2023

Cela nécessite la présence de données pseudonymisées relatives aux individus, aux séjours hospitaliers du PMSI MCO, et à des données de remboursement de soins de ville notamment en lien avec les médicaments.

Pour les deux ensembles d’exercices, les tables suivantes ont été générées :

  • Tables DCIR

    • ER_BIO_F
    • ER_CAM_F
    • ER_ETE_F
    • ER_PHA_F
    • ER_PRS_F
    • ER_TIP_F
  • Référentiels

    • IR_BEN_R
    • IR_PHA_R
    • NT_LPP
  • Tables PMSI MCO

    • T_MCO22A
    • T_MCO22B
    • T_MCO22C
    • T_MCO22D
    • T_MCO22E
    • T_MCO22UM
    • T_MCO23A
    • T_MCO23B
    • T_MCO23C
    • T_MCO23D
    • T_MCO23E
    • T_MCO23UM

Le détail de ces tables (variables, format) créées à l’identique des tables réelles est disponible dans :

# Licence

La licence est ouverte (Open Licence 2.0 ou Etalab 2.0).