# SNDS synthétique de la DNUM
# Contextualisation
Ce jeu de données synthétiques (opens new window) a été créé dans le cadre des travaux visant à déployer l’expertise dans le traitement des données de la base principale du SNDS. Créé par Jérôme Brocca, Chef de projet Données de santé à la Direction du Numérique (DNUM), il constitue la base d’exercices associés aux deux premiers modules :
- Savoir cibler une population d’étude dans la base principale du SNDS
- Savoir pré-traiter et vérifier son extraction de la base principale du SNDS
# Public cible
Le jeu de données synthétiques s’adresse aux débutants, primo-accédants utilisateurs de la base principale du SNDS.
# Méthodologie de création des données
Ce jeu de données synthétiques a été généré sans extraction préalable de données source de la base principale du SNDS, uniquement en répliquant des données du SNDS à partir d’un code SAS par un expert qui maîtrise les règles “métier” de ces données. Ces données présentent la même structure que les données SNDS source (librairies, tables, variables, codage…), le contenu des variables et la cohérence des informations ressemblent à ce qui est réellement observé dans les données source. Il contient :
- 1 092 sujets distincts
- des données de séjours hospitaliers PMSI MCO sur la période 2022-2023
- des données de remboursement de soins de ville (médicaments, consultations, procédures) sur la période 01/01/2023 – 01/01/2025
# Tables et variables
Le choix de création des tables et variables créées est lié aux cas d’usage dans lesquels l’utilisateur va chercher à :
Cibler une population d’étude
- comptabilisant le nombre de sujets ayant eu une délivrance d’antibiotiques en 2023
- sélectionnant des sujets diabétiques en 2023 sélectionnant des sujets diabétiques en 2023 à partir de leurs diagnostics hospitaliers et leur consommation de médicaments
Pré-traiter et vérifier une extraction
- calculant par type d’exécutant (PS/Etablissement), spécialité exécutant et prestation, le nombre d’actes de téléconsultation retrouvés dans le DCIR en 2023
- recherchant le nombre de bénéficiaires ayant eu un séjour avec diabète en 2023
Cela nécessite la présence de données pseudonymisées relatives aux individus, aux séjours hospitaliers du PMSI MCO, et à des données de remboursement de soins de ville notamment en lien avec les médicaments.
Pour les deux ensembles d’exercices, les tables suivantes ont été générées :
Tables DCIR
ER_BIO_FER_CAM_FER_ETE_FER_PHA_FER_PRS_FER_TIP_F
Référentiels
IR_BEN_RIR_PHA_RNT_LPP
Tables PMSI MCO
T_MCO22AT_MCO22BT_MCO22CT_MCO22DT_MCO22ET_MCO22UMT_MCO23AT_MCO23BT_MCO23CT_MCO23DT_MCO23ET_MCO23UM
Le détail de ces tables (variables, format) créées à l’identique des tables réelles est disponible dans :
# Licence
La licence est ouverte (Open Licence 2.0 ou Etalab 2.0).