La collecte des données

Le type de données requises dépend du design de l’étude choisi. Il s’agit à la fois de données de santé et de données d’exposition. De manière générale, ces choix font intervenir :
- La population visée, définition des caractéristiques comme, les limites géographiques, données démographiques et socioéconomiques ;
- Le facteur de risque (variable explicative principale), en termes d’exposition et de possibles facteurs confondants [1] ;
- L’effet sanitaire étudié (mortalité, maladie spécifique...), en appliquant si possible des systèmes de codification internationaux (classification CIM - ) ;
- La période concernée, rétrospective ou non.

Pour chaque catégorie il peut y avoir des difficultés en fonction des pays. Les données populationnelles peuvent exister sous des formes plus ou moins difficilement exploitables. L’unité territtoriale peut ne pas correspondre aux données d’exposition ; les indicateurs socioéconomiques peuvent ne pas avoir la même résolution que les données démographiques. Les données d’exposition peuvent aussi s’avérer limitantes. Pour prendre un exemple, si le réseau de mesures de la pollution atmosphérique comprend juste le nombre de stations permettant de disposer d’une moyenne annuelle sur le polluant d’intérêt et à l’échelle d’une agglomération, les possibilités ne seront pas les mêmes pour les territoires où l’on dispose d’une cartographie de bonne qualité (connaissance des sources et accès à de bon modèles de dispersion), sur des mailles de 50 m de côté.

Les données sanitaires peuvent aussi poser des difficultés. Nous nous limiterons à quelques exemples, sachant qu’il existe des différences entre pays qui affecteront aussi le résultat. Les statistiques de mortalité sont a priori les plus accessibles. Les questions peuvent porter sur l’enregistrement sytématique (certificats de décès mentionnant la cause) ou leur centralisation. Il est possible qu’elles soient accessibles pour l’année n+2 [2], voire plus. Les données d’admission à l’hôpital sont tenues par une administration différente, liée au système de soins. Elles ont l’avantage d’être exploitables sur une base journalière, ce qui est utile pour étudier les épisodes de courte durée. L’accès aux statistiques sur les maladies peut être limité par le système d’enregistrement. L’existence de registres offre l’exhaustivité et une bonne précision sur la localisation (domicile du patient). Le coût de leur maintien fait qu’ils restent relativement rares, sauf pour le cancer, mais encore la couverture du territoire peut être incomplète (c’est le cas de la France). L’enregistrement systématique de chaque cas permet de calculer l’incidence (nouveaux cas). Par contre, pour les autres pathologies, prenons l’exemple de l’asthme, nous ne disposerons que des consultations pour une pathologie donnée, ce qui mèle nouveaux et anciens cas. Seule la prévalence peut être obtenue, sur la base d’un échantillon de la population (aspects statistiques à prendre en compte). Dans certains cas nous pouvons avoir recours aux données sur la consommation de soins. En poursuivant sur l’exemple de l’asthme, comme le traitement standard consiste à prescrire des bronchodilatateurs, nous pouvons utiliser l’évolution des quantités prescrites comme indicateur de la maladie. Notons que ce type d’association n’est possible que dans de rares cas où le médicament est relativement spécifique (peu ou pas d’autres indications de traitement).

Un dernier point doit être souligné. Les bases de données ne sont pas publiques. Certaines peuvent même être payantes [3]. Il est donc indispensable de prévoir à l’avance de remplir les obligations concernant les conventions entre l’organisme demandeur et le détenteur ou d’obtenir les autorisations nécessaires (confidentialité, éthique, respect des personnes).

2 Messages de forum

  • La collecte des données 17 décembre 2010 10:08, par Perez Munoz Antoine

    La création d’un registre national pour les tumeurs solides de l’enfant, envisagée pour 2002, s’est-elle concrétisée depuis ?

Notes

[1] Il est important de prendre en compte l’accessibilité des données dès le départ

[2] Statistiques de l’année 2006 disponibles 2 ou 3 ans plus tard

[3] C’est le cas des données démographiques en France

SPIP  Mise à jour : le 12 décembre 2019 | Chartes | Mentions légales | A propos