Box plots et recherche clinique

  • May 25, 2024

Utilisation de boxplots en recherche clinique

  • Jean Paul Maalouf
  • 0 comments

En recherche clinique et médicale, il est essentiel de disposer d'outils statistiques permettant de décrire efficacement les résultats mesurés sur une échelle quantitative (niveau de cholestérol, pression systolique, taux d'insuline, etc.).

Introduction : box plot et recherche clinique

En recherche clinique et médicale, il est essentiel de disposer d'outils statistiques permettant de décrire efficacement les résultats mesurés sur une échelle quantitative (niveau de cholestérol, pression systolique, taux d'insuline, etc.).

Le boxplot, ou boîte à moustaches, est un graphique particulièrement utile pour cet objectif. Il permet de résumer de manière visuelle les mesures suivantes :

  • La médiane représente la valeur centrale d'un ensemble de données.

  • Les quartiles (Q1 et Q3) délimitent les 25% et 75% des données reflétant ainsi leur dispersion.

  • Les limites de Tukey (souvent représentées par les moustaches du boxplot) indiquent les points extrêmes. Ils sont situés à 1,5 fois l'intervalle interquartile (IQR) au-delà des quartiles.

Les boxplots sont particulièrement utiles pour comparer les résultats cliniques entre plusieurs groupes, tels que différentes cohortes de patients. En visualisant les données de cette manière, les chercheurs peuvent aisément repérer les différences et les similitudes entre les groupes étudiés, facilitant ainsi l'interprétation et la communication efficace des résultats de leurs analyses.

Voici un exemple de boxplot qui représente la répartition du taux de cholestérol dans une cohorte de patients.

Elements du boxplot

La médiane est représentée par la ligne au milieu de la boîte, les quartiles Q1 et Q3 définissent les limites de la boîte, et les limites inférieure et supérieure de Tukey sont représentées par les moustaches (lignes verticales). Les points au-dessus des moustaches sont des données extrêmes, ou outliers, indiquant des valeurs de cholestérol significativement plus élevées que le reste de l'échantillon.


Voici quelques exemples d'illustration, issus de données fictives.

Exemple 1 : Comparaison des niveaux de cholestérol entre deux groupes

Imaginons une étude clinique comparant les niveaux de cholestérol entre un groupe de patients traités et un groupe de patients recevant un placebo.

Exemple boxplot comparaison cohortes cholestérol

Le graphique montre que le groupe traité a un niveau de cholestérol médian plus bas que le groupe placebo. Cependant, il y a une certaine superposition dans les valeurs interquartiles, indiquant une variabilité des niveaux de cholestérol au sein de chaque groupe.

Exemple 2 : Distribution des scores de douleur dans un essai clinique

Nous mesurons les scores de douleur des patients avant et après une intervention médicale.

Exemple boxplot comparaison groupes douleur

Le boxplot montre que les scores de douleur après intervention sont inférieurs que les scores avant intervention. Cela suggère que l'intervention a été efficace pour réduire la douleur chez les patients.

Exemple 3 : Analyse des niveaux de glucose par groupe d'âge

Comparons les niveaux de glucose dans le sang chez les patients de différentes classes d'âge.

comparaison du niveau de glucose de 3 classes d'âge

Les boxplots indiquent que les niveaux de glucose augmentent avec l'âge. Les patients plus âgés ont des niveaux de glucose significativement plus élevés que les jeunes et les adultes, ce qui peut refléter des différences métaboliques ou un risque accru de troubles métaboliques avec l'âge. Notez l'existence de données extrêmes inférieures dans les trois groupes.

Un cas plus complexe : traitement, âge et taux de cholestérol

Comment visualiser en même temps les effets de deux facteurs de risque sur une réponse clinique ? Par exemple, on pourrait se demander si l'effet d'un traitement sur le taux de cholestérol change en fonction de la classe d'âge. Il suffit de placer un des facteurs sur l'axe des X (ici la classe d'âge) et de colorer les boxplots selon les modalités du deuxième facteur (ici le traitement).

Box plots deux facteurs de risque

Le graphique montre que le traitement semble réduire le taux de cholestérol plus efficacement pour les classes 2 et 3. Statistiquement, on parle d'interaction statistique entre les deux facteurs de risque. C'est à dire que l'effet d'un facteur dépend des modalités de l'autre facteur.

Conclusion : utilisation de boxplots en recherche clinique

Ces trois exemples illustrent comment les boxplots peuvent être utilisés pour visualiser des comparaisons de distributions dans divers contextes cliniques. Ils permettent de rapidement identifier les différences entre les groupes, les tendances centrales et la variabilité des données, facilitant ainsi l'interprétation des résultats de la recherche clinique.

Aller plus loin : les boxplots ne sont pas suffisants pour conclure

L'utilisation des boxplots est essentielle et efficace pour visualiser les données. Cependant, l'anayse n'est pas suffisante conclure dans une étude clinique. Il est essentiel de compléter l'analyse avec des tests statistiques ou des modèles statistiques. Typiquement, des modèles tels que l'Analyse de Variance (ANOVA) sont souvent utilisés pour étudier statistiquement le lien entre un résultat clinique quantitatif et des facteurs de risque catégoriels.

Envie d'en apprendre plus ?

  • Gratuit

Formation Statistiques avec R : accès limité gratuit

  • Cours
  • 32 Leçons

Accès illimité pendant 2 ans à partir de la date d'achat. 50% de réduction sur présentation d'une carte étudiant.

  • 288 €

Statistiques avec R : formation complète en ligne

  • Cours
  • 80 Leçons

Accès illimité pendant 2 ans à partir de la date d'achat. 50% de réduction sur présentation d'une carte étudiant.

0 comments

Sign upor login to leave a comment