Un modèle statistique est une représentation simplifiée et chiffrée d’un phénomène. Il nous aide à expliquer la réalité et à faire des prédictions. Selon l'objectif que l'on se pose (explication ou prédiction), les outils de modélisation statistique ne seront pas approchés de la même manière.
En général, un modèle statistique implique :
Variable à expliquer = variable dépendante = variable Y
Variables explicatives = variables indépendantes = variables X
Exemples :
Le score de qualité d’une boisson peut-il être expliqué par son acidité ?
La pression systolique est-elle affectée par l’âge du patient ? Par son Indice de Masse Corporelle ?
Le rendement agricole d’un champ dépend-il du type de fertilisant utilisé ? Du régime d’irrigation ?
Le risque de réaction allergique à un médicament est-il influencé par son dosage ?
Le montant de la rémunération affecte-t-il le risque de démission ?
Les variables Y et X sont associées dans une équation qui inclut des coefficients = paramètres.
Exemple : variable à expliquer = a + b*variable explicative1 + c*variable explicative2.
Selon la nature de la variable à expliquer / des variables explicatives, des modèles statistiques courants existent.
Ce guide présente les modèles statistiques classiques les plus courants, classés selon la nature des variables à expliquer et explicatives. La syntaxe R simplifiée est également fournie.