Bonjour les extra-terrestres

Bonjour les extra-terrestres

Les questions que vous vous posez peuvent être catégorisées en différents types auxquels correpondent différentes familles d'outils statistiques. On évoquera les statistiques descriptives univariées et bivariées, les tests statistiques, les statistiques exploratoires multivariées, le clustering, la modélisation statistique ainsi que le Machine Learning supervisé.

Tous ces thèmes seront abordés par la suite, à l'exception du Machine Learning supervisé, déjà très documenté sur internet dans le monde de la Data Science.

Attention : il est recommandé de poser nos questions et problématiques avant la collecte des données. Mais on peut souvent se rattraper, si ce n'est pas le cas :)

Vous travaillez sur vos propres données ?

Si vous avez un doute sur :

  • La structuration de vos données

  • Le choix d'une méthode statistique appropriée

  • L'implémentation R

Vous pouvez me décrire vos besoins ici :

Contactez-moi

Autrement, n'hésitez pas à donner votre avis sur cette formation

Donnez votre avis

Statistiques avec R : formation complète

Acheter maintenantEn savoir plus

1. Statistiques : Se poser les bonnes questions

  • Bonjour les extra-terrestres28

2. Introduction-éclair au logiciel R

  • Introduction-éclair au logiciel R : diapositives1
  • 2.1 Présentation de R1
  • 2.2. Installer R et RStudio4
  • 2.3 Créer un projet R avec RStudio9
  • Téléchargement : projet R, données illustratives et scripts1
  • 2.4 Quelques notes sur la syntaxe2
  • 2.5 Fonctions et Packages1
  • 2.6 Types de données et commentaires #
  • 2.7 Jeux de données dans R : la structure data frame1
  • 2.8 Préparation et importation d'un jeu de données en data frame2
  • 2.9 Caractérisation d'un data frame
  • 2.10 Accéder à différentes parties d'un data frame7
  • 2.11 Trier un data frame2
  • 2.12 Créer de nouvelles colonnes dans un data frame
  • 2.13 Calculs automatisés sur chaque colonne2
  • 2.14 Effectuer des calculs par groupe et exporter un data frame
  • 2.15 Graphiques avec ggplot2
  • Environnement R : fonctions principales

3. Statistiques : introduction et définitions

  • Statistiques : introduction et définitions, diapositives
  • Statistiques : introduction et quelques définitions

4. Statistiques descriptives univariées

  • Statistiques descriptives univariées : diapositives
  • 4.1 Décrire une variable qualitative
  • 4.2 Décrire une var. quantitative : tendance centrale
  • 4.3 Décrire une var. quantitative : dispersion
  • 4.4 Décrire une var. quantitative : box plot
  • 4.5 Décrire une var. quantitative : distribution et histogramme1
  • 4.6 Intervalles de confiance1
  • Téléchargement : dossier, projet R, données et script
  • 4.7 Application R : décrire une variable qualitative
  • 4.8 Application R : décrire une variable quantitative
  • 4.9 Application R : fonctions génériques de statistiques univariées

5. Statistiques descriptives bivariées

  • Statistiques descriptives bivariées : diapositives
  • 5.1 Décrire le lien entre deux variables qualitatives
  • 5.2 Décrire le lien entre deux variables quantitatives
  • 5.3 Décrire le lien entre une variable quantitative et une variable qualitative
  • Téléchargement : dossier, projet R, données et script

6. Tests statistiques

  • Tests statistiques : diapositives
  • 6.1 Introduction aux tests statistiques
  • 6.2 Tester le lien entre une variable quantitative et une qualitative
  • 6.3 Tester le lien entre deux variables qualitatives
  • 6.4 Tester le lien entre deux variables quantitatives
  • 6.5 Echantillons indépendants et échantillons appariés
  • 6.6 Bonus : Tests non-paramétriques
  • 6.7 Tests statistiques : récapitulatif
  • Téléchargement : dossier, projet R, données illustratives et scripts
  • Guide de choix d'un test statistique et code R

7. Statistiques exploratoires multivariées

  • Statistiques exploratoires multivariées : diapositives
  • 7.1 Introduction aux statistiques exploratoires multivariées
  • 7.2.1 Analyse en Composantes Principales 11
  • 7.2.2 Analyse en Composantes Principales 2
  • 7.3 Analyse Factorielle des Correspondances6
  • 7.4 Analyse des Correspondances Multiples1
  • Téléchargement : dossier, projet R, données et script

8. Segmenter des données avec des techniques de Clustering

  • Segmentation des données ou clustering : diapositives
  • 8.1 Introduction à la segmentation des données ou clustering2
  • 8.2 Classification Ascendante Hiérarchique
  • 8.3 Classification k-means
  • 8.4 Décrire les clusters
  • Téléchargement : dossier, projet R, données et script

9. Modélisation statistique : introduction et régression linéaire

  • Modélisation statistique, Introduction et régression linéaire : diapositives
  • 9.1 Modélisation statistique : introduction
  • 9.2 Régression linéaire simple
  • 9.3 Hypothèses sur les résidus
  • 9.4 Régression linéaire multiple : principes
  • 9.5 Le probème du surajustement
  • 9.6 Le problème de multicolinéarité
  • 9.7 Régression linéaire multiple : exemple1
  • Téléchargement : dossier, projet R, données et script

10. Modélisation statistique : régression logistique

  • Modélisation statistique, Régression logistique : diapositives
  • 10.1 Introduction à la régression logistique
  • 10.2 Régression logistique, exemple
  • Téléchargement : dossier, projet R, données et script

11. Modélisation statistique : Analyse de Variance ou ANOVA

  • Modélisation statistique - Analyse de Variance ANOVA : diapositives
  • 11.1 ANOVA à un facteur
  • 11.2 Hypothèses sur les résidus
  • 11.3 Comparaisons multiples par paires
  • 11.4 ANOVA à deux facteurs et effet d'interaction
  • Téléchargement : dossier, projet R, données et script

Fiches-résumé

  • Résumé Fonctions R et Statistiques