Lvaudor

This author hasn't added his/her bio.

Test des contrastes de Scheffé

Le test de Scheffé est un test qu’on applique souvent après une ANOVA: on parle de test post-hoc (au même titre, par exemple, qu’un test de Tukey). En effet, l’ANOVA à 1 facteur permet de mettre en évidence (le cas échéant) le fait qu’au moins un groupe a une moyenne différente des autres. Si on a affaire à 3 groupes ou plus, une question se pose alors: quels sont les groupes.. Read More

Non-respect des hypothèses du modèle linéaire (ANOVA, régression): c’est grave, docteur??

Les hypothèses du modèle linéaire Beaucoup de personnes, lorsqu’elles souhaitent utiliser un modèle linéaire classique (régression linéaire ou ANOVA), se retrouvent confrontées au problème du non-respect des hypothèses de ce modèle. En effet, les hypothèses du modèle sont les suivantes: distribution gaussienne des résidus homoscedasticité des résidus (i.e. les résidus ont la même variance quel que soit le groupe considéré, ou quelle que soit la valeur de la variable explicative.. Read More

Régression linéaire: erreur et incertitude

Dans ce billet, je souhaite montrer comment estimer l’incertitude associée à l’estimation des paramètres (pente et ordonnée à l’origine) d’un modèle de régression linéaire simple. Pour ce faire, je vais: montrer comment le calcul d’incertitude dérive de résultats analytiques (i.e. d’équations qui permettent, si on le souhaite, de calculer l’incertitude « à la main »), fournir les lignes de code permettant de calculer (et représenter) ce même résultat sous R, illustrer (pour.. Read More

Créer une interface « clique-boutons » sous R

EDIT: Ce billet date d’une époque où je n’avais pas encore découvert la magie de Shiny… Désormais, je conseillerais à quiconque souhaite faire une petite interface interactive sous R d’aller voir de ce côté là… Il y a déjà des tutoriels très bien faits ici. Ce billet vise à vous montrer comment construire une interface « clique-boutons » pour R. Pour un utilisateur régulier de R, le recours à une telle interface.. Read More

Classification par arbres décisionnels

Qu’est-ce que c’est? Les arbres décisionnels font partie des méthodes d’apprentissage supervisé, et font à ce titre partie de la boîte à outils du parfait petit dataminer. Ils visent à prédire les valeurs prises par une variable en fonction d’un jeu de variables d’entrée (qu’on appellera ici les descripteurs). Cette prédiction se fait à travers la construction d’un arbre dont chaque noeud correspond à une décision quant à la valeur.. Read More

Test de Wilcoxon-Mann-Whitney

Mise à jour de ce billet: novembre 2020. => passage au tidyverse pour la manipulation des tables de données et les graphiques. A quoi sert-il? Le test U de Mann-Whitney (aussi appelé test de la somme des rangs de Wilcoxon ou plus simplement test de Wilcoxon) sert à tester l’hypothèse selon laquelle la distribution des données est la même pour deux groupes. La p-value associée à ce test va ainsi.. Read More

Ajuster un modèle de distribution à des données

Ce billet vise à vous montrer comment ajuster un modèle de distribution (par exemple une jolie « cloche » gaussienne) à une distribution empirique (i.e. la distribution de vos données telle que vous l’observez, par exemple en traçant l’histogramme correspondant). Il existe plusieurs méthodes possibles pour faire cela, dont la méthode des moments dont je vais parler ici. Considérons les données disponibles ici x=read.csv(paste(dat.path, »data_vraisemblance.csv »,sep= » »),sep= »; »)$x head(x) ## [1] 132.5 194.8 179.0 108.7 112.5.. Read More

Faire des boucles for dans R pour automatiser des tâches

La boucle for est un peu le B-A BA de la programmation sous R, mais (pour ceux qui ne connaissent pas), elle a de quoi vous mettre des étoiles dans les yeux (sans exagérer!). En effet, elle permet de vous éviter certaines tâches répétitives en les automatisant, et ainsi de vous faire gagner beaucoup de temps… Voici comment elle est structurée: for (i in 1:n){ ## tâche à répéter n.. Read More

Calculer une aire entre deux courbes

Dans ce post je montre comment utiliser des fonctions que j’ai écrites pour calculer des aires: entre deux courbes entre une courbe et une droite horizontale Cela peut être utile si vous travaillez sur des profils spatiaux qui évoluent au cours du temps (profil topographique par exemple) et que vous souhaitez calculer un bilan (sédimentaire par exemple) entre ces profils. Données d’exemple et script à télécharger Considérons le jeu de.. Read More

Une fonction magique: tapply

Cette fonction permet de calculer une statistique par niveau d’un facteur. Par exemple, considérons les données accessibles ici: ## Warning: attempt to set ‘sep’ ignored ## site taille ## 1 site1 3.125 ## 2 site1 1.162 ## 3 site1 4.222 ## 4 site1 2.748 ## 5 site1 3.625 ## 6 site1 3.892 Pour connaître la moyenne (par exemple) de la taille en fonction du site, on peut procéder comme suit:.. Read More