Lvaudor

This author hasn't added his/her bio.

Manipulation de facteurs avec forcats

J'ai récemment eu à travailler avec des données d'enquête (ce qui m'arrive somme toute assez rarement) et notamment à tenter de produire des tableaux et des figures rendant compte de ces données, souvent catégorielles. J'ai été assez rapidement confrontée à un problème qui peut sembler trivial de prime abord, mais qui néanmoins n'est pas si anecdotique que cela au regard du temps qu'il peut faire perdre: la manipulation de factors,.. Read More

Combinaisons et jointures de tables, avec dplyr!

Il y a quelques mois, je postais un billet concernant la manipulation de tableaux de données avec dplyr, concernant plus particulièrement la réalisation de 5 opérations de base sur des tableaux (sélection de colonnes avec select(), filtrage de lignes avec filter, réarrangement des lignes avec arrange, création ou modification de colonnes avec mutate, et synthétisation statistique avec summarise). Aujourd'hui, je vais aborder un type d'opération différent, à savoir, les jointures.. Read More

strings et expressions régulières

Les expressions régulières, pour quoi faire? Les expressions régulières servent à effectuer des recherches de patterns dans les strings en définissant les règles qui régissent ces patterns. Par exemple, si je cherche à trouver le mot "turlututu" dans le string "turlututu chapeau pointu", mon pattern est simplement "turlututu". Si en revanche, je cherche à trouver tous les mots débutant par une majuscule qui ne correspondent pas à un début de.. Read More

Manipuler des strings avec R

Oui, bon, j'avoue, j'ai choisi le titre de ce billet exprès pour que, à sa lecture, vous ayiez ce genre d'image qui vous vienne à l'esprit: Mais en vrai, je m'apprête à vous parler de quelque chose d'un peu moins "caliente", car En revanche: Vous l'aurez compris, je parle ici de "manipuler des strings" pour "manipuler des chaînes de caractères", en français (je vais tout-de-même rester sur "string" pour la.. Read More

C'est donc à ça que ça sert, plotly pour R?

plotly? plotly.js? plot.ly? ggplot? ggplotly? WHAT? Voilà quelques temps que j'entends parler de plotly, sans bien comprendre en quoi cela consiste (une API? un package?) ni en quoi cela pourrait m'être utile maintenant que j'ai trouvé l'épanouissement graphique avec le package ggplot2... Et pour cause! plot.ly, c'est un outil en ligne (disponible ici : https://plot.ly) qui permet de créer des graphiques en ligne, et qui s'appuie sur une librairie JavaScript.. Read More

Scraper Wikipedia

Ah, la mine d'informations (à portée de clic) qu'est le web! Est-ce que ça ne vous fait pas rêver? Moi, si! et c'est pourquoi je vais aujourd'hui m'aventurer à faire un peu de webmining. S'il est possible de "scraper" (i.e. "râcler", littéralement) n'importe quel site web avec un package comme rvest (qui permet de "parser" le html, i.e. de récupérer attributs et contenus des différentes sections de ce type de.. Read More

Torturer ses données pour les faire parler, c'est mal! (Oui, mais pourquoi?)

Le pavé dans la mare Il y a peu de temps je suis tombée sur cet article qui m'a laissée songeuse: Ioannidis JPA (2005) Why Most Published Research Findings Are False. PLoS Med 2(8):e124. (https://doi.org/10.1371/journal.pmed.0020124 ) Comme son titre l'indique, cet article s'appuie sur des calculs de probabilités pour montrer que lorsqu'un chercheur publie un résultat significatif, il y a en fait de fortes chances pour que ce résultat soit faux... Read More

dplyr: package magique pour manipuler ses tableaux de données

Ah, la joie de vous parler d'un package qui va me/vous simplifier la vie!... Aujourd'hui, il s'agit de dplyr, qui fait partie de la suite de packages tidyverse (qui comprend ggplot2, tidyr, stringr, lubridate et tellement d'autres) qui fait grand bruit en ce moment dans l'univ-R. dplyr vise à simplifier la manipulation de tables de données à travers l'usage de cinq "verbes" (ou fonctions): select, qui permet de sélectionner des.. Read More

Par ici les jolies cartes avec ggmap

Aujourd'hui est le début d'une grande aventure puisque je me lance dans l'espace (enfin, les données spatiales, quoi), ce qui ne manquera pas de faire plaisir à mes petits collègues géographes. Je vais commencer par vous montrer les possibilités du package ggmap qui comme son nom le laisse entendre est un peu le petit frère de ggplot2 (dont je vous ai déjà parlé ici, et qui fait l'objet d'un cours.. Read More

Comment utiliser un modèle bayésien (pour les nuls)

Dans le billet précédent, j'ai présenté le théorème de Bayes à travers l'exemple d'un modèle (très très simple) portant sur le comportement des ours. Ce modèle mettait en relation deux variables C et G où C est la variable indicatrice de l'évènement "L'ours est en colère" (C=o ou C=n) G est la variable indicatrice de l'événement "L'ours grogne" (G=o ou G=n). Il est possible d'utiliser un modèle bayésien (même un.. Read More