Gérer des dates avec lubridate: un jeu d'enfant

Voilà déjà 2-3 ans que je recommande à qui veut m'entendre le package lubridate pour travailler avec des dates. En effet, travailler avec des dates, à la base, ce n'est pas évident. Des opérations a priori simples, comme ordonner les vecteurs, calculer des différences, arrondir des valeurs, peuvent devenir compliquées dès que le vecteur en question est de classe date. Cela avait d'ailleurs fait l'objet de mon tout premier billet.. Read More

Utiliser des pipes pour enchaîner des instructions

Quand je fais mon cours d'initiation R aux petits Padawans de l'année, j'ai toujours un peu de difficultés à leur montrer l'intérêt du pipe (%>%) au moment où je leur montre les fonctions de dplyr. C'est toujours un moment où je m'anime, où je fais des grands gestes pour montrer comment on pousse le résultat d'une commande à travers un "tuyau" pour qu'elle atterrise dans une deuxième commande, où je.. Read More

Se souvenir de tout

Eh bien voilà, tout est parti de là: Je me reconnais doublement dans ce tweet, d'une part parce que moi aussi j'ai du mal avec les fonctions gather() et spread() de tidyr (et que je dois consulter la cheatsheet à chaque fois que je les utilise), et d'autre part parce qu'à moi aussi, on me pose souvent la question dans le cadre des formations R que je fais: "Mais comment.. Read More

Itération de fonctions avec purrr

Bon, les amis, je vais être abrupte, mais voilà: Les boucles sont officiellement has been depuis le printemps-été 2017. Non, je ne parle pas des boucles soyeuses et joyeuses qui s'ébattent sur vos têtes (pour les plus chanceux d'entre vous). Je veux parler des boucles laborieuses et épineuses qui s'étirent sur vos scripts. Alors, je me sens quand-même légèrement gênée de vous annoncer cela vu que, peut-être, vous avez récemment.. Read More

Manipulation de facteurs avec forcats

J'ai récemment eu à travailler avec des données d'enquête (ce qui m'arrive somme toute assez rarement) et notamment à tenter de produire des tableaux et des figures rendant compte de ces données, souvent catégorielles. J'ai été assez rapidement confrontée à un problème qui peut sembler trivial de prime abord, mais qui néanmoins n'est pas si anecdotique que cela au regard du temps qu'il peut faire perdre: la manipulation de factors,.. Read More

Combinaisons et jointures de tables, avec dplyr!

Il y a quelques mois, je postais un billet concernant la manipulation de tableaux de données avec dplyr, concernant plus particulièrement la réalisation de 5 opérations de base sur des tableaux (sélection de colonnes avec select(), filtrage de lignes avec filter, réarrangement des lignes avec arrange, création ou modification de colonnes avec mutate, et synthétisation statistique avec summarise). Aujourd'hui, je vais aborder un type d'opération différent, à savoir, les jointures.. Read More

strings et expressions régulières

Les expressions régulières, pour quoi faire? Les expressions régulières servent à effectuer des recherches de patterns dans les strings en définissant les règles qui régissent ces patterns. Par exemple, si je cherche à trouver le mot "turlututu" dans le string "turlututu chapeau pointu", mon pattern est simplement "turlututu". Si en revanche, je cherche à trouver tous les mots débutant par une majuscule qui ne correspondent pas à un début de.. Read More

Manipuler des strings avec R

Oui, bon, j'avoue, j'ai choisi le titre de ce billet exprès pour que, à sa lecture, vous ayiez ce genre d'image qui vous vienne à l'esprit: Mais en vrai, je m'apprête à vous parler de quelque chose d'un peu moins "caliente", car En revanche: Vous l'aurez compris, je parle ici de "manipuler des strings" pour "manipuler des chaînes de caractères", en français (je vais tout-de-même rester sur "string" pour la.. Read More

C'est donc à ça que ça sert, plotly pour R?

plotly? plotly.js? plot.ly? ggplot? ggplotly? WHAT? Voilà quelques temps que j'entends parler de plotly, sans bien comprendre en quoi cela consiste (une API? un package?) ni en quoi cela pourrait m'être utile maintenant que j'ai trouvé l'épanouissement graphique avec le package ggplot2... Et pour cause! plot.ly, c'est un outil en ligne (disponible ici : https://plot.ly) qui permet de créer des graphiques en ligne, et qui s'appuie sur une librairie JavaScript.. Read More

Scraper Wikipedia

Ah, la mine d'informations (à portée de clic) qu'est le web! Est-ce que ça ne vous fait pas rêver? Moi, si! et c'est pourquoi je vais aujourd'hui m'aventurer à faire un peu de webmining. S'il est possible de "scraper" (i.e. "râcler", littéralement) n'importe quel site web avec un package comme rvest (qui permet de "parser" le html, i.e. de récupérer attributs et contenus des différentes sections de ce type de.. Read More