Lise Vaudor
01/02/2021
Pour lire un tableau de données il faudra indiquer le chemin du fichier… Si vous travaillez sous forme de projets .Rproj alors le plus simple est d’indiquer le chemin relatif par rapport au dossier racine (celui qui contient le .Rproj). |
Notez l’usage des slashs (/) et non d’antislashs, quel que soit votre système d’exploitation. Par exemple, Si pour une raison ou une autre vous avez besoin de remonter dans l’arborescence des fichiers (c’est généralement non recommandé mais ça peut arriver), vous pouvez le faire avec “../”. Par exemple “../../donnees_hydro” vous fait remonter de deux niveaux dans l’arborescence avant de vous faire redescendre dans un dossier “donnees_hydro”. Vous pouvez également utiliser la fonction
|
Examinons la commande suivante:
|
Notez que le format csv correspond à des valeurs séparées par une virgule (“csv”= Coma Separated Values). Pour lire une table qui comprendrait un type de séparateur différent (par exemple, un espace, ou un point-virgule), on peut utiliser la fonctionread_delim() .
|
Dans la suite de ce document nous allons utiliser un jeu de données Il s’agit de données fictives, créées de toute pièce dans un but pédagogique…
|
Les variables de ce jeu de données sont les suivantes:
|
Attention, utilisateurs de tableurs, cette diapo est pour vous…
Si vous avez des difficultés à lire votre tableau des données, c’est sans doute parce que celui-ci n’est pas un tableau de données brutes.
Pour lire un tableau de données sous R, il convient d’abord de nettoyer ce tableau:
|
|
On peut également utiliser les fonctionnalités de RStudio pour afficher et modifier la table.
A l’inverse, il est possible d’écrire des fichiers depuis R. Pour écrire une table, par exemple:
|
Cette-fois les arguments principaux sont:
|
|
Pour afficher les premières lignes du tableau:
Pour afficher les dernières lignes du tableau:
|
dplyr est un package qui permet de faire simplement diverses opérations sur les tableaux de données:
|
select() permet de sélectionner des variables Par exemple, on peut sélectionner des variables de la table
|
|
select() permet de sélectionner des variables en passant par des fonctions auxiliaires. On peut citer par exemple:
|
Par exemple:
|
filter() permet de filtrer les lignes du tableau en fonction des valeurs de telle ou telle variable. Ici, par exemple, on cherche toutes les lignes qui correspondent au mois de juillet:
|
On peut combiner plusieurs conditions logiques (ET logique, par une virgule ou un &, OU logique, par l’opérateur |). Par exemple,
Vous pouvez également utiliser l’opérateur
|
Pour réarranger un tableau selon l’ordre d’une variable, on peut faire appel à la fonction
|
et pour ordonner par ordre décroissant, on utilise desc():
|
Pour créer de nouvelles variables et les ajouter au tableau de données on peut utiliser la fonction mutate(). Voici par exemple comment procéder si je souhaite créer une nouvelle variable,
|
Je peux créer une nouvelle variable
Si je réutilise un nom de colonne déjà présent dans la table, la colonne est “écrasée”:
|