Restart 2: Opérateurs et fonctions

Lise Vaudor

01/02/2021

Opérateurs arithmétiques

Ils permettent d’effectuer des opérations arithmétiques simples, comme des additions, des multiplications,etc.

v1
[1]  2.3  3.6  1.1  2.4  2.5 10.2
v1+4 # addition
[1]  6.3  7.6  5.1  6.4  6.5 14.2
v1-3 # soustraction
[1] -0.7  0.6 -1.9 -0.6 -0.5  7.2
v1*5 # multiplication
[1] 11.5 18.0  5.5 12.0 12.5 51.0
v1/4 # division
[1] 0.575 0.900 0.275 0.600 0.625 2.550
v1^2 # puissance
[1]   5.29  12.96   1.21   5.76   6.25 104.04

Opérateurs de comparaison

Ils permettent de comparer des vecteurs entre eux.

v1
[1]  2.3  3.6  1.1  2.4  2.5 10.2
v1==3.6 # égal à
[1] FALSE  TRUE FALSE FALSE FALSE FALSE
v1!=2   # différent de
[1] TRUE TRUE TRUE TRUE TRUE TRUE
v1
[1]  2.3  3.6  1.1  2.4  2.5 10.2
v1<4  # plus petit
[1]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE
v1>10 # plus grand
[1] FALSE FALSE FALSE FALSE FALSE  TRUE
v1<=5 # plus petit ou égal
[1]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE
v1>=3 # plus grand ou égal
[1] FALSE  TRUE FALSE FALSE FALSE  TRUE

Opérateurs logiques

Ils permettent de vérifier si une proposition est vraie ou non.

v1
[1]  2.3  3.6  1.1  2.4  2.5 10.2
!(v1>10)    # NON logique
[1]  TRUE  TRUE  TRUE  TRUE  TRUE FALSE
v1<2 & v1>5 # ET logique
[1] FALSE FALSE FALSE FALSE FALSE FALSE
v1<3 | v1>5 # OU logique
[1]  TRUE FALSE  TRUE  TRUE  TRUE  TRUE

Notez également l’existence de la fonction is.na() qui permet d’évaluer si les éléments d’un vecteur sont vides ou non!

v9 <- c(3.2, NA, 8.9, 42.3, 59.2, NA)
is.na(v9)
[1] FALSE  TRUE FALSE FALSE FALSE  TRUE

Opérateurs: opérations terme-à-terme

Pour réaliser les opérations R recycle les vecteurs autant de fois que nécessaire.

Si v1 est de longueur n et v2 de longueur 1, v2 est recyclé n fois.

Si v1 et v2 sont de même longueur n, l’opération se fait terme à terme.

v1=c(3,1,5,2,4)
v2=c(2,1,3,1,0)
v1+v2
[1] 5 2 8 3 4

Fonctions: exemples statistiques

x=c(2.3,5.5,3.7,10.5,11.5,4,3.6,6.1,2.4,12.9)

On peut décrire le mode d’une variable via sa moyenne ou sa médiane.

mean(x)
[1] 6.25
median(x)
[1] 4.75

La distinction entre moyenne et médiane peut être importante quand la variable a une distribution asymétrique.

On peut décrire la variabilité des données à travers la variance ou l’écart-type:

Dans R, on calcule variance et écart-type à l’aide des fonctions var() et sd()

var(x)
[1] 15.49389
sd(x)
[1] 3.936228

Fonctions: exemples statistiques

Le quantile d’ordre p de \(x=(x_1,x_2,...,x_n)\) correspond à la valeur \(\lambda\) telle que p% des données sont inférieures à p.

\[\begin{eqnarray} pr(X \leq \lambda)=p \end{eqnarray}\]

Les quantiles d’ordre 25%, 50%, et 75% sont aussi appelés premier quartile, deuxième quartile (ou médiane), et troisième quartile.

quantile(x, 0.10)
 10% 
2.39 

Le quantile d’ordre 10% (ou 0.10) de x est 2.39.

Cela signifie que seulement 10% des valeurs de x sont inférieures à 2.39.

Par ailleurs, le minimum et maximum des variables peuvent être affichés comme suit:

min(x)
[1] 2.3
max(x)
[1] 12.9

Fonctions : Arguments

Nous avons d’ores et déjà utilisé un certain nombre de fonctions, comme

  • c(),
  • seq(),
  • rep(),
  • mean(), etc.

Toutes les fonctions que nous avons utilisées jusqu’à présent sont définies sur le package de base de R.

Les fonctions sont des objets qui ont toutes un point commun: elles s’écrivent avec des parenthèses, dans lesquelles l’utilisateur précise la valeur des arguments si besoin est.

Les arguments peuvent être obligatoires (la fonction ne peut pas fonctionner si ces arguments ne sont pas fournis par l’utilisateur) ou au contraire optionnels. Par exemple, dans

quantile(x=x, probs=0.1)
 10% 
2.39 

l’argument x est obligatoire, et l’argument probs est optionnel. On peut ainsi ne passer que l’argument x à la fonction:

quantile(x=x)
    0%    25%    50%    75%   100% 
 2.300  3.625  4.750  9.400 12.900 

Fonctions: Ordre et noms des arguments

Si l’on passe les arguments à la fonction dans le bon ordre, on n’a pas besoin de préciser le nom des arguments. Ainsi, il est possible d’appeler la fonction quantile des deux manières suivantes:

quantile(x=x, probs=0.1)
 10% 
2.39 
quantile(x,0.1)
 10% 
2.39 

En revanche, l’appel suivant produira une erreur:

quantile(0.1,x)
Error in quantile.default(0.1, x): 'probs' outside [0,1]

Pour accéder aux informations quant aux arguments d’une fonction, on peut consulter l’aide associée des deux façons suivantes:

help(quantile)
?quantile

Fonctions: Aide

Le fichier d’aide associé à une fonction est toujours structuré de la même manière. Sans trop détailler, voici les parties qui me semblent les plus importantes…

  • Description qui décrit succintement le but de la fonction
  • Arguments qui détaille les arguments, vous montre l’ordre dans lequel ils sont attendus, et vous précise leur effet ainsi que leurs valeurs par défaut (le cas échéant).
  • une partie Exemples qui permet généralement de tester la fonction pour comprendre rapidement son usage.

Détails et References permettent en outre d’expliquer les détails de la méthode et éventuellement de citer la ou les publications associées à la méthode/fonction ou package.

Packages

Les packages sont des paquets de fonctions visant à réaliser des tâches un peu particulières. L’installation de base de R vous installe, par défaut, un certain nombre de packages (base, methods, stats, graphics, etc.)

Dans la suite de ce cours, nous serons amenés à utiliser le package dplyr qui sert à manipuler des tableaux de données.

Pour être en mesure d’utiliser les fonctions de ce package, il faut:

  • Installer le package: les fonctions du package sont alors téléchargées depuis un serveur distant et enregistrées sur le disque dur de votre ordinateur:
install.packages("dplyr")
  • Charger le package (les fonctions du package sont chargées dans l’environnement R pour la session en cours)
library(dplyr)  

Vous pouvez également installer et charger les packages en passant par RStudio:

On récapitule!

On a parlé de quoi, déjà?
  • opérateurs (arithmétiques, comparaisons, logiques)
  • description d’objets (quelques fonctions de base)
  • usage des fonctions (arguments: nommage, ordre, valeurs par défaut)
  • aide associée aux fonctions
  • packages (installation, chargement)

Qu’est-ce qu’un package ?

Un package est un ensemble de fonctions documentées visant à la réalisation d’une tâche particulière.