Initiation à R

2016-08-29 · typeoumode

2+2
[1] 4
32.7*59.6 # multiplication
[1] 1948.92
53/59  # division
[1] 0.8983051
2.33^5 # puissance
[1] 68.67199
(45-69)*75 # combinaisons d'operations
[1] -1800
>(33+52)/((57+11)
32.7*59.6 
[1] 1948.92
53/59 
[1] 0.8983051
a=32.7*59.6 
b=53/59 
a<-32.7*59.6 
53/59->b 
a
[1] 1948.92
b
[1] 0.8983051
print(a)
[1] 1948.92
print(b)
[1] 0.8983051
a+b  # calcul puis affichage
[1] 1949.818
c=a+b # calcul et creation d'objet
print(c) # affichage
[1] 1949.818
v1 <- c(2.3,3.6,1.1,2.4,2.5,10.2,5.1,2.0)
v2 <- c("Paris","Lyon","Marseille","Rennes","Montpellier")
v3<-seq(from=0,to=10,by=2) # valeurs de 0 à 10 par pas de 2
v4<-seq(from=2,to=13,length.out=20)  # 20 valeurs regulierement espacees de 2 a 13 
v5<-0:10  # nombres entiers de 0 a 10
v6<-rep("date1",5)
v7<-rep(v5,3)
vglobal<-c(v3,v4,v5)
vessai=c(v6,v7)
v6_bis=rep(date1,5)
f1=factor(c(rep("date1",5),rep("date2",5)))
f1
 [1] date1 date1 date1 date1 date1 date2 date2 date2 date2 date2
Levels: date1 date2
levels(f1)
[1] "date1" "date2"
M1 <- matrix(c(1,2,3,8,7,0),nrow=2,ncol=3)
M1 <- matrix(c(1,3,7,2,8,0), nrow=2, ncol=3, byrow=T)
M2 <- matrix(c(0,1,0,0,0,1,0,0,1,1,1,1,0,0,1,0,0,0,0,0),nrow=4)
M1<-cbind(c(1,2),c(3,8),c(7,0))
M1<-rbind(c(1,3,7),c(2,8,0))
matrix(c(1,1,1,2,2,2,3,3),nrow=3)
l1=list(sites=v2, nb=M1)
air=read.table("../../datasets/air.txt",sep=",", header=T)
getwd()
setwd("C:/Documents and Settings/lvaudor/Bureau/tutoRial/Initiation_R_dev/")
air=read.table("../../datasets/air.txt",sep=",", header=T)
help(read.table)
?read.table
air$Ozone
 [1]  41  36  12  18  NA  28  23  19   8  NA   7  16  11  14  18  14  34
[18]   6  30  11   1  11   4  32  NA  NA  NA  23  45 115  37  NA  NA  NA
[35]  NA  NA  NA  29  NA  71  39  NA  NA  23  NA  NA  21  37  20  12  13
[52]  NA  NA  NA  NA  NA  NA  NA  NA  NA  NA 135  49  32  NA  64  40  77
[69]  97  97  85  NA  10  27  NA
 [ reached getOption("max.print") -- omitted 78 entries ]
 [1]  41  36  12  18  NA  28  23  19   8  NA   7  16  11  14  18  14  34
[18]   6  30  11   1  11   4  32  NA  NA  NA  23  45 115  37  NA  NA  NA
[35]  NA  NA  NA  29  NA  71  39  NA  NA  23  NA  NA  21  37  20  12  13
[52]  NA  NA  NA  NA  NA  NA  NA  NA  NA  NA 135  49  32  NA  64  40  77
[69]  97  97  85  NA  10  27  NA
 [ reached getOption("max.print") -- omitted 78 entries ]
representations=read.table("../../datasets/representations.csv",sep=";", header=T)
attach(representations)
is.factor(v6)
[1] FALSE
is.numeric(v6)
[1] FALSE
v6=as.factor(v6)
TempCelsius<-(Temp-32)*5/9
TempCelsius<=20
Month==7
!(is.na(Ozone))    
v[i]
Ozone[3]
[1] 12
Ozone[1:10]  # les dix premieres valeurs
 [1] 41 36 12 18 NA 28 23 19  8 NA
M[i,j]
M1[1,3] # la valeur sur la ligne 1 et la colonne 3
[1] 7
M1[,3]  # toutes les valeurs sur la colonne 3
[1] 7 0
M1[2,1:2] # les deux premieres valeurs de la ligne 2
[1] 2 8
liste[[i]]
air$Ozone
l1$sites
condition=TempCelsius>20
indices=which(condition)
indices
TempCelsius[indices]
air[lignes_renseignees,]  
x <- c(3, 10, 5, 4, 1)
order(x, decreasing=F)
[1] 5 1 4 3 2
air=air[order(Month,Day, decreasing=F),]
print(air[1:10,])
   Ozone Solar.R Wind Temp Month Day
1     41     190  7.4   67     5   1
2     36     118  8.0   72     5   2
3     12     149 12.6   74     5   3
4     18     313 11.5   62     5   4
5     NA      NA 14.3   56     5   5
6     28      NA 14.9   66     5   6
7     23     299  8.6   65     5   7
8     19      99 13.8   59     5   8
9      8      19 20.1   61     5   9
10    NA     194  8.6   69     5  10
read.table(file="air.txt",sep=",", header=T)
install.packages("ade4")
library(ade4)  
mafonction <-function(argument1,argument2){
  ...
  ...
  resultat <- ...
  return(resultat)
}
Tconversion  <-function(x){
    reponse=(x-32)*5/9
    return(reponse)
}
Tconversion(451)
mean(taille)
[1] 170.7638
median(taille)
[1] 171
mean(Ozone)
[1] NA
mean(Ozone, na.rm=T)
[1] 42.12931
mean(depenses)
[1] 73.46734
median(depenses)
[1] 62
var(taille)
[1] 128.8581
sd(taille)
[1] 11.35157
mean(taille[which(sexe=="homme")])
[1] 176.3495
mean(taille[which(sexe=="femme")])
[1] 164.7708
tapply(taille, sexe, "mean")
   femme    homme 
164.7708 176.3495 
tapply(taille, sexe, "median")
femme homme 
  165   176 
tapply(taille, sexe, "sd")
    femme     homme 
10.195437  9.381572 
tapply(taille, sexe, "var")
   femme    homme 
103.9469  88.0139 
quantile(taille, c(0.05,0.95))
 5% 95% 
151 191 
min(depenses)
[1] 12
max(depenses)
[1] 256
layout(matrix(1:4, nrow=2))
plot(taille, poids, main="cas a")
plot(taille, poids, pch=20, xlab="taille (cm)", ylab="poids (kg)", main="cas b")
plot(Ozone, type="l", col="blue", lty=3, main="cas c")
effectifs=table(autonotation)
plot(effectifs, col="orange", type="h", lwd=2, main="cas d")
plot(poids,taille, ylim=c(0,200))
points(poids, depenses, col="red")
layout(matrix(1:3,nrow=1))
boxplot(depenses, main="Cas a")
boxplot(depenses, range=3, main="Cas b")
boxplot(depenses, range=0, main="Cas c")
boxplot(depenses~sexe)
boxplot(depenses~autonotation)
moyennes=tapply(depenses,autonotation,"mean")
points(moyennes,col="red",pch=20)
hist(depenses)
layout(matrix(1:2,nrow=1))
hist(depenses)
hist(depenses, freq=F) 
layout(matrix(1:3,nrow=1))
hist(depenses, main="cas a")
hist(depenses, breaks=30, main="cas b")
hist(depenses, breaks=c(0,50,100,max(depenses)), main="cas c")

Notation	Opération	Exemple
`-`	soustraction	`6-4` >>2
`*`	multiplication	`2*5` >>10
`/`	division	`6/2` >>3
`^`	puissance	`2^5` >>32
`<`	plus petit	`3<4` >>TRUE
`>`	plus grand	`7>10` >>FALSE
`<=`	plus petit ou égal	`5<=5` >>TRUE
`>=`	plus grand ou égal	`6>=3` >>TRUE
`==`	égal	`2==3` >>FALSE
`!=`	différent	`5!=5` >>FALSE
`!`	NON logique	`!(5!=5)` >>TRUE
`&`	ET logique	`3<4 & 5<=1` >>FALSE
`\|`	OU logique	`3<4 \| 5<=1` >>TRUE

Type d’action	Fonction	Objet renvoyé ou résultat de la fonction
Général	`help(...)`	ouvre le fichier d’aide de la fonction spécifiée
Général	`getwd()`	indique le nom du répertoire de travail courant
Général	`setwd(...)`	change le répertoire de travail
Général	`ls()`	liste d’objets contenus par l’environnement courant
Général	`rm(...)`	efface un objet de l’environnement
Général	`install.packages(...)`	installe le package spécifié
Général	`require(...)`	charge le package spécifié
Lecture et écriture de données	`read.table(...)`	charge un tableau de données depuis un fichier
Lecture et écriture de données	`write.table(...)`	écrit un tableau de données dans un fichier
Lecture et écriture de données	`attach(...)`	attache un tableau à l’environnement
Lecture et écriture de données	`detach(...)`	détache un tableau de l’environnement
Visualisation des données	`print(...)`	affiche l’objet dans la console
Visualisation des données	`edit(...)`	ouvre le tableau spécifié dans un éditeur
Visualisation des données	`colnames(...)`	affiche les noms de colonnes
Visualisation des données	`rownames(...)`	affiche les noms de lignes
Création d’objets	`c(...)`	crée un vecteur Création d’objets
Création d’objets	`seq(...)`	crée une séquence de valeurs régulièrement espacées
Création d’objets	`rep(...)`	crée une séquence de valeurs répétées
Création d’objets	`cbind(c1,c2)`	accole des colonnes c1 et c2
Création d’objets	`rbind(r1,r2)`	accole des lignes r1 et r2
Création d’objets	`data.frame(var1,var2)`	accole plusieurs variables ou tableaux
Indexation	`which(condition)`	indices des éléments vérifiant la condition
Indexation	`sort(x)`	vecteur x ordonné
Indexation	`order(x)`	indices du vecteur ordonné
Description	`length(x)`	longueur de x
Description	`nrow(M)`	nombre de lignes de M
Description	`ncol(M)`	nombre de colonnes de M
Description	`dim(M)`	dimension de M
Description	`mean(x)`	moyenne de x
Description	`var(x)`	variance de x
Description	`sd(x)`	écart-type de x
Description	`cor(x,y)`	coefficient de corrélation entre x et y
Description	`median(x)`	médiane de x
Description	`min(x)`	minimum de x
Description	`max(x)`	maximum de x
Description	`summary(x)`	“résume” la distrib. de x
Description	`tapply(x,y,"f")`	applique “f” à “x” pour chaque groupe de “y”
Graphiques de base	`plot(...)`	trace un nuage de points
Graphiques de base	`boxplot(...)`	trace des boîtes à moustaches
Graphiques de base	`hist(...)`	trace des histogrammes
Graphiques de base	`barplot(...)`	trace un graphique en barres
Graphiques de base	`contour(...)`	trace des courbes de niveau
Ajouts sur graphiques	`points(...)`	ajoute un nuage de points
Ajouts sur graphiques	`axis(...)`	change les valeurs affichées sur les axes
Ajouts sur graphiques	`text(...)`	ajoute du texte
Contrôle du dispositif graphique	`x11()`	ouverture d’un nouveau dispositif graphique R
Contrôle du dispositif graphique	`bmp(...)`	ouverture d’un fichier graphique bmp
Contrôle du dispositif graphique	`jpg(...)`	ouverture d’un fichier graphique jpg
Contrôle du dispositif graphique	`tiff(...)`	ouverture d’un fichier graphique tiff
Contrôle du dispositif graphique	`pdf(...)`	ouverture d’un fichier graphique pdf
Contrôle du dispositif graphique	`dev.off()`	fermeture des dispositifs graphiques
Contrôle du dispositif graphique	`layout(...)`	découpage de la fenêtre graphique

Initiation à R

Initiation à R

1 Generalités

1.1 Pourquoi utiliser le logiciel R?

1.2 Installation de base et premiers pas

1.3 Utilisation d’objets

1.4 Utilisation de scripts et IDE

2 Création d’objets

2.1 Vecteurs, facteurs, matrices et listes

2.1.1 Vecteurs

2.1.2 Facteurs

2.1.3 Matrices

2.2 Listes

2.3 Tableaux de données (data.frame) chargés depuis un fichier

2.3.1 Choix du répertoire de travail et lecture du fichier

2.3.2 Options de lecture du fichier

2.4 Conversion d’objets

3 Manipulation d’objets

3.1 Opérateurs

3.2 Système d’indexation

3.3 Fonctions

4 Statistiques descriptives

4.1 Moyenne et médiane

4.2 Variance et écart-type

4.3 Description de groupes ou de sous-échantillons

4.4 Quantiles, minimum, maximum

5 Graphiques

5.1 Graphiques de base, nuages de points

5.2 Superposer plusieurs graphes

5.3 Boîtes à moustaches

5.4 Histogrammes

6 Aide-mémoire

6.1 Besoin d’aide?

6.2 Besoin d’en savoir plus?