README.md 7.67 KB
Newer Older
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
1 2 3
title: Initiation à R à travers RStudio
author: Vincent Navratil (vincent.navratil@univ-lyon1.fr)
[[_TOC_]]
4

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
5 6 7
<a href="https://rstudio.com"><img src="https://d33wubrfki0l68.cloudfront.net/62bcc8535a06077094ca3c29c383e37ad7334311/a263f/assets/img/logo.svg" width=200px></a>

## Prérequis
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
8
- pas de connaissance de base sur les lignes de commandes et R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
9

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
10
# Séance 1 - Prise en main de l'IDE RStudio (1h)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
11

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
12
## Objectif de l'atelier
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
13
- installer la version desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
14
- utiliser les principales fonctionnalités des panneaux de RStudio (édition, console, navigateurs)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
15
- créer un projet RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
16
- savoir où et comment sauveguarder les historiques, les objets R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
17 18 19 20 21 22

## Support de l'atelier

![Getting started with RStudio](https://learning.oreilly.com/library/cover/9781449314798/250w/)

## Qu'est ce que R ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
23

24 25 26 27 28 29
- un environnement logiciel open-source pour les calculs scientifiques et les graphiques.
- disponibles pour Windows, Mac OS X et plusieurs plateformes UNIX (incluant Linux) sous forme de binaires (compilés)
- Robert Gentleman and Ross Ihaka et la R’s core development team
- un langage de programmation (de script) interprété + add-on package
- the Comprehensive R Archive Network (CRAN) http://cran.r-project.org

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
30
## Pourquoi utiliser l'IDE RStudio ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
31

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
32
- IDE (Integrated Development Environnment)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
33
- facilite l'écriture le développement de programme et de fonctions dans un environnement intégré
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
34
- projet open-source, multi-plateformes (Windows, Mac Os X, UNIX)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
35 36
- mode standalone (Desktop Rstudio) ou serveur (à travers un naviguateur web, RStudio server)
- organisé sous forme de 4 panneaux (éditeur de code source, console+terminal, navigateur d'objets/historiques, navigateurs de fichiers/graphiques/packages/aide)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
37
- plus convivial que la console R pour débuter, plus facile à apprendre que Emacs, plus facile à installer que Eclipse ...
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
38 39
- développement actif

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
40
## Installation de la version Desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
41

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
42
RStudio nécessite l'installation d'une version récente de R (http://cran.r-project.org).
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
43

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
44 45 46 47 48 49 50 51 52 53 54 55 56 57
Vérifier si une version n'est pas déjà installée sur votre OS.
```bash
R
```

Puis installer RStudio depuis rstudio.com (https://rstudio.com/products/rstudio/download/#download).

> ### Astuce
> Utiliser la variable d'environnement `RSTUDIO_WHICH_R` afin de  pointer sur une version de R donnée.
```bash
export RSTUDIO_WHICH_R=/usr/local/bin/R
```

## Premiers pas avec RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
58

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
59 60
Une fois installée lancer RStudio.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
61 62
### Notion d'Espace de travail (Workspace)
Au lancement de RStudio, R est lancé: 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
63

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
64 65 66
> - Le programme R est lancé dans le répertoire courant (**working directory** - wd)
> - Si présentes, les commandes dans le fichier **.Rprofile** sont executées
> - Si présentes les données dans le fichier **.Rdata** sont chargées
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
67
> - En quitant (à l'aide de la commande `quit()`), l'utilisateur peut sauvegarder son espace de travail en répondant "yes" à la question "Save workspace image ?" (les données stockées dans les **objets R** seront écrites dans le **.RData**, les commandes dans le fichier **.Rhistory**)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
68
> - Il y a la possibilité d'utiliser la commande `save.image()` ou `save()` en cours de session pour sauveguarder respectivement tout ou une partie des objets de la session dans un fichier au foramt **.RData**. Il y a la possibilité de recharger ce fichier à l'aide de la fonction `load()`
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
69

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
70
### Création de Projets sous RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
71

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
72 73
RStudio peut créer un nouveau projet (**"New  Directory"**) ou importer un projet existant depuis un répertoire/dossier (**"Existing Directory"**) ou depuis un gestionnaire de version (**"Version Control"**) (git, svn).
Les nouveaux projets sont de plusieurs types (Analyse : **"New Project"**, Développement de packages: **"R Package"** ou d'application Shiny **"Shiny Web Application"**)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
74

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
75
- Possibilité de créer un dépôt **git** associé ("Create a git repository")
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
76
- Possibilité d'utiliser un gestionnaire de package **Packrat** ("Use packrat with this project") http://rstudio.github.io/packrat/rstudio.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
77

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
78 79
### Préférences de RStudio

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
80
En cliquant sur l'onglet RStudio>preferences nous avons accès aux options paramétrables de RStudio.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
81

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
82
## Quelques cours en ligne utiles 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
83

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
84
https://openclassrooms.com/fr/courses/4525256-initiez-vous-au-langage-r-pour-analyser-vos-donnees/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
85

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
86 87
http://swcarpentry.github.io/r-novice-gapminder/01-rstudio-intro/index.html

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
88 89
https://r.developpez.com/tutoriels/introduction-r-et-rstudio/

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
90
# Séance 1-bis - Utiliser RStudio server sur le cloud (1h)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
91

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
92 93 94 95
# Séance 2 - Initiation à R sous RStudio (1h)

Le **package base** de R est constitué d'un ensemble de fonctions et de données installés par défaut.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
96
Nous allons utiliser le jeux de données `iris` pour illustrer les différentes fonctionalités de base de R.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
97 98
https://fr.wikipedia.org/wiki/Iris_de_Fisher

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
99 100 101 102 103 104 105
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Kosaciec_szczecinkowaty_Iris_setosa.jpg/440px-Kosaciec_szczecinkowaty_Iris_setosa.jpg" width="100px"> <i>Iris setosa</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/41/Iris_versicolor_3.jpg/440px-Iris_versicolor_3.jpg" width="100px"> <i>Iris versicolor</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/Iris_virginica.jpg/440px-Iris_virginica.jpg" width="100px"> <i>Iris virginica</i><br>

Nous allons pour se faire utiliser la fonction `data()`. 
> les fonctions en R sont toujours écrites de la manière suivante: nom_de_ma_fonction(liste de paramètres).

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
106 107 108 109 110 111 112 113
Pour avoir plus d'information faire précéder le nom de la fonction à l'aide de la commande `?`

```R
?data
#liste tous le datasets présents dans le package de base
data()
#charge le dataset "iris"
data(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
114 115 116 117 118 119 120 121
ls()
```

La fonction `ls()` permet de lister le contenu de l'espace de travail en terme d'objets R disponibles.
La fonction `class()` détermine la classe de l'objet passé en paramètre.
La fonction `names()` retourne dans un objet de classe vecteur le nom des différentes colonnes du dataframe passé en paramètre.

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
122
class(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
123
dim(class)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
124 125
names(iris)
class(iris$Sepal.Length)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150
```
## Premières statistiques et graphiques descriptifs

La fonction générique `summary()` donne un résumé de l'objet passé en paramètre. En ce qui concerne l'objet celà donne les valeures Min/Max,la médianne, la moyenne ainsi que les valeurs des premiers et troisième quartile

```R
summary(iris)
```

La fonction graphique `boxplot()` représente ces valeures graphiquement sous forme d'une boite à moustaches. Les **paramètre** `varwidth` donne une largeure variable en fonction dun ombre d'observation, `notch` (entaille) donne un intervalle de confiance à 95% autoir de la mediane, `outline` donne les valeures extrème en dehors des limites fiwée par la boite à moustache.

```R
boxplot(iris[1:4],varwidth = TRUE, notch = TRUE, outline = TRUE)
```

La fonction graphique `pairs()` donne un représentation sous forme d'une matrice de graphique de type scatterplot (plot de deux variables).

```R
pairs(iris[1:4],col=c("red","blue","green")[iris$Species])
```


## data.frame, vector, list, factor, matrix

Le langage R utilise des objets pour manipuler les données qui peuvent être de plusieurs classes.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
151

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
152
- l'objet de classe `data.frame` permet de créer une liste de vecteur de
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
153

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
154 155 156
## Références de la formation
https://pbil.univ-lyon1.fr/R/pdf/bs01.pdf
https://rpubs.com/moeransm/intro-iris
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
157 158
https://github.com/hbctraining/Intro-to-R/blob/master/schedules/1.5-day.md
http://adv-r.had.co.nz/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
159

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
160 161 162
## Apprendre R avec swirl

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
163 164 165
> install.packages("swirl")
> library(swirl)
> swirl()
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
166 167
```

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
168 169
## Pour aller plus loin 
R For Data Science: https://r4ds.had.co.nz/index.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
170 171 172 173

## Prochains thèmes
Initiation à Bioconductor
Initiation à tidyverse
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
174 175 176
Initiation à RPostgreSQL
Initiation à Rmarkdown (https://rmarkdown.rstudio.com/)
Initiation à R shiny
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
177
...