README.md 7.78 KB
Newer Older
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
1 2
---
title: Prise en main de R à travers RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
3
author: Vincent Navratil (vincent.navratil@univ-lyon1.fr)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
4 5
---

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
6
[[_TOC_]]
7

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
8 9
<a href="https://rstudio.com"><img src="https://d33wubrfki0l68.cloudfront.net/62bcc8535a06077094ca3c29c383e37ad7334311/a263f/assets/img/logo.svg" width=200px></a>

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
10
# Prérequis
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
11
- pas de connaissance de base sur les lignes de commandes et R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
12

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
13
# Séance 1 - Prise en main de l'IDE RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
14

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
15
## Objectif de l'atelier
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
16
- installer la version desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
17
- utiliser les principales fonctionnalités des panneaux de RStudio (édition, console, navigateurs)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
18
- créer un projet RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
19
- savoir où et comment sauveguarder les historiques, les objets R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
20 21 22 23 24 25

## Support de l'atelier

![Getting started with RStudio](https://learning.oreilly.com/library/cover/9781449314798/250w/)

## Qu'est ce que R ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
26

27 28 29 30 31 32
- un environnement logiciel open-source pour les calculs scientifiques et les graphiques.
- disponibles pour Windows, Mac OS X et plusieurs plateformes UNIX (incluant Linux) sous forme de binaires (compilés)
- Robert Gentleman and Ross Ihaka et la R’s core development team
- un langage de programmation (de script) interprété + add-on package
- the Comprehensive R Archive Network (CRAN) http://cran.r-project.org

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
33
## Pourquoi utiliser l'IDE RStudio ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
34

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
35
- IDE (Integrated Development Environnment)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
36
- facilite l'écriture le développement de programme et de fonctions dans un environnement intégré
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
37
- projet open-source, multi-plateformes (Windows, Mac Os X, UNIX)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
38 39
- mode standalone (Desktop Rstudio) ou serveur (à travers un naviguateur web, RStudio server)
- organisé sous forme de 4 panneaux (éditeur de code source, console+terminal, navigateur d'objets/historiques, navigateurs de fichiers/graphiques/packages/aide)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
40
- plus convivial que la console R pour débuter, plus facile à apprendre que Emacs, plus facile à installer que Eclipse ...
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
41 42
- développement actif

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
43
## Installation de la version Desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
44

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
45
RStudio nécessite l'installation d'une version récente de R (http://cran.r-project.org).
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
46

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
47 48 49 50 51 52 53 54 55 56 57 58 59 60
Vérifier si une version n'est pas déjà installée sur votre OS.
```bash
R
```

Puis installer RStudio depuis rstudio.com (https://rstudio.com/products/rstudio/download/#download).

> ### Astuce
> Utiliser la variable d'environnement `RSTUDIO_WHICH_R` afin de  pointer sur une version de R donnée.
```bash
export RSTUDIO_WHICH_R=/usr/local/bin/R
```

## Premiers pas avec RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
61

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
62 63
Une fois installée lancer RStudio.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
64 65
### Notion d'Espace de travail (Workspace)
Au lancement de RStudio, R est lancé: 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
66

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
67 68 69 70 71 72 73
>>>
- Le programme R est lancé dans le répertoire courant (**working directory** - wd)
- Si présentes, les commandes dans le fichier **.Rprofile** sont executées
- Si présentes les données dans le fichier **.Rdata** sont chargées
- En quitant (à l'aide de la commande `quit()`), l'utilisateur peut sauvegarder son espace de travail en répondant "yes" à la question "Save workspace image ?" (les données stockées dans les **objets R** seront écrites dans le **.RData**, les commandes dans le fichier **.Rhistory**)
- Il y a la possibilité d'utiliser la commande `save.image()` ou `save()` en cours de session pour sauveguarder respectivement tout ou une partie des objets de la session dans un fichier au foramt **.RData**. Il y a la possibilité de recharger ce fichier à l'aide de la fonction `load()`
>>>
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
74

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
75
### Création de Projets sous RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
76

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
77 78
RStudio peut créer un nouveau projet (**"New  Directory"**) ou importer un projet existant depuis un répertoire/dossier (**"Existing Directory"**) ou depuis un gestionnaire de version (**"Version Control"**) (git, svn).
Les nouveaux projets sont de plusieurs types (Analyse : **"New Project"**, Développement de packages: **"R Package"** ou d'application Shiny **"Shiny Web Application"**)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
79

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
80
- Possibilité de créer un dépôt **git** associé ("Create a git repository")
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
81
- Possibilité d'utiliser un gestionnaire de package **Packrat** ("Use packrat with this project") http://rstudio.github.io/packrat/rstudio.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
82

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
83 84
### Préférences de RStudio

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
85
En cliquant sur l'onglet RStudio>preferences nous avons accès aux options paramétrables de RStudio.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
86

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
87
## Quelques cours en ligne utiles 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
88 89 90
https://biostat2.uni.lu/lectures.html

http://perso.ens-lyon.fr/lise.vaudor/grimoire/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
91

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
92
https://openclassrooms.com/fr/courses/4525256-initiez-vous-au-langage-r-pour-analyser-vos-donnees/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
93

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
94 95
http://swcarpentry.github.io/r-novice-gapminder/01-rstudio-intro/index.html

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
96 97
https://r.developpez.com/tutoriels/introduction-r-et-rstudio/

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
98

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
99 100 101 102 103
# RStudio cheatsheets

https://raw.githubusercontent.com/rstudio/cheatsheets/master/rstudio-ide.pdf

# Séance 2 - Prise en main de R sous RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
104 105 106

Le **package base** de R est constitué d'un ensemble de fonctions et de données installés par défaut.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
107
Nous allons utiliser le jeux de données `iris` pour illustrer les différentes fonctionalités de base de R.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
108 109
https://fr.wikipedia.org/wiki/Iris_de_Fisher

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
110 111 112 113 114 115 116
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Kosaciec_szczecinkowaty_Iris_setosa.jpg/440px-Kosaciec_szczecinkowaty_Iris_setosa.jpg" width="100px"> <i>Iris setosa</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/41/Iris_versicolor_3.jpg/440px-Iris_versicolor_3.jpg" width="100px"> <i>Iris versicolor</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/Iris_virginica.jpg/440px-Iris_virginica.jpg" width="100px"> <i>Iris virginica</i><br>

Nous allons pour se faire utiliser la fonction `data()`. 
> les fonctions en R sont toujours écrites de la manière suivante: nom_de_ma_fonction(liste de paramètres).

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
117 118 119 120 121 122 123 124
Pour avoir plus d'information faire précéder le nom de la fonction à l'aide de la commande `?`

```R
?data
#liste tous le datasets présents dans le package de base
data()
#charge le dataset "iris"
data(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
125 126 127 128 129 130 131 132
ls()
```

La fonction `ls()` permet de lister le contenu de l'espace de travail en terme d'objets R disponibles.
La fonction `class()` détermine la classe de l'objet passé en paramètre.
La fonction `names()` retourne dans un objet de classe vecteur le nom des différentes colonnes du dataframe passé en paramètre.

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
133
class(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
134
dim(class)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
135 136
names(iris)
class(iris$Sepal.Length)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157
```
## Premières statistiques et graphiques descriptifs

La fonction générique `summary()` donne un résumé de l'objet passé en paramètre. En ce qui concerne l'objet celà donne les valeures Min/Max,la médianne, la moyenne ainsi que les valeurs des premiers et troisième quartile

```R
summary(iris)
```

La fonction graphique `boxplot()` représente ces valeures graphiquement sous forme d'une boite à moustaches. Les **paramètre** `varwidth` donne une largeure variable en fonction dun ombre d'observation, `notch` (entaille) donne un intervalle de confiance à 95% autoir de la mediane, `outline` donne les valeures extrème en dehors des limites fiwée par la boite à moustache.

```R
boxplot(iris[1:4],varwidth = TRUE, notch = TRUE, outline = TRUE)
```

La fonction graphique `pairs()` donne un représentation sous forme d'une matrice de graphique de type scatterplot (plot de deux variables).

```R
pairs(iris[1:4],col=c("red","blue","green")[iris$Species])
```

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
158
## R cheatsheets
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
159

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
160
https://raw.githubusercontent.com/rstudio/cheatsheets/master/base-r.pdf
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
161

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
162
# Séance 1-bis - Prise en main de RStudio sur le cloud
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
163

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
164
# Références de la formation
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
165 166
https://pbil.univ-lyon1.fr/R/pdf/bs01.pdf
https://rpubs.com/moeransm/intro-iris
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
167 168
https://github.com/hbctraining/Intro-to-R/blob/master/schedules/1.5-day.md
http://adv-r.had.co.nz/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
169

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
170 171 172 173
# R cheatsheets

https://rstudio.com/resources/cheatsheets/

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
174 175 176
## Apprendre R avec swirl

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
177 178 179
> install.packages("swirl")
> library(swirl)
> swirl()
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
180 181
```

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
182 183
## Pour aller plus loin 
R For Data Science: https://r4ds.had.co.nz/index.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
184

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
185
# Prochains thèmes
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
186 187
Initiation à Bioconductor
Initiation à tidyverse
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
188 189 190
Initiation à RPostgreSQL
Initiation à Rmarkdown (https://rmarkdown.rstudio.com/)
Initiation à R shiny
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
191
...