README.md 7.69 KB
Newer Older
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
1 2
---
title: Prise en main de R à travers RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
3
author: Vincent Navratil (vincent.navratil@univ-lyon1.fr)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
4 5
---

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
6
[[_TOC_]]
7

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
8 9
<a href="https://rstudio.com"><img src="https://d33wubrfki0l68.cloudfront.net/62bcc8535a06077094ca3c29c383e37ad7334311/a263f/assets/img/logo.svg" width=200px></a>

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
10
# Prérequis
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
11
- pas de connaissance de base sur les lignes de commandes et R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
12

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
13
# Séance 1 - Prise en main de l'IDE RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
14

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
15
## Objectif de l'atelier
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
16
- installer la version desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
17
- utiliser les principales fonctionnalités des panneaux de RStudio (édition, console, navigateurs)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
18
- créer un projet RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
19
- savoir où et comment sauveguarder les historiques, les objets R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
20 21 22 23 24 25

## Support de l'atelier

![Getting started with RStudio](https://learning.oreilly.com/library/cover/9781449314798/250w/)

## Qu'est ce que R ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
26

27 28 29 30 31 32
- un environnement logiciel open-source pour les calculs scientifiques et les graphiques.
- disponibles pour Windows, Mac OS X et plusieurs plateformes UNIX (incluant Linux) sous forme de binaires (compilés)
- Robert Gentleman and Ross Ihaka et la R’s core development team
- un langage de programmation (de script) interprété + add-on package
- the Comprehensive R Archive Network (CRAN) http://cran.r-project.org

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
33
## Pourquoi utiliser l'IDE RStudio ?
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
34

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
35
- IDE (Integrated Development Environnment)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
36
- facilite l'écriture le développement de programme et de fonctions dans un environnement intégré
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
37
- projet open-source, multi-plateformes (Windows, Mac Os X, UNIX)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
38 39
- mode standalone (Desktop Rstudio) ou serveur (à travers un naviguateur web, RStudio server)
- organisé sous forme de 4 panneaux (éditeur de code source, console+terminal, navigateur d'objets/historiques, navigateurs de fichiers/graphiques/packages/aide)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
40
- plus convivial que la console R pour débuter, plus facile à apprendre que Emacs, plus facile à installer que Eclipse ...
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
41 42
- développement actif

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
43
## Installation de la version Desktop de RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
44

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
45
RStudio nécessite l'installation d'une version récente de R (http://cran.r-project.org).
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
46

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
47 48 49 50 51 52 53 54 55 56 57 58 59 60
Vérifier si une version n'est pas déjà installée sur votre OS.
```bash
R
```

Puis installer RStudio depuis rstudio.com (https://rstudio.com/products/rstudio/download/#download).

> ### Astuce
> Utiliser la variable d'environnement `RSTUDIO_WHICH_R` afin de  pointer sur une version de R donnée.
```bash
export RSTUDIO_WHICH_R=/usr/local/bin/R
```

## Premiers pas avec RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
61

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
62 63
Une fois installée lancer RStudio.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
64 65
### Notion d'Espace de travail (Workspace)
Au lancement de RStudio, R est lancé: 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
66

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
67 68 69 70 71 72 73
>>>
- Le programme R est lancé dans le répertoire courant (**working directory** - wd)
- Si présentes, les commandes dans le fichier **.Rprofile** sont executées
- Si présentes les données dans le fichier **.Rdata** sont chargées
- En quitant (à l'aide de la commande `quit()`), l'utilisateur peut sauvegarder son espace de travail en répondant "yes" à la question "Save workspace image ?" (les données stockées dans les **objets R** seront écrites dans le **.RData**, les commandes dans le fichier **.Rhistory**)
- Il y a la possibilité d'utiliser la commande `save.image()` ou `save()` en cours de session pour sauveguarder respectivement tout ou une partie des objets de la session dans un fichier au foramt **.RData**. Il y a la possibilité de recharger ce fichier à l'aide de la fonction `load()`
>>>
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
74

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
75
### Création de Projets sous RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
76

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
77 78
RStudio peut créer un nouveau projet (**"New  Directory"**) ou importer un projet existant depuis un répertoire/dossier (**"Existing Directory"**) ou depuis un gestionnaire de version (**"Version Control"**) (git, svn).
Les nouveaux projets sont de plusieurs types (Analyse : **"New Project"**, Développement de packages: **"R Package"** ou d'application Shiny **"Shiny Web Application"**)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
79

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
80
- Possibilité de créer un dépôt **git** associé ("Create a git repository")
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
81
- Possibilité d'utiliser un gestionnaire de package **Packrat** ("Use packrat with this project") http://rstudio.github.io/packrat/rstudio.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
82

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
83 84
### Préférences de RStudio

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
85
En cliquant sur l'onglet RStudio>preferences nous avons accès aux options paramétrables de RStudio.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
86

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
87
## Quelques cours en ligne utiles 
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
88

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
89
https://openclassrooms.com/fr/courses/4525256-initiez-vous-au-langage-r-pour-analyser-vos-donnees/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
90

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
91 92
http://swcarpentry.github.io/r-novice-gapminder/01-rstudio-intro/index.html

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
93 94
https://r.developpez.com/tutoriels/introduction-r-et-rstudio/

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
95

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
96 97 98 99 100
# RStudio cheatsheets

https://raw.githubusercontent.com/rstudio/cheatsheets/master/rstudio-ide.pdf

# Séance 2 - Prise en main de R sous RStudio
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
101 102 103

Le **package base** de R est constitué d'un ensemble de fonctions et de données installés par défaut.

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
104
Nous allons utiliser le jeux de données `iris` pour illustrer les différentes fonctionalités de base de R.
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
105 106
https://fr.wikipedia.org/wiki/Iris_de_Fisher

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
107 108 109 110 111 112 113
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Kosaciec_szczecinkowaty_Iris_setosa.jpg/440px-Kosaciec_szczecinkowaty_Iris_setosa.jpg" width="100px"> <i>Iris setosa</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/41/Iris_versicolor_3.jpg/440px-Iris_versicolor_3.jpg" width="100px"> <i>Iris versicolor</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/Iris_virginica.jpg/440px-Iris_virginica.jpg" width="100px"> <i>Iris virginica</i><br>

Nous allons pour se faire utiliser la fonction `data()`. 
> les fonctions en R sont toujours écrites de la manière suivante: nom_de_ma_fonction(liste de paramètres).

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
114 115 116 117 118 119 120 121
Pour avoir plus d'information faire précéder le nom de la fonction à l'aide de la commande `?`

```R
?data
#liste tous le datasets présents dans le package de base
data()
#charge le dataset "iris"
data(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
122 123 124 125 126 127 128 129
ls()
```

La fonction `ls()` permet de lister le contenu de l'espace de travail en terme d'objets R disponibles.
La fonction `class()` détermine la classe de l'objet passé en paramètre.
La fonction `names()` retourne dans un objet de classe vecteur le nom des différentes colonnes du dataframe passé en paramètre.

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
130
class(iris)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
131
dim(class)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
132 133
names(iris)
class(iris$Sepal.Length)
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154
```
## Premières statistiques et graphiques descriptifs

La fonction générique `summary()` donne un résumé de l'objet passé en paramètre. En ce qui concerne l'objet celà donne les valeures Min/Max,la médianne, la moyenne ainsi que les valeurs des premiers et troisième quartile

```R
summary(iris)
```

La fonction graphique `boxplot()` représente ces valeures graphiquement sous forme d'une boite à moustaches. Les **paramètre** `varwidth` donne une largeure variable en fonction dun ombre d'observation, `notch` (entaille) donne un intervalle de confiance à 95% autoir de la mediane, `outline` donne les valeures extrème en dehors des limites fiwée par la boite à moustache.

```R
boxplot(iris[1:4],varwidth = TRUE, notch = TRUE, outline = TRUE)
```

La fonction graphique `pairs()` donne un représentation sous forme d'une matrice de graphique de type scatterplot (plot de deux variables).

```R
pairs(iris[1:4],col=c("red","blue","green")[iris$Species])
```

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
155
## R cheatsheets
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
156

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
157
https://raw.githubusercontent.com/rstudio/cheatsheets/master/base-r.pdf
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
158

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
159
# Séance 1-bis - Prise en main de RStudio sur le cloud
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
160

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
161
# Références de la formation
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
162 163
https://pbil.univ-lyon1.fr/R/pdf/bs01.pdf
https://rpubs.com/moeransm/intro-iris
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
164 165
https://github.com/hbctraining/Intro-to-R/blob/master/schedules/1.5-day.md
http://adv-r.had.co.nz/
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
166

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
167 168 169 170
# R cheatsheets

https://rstudio.com/resources/cheatsheets/

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
171 172 173
## Apprendre R avec swirl

```R
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
174 175 176
> install.packages("swirl")
> library(swirl)
> swirl()
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
177 178
```

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
179 180
## Pour aller plus loin 
R For Data Science: https://r4ds.had.co.nz/index.html
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
181

NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
182
# Prochains thèmes
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
183 184
Initiation à Bioconductor
Initiation à tidyverse
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
185 186 187
Initiation à RPostgreSQL
Initiation à Rmarkdown (https://rmarkdown.rstudio.com/)
Initiation à R shiny
NAVRATIL VINCENT's avatar
NAVRATIL VINCENT committed
188
...