Commit 476f2787 authored by NAVRATIL VINCENT's avatar NAVRATIL VINCENT
Browse files

Update README.md

parent a7e099f6
https://thinkr.fr/pedagogie-de-la-formation-au-langage-r/
# Initiation aux data science à l'aide de R et du tidyverse
contact@prabi.fr
![L'univers bien rangé](https://thinkr.fr/wp-content/uploads/2019/07/thinkr_tidyverse-first_header.jpg)
## Remerciements
```
If you use the computing resources of LBBE / PRABI, thank you to make it
appear in your scientific publications by including the following sentence:
"This work was performed using the computing facilities of the CC LBBE/PRABI."
```
## Prérequis
- Initiation R à travers R Studio
## La pédagogie "tydiverse first"
https://www.tidyverse.org/
https://jcoliver.github.io/learn-r/
R repose sur environ 13000 packages référencés sur l'archive du cran https://cran.r-project.org/web/packages/
Le langage R repose sur de nombreuses commandes/objets de base qu'il faut assimiler avant de rentrer dans le vif du sujet.
https://larmarange.github.io/analyse-R/
En 2016 Hadley Wickham propose un ensemble de package R répondant à une grammaire cohérante, lisible et intuitive pour l'analyse de données / data science, dont notemment:
- importation des données
- la manipulation des données
- la visualisation des données
- la modélisation des données
- l'exportation des données
![](https://juba.github.io/tidyverse/resources/logos/core_packages.png)
Ces packages sont aujourd'hui regroupés sous le package tidyverse, on y retrouve :
- ggplot2 (visualisation)
- dplyr (manipulation des données)
- tidyr (remise en forme des données)
- purrr (programmation)
- readr (importation de données)
- tibble (tableaux de données)
- forcats (variables qualitatives)
- stringr (chaînes de caractères)
Nous allons tenter d'apprivoiser R à l'aide de tidyverse. https://thinkr.fr/pedagogie-de-la-formation-au-langage-r/
Tout d'abord nous allons installer le package `tidyverse` sous R/RStudio:
```R
install.packages("tidyverse")
```
Pour charger de librairie on utilise la fonction `library` de R avec `tidyverse` comme argument:
```R
library(tidyverse)
── Attaching packages ──────────────────────────────────────────── tidyverse 1.3.1 ──
ggplot2 3.3.5 purrr 0.3.4
tibble 3.1.5 dplyr 1.0.7
tidyr 1.1.4 stringr 1.4.0
readr 2.0.2 forcats 0.5.1
── Conflicts ─────────────────────────────────────────────── tidyverse_conflicts() ──
x dplyr::filter() masks stats::filter()
x dplyr::lag() masks stats::lag()
```
Nous allons utiliser le jeux de données `iris` pour illustrer les différentes fonctionalités de base de R.
https://fr.wikipedia.org/wiki/Iris_de_Fisher
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/5/56/Kosaciec_szczecinkowaty_Iris_setosa.jpg/440px-Kosaciec_szczecinkowaty_Iris_setosa.jpg" width="100px"> <i>Iris setosa</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/41/Iris_versicolor_3.jpg/440px-Iris_versicolor_3.jpg" width="100px"> <i>Iris versicolor</i><br>
<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/9/9f/Iris_virginica.jpg/440px-Iris_virginica.jpg" width="100px"> <i>Iris virginica</i><br>
Présentation des principes du tidyverse (https://juba.github.io/tidyverse/06-tidyverse.html)
- tidy data et tibble vs data.frame (voir chappitre 6.3, 6.4)
```R
class(iris)
```
#dplyr
```R
slice(iris,10)
slice(iris,10)
```
https://juba.github.io/tidyverse/index.html
https://larmarange.github.io/analyse-R/introduction-au-tidyverse.html
https://jcoliver.github.io/learn-r/
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment