Série d’ateliers R du CSBQ
Préface
0.1
Code de conduite
0.1.1
Comportement attendu
0.1.2
Comportements inacceptables
0.2
Contributeurs et contributrices
0.3
Contribuez à la série!
Charger et manipuler des données
1
Objectifs d’apprentissage
2
Préparez-vous pour cet atelier
3
Les projets RStudio
3.1
Créer un projet dans RStudio
3.2
Organiser ses fichiers
3.3
Préparer des données pour l’importation dans R
3.3.1
Bien nommer les fichiers
3.3.2
Bien nommer les variables
3.3.3
Conseils pour la préparation de jeux de données
3.3.4
Exemples de mauvaises habitudes
4
Écrire un script dans R
4.0.1
Commandes & Commentaires
4.0.2
En-têtes
4.0.3
En-têtes de section
4.0.4
Nettoyage
4.0.5
Petit rappel important
5
Charger, explorer et enregistrer des données
5.0.1
Répertoire de travail
5.0.2
Afficher le contenu du répertoire de travail
5.0.3
Importer un jeu de données
5.0.4
Explorer le jeu de données
5.0.5
Rappel de l’atelier 1 : Accéder aux données
5.0.6
Changer les noms de variables
5.0.7
Créer des nouvelles variables
5.0.8
Extraire un sous-ensemble d’un jeu de données
5.0.9
Explorer les données
5.0.10
Enregistrer son espace de travail
5.0.11
Exporter le jeu de données
5.0.12
DÉFI: Utilisez vos propres données
6
Réparer un jeu de données
6.0.1
DÉFI: Réparer un jeu de données “endommagé”
7
Manipuler ses données avec tidyr, dyplr, maggritr
7.1
Utiliser “tidyr” pour réorganiser ses données
7.1.1
Pourquoi réorganiser ses données?
7.1.2
Données en longueur vs. en largeur
7.1.3
pivot_longer(): Rassembler les données en longueur
7.1.4
pivot_wider(): Disperser les données en largeur
7.1.5
La structure
tibble
pour des tables de données
7.1.6
separate(): séparer une colonne en deux (ou plusieurs) colonnes
7.1.7
Récapitulatif: tidyr
7.1.8
DÉFI: Utiliser tidyr pour convertir le format long en format large
7.1.9
Solution
7.2
Utiliser “dplyr” pour manipuler les données
7.2.1
Introduction à dplyr
7.2.2
select(): Sélection de colonnes
7.2.3
filter(): Sélection de rangées
7.2.4
arrange(): Triage de rangées
7.2.5
mutate(): Créer des nouvelles colonnes
7.3
dplyr et magrittr, un don du ciel
7.4
Regroupement d’opérations et sommaires avec “dplyr”
7.4.1
DÉFI: dplyr et magrittr
7.4.2
Solution:
7.4.3
NINJA DÉFI: dplyr & magrittr
7.4.4
Indice pour les ninjas
7.4.5
Solution
7.4.6
Défi R base
7.4.7
Défi R base - Solution
7.5
Fusionner des tableaux de données avec dplyr
Considérations finales
8
Résumé
9
Resources additionnels
10
Réferences
QCBS R Workshop Series
Atelier 2: Charger et manipuler des données
Chapitre 10
Réferences