Plan du cours

Jour 1

Introduction et préliminaires

  • Rendre R plus convivial, R et les interfaces graphiques disponibles
  • Rstudio
  • Logiciels connexes et documentation
  • R et les statistiques
  • Utiliser R de manière interactive
  • Une session d'introduction
  • Obtenir de l'aide sur les fonctions et les caractéristiques
  • Commandes R, sensibilité à la casse, etc.
  • Rappel et correction des commandes précédentes
  • Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
  • Permanence des données et suppression d'objets

Manipulations simples ; nombres et vecteurs

  • Vecteurs et affectation
  • Arithmétique vectorielle
  • Génération de séquences régulières
  • Vecteurs logiques
  • Valeurs manquantes
  • Vecteurs de caractères
  • Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
  • Autres types d'objets

Les objets, leurs modes et leurs attributs

  • Attributs intrinsèques : mode et longueur
  • Modification de la longueur d'un objet
  • Obtention et définition d'attributs
  • La classe d'un objet

Facteurs ordonnés et non ordonnés

  • Un exemple spécifique
  • La fonction tapply() et les tableaux en escalier
  • Facteurs ordonnés

Tableaux et matrices

  • Les tableaux
  • Indexation des tableaux. Sous-sections d'un tableau
  • Indexation des matrices
  • La fonction array()
    • Arithmétique mixte des vecteurs et des tableaux. La règle de recyclage
  • Le produit extérieur de deux tableaux
  • Transposition généralisée d'un tableau
  • Facilités Matrix.
    • Multiplication Matrix
    • Equations linéaires et inversion
    • Valeurs propres et vecteurs propres
    • Décomposition en valeurs singulières et déterminants
    • Ajustement des moindres carrés et décomposition QR
  • Formation de matrices partitionnées, cbind() et rbind()
  • La fonction de concaténation, (), avec les tableaux
  • Tableaux de fréquences à partir de facteurs

Deuxième jour

Listes et cadres de données

  • Les listes
  • Construire et modifier des listes
    • Concaténation de listes
  • Cadres de données
    • Création de cadres de données
    • attach() et detach()
    • Travailler avec des cadres de données
    • Attacher des listes arbitraires
    • Gestion du chemin de recherche

Manipulation des données

  • Sélection, sous-ensemble d'observations et de variables
  • Filtrage, regroupement
  • Recodage, transformations
  • Agrégation, combinaison d'ensembles de données
  • Manipulation de caractères, package stringr

Lecture des données

  • Fichiers Txt
  • Fichiers CSV
  • Fichiers XLS, XLSX
  • SPSS, SAS, Stata,... et autres formats de données
  • Exporter des données vers des formats txt, csv et autres
  • Access données provenant de bases de données à l'aide du langage SQL.

Distributions de probabilités

  • R comme ensemble de tableaux statistiques
  • Examen de la distribution d'un ensemble de données
  • Tests à un et deux échantillons

Groupement, boucles et exécution conditionnelle

  • Expressions groupées
  • Instructions de contrôle
    • Exécution conditionnelle : instructions if
    • Exécution répétitive : boucles for, repeat et while

Troisième jour

Écrire ses propres fonctions

  • Exemples simples
  • Définition de nouveaux opérateurs binaires
  • Arguments nommés et valeurs par défaut
  • L'argument '...'
  • Affectations au sein des fonctions
  • Exemples plus avancés
    • Facteurs d'efficacité dans la conception des blocs
    • Suppression de tous les noms dans un tableau imprimé
    • Intégration numérique récursive
  • Champ d'application
  • Personnalisation de l'environnement
  • Classes, fonctions génériques et orientation objet

Analyse statistique en R

  • Modèles de régression linéaire
  • Fonctions génériques pour l'extraction d'informations sur les modèles
  • Mise à jour des modèles ajustés
  • Modèles linéaires généralisés
    • Familles
    • La fonction glm()
  • Classification
    • Régression logistique
    • Analyse discriminante linéaire
  • Apprentissage non supervisé
    • Analyse des composantes principales
    • Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
  • Analyse de survie
    • Objets de survie en r
    • Estimation de Kaplan-Meier
    • Bandes de confiance
    • Modèles PH de Cox, covariables constantes
    • Modèles PH de Cox, covariables dépendantes du temps

Procédures graphiques

  • Commandes de traçage de haut niveau
    • La fonction plot()
    • Affichage de données multivariées
    • Affichage de graphiques
    • Arguments des fonctions de traçage de haut niveau
  • Graphiques de visualisation de base
  • Relations multivariées avec le treillis et le paquetage ggplot
  • Utilisation des paramètres graphiques
  • Liste des paramètres graphiques

Rapports automatisés et interactifs

  • Combiner les résultats de R avec du texte
  • Création de documents html, pdf

Pré requis

Bonne compréhension des statistiques.

 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires