Plan du cours
Introduction
- Comprendre l'importance de la préparation des données dans l'analyse et l'apprentissage automatique
- Le pipeline de préparation des données et son rôle dans le cycle de vie des données
- Explorer les défis courants liés aux données brutes et leur impact sur l'analyse
Collecte et acquisition des données
- Sources de données : bases de données, API, feuilles de calcul, fichiers texte, etc.
- Techniques de collecte de données et garantie de la qualité des données pendant la collecte
- Collecte de données à partir de différentes sources
Data Cleaning Techniques
- Identifier et traiter les valeurs manquantes, les valeurs aberrantes et les incohérences
- Traitement des doublons et des erreurs dans l'ensemble de données
- Nettoyer les ensembles de données du monde réel
Transformation et normalisation des données
- Techniques de normalisation et de standardisation des données
- Traitement des données catégorielles : encodage, binning et ingénierie des caractéristiques
- Transformation des données brutes en formats utilisables
Data Integration et l'agrégation
- Fusionner et combiner des ensembles de données provenant de différentes sources
- Résoudre les conflits de données et aligner les types de données
- Techniques d'agrégation et de consolidation des données
Data Quality Assurance
- Méthodes permettant de garantir la qualité et l'intégrité des données tout au long du processus
- Mise en œuvre de contrôles de qualité et de procédures de validation
- Études de cas et applications pratiques de l'assurance qualité des données
Réduction de la dimensionnalité et sélection des caractéristiques
- Comprendre la nécessité de la réduction de la dimensionnalité
- Techniques telles que l'ACP, la sélection des caractéristiques et les stratégies de réduction
- Mettre en œuvre des techniques de réduction de la dimensionnalité
Résumé et prochaines étapes
Pré requis
-
Compréhension de base des concepts de données
Audience
-
Analystes de données
[Administrateurs
Professionnels de l'informatique
Nos clients témoignent (4)
La capacité à s'engager sur une base individuelle et à s'assurer que je comprenais bien les concepts abordés.
Dave - Sea
Formation - Data Architecture Fundamentals
Traduction automatique
Avoir déjà le code des exercices, cela permet de mieux se concentrer sur les points importants à comprendre et retenir, en étant disponible pour poser les questions.
Carole Roux - INRAE
Formation - EBX5 for Developers
C'est une session pratique.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Formation - Talend Open Studio for ESB
Traduction automatique
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Formation - GDPR Workshop
Traduction automatique