Plan du cours
Introduction
- Bases de données et bibliothèques graphiques
Comprendre les données graphiques
- Le graphe en tant que structure de données
- Utiliser les sommets (points) et les arêtes (lignes) pour modéliser des scénarios du monde réel
Utilisation des graphes Database pour modéliser, persister et traiter les données graphiques
- Algorithmes/traversées de graphes locaux
- neo4j, OrientDB et Titan
Exercice : Modélisation de données graphiques avec neo4j
- Modélisation de données sur tableau blanc
Au-delà des graphes Databases : Graph Computing
- Comprendre le graphe de propriétés
- Graphique modélisant différents scénarios (graphe logiciel, graphe de discussion, graphe de concept)
Résoudre des problèmes concrets à l'aide de trajets
- Traversée algorithmique/dirigée du graphe
- Déterminer les dépendances circulaires
Étude de cas : Classement des contributeurs aux discussions
- Classement en fonction du nombre et de la profondeur des contributions aux discussions
- Note sur l'analyse des sentiments et des concepts
Graph Computing : Boîtes à outils locales et en mémoire pour les graphes
- Analyse et visualisation de graphes
- JUNG, NetworkX et iGraph
Exercice : Modélisation de données graphiques avec NetworkX
- Utilisation de NetworkX pour modéliser un système complexe
Graph Computing : Cadres de traitement par lots des graphes
- Exploiter Hadoop pour le stockage (HDFS) et le traitement (MapReduce)
- Aperçu des algorithmes itératifs
- Hama, Giraph et GraphLab
Graph Computing : Calcul parallèle de graphes
- Unification de l'ETL, de l'analyse exploratoire et du calcul itératif de graphes au sein d'un système unique
- GraphX
Configuration et installation
- Hadoop et Spark
GraphX Opérateurs
- Propriété, structure, jointure, agrégation de voisinage, mise en cache et décachetage
Itérer avec l'API Pregel
- Passer des arguments pour l'envoi, la réception et le calcul
Construction d'un graphe
- Utilisation des sommets et des arêtes dans un RDD ou sur disque
Conception d'algorithmes Scalable
- Optimisation GraphX
[Algorithmes supplémentaires
- PageRank, composantes connectées, comptage de triangles
Exercices : Page Rank et Top Users
- Construction et traitement de données graphiques à l'aide de fichiers texte en entrée
Déploiement en production
Remarques finales
Pré requis
- Une compréhension de la programmation et des cadres Java.
- Une compréhension générale de Python est utile mais n'est pas nécessaire
- Une compréhension générale des concepts de base de données
Public
- Développeurs
Nos clients témoignent (2)
Very nice training
Maira Frisch - Novartis Pharma AG
Formation - SPARQL
He was interactive.