Plan du cours

Introduction à l'IA multimodale

  • Qu'est-ce que l'IA multimodale ?
  • Principaux défis et applications
  • Aperçu des principaux modèles multimodaux

Traitement du texte et compréhension du langage naturel

  • Exploiter les LLM pour les agents d'IA basés sur le texte
  • Comprendre l'ingénierie des messages pour les tâches multimodales
  • Affiner les modèles de texte pour des applications spécifiques à un domaine

Reconnaissance et génération d'images

  • Traitement d'images avec l'IA : classification, légendes et détection d'objets
  • Génération d'images avec des modèles de diffusion (Stable Diffusion, DALLE)
  • Intégration de données d'images avec des modèles textuels

Traitement de la parole et de l'audio

  • Reconnaissance de la parole avec Whisper ASR
  • Techniques de synthèse de la parole à partir du texte (TTS)
  • Amélioration de l'interaction avec l'utilisateur grâce à l'IA basée sur la voix

Intégration d'entrées multimodales

  • Construction de pipelines d'IA pour le traitement de plusieurs types d'entrées
  • Techniques de fusion pour combiner le texte, l'image et les données vocales
  • Applications réelles d'agents d'IA multimodaux

Déploiement d'agents multimodaux AI Agents

  • Construire des solutions d'IA multimodale pilotées par API
  • Optimisation des modèles pour la performance et l'évolutivité
  • Meilleures pratiques pour le déploiement de l'IA multimodale en production

Considérations éthiques et tendances futures

  • Biais et équité dans l'IA multimodale
  • Préoccupations en matière de protection de la vie privée liées aux données multimodales
  • Développements futurs de l'IA multimodale

Résumé et prochaines étapes

Pré requis

  • Compréhension des principes de l'apprentissage automatique
  • Expérience de la programmation Python.
  • Familiarité avec les cadres d'apprentissage profond (par exemple, TensorFlow, PyTorch)

Public

  • Développeurs d'IA
  • Chercheurs
  • Ingénieurs multimédia
 21 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires