Plan du cours

Introduction aux petits modèles linguistiques (SLM)

  • Vue d'ensemble des modèles de langage
  • Évolution des grands modèles de langue vers les petits modèles de langue
  • Architecture et conception des SLM
  • Avantages et limites des SLM

Fondements techniques

  • Comprendre les réseaux neuronaux et les paramètres
  • Processus de formation pour les SLM
  • Exigences en matière de données et optimisation des modèles
  • Mesures d'évaluation des modèles linguistiques

Les SLM dans le traitement du langage naturel

  • Génération de texte avec les SLM
  • Traduction et localisation des langues
  • Analyse des sentiments et classification des textes
  • Réponse aux questions et chatbots

Applications des SLM dans le monde réel

  • Applications mobiles : Traitement linguistique sur l'appareil
  • Systèmes embarqués : SLMs dans les appareils IoT
  • IA préservant la vie privée : traitement local des données
  • Informatique en périphérie : SLM dans les environnements à faible latence

Études de cas

  • Analyse des déploiements réussis de SLM
  • Applications spécifiques à l'industrie (soins de santé, Finance, etc.)
  • Étude comparative : SLMs vs. grands modèles en production

Orientations futures

  • Tendances de la recherche sur les SLM
  • Défis liés à la mise à l'échelle et au déploiement
  • Considérations éthiques et IA responsable
  • La voie à suivre : Les SLM de la prochaine génération

Ateliers pratiques

  • Construire un SLM simple pour la génération de texte
  • Intégration des SLM dans les applications mobiles
  • Affiner les SLM pour des tâches spécifiques
  • Analyse des performances et interprétabilité des modèles

Projet phare

  • Identification d'un espace de problème pour l'application des SLM
  • Conception et mise en œuvre d'une solution SLM
  • Test et itération du modèle
  • Présentation du projet et des résultats

Résumé et prochaines étapes

Pré requis

  • Compréhension de base des concepts d'apprentissage automatique
  • Familiarité avec la programmation Python.
  • Connaissance des réseaux neuronaux et de l'apprentissage profond

Audience

  • Scientifiques des données
  • Développeurs de logiciels
  • Passionnés d'IA
 14 Heures

Nombre de participants


Prix ​​par Participant

Cours à venir

Catégories Similaires