Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction au LLM DeepSeek Fine-Tuning
- Aperçu des modèles DeepSeek, par exemple DeepSeek-R1 et DeepSeek-V3
- Comprendre la nécessité d'un réglage fin des LLM
- Comparaison entre le réglage fin et l'ingénierie rapide
Préparation de l'ensemble de données pour Fine-Tuning
- Conserver des ensembles de données spécifiques à un domaine
- Techniques de prétraitement et de nettoyage des données
- Tokenisation et formatage des données pour le DeepSeek LLM
Configuration de l'environnement Fine-Tuning
- Configuration de l'accélération GPU et de la TPU
- Configuration des transformateurs Hugging Face avec DeepSeek LLM
- Comprendre les hyperparamètres pour un réglage fin
Fine-Tuning DeepSeek LLM
- Implémentation du réglage fin supervisé
- Utilisation de LoRA (Low-Rank Adaptation) et PEFT (Parameter-Efficient Fine-Tuning)
- Exécution d'un réglage fin distribué pour des ensembles de données à grande échelle
Évaluation et optimisation des modèles finement ajustés
- Évaluer les performances du modèle à l'aide de mesures d'évaluation
- Gestion du surajustement et du sous-ajustement
- Optimisation de la vitesse d'inférence et de l'efficacité du modèle
Déploiement de modèles finement ajustés DeepSeek (en anglais)
- Emballage des modèles pour le déploiement de l'API
- Intégration de modèles affinés dans les applications
- Mise à l'échelle des déploiements avec l'informatique en nuage et en périphérie
Use Case et applications dans le monde réel
- LLM affinés pour la finance, les soins de santé et l'assistance à la clientèle
- Études de cas d'applications industrielles
- Considérations éthiques dans les modèles d'IA spécifiques à un domaine
Résumé et prochaines étapes
Pré requis
- Expérience de l'apprentissage automatique et des cadres d'apprentissage profond
- Familiarité avec les transformateurs et les grands modèles de langage (LLM)
- Compréhension des techniques de prétraitement des données et d'entraînement des modèles.
Audience
- Chercheurs en IA explorant le réglage fin des LLM
- Ingénieurs en apprentissage automatique développant des modèles d'IA personnalisés
- Développeurs avancés mettant en œuvre des solutions basées sur l'IA
21 Heures