Objectifs d'apprentissage
Le deep learning a permis des avancées majeures pour des problèmes difficiles tels que des tâches de perception (vision, audition), de traitement de la langue (traduction…). Cette technologie envahit de nombreux champs applicatifs et est intégrée dans des systèmes industriels chez de multiples acteurs y compris les plus grands (Google, Microsoft, Amazon, Facebook, etc).
L’objectif du cours est de former à l’utilisation de toolkits de deep learning et à la conception de systèmes simples basés sur des architectures classiques.
Une partie du cours sera consacrée à l'apprentissage sur des données textuelles. Cette partie se focalise sur les aspects pratiques avec l'utilisation de bibliothèques telles que NLTK, spaCy, GloVe, etc, et l'étude de modèles plus récents (Bert, GPT, Llama, Mistral).
Description du programme
Le cours aborde successivement
- Perceptrons multicouches
- Architectures totalement connectées et autoencodeurs
- Architectures convolutionnelles
- Apprentissage de représentations et embeddings
- Réseaux récurrents, Transformer et mécanismes d’attention
Compétences et connaissances scientifiques et techniques visées dans la discipline
Le but est d’acquérir les connaissances nécessaires à la mise en œuvre de systèmes de deep learning sur des taches et des données classiques ; en classification, reconnaissance et prédiction, sur des images, textes et séries temporelles.
Modalité de contrôle des connaissances
Examen sur machine.
Equipe pédagogique
- Thierry ARTIERES
- Ronan SICRE
- Anne-Laure MEALIER
- Total des heures d'enseignement 30h
- Cours Magistral20h
- Travaux Dirigés10h