Introduction
Dans ce cours vous aurez une introduction à l'Intelligence Artificielle et vous ferez vos premier pas en Machine Learning à l'aide des outils Google Collab et du langage Python.
Cette année, vos enseignants seront Michel Buffa qui assurera les cours magistraux et un groupe de TP, et Rémi Felin, doctorant dans l'équipe de recherche WIMMICS (commune aux laboratoires I3S et INRIA), qui assurera deux groupes de TP. Il fait sa thèse en IA.
L'ensemble des TPs ont été conçus par Melissa Sanabria qui assurait une grande partie de ce cours l'an dernier. Je me réfèrerai parfois à ses supports de cours de l'an dernier.
Repository Github du cours
Séance 1 : Introduction à l'IA (cours magistral par M.Buffa)
- Support de cours (powerpoint, 2.2gb) : tous mes powerpoints. Lors de cette séance on a fait les jeux de transparents 1 et 2.
- A lire : "La revanche des neurones", article de Dominique Cardon, excellente introduction à la révolution récente de l'IA par apprentissage. Raconte dans les quatre premières pages l'anecdote du jeune de 18 ans qui a programmé des algos dans un GPU et qui a amélioré le record de reconnaissance d'objets d'une manière incroyable, provoquant un nouvel engouement pour le Machine Learning.
- A lire aussi pour la culture: "Introduction à l'IA par le GDR IA"
Pas de TP après cette séance...
Séance 2 : le test de Turing, le Machine Learning selon Turing, les systèmes de recommandation / problème de mémoire, KNN
- Support de cours : dans les powerpoints téléchargeables (voir séance 1), on va faire les jeux de slides 3, 4, 5
- Préparation au TP : dans le TP vous allez préparer des jeux de données pour la reconnaissance vocale. Pour identifier les sons, on va calculer dans le TP des sortes d'identificateurs uniques (il y en a 13) caractérisant un fichier audio correspondant à un mot. Ces 13 valeurs calculées s'appellent les MFCC et correspondent à des valeurs caractérisant de manière précise en son (ex: fréquence, timbre, etc.). Un peu comme en reconnaissance des visages on va regarder la forme et l'emplacement des yeux, du nez, de la bouche, des sourcils, pour arriver à caractériser de manière compacte un visage, ici on caractérisera un son avec ses MFCCs.
TP1 : familliarisation avec Google Collab, préparation des jeux de données (entrainement, test et validation)
Objectif :
- ASR - Automatic Speech Recognition ou "Reconnaissance automatique de la parole"
- On va détecter quand des mots différents sont prononcés
Jeu de données :
- Jeu de données = extrait des commandes vocales de Google Assistant
- Il s'agit de 65.000 énoncés d'une seconde, composés de 30 mots courts, prononcés par des milliers de personnes différentes.
- On va essayer de détecter, à partir de fichiers audio correspondants à des mots parlés, de deviner / prédire de quel mot il s'agit
Travail à faire :
- Clonez le repository github du cours, et faites-en une copie pour travailler dessus.
- Importez dans votre Google Drive le fichier TD1.ipynb et ouvrez-le ensuite avec Google Collaboratory
- Suivez les instructions....
Séance 3 : régression et classification non linéaire, jeux de données d'entrainement et de test, réseau de neurones
- Support de cours : dans les powerpoints téléchargeables (voir séance 1), on va faire les jeux de slides 6, 7 et 8
TP2 :
- Dans le repository github du coursrécupérez et importez dans votre Google Drive le fichier TD2.ipynb et ouvrez-le ensuite avec Google Collaboratory
- Suivez les instructions....
Séance 4 : fin réseaux de neurones
- Support de cours : voir dans le dossier des slides powerpoint, le jeu No 8 que j'ai mis à jour avec 4 vidéos sous-titrées (on en a vu deux seulement en classe, les autres sont pour les curieux et débordent du cadre de ce cours).
TP3 :
- Dans le repository github du coursrécupérez et importez dans votre Google Drive le fichier TD3.ipynb et ouvrez-le ensuite avec Google Collaboratory
- Suivez les instructions....
TP4 : CNN etc.
- Dans le repository github du coursrécupérez et importez dans votre Google Drive le fichier TD4.ipynb et ouvrez-le ensuite avec Google Collaboratory
- Suivez les instructions....