Machine Learning

Machine Learning

Comprendre le processus de Machine Learning et les principaux modèles d'apprentissage


Référence IIA-MACL-F
Durée 5 jour(s)

Pour une session intra ou sur mesure

Demander un devis
Débutant Intelligence artificielle

Le Machine learning est une composante de l’intelligence artificielle à fort potentiel pour les organisations compétitives puisqu’elle offre des nouvelles techniques permettant l’amélioration du processus de prise de décision.

Objectifs pédagogiques

Les objectifs pour un candidat ayant suivi cette formation sont :

  • Comprendre l'intérêt du Machine Learning et ses apports pour l'analyse de données.
  • Savoir transformer un gros volume de données à priori hétérogènes en informations utiles.
  • Maîtriser l'utilisation d'algorithmes d'auto-apprentissage adaptés à une solution d'analyse.
  • Comprendre comment exploiter de gros volumes de données textuelles.
  • Être capable d'appliquer ces différentes techniques aux projets Big Data.

Public concerné

Cette formation s’adresse aux décideurs, statisticiens, data scientists, chargés d’études en charge de l’exploitation des données de l’entreprise.

Prérequis

Connaissances en Python et en mathématique.

Programme de la formation

Introduction

  • Présentation générale. 
  • Comprendre ce qu’est l’«intelligence artificielle», concepts et principes.

Fondamentaux

  • Au-delà du buzz
  • Les évolutions récentes et l'état d'arts de l'IA.
  • Le lien entre Big Data et intelligence artificielle.
  • Potentiel et limites de la discipline.
  • Taxomony: training, inference, algorithme, donnée, incertitude, etc.

Intro au Python

  • Notions de base.
  • Data-types. 
  • Les packages de python pour l'IA.
  • Importation , exportations des fichiers.
  • Jupyter Notebooks.

Exploratory Data Analysis

  • Rappel Statistique. 
  • Analyse exploratoire.
  • Visualisation des données.

Features Engineering

  • Data cleaning. 
  • Traitement des valeurs manquantes et aberrantes.
  • Encodage des données (numérique et catégoriales).
  • Data ReScaling.
  • Data Normalization/Standarization.
  • Data Reduction.
  • Features selection et Features extraction. 
  • Unbalanced Data.

Modélisation

  • Les algorithmes supervisés et non supervisés.
  • Le choix entre la régression et la classification.
  • Les étapes de construction d’un modèle.

Data Preparation

  • Ensemble Train, test, validation. 
  • Introduction à l'échantillonnage (Stratified sampling Vs random sampling ).
  • Process d'apprentissages des modele ML.
  • La validation croisée.

Algorithmes supervisés

  • Regression lineaire.
  • Regression logistique.
  • Naive Bayes.
  • L’arbre de décision.
  • KNN.
  • Random Forest.
  • Xgboost.
  • Overfetting & underfitting.

Algorithmes non supervisés

  • Clustering.
  • K-means.

Procédures d’évaluation de modèles

  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion, de coût et la courbe ROC et AUC.

Recap

  • Restitution du cycle de vie d’un projet en intelligence artificielle.
  • Etude de cas de regressions.
  • Etude de cas de classification.  
  • Etude de cas de clustering. 

Moyens pédagogiques

Mise en situation des participants devant des problèmes concrets.