machine-learning-methodes-et-solutions

MACHINE LEARNING, MÉTHODES ET SOLUTIONS

Evaluation Non disponible (0 Avis)

Description
Le Machine Learning couvre l'ensemble des méthodes et concepts qui permettent d'extraire automatiquement à partir de données, des modèles de prédiction et de prise de décision. Vous mettrez en œuvre toute la chaîne de conception appliquée au Machine Learning dans un contexte Big Data batch et streaming.
Objectif
Comprendre les différents modèles d'apprentissage.
Modéliser un problème pratique sous forme abstraite.
Identifier les méthodes d'apprentissage pertinentes pour résoudre un problème.
Appliquer et évaluer les méthodes identifiées sur un problème.
Faire le lien entre les différentes techniques d'apprentissage.
Prérequis
Connaissances équivalentes à celles apportées par le stage Data Science avec Python/R
Participants
Ingénieurs/chefs de projet souhaitant considérer les techniques d'apprentissage automatique dans la résolution de problèmes industriels.
Programme
Introduction au Machine Learning
-	Le Big Data et le Machine Learning.
-	Les algorithmes d'apprentissage supervisés, non supervisés et par renforcement.
-	Les étapes de construction d'un modèle prédictif.
-	Détecter les valeurs aberrantes et traiter les données manquantes.
-	Comment choisir l'algorithme et les variables de l'algorithme -
Travaux pratiques 
    Prise en main de l'environnement R/Python à l'aide de Jupyter Notebook. Visualiser plusieurs exemples de modèles fournis.
    
Procédures d'évaluation de modèles
-	Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test.
-	Test de représentativité des données d'apprentissage.
-	Les techniques de bootstrap
-	La validation croisée
-	Définition d'une métrique de performance.
-	Mesures de performance des modèles prédictifs.
-	Matrice de confusion, de coût et la courbe ROC et AUC.
Travaux pratiques 
    Evaluation et comparaison des différents algorithmes sur les modèles fournis.
    
Les algorithmes non supervisés
-	Le clustering hiérarchique.
-	Le clustering non hiérarchique.
-	Les approches mixtes.
-	Le clustering par mesure de densité DBSCAN
-	Autres approches du Clustering
Travaux pratiques 
    Traitements de clustering non supervisés sur plusieurs jeux de données.
    
Les algorithmes supervisés régressions
-	Le principe de régression linéaire univariée.
-	La régression multivariée.
-	La régression polynomiale.
-	La régression régularisée. 
Travaux pratiques 
    Mise en œuvre des régressions sur plusieurs types de données.
    
Les algorithmes supervisés classifications
-	Le Naive Bayes.
-	La régression logistique.
-	Les arbres de décision
-	Machines à vecteurs supports et méthodes à noyaux.
-	Quantification vectorielle.
Travaux pratiques 
    Mise en œuvre des classifications sur plusieurs types de données.
    
Les algorithmes ensemblistes
-	L'ensemble de méthodes bagging
-	Ramdom Forest.
-	Les méthodes de Boosting.
-	L'assemblage de plusieurs modèles.
Travaux pratiques 
    Mise en œuvre des analyses avec un assemblage des algorithmes.
    
Concepts fondamentaux d'un réseau de neurones
-	Rappel de bases mathématiques.
-	Le réseau de neurones : architecture, fonctions d'activation et de pondération des activations précédentes.
-	L'apprentissage d'un réseau de neurones : fonctions de coût, back-propagation, stochastic gradient descent.
-	Modélisation d'un réseau de neurones.
-	Data Augmentation : comment équilibrer un dataset
-	Généralisation des résultats d'un réseau de neurones.
-	Initialisations et régularisations d'un réseau de neurones.
-	Optimisations et algorithmes de convergence.
Travaux pratiques 
    Approximation d'une fonction et d'une distribution par un réseau de neurones.
    
Machine Learning en production
-	Le cycle de vie d'un projet de machine Learning.
-	Les spécificités liées au développement d'un modèle en environnement distribué.
-	Les outils du marché pour le traitement de la donnée.
-	Le déploiement Big Data avec Spark et la MLlib.
-	Le Cloud : DataBrics, Dataiku, DataDog, Amazon, Microsoft Azure ML, IBM Watson... 
-	La maintenance du modèle.
Travaux pratiques 
    Mise en production d'un modèle prédictif avec l'intégration dans des processus de batch et dans des flux de traitements.
Complément d'information

Délai d'accès : 10 jours

Méthode mobilisées : En distanciel, vous devez disposer d'un ordinateur avec une connexion Internet. En présentiel, les locaux, dont nous faisons usage, disposent d'ordinateur et de connexion Internet. Dans les deux cas, votre formateurs vous accompagnera en début de formation pour installer les outils dont vous aurez besoin. Le formateur mobilise tous les moyens pédagogiques pour transmettre son savoir : Présentation théorique de concepts, exemple concrets, exercices pratiques, quiz et applications.

Modalités d'évaluation : Exercices, Quiz et Applications.

Accessibilité : Nos formations en distanciel sont accesibles à tous, en utilisant un outil de vidéo conférence. Pour les formations en présentiel, les locaux dont nous faisons usage respectent la norme ERP 5 pour l'accueil des personnes en situation d'handicap .

Horaires de formation : de 9h à 12h et de 14h à 18h.

Adresse d'accueil en présentiel : Village 5 - 50 place de l'Ellipse. 92000 La Défense.

Contact

Contactez-nous
Avis Client

Nous consulter
Title