IFGPE > Data Mining et Machine Learning
Formation People Cert

Data Mining et Machine Learning
Formation non certifiante

Objectifs

  • Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage?
  • Savoir transformer un gros volumes de données à priori hétérogène en information utile
  • Maîtriser l’utilisation d’algorithmes d’auto-apprentissage adaptés à une solution d’analyse
  • Comprendre comment exploiter de gros volumes de données textuelles
  • Être capable d’appliquer ces différentes techniques aux projets Big Data

Participants

  • Ingénieurs, analystes, responsables marketing
  • Data Analysts, Data Scientists, Data Steward
  • Toute personne intéressée par les techniques de Data Mining et de Learning Machine

Déroulement

  • L’accueil au centre en salle dédiée 15 minutes avant le début de la formation, petits déjeuners, boissons, pauses gourmandes
  • Présentation du formateur et des participants
  • Le support de cours format papier personnalisé
  • La formation par un formateur expert
  • La préparation intensive à l’examen de certification
  • Le passage de la certification
  • L’envoi des résultats par e-mail puis certificat officiel envoyé par courriel
  • Les déjeuners complets
  • Formation en français

Programme

Introduction
  • Data Mining vs Big Data
  • Data Mining vs Machine Learning vs Deep Learning
  • Apprentissage supervisé vs Apprentissage non supervisé et méta-apprentissage
Ingénierie de la décision
  • Analyse procédurale hiérarchique
  • Problème d’association stable (algorithme de Lloy Shaply)
  • Chaîne de Markov discrète (DTMC)
  • Jeu d’entraînement et jeu de test
Sélection d’instances
  • Échantillonnage balancé
  • Échantillonnage stratifié (probabilité non égales)
Data Mining (fouille de données)
  • Analyse en composantes principales
  • Analyse d’affinité
  • Agglomération hiérarchique et dendrogrammes
  • Bagging de dendrogrammes (bootstrop aggregating)
  • Positionnement multidimensionnel
  • K-means
  • SVM (Support Vector Machines)
Machine Learning
  • Régression logistique binaire
  • GLM
  • One-R (technique de règle unique de regroupement)
  • Regroupement ID-3
  • Liste de décision
  • Regroupement par régression d’arbres (CRT)
  • Arbres aléatoires (CRT bootstrap)
  • K plus proches voisins (K-NN)
  • Classification bayésienne naïve
  • Détections automatiques d’interactions par le chi-2 (CHAID)
  • Analyse discriminante linéaire et quadratique (LDA/QDA)
  • Réseaux de neurones
Text Mining
  • Analyse statistique de corpus
  • Détection automatique de langues
  • Noms/Prénoms et détection automatique de genres
  • Nuage de mots
  • Table de contingence de mots
  • Matrice d’adjacence de mots dans un corpus
  • Exploration dynamique d’un graphe connexe de mots
  • Analyse de sentiments
  • Analyse Sémantique Latente (LSA)
Big Data
  • Gestion de gros volumes de données
Les plus de cette formation
  • Une formation très pratique : 90% du temps de la formation est dédié à la mise en pratique pour une meilleure assimilation de notions de base.
  • Cette formation est basée sur des exercices principalement proposés par le formateur et tirés de l’ouvrage qui sert de support pour la formation
  • Les travaux pratiques sont principalement réalisés avec R et Pyhton
  • Des consultants expérimentés partagent leur savoir-faire avec les participants.
  • ifg-bi105
  • 2 jours
  • 1190
 
  • Dates d'inscriptionCentre Paris

  • 01 42 60 10 55
  • contact@ifgpe.fr

Parlez en autour de vous

Le retour des formés