IFGPE > Big Data – Les fondamentaux de l’analyse des données
Formation People Cert

Big Data – Les fondamentaux de l’analyse des données
Formation non certifiante

Objectifs

  • Comprendre le rôle stratégique de la gestion des données pour l’entreprise
  • Identifier ce qu’est la donnée, et en quoi consiste le fait d’assurer la qualité de données
  • Synthétiser le cycle de vie de la donnée
  • Assurer l’alignement des usages métiers avec le cycle de vie de la donnée
  • Découvrir les bonnes pratiques en matière de contrôle de qualité des données
  • Assurer la mise en oeuvre de la gouvernance de la donnée
  • Disposer d’un premier aperçu des possibilités de traitement proposé par MapR et Hadoop

Participants

  • MOA, Chef de projet, Urbaniste fonctionnel, Responsable de domaine, Analystes, Développeurs, Data Miners …
  • Futurs Data Scientists, Data Analysts et Data Stewards

Déroulement

  • L’accueil au centre en salle dédiée 15 minutes avant le début de la formation, petits déjeuners, boissons, pauses gourmandes
  • Présentation du formateur et des participants
  • Le support de cours format papier personnalisé
  • La formation par un formateur expert
  • La préparation intensive à l’examen de certification
  • Le passage de la certification
  • L’envoi des résultats par e-mail puis certificat officiel envoyé par courriel
  • Les déjeuners complets
  • Formation en français

Programme

En Présentiel
Introduction
  • Les origines du Big Data
  • La donnée en tant que matière première
  • La connaissance de la question
  • Big Data, Données, qualité et stratégie d’entreprise
  • Problématiques d’alignement de la qualité de la donnée avec les usages métiers
  • Les différentes sources de données de l’entreprise, de l’Internet, des objets connectés
  • Les différentes formes d’exploitation de données
  • Système d’information opérationnel
  • Système d’information décisionnel
  • Big Data et smart Data
La collecte de données
  • Où et comment collecter des données ?
  • Les sources de données, les API, les fournisseurs, les agrégateurs…
  • Les principaux outils de collecte et de traitement de l’information (ETL)
  • Les particularités de la collecte des données semi-structurées et non-structurées
Le stockage des données
  • Les différentes formes de stockage des données : rappel de l’architecture relationnelle de stockage des données transactionnelles (SGBD/R) et multidimensionnelles (OLAP)
  • Prise en main d’une base de données OLAP
  • Les nouvelles formes de stockage des données – compréhension, positionnement et comparaison : Bases NoSQL, Hadoop, Spark, Bases de données graph…
  • Panorama des bases de données NoSQL
  • Particularités liées au stockage des données non-structurées
  • Comment transformer des données non structurées en données structurées
L’écosystème Hadoop
  • Présentation des principaux modules de la distribution Apache Hadoop
  • Présentation et comparaison des principales distributions commerciales (Cloudera, Hortonworks…)
  • L’infrastructure matérielle et logicielle nécessaire au fonctionnement de Hadoop
  • Serveur local ou cloud
  • Les concepts de base de l’architecture Hadoop: Data Node, Name Node, Job Tracker, Task Tracker
  • Présentation de HDFS (Système de gestion des fichiers de Hadoop)
  • Présentation de MapReduce (Outil de traitement de Hadoop)
  • Les commandes exécutées au travers de PIG
  • Présentation de HIVE pour transformer du SQL en MapReduce
L’analyse de données
  • Comment requêter les données ?
  • Analyser et comprendre la signification des données extraites
  • Particularités liées à l’analyse des données non structurées
  • Analyse prédictive : transformer des données du passé en prévisions pour le futur
  • Calculer des tendances
  • Machine Learning : les bases de l’apprentissage machine
  • Deep Learning : notions de base de l’analyse future automatisée de données non structurées
Transformer les données en décisions
  • Comprendre les besoins et les attentes des utilisateurs business
  • Traduire les demandes des utilisateurs en requêtes
  • Évaluer et vérifier la qualité des données extraites en fonction des résultats obtenus
  • Définir un indice de confiance permettant d’échanger avec les utilisateurs business
Après le Présentiel
Retrouvez sur le Learning Hub ib
  • un vidéocast : L’écosystème Hadoop
  • deux vidéo-tutos : Installation d’un environnement Hadoop de base et Développement d’un premier MapReduce
Les plus de cette formation Big Data
  • Une formation très opérationnelle durant laquelle s’alternent les phases d’apports théoriques, d’échanges, de partage d’expériences.
  • Un panorama exhaustif des outils du Big Data.
  • L’apprentissage par la pratique : les ateliers proposés permettent aux participants d’acquérir une première expérience.
  • Les retours d’expérience et conseils de consultants experts.
  • ifg-bd540
  • 3 jours
  • 1790
 
  • Dates d'inscriptionCentre Paris

  • 01 42 60 10 55
  • contact@ifgpe.fr

Parlez en autour de vous

Le retour des formés