Hadoop – Développer des applications pour le Big Data

Vous trouverez ci-dessous le programme détaillé de la formation « Hadoop – Développer des applications pour le Big Data ». Cette formation de 5 jours vous permettra de comprendre, concevoir et développer une application pour le Big Data.

En résumé

Catégorie :
Technologie
Durée :
5 jours (35h)
Ref :
B-D-HD V1.1 du 30/07/2024
Prix :
3125€ HT
Publics :
Analyste / Data Scientist, Développeur
Pré-requis :

Être à l’aise avec l’un de ces langages : Scala, Python ou Java

Connaissance des lignes de commande.

La connaissance de SQL est un plus.

Prochaines sessions :
7/4/2025

Programme de la formation

Objectifs pédagogiques

  • Comprendre les fondamentaux du Big Data
  • Comprendre les problématiques liées au Big Data
  • Identifier les outils Hadoop appropriés à chaque usage
  • Maîtriser les principaux outils Hadoop et autres frameworks Big Data
  • Mettre en place des traitements de Machine Learning et de visualisation

Programme détaillé

Présentation de l’écosystème Big Data

  • Comprendre le Big Data
  • Les différentes problématiques du Big Data
  • Les cas d’usages du Big Data

Objectif opérationnel : Comprendre l'écosystème Big Data

Moyen d’évaluation : QCM

Aperçu des technologies Big Data

  • Historique des technologies Big Data
  • Principaux frameworks
  • Classification des outils selon leurs cas d’usage
  • Le Big Data dans le cloud

Objectif opérationnel : Avoir une connaissance de l’ensemble des technologies Big Data

Moyen d’évaluation : QCM

Le Framework Hadoop

  • Introduction à Hadoop
  • Les distributions Hadoop
  • HDFS
  • YARN
  • MapReduce
  • Autres : Hive, Flume, Sqoop, Oozie, etc.

Objectif opérationnel : Maîtriser les outils principaux Hadoop

Moyen d’évaluation : Travaux pratiques

Analyse de données avec Spark

  • Introduction à Spark
  • Architecture générale
  • Programme avec RDD
  • Manipuler les données structurées avec Spark SQL
  • Spark Streaming

Objectif opérationnel : Maîtriser l’analyse de données avec Spark

Moyen d’évaluation : Travaux pratiques

Kafka

  • Introduction à Kafka
  • Architecture générale
  • Écosystème Kafka
  • Programme avec Kafka

Objectif opérationnel : Maîtriser  l’outil Kafka

Moyen d’évaluation : Travaux pratiques

Machine Learning & Visualisation

  • Spark ML
  • Data Viz

Objectif opérationnel : Mettre en place un traitement ML et faire de la DataViz

Moyen d’évaluation : Travaux pratiques

Moyen d'évaluation final : QCM d'évaluation des connaissances

Informations pratiques

  • THÉORIE : 30%
  • PRATIQUE : 70%
  • LIEUX : CENTRE DE NANTES, CLASSE A DISTANCE, DANS VOS LOCAUX


Votre formateur

Consultant, Formateur Architecte SI/Data. Architecte du SI depuis de nombreuses années impliqués dans les problématiques de traitement et valorisation de la Data, passionné d’IA.

Personnes en situation de handicap
Nos formations sont accessibles aux personnes en situation de handicap. Afin de nous permettre d’organiser le déroulement de la formation dans les meilleures conditions possibles, contactez-nous. Un entretien avec notre référent.e handicap pourra être programmé afin d’identifier les besoins et aménagements nécessaires.

Progamme et catalogue peuvent être envoyés sur simple demande

Demander un devis

Dates des prochaines sessions

Session garantie à partir de 2 personnes.

April

Du
7.4.25
au
12.4.25
Centre de Nantes / Classe à Distance / Dans vos locaux