Data / IA

Formation

Data Engineer

Vous souhaitez devenir Data Engineer ?
Formez vous avec Simplon pour accéder à ce métier phare de la data et booster votre carrière dans la Tech.
Formation de 3 mois à temps plein, plus 18 mois en alternance.

Candidater
Télécharger le programme

Découvrez en détail notre formation

Data Engineer

Retrouvez dans notre brochure tout ce qu’il faut savoir sur la formation : débouchés métiers, programme de formation, certifications...

Merci d'avoir renseigné le formulaire.
Programme disponible ci-dessous:
Télécharger le programme
Une erreur est survenue, veuillez réessayer ultérieurement

Titre professionnel  Bac +5

21 mois avec alternance

Sur campus ou à distance

100% financée

Un métier attractif
au coeur des enjeux de cybersécurité

Le Data Engineer organise les flux de données lorsqu’une entreprise se sert de grandes quantités de données (Big Data). Son objectif principal est de rendre les données facilement accessibles et prêtes à être analysées. Lorsque l’infrastructure est mise en place, il construit les solutions pour stocker, organiser, accéder, agréger, protéger et analyser les données. La sécurité des données est pour lui une préoccupation constante.

Ses activités principales :
- Piloter la conduite d’un projet data
- Réaliser la collecte, le stockage et la mise à disposition des données d’un projet data
- Élaborer et maintenir un entrepôt de données (data warehouse)
- Encadrer la collecte massive des données et leur organisation (data lake)

Le programme de formation
fondé sur la pédagogie Simplon

Introduction à la formation

Durant les premières semaines, découvrez les grandes lignes de votre futur métier, expérimentez la pédagogie active de Simplon et faites connaissance avec votre promotion. Très vite, vous aurez une vision claire des compétences à acquérir et des critères sur lesquels vous serez évalué pour l'obtention de la certification finale.

Durant la formation, vous appréhendez des langages de programmation comme Python, Java ou Scala, ainsi que les outils Big Data tels que Hadoop, Spark et SQL. Vous acquerrez également des connaissances en architecture distribuée et en  cloud computing.

Phase 1

Vous intervenez sur des bases de données
et les faites évoluer

Vous créez et manipulez des bases de données répondant à un besoin métier simple.
Notamment :

Vous participez à la gestion d’un projet data répondant à un besoin formalisé

Vous contribuez à la conception et à la création de bases de données

Vous êtes impliqué dans l’ingestion automatique de données dans les bases de données 

Phase 2

Vous faites évoluer un data warehouse

Vous intervenez au niveau de l’entrepôt de données de l’entreprise avec une démarche d’automatisation et de standardisation des traitements de données. Par exemple :

Vous prenez connaissance des schémas des structures de données en faits et dimensions du data warehouse

Vous testez le bon fonctionnement de l’entrepôt de données en environnement de développement/test

Vous intégrez de nouvelles sources de données en adaptant les scripts d'extraction, transformation et chargement de données déjà en place

Phase 3

Vous faites évoluer un data lake

Vous intervenez au niveau du data lake, où sont stockées les données brutes de l’entreprise.
Par exemple :

Vous adaptez les procédures de collecte automatique de données

Vous intervenez sur les outils de catalogage de données

Vous paramétrez les droits d’accès

Phase 4

Vous mettez en place des bases de données accessibles aux équipes d’analyse

À l’échelle d’un projet data, vous réalisez une base de données répondant à un besoin métier. 
Par exemple : 

Vous identifiez les données sources pertinentes à partir de la documentation disponible

Vous concevez une base de données cible

Vous automatisez l’import des données depuis des sources variées

Vous développez des points de terminaison d’API et des règles d’autorisation associées

Phase 5

Vous créez un data warehouse

Vous réalisez un entrepôt de données permettant de servir les différents usages data au sein de l’entreprise. Par exemple :

Vous cartographiez les données collectées par l’entreprise

Vous structurez l’entrepôt de données selon les cas d’usage recensés 

Vous sélectionnez les outils de stockage et d’import pour l’entrepôt de données

Vous maintenez en condition opérationnelle les composants techniques de l’entrepôt de données

Phase 6

Vous créez un data lake

Vous mettez en place l’architecture, l’infrastructure, la structuration et la gouvernance d’un data lake.
Par exemple :

Vous concevez l'architecture du data lake

Vous intégrez les différents composants d'infrastructure du datalake 

Vous mettez en place un catalogue de données

Vous implémentez des règles de gouvernance des données

Phase 7

Vous menez des missions d’étude, de conseil et d’intégration en systèmes de stockage et big data 

Vous pilotez un projet data. Par exemple :

Vous analysez une expression de besoin pour un projet data

Vous réalisez une veille technique et réglementaire

Vous communiquez tout au long de la réalisation du projet data

Phase 8

Vous préparez et passez votre titre professionnel

Pour attester de votre maîtrise de l’ensemble des compétences visées par le titre professionnel,
vous réalisez un projet que vous présentez devant un jury de professionnels.

Les pré-requis et conditions
pour nous rejoindre

Vous devez être titulaire d’un titre ou d’un diplôme de niveau Bac +3 en informatique (développement, data, gestion de base de données ou d’infrastructure). Si vous ne remplissez pas cette condition, votre dossier de candidature pourra être néanmoins examiné en vue d’une admission exceptionnelle.

Votre état d’esprit

Une très forte motivation, à démontrer lors de la candidature

Curieux et créatif, avec un bonne capacité d’expression à l’oral
et à l’écrit

Prêt à travailler en équipe et à collaborer autour de projets

La volonté de vous investir dans la durée dans un parcours de formation intense

Votre niveau de maîtrise technique

Cette formation s’adresse en priorité à des personnes disposant, par le diplôme ou l’expérience professionnelle de compétences en gestion de projet : identification des besoins, rédaction technique, suivi du planning, liaison client-équipes

De compétences techniques telles que installation et gestion de services, programmation de scripts d'automatisation sous Linux, conception de bases de données, maîtrise de SQL et manipulation de données pour qualification, programmation (PHP, Python, Java)

D’une maîtrise de l’anglais technique

Handicap

Si vous êtes en situation de handicap, il est possible de mettre en place des aménagements.

Les étapes pour candidater

01
Prise de contact

Vous êtes intéressé par une session de formation ? Renseignez le formulaire de candidature

02
Dossier de candidature

Complétez soigneusement le dossier de candidature que vous recevrez par mail. Celui-ci peut inclure une phase d’auto-apprentissage ou la réalisation d’un mini-projet.

03
Sélection

Participez aux entretiens de sélection.

04
Recherche d'entreprise

Pour une formation en alternance, nous pouvons vous accompagner dans votre recherche d'entreprise.

05
Début de la formation

Rentrez en formation !

Visez un titre à finalité professionnelle

RNCP 37638

Expert en infrastructures de données massives

Titre professionnel

Les compétences que vous allez développer

Piloter la conduite d’un projet data au sein d’une organisation

Analyser l’expression d’un besoin de projet data dans une étude de faisabilité en explorant, à l’aune des enjeux stratégiques de l’organisation, le besoin métier avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques du projet avec le ou les commanditaire(s).

Cartographier les données disponibles en référençant les usages, les sources, les métadonnées et les données afin de valider les hypothèses techniques du projet data.

Concevoir un cadre technique d’exploitation des données en analysant les contraintes techniques, de moyens et la cartographie des données afin de définir une réponse technique adaptée aux ressources mobilisables dans le respect du RGPD et d’une démarche éco-responsable.

Réaliser une veille technique et réglementaire en sélectionnant des sources et en collectant et traitant les informations collectées afin de formuler des recommandations projet toujours en phase avec l’état de l’art.

Superviser la réalisation d’un projet data en organisant les méthodes, les outils de travail et la communication entre les parties prenantes, afin d’accompagner les membres de l’équipe dans la réussite du projet.

Communiquer tout au long de la réalisation du projet data sur les orientations, les réalisations et leurs impacts en élaborant la stratégie et les supports de communication afin d’informer toutes les parties prenantes des évolutions ou des opportunités internes comme externes, portés par le projet.

Réaliser la collecte, le stockage et la mise à disposition des données d’un projet data au sein d’une organisation

Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet.

Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet.

Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final.

Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet.

Partager le jeu de données en configurant des interfaces logicielles et en créant des interfaces programmables afin de mettre à disposition le jeu de données pour le développement du projet.

Élaborer et maintenir un entrepôt de données (data warehouse)

Modéliser la structure des données d’un entrepôt de données en s’appuyant sur les dimensions et les faits afin d’optimiser l’organisation des données pour les requêtes analytiques.

Créer un entrepôt de données à partir des paramètres du projet, des contraintes techniques et matérielles et de la modélisation de la structure des données afin de soutenir l’analyse de l’activité et l’aide à la décision stratégique de l’organisation.

Intégrer les ETL nécessaires en entrée et en sortie d’un entrepôt de données afin de garantir la qualité et le bon formatage des données en respectant les modélisations logiques et physiques préalablement établies.

Gérer l’entrepôt de données à l’aide des outils d’administration et de supervision dans le respect du RGPD, afin de garantir les bons accès, l’intégration des évolutions structurelles et son maintien en condition opérationnelle dans le temps.

Implémenter des variations dans les dimensions de l’entrepôt de données en appliquant la méthode adaptée en fonction du type de changement demandé afin d’historiser les évolutions de l’activité de l’organisation et maintenir ainsi une bonne capacité d’analyse.

Encadrer la collecte massive et la mise à disposition des données issues de l’activité de l’organisation grâce à un data lake

Concevoir l'architecture du data lake en sélectionnant les technologies appropriées en fonction de la volumétrie, de la variété et de la vitesse des données dans le but de définir l’architecture technique optimale à intégrer.

Intégrer les différents composants d'infrastructure du data lake en appliquant la procédure adaptée, afin d’assurer l’acquisition, le stockage et la mise à disposition du catalogue de données

Gérer le catalogue des données en tenant compte de leur nature, de leurs sources d’alimentation et de leur cycle de vie, dans le respect du RGPD, afin de garantir les fonctionnalités du service.

Implémenter les règles de gouvernance des données en sécurisant la recherche, la récupération et l’ajout de données afin de respecter les règles de gouvernance des données de l’organisation, dans le cadre du déploiement de la politique de protection des données.

Rejoignez une prochaine session

Prêt à vous lancer ? Voici un aperçu des sessions ouvertes à la candidature.

Une formation de la filière DATA & IA

Avec Simplon, construisez un parcours de formation qui répond à vos objectifs.

Ils ont choisi Simplon

Découvrez le témoignage de nos alumni qui ont lancé leur carrière dans la tech avec Simplon.

Avec de la volonté, on peut tout apprendre. J’aimerais que mon expérience puisse être une porte ouverte aux personnes qui n’osent pas.
Fatisa
Découverte Numérique
Avant Simplon, je n’avais pas d’idée de ce que je voulais faire. Aujourd'hui, je suis beaucoup plus sereine, j’ai enfin trouvé un domaine dans lequel je pourrai évoluer.
Julie
Développeuse Web
En tant que femme et maman, vous avez votre place dans le numérique. Simplon est une chance de changer de vie, alors foncez !
Lylla
Administratrice Cloud

Tout pour réussir

Nos formations sont accessibles à toutes et tous, le plus souvent sans pré-requis de diplôme et intégralement financées, pour que votre motivation soit le principal levier de réussite. Avec Simplon, vous avez toutes les clés pour vous permettre d’évoluer.

Des formations qui ciblent des compétences recherchées par les entreprises sur des métiers Tech porteurs

Une pédagogie active qui vous prépare au monde professionnel avec des mises en situation concrètes et des projets réalisés en équipe

Des compétences validées par des titres professionnels et des certifications reconnus par France Compétences

Un accompagnement personnalisé pour valoriser votre profil et donner un nouvel à votre carrière

Participez à un prochain évènement Simplon

Vous avez un projet de votre formation ? Rencontrez nos équipes pour en savoir plus sur les formations proposées par Simplon.

Des questions ?

Retrouvez ci-dessous les questions-réponses les plus fréquentes sur la formation.

Puis-je suivre plusieurs formations chez Simplon ?

Notre offre de formation est conçue dans une logique de parcours de formation. Les formations Découverte sont des portes d’entrée vers des formations professionnalisantes plus longues. A l’issue d’une formation, des suites de parcours vous permettent d’accéder à une certification de niveau supérieur ou de vous spécialiser. Vous pouvez également revenir après quelques années d’expérience professionnelle pour suivre une nouvelle formation chez Simplon.

Quelle est la durée d’une formation ?

Nos formations aux métiers du numérique, qu’elles soient à temps plein ou en alternance, se déroulent en général sur une durée de 3 à 18 mois. En amont, les formations Découverte de quelques semaines vous permettent de vous initier à un domaine et de confirmer votre projet professionnel avant de vous engager dans une formation plus longue.

Quelles sont les formations proposées par Simplon ?

Nos formations sont conçues pour être en phase avec les besoins des entreprises et vous aider à développer les compétences recherchées. Nous proposons des formations de Découverte du numérique et des formations professionnalisantes du niveau Bac au niveau Bac+5 en sortie. Quels que soient votre niveau de compétence actuel ou vos objectifs professionnels, n’hésitez pas à nous contacter pour que nous vous orientions vers la formation adaptée à votre profil.

Combien coûte une formation chez Simplon ?

Le coût horaire des formations incluant le passage de certifications, varie de 12 euros à 27 euros de l'heure (hors majoration ou modulation liée à un dispositif spécifique). Sous réserve d’éligibilité, selon votre profil, les formations sont intégralement financées en mobilisant les dispositifs de la formation professionnelle, sans aucun reste à charge pour vous.

Les formations sont-elles accessibles aux personnes en situation de handicap ?

Les formations Simplon sont ouvertes à toutes et tous, inclusives et adaptées aux personnes en situation de handicap. En fonction de vos besoins, vous pourrez bénéficier d'aménagements spécifiques : temps de pause adaptés, journées de télétravail ponctuelles, siège ergonomique… Le mieux est de nous en faire part dès la phase de candidature afin que nous puissions vous proposer une solution personnalisée.

Comment puis-je savoir quelle formation me conviendrait ?

Si vous envisagez une formation aux métiers de la tech, sans avoir encore de projet professionnel précis, nous vous encourageons à vous renseigner par vous-même en faisant des recherches sur le web ou en participant à des événements (conférences, masterclass, rencontres avec des professionnels). La capacité à être autonome et actif est une qualité que nous apprécions chez Simplon. Prenez également en compte votre disponibilité : au quotidien, nos formations impliquent 35 heures de présence par semaine, avec en plus un travail autonome sur des projets qui peut représenter quelques heures par semaine. dans la durée, nos parcours de formation impliquent un engagement de votre part de quelques semaines à 12 ou 18 mois.

Je souhaite en savoir plus sur les formations Simplon avant de candidater. Comment faire ?

Nous organisons différents événements où vous serez les bienvenus : réunions d'information en ligne, Journées Portes Ouvertes, ateliers d’initiation au code. C’est l’occasion de vous informer, de préciser votre projet de formation et de bénéficier de nos conseils pour vous orienter.

Vous souhaitez en savoir plus ?

Venez rencontrer nos équipes lors d’un prochain événement