Cloudera - CCP Data Engineer

Looptijd

Looptijd:

Slechts 3 dagen

Methode

Methode:

Klas / Online / Hybride

Volgende datum

Volgende datum:

24/6/2024 (Maandag)

Overview

Learn how to build big data applications to solve real-world problems using Apache Hadoop and associated tools, in just 3-days.

On this accelerated CCP Data Engineer course, you’ll get the knowledge to build and design solutions that can ingest data, determine the appropriate file format for storage, process stored data, and present the results to the end-user. 

You’ll be immersed in your accelerated course with Firebrand’s Lecture | Lab | Review methodology. Get CCP Data Engineer certified - in just 3 days - and join an elite group of data engineers. You’ll also learn how to:

  • Convert data between file formats
  • Purge bad data
  • Filter, sort, join, aggregate and transform complex data sets
  • Create linear and branching workflows that include Hadoop/Hive/Pig jobs

You’ll follow the curriculum for Cloudera’s Designing and Building Big Data Applications course. This includes additional Firebrand material to prepare you for the CCP Data Engineer exam (DE575), which you’ll take as part of your accelerated course. This exam is covered by your Certification Guarantee.

Zeven redenen waarom u met uw CCP Data Engineer cursus voor Firebrand Training moet kiezen

  1. U zult in slechts 3 dagen CCP Data Engineer gecertificeerd zijn. Met ons bent u in recordtijd CCP Data Engineer getraind
  2. Onze CCP Data Engineer cursus is all-inclusive. Een eenmalige contributie bekostigt alle cursusmaterialen, accommodaties en maaltijden.
  3. Slaag de eerste keer voor CCP Data Engineer of volg de training nogmaals. Dit is onze garantie. Wij zijn er zeker van dat u de eerste keer zult slagen voor uw CCP Data Engineer cursus. Mocht dit niet het geval zijn, dan kunt u binnen het jaar terugkomen en enkel voor de accommodatie en examens te betalen. De rest is gratis
  4. U zult meer CCP Data Engineer leren. Een dag met een traditionele training aanbieder duurt over het algemeen van 9 uur 's ochtends tot 17 uur in de middag, met een lange lunchpauze. Met Firebrand Training kunt u rekenen op minstens 12 uur leren per dag met uw instructeur
  5. U zult CCP Data Engineer snellerde theorie beheersen. De kans bestaat dat u een andere manier van leren heeft dan uw omgeving. Wij combineren visuele, auditieve en tastbare leerstijlen, dit zorgt voor een snellere en eenvoudigere manier van leren
  6. U zult CCP Data Engineer studeren met de beste. We hebben het Q-For kwaliteit label, dat onze standaarden en professionaliteit in de training markt erkent. Naast het winnen van nog vele andere prijzen, hebben we inmiddels 134561 professionals getraind en gecertificeerd en we zijn partners met alle grote namen in deze tak van het bedrijfsleven
  7. U zult meer doen dan alleen CCP Data Engineer de cursusstof bestuderen. We maken gebruik van laboratoria, case-studies en oefentests, om ervoor te zorgen dat u uw nieuwe kennis in uw werkomgeving kan toepassen. Onze instructeurs gebruiken demonstraties en hun eigen ervaringen om de dag interessant en boeiend te houden

Benefits

Curriculum

Introduction

Application architecture

  • Scenario explanation
  • Understanding development

Environment

  • Identifying and collecting input data
  • Selecting tools for data processing and analysis
  • Presenting results to the user

Defining and using data sets

  • Metadata management
  • What is Apache Avro?
  • Avro schemas
  • Avro schema evolution
  • Selecting a file format
  • Performance considerations

Using the Kite SDK data module

  • What is the Kite SDK?
  • Fundamental data module concepts
  • Creating new data sets using the Kite SDK
  • Loading, accessing and deleting a data set

Importing relational data with Apache Sqoop

  • What is Apache Sqoop?
  • Basic imports
  • Limiting results
  • Improving Sqoop’s performance
  • Sqoop 2

Capturing data with Apache Flume

  • What is Apache Flume?
  • Basic Flume architecture
  • Flume sources
  • Flume sinks
  • Flume configuration
  • Logging application events to Hadoop

Developing custom Flume components

  • Flume data flow and common extension points
  • Custom Flume sources
  • Developing a flume pollable source
  • Developing a Flume event-driven source
  • Custom Flume interceptors
  • Developing a header-modifying Flume interceptor
  • Developing a filtering flume interceptor
  • Writing Avro objects with a custom Flume interceptor

Managing workflows with Apache Oozie

  • The need for workflow management
  • What is Apache Oozie?
  • Defining an Oozie workflow
  • Validation, packaging and deployment
  • Running and tracking workflows using the CLI
  • Hue UI for Oozie

Processing data pipelines with Apache Crunch

  • What is Apache Crunch?
  • Understanding the runch Pipeline
  • Comparing Crunch to Java MapReduce
  • Working with Crunch Projects
  • Reading and writing Data in Crunch
  • Data collection API
  • Functions
  • Utility classes in the Crunch API

Working with tables in Apache Hive

  • What is Apache Hive?
  • Accessing Hive
  • Basic query syntax
  • Creating and populating Hive Tables
  • How Hive reads data
  • Using the RegexSerDe in Hive

Developing user-defined functions

  • What are user-defined functions?
  • Implementing a user-defined function
  • Deploying custom libraries in hive
  • Registering a user-defined function in Hive

Executing interactive queries with Impala

  • What is Impala?
  • Comparing Hive to Impala
  • Running queries in Impala
  • Support for user-defined functions
  • Data and metadata management

Understanding Cloudera Search

  • What is Cloudera Search?
  • Search architecture
  • Supported document formats

Indexing data with Cloudera Search

  • Collection and schema management
  • Morphlines
  • Indexing data in batch mode
  • Indexing data in near real time

Presenting results to users

  • Solr query syntax
  • Building a search UI with Hue
  • Accessing Impala through JDBC
  • Powering a custom web application with Impala and Search

Exam Track

You'll sit the following exam at the Firebrand Training Centre, covered by your Certification Guarantee:

  • CCP Data Engineer Exam (DE575)

You will be provided with five to eight customer problems, each with a large, unique data set and a CDH cluster. You will then have four hours in which to implement a technical solution to each problem that meets all functional requirements.

Additional information:

  • This is a hands-on practical exam using Cloudera technologies
  • You’ll get your own pre-loaded CDH cluster that includes:
    • Spark
    • Impala
    • Crunch
    • Hive
    • Pig
    • Sqoop
    • Kafka
    • Flume
    • Kite
    • Hue
    • Oozie
    • DataFu
  • Your CCP certification is valid for three years

What's Included

Prerequisites

You should possess in-depth experience developing data engineer solutions and a high-level working knowledge of data analysis. 

Weet je niet zeker of je aan de vereisten voldoet? Maak je geen zorgen. Jouw trainingsadviseur bespreekt jouw achtergrond met je om te begrijpen of deze cursus geschikt is voor je.

Beoordelingen

Wereldwijd heeft Firebrand in haar 10-jarig bestaan al 134561 studenten opgeleid! We hebben ze allemaal gevraagd onze versnelde opleidingen te evalueren. De laatste keer dat we onze resultaten analyseerden, bleek 96.41% ons te beoordelen als 'boven verwachting'


"De kennis van de trainer en zijn vermogen om deze hoeveelheid stof in 2 dagen over te brengen zijn een groot compliment waard. Kwaliteit van de locatie is uitstekend."
Arie van der Sman, Ventus. (25/3/2024 (Maandag) t/m 27/3/2024 (Woensdag))

"Van het begin tot het einde professionele dienstverlening"
Philip Lebesque. (25/3/2024 (Maandag) t/m 26/3/2024 (Dinsdag))

"Very good training!"
MK. (25/3/2024 (Maandag) t/m 26/3/2024 (Dinsdag))

"Very well structured! I found the course very useful and the instructor explained everything very well"
AN. (19/3/2024 (Dinsdag) t/m 21/3/2024 (Donderdag))

"I loved the pace and involvement of the coach. the course is very intensive but worth the price. the infrastructure and venue is fantastic aswell."
Andreas Vandenberghe, Allianz Technology SE. (18/3/2024 (Maandag) t/m 24/3/2024 (Zondag))

Cursusdata

Start datum

Eind datum

Status

Locatie

Nu boeken

19/2/2024 (Maandag)

21/2/2024 (Woensdag)

Beëindigde cursus - Geef feedback

-

 

24/6/2024 (Maandag)

26/6/2024 (Woensdag)

Wachtlijst

Landelijk

 

5/8/2024 (Maandag)

7/8/2024 (Woensdag)

Beperkte beschikbaarheid

Landelijk

 

16/9/2024 (Maandag)

18/9/2024 (Woensdag)

Open

Landelijk

 

28/10/2024 (Maandag)

30/10/2024 (Woensdag)

Open

Landelijk

 

9/12/2024 (Maandag)

11/12/2024 (Woensdag)

Open

Landelijk

 

Nieuwste beoordelingen van onze studenten