Curso Presencial Big Data con Hadoop y Spark

Características Principales

  • Modalidad A: Presencial en Madrid 
  • Modalidad B: Telepresencial
  • Duración: 30 horas
  • Precio Presencial 580€ IVA Ext
  • Precio Telepresencial 522€ IVA Ext
  • Bonificable para trabajadores y empresas
  • Participantes: A partir de 6 alumnos

 

Descripción del curso:

 

Durante el curso estudiaremos en profundidad las principales funcionalidades de Apache Hadoop y Apache Spark en cuestiones relativas al almacenamiento, intercambio y procesamiento y seguridad de los datos entre otras, a través de numerosas prácticas durante la formación.

Al finalizar el curso, conocerás todos los componentes del ecosistema Hadoop que hoy se utilizan en proyectos Big Data (Hive, HDFS, Pig, etc.), y serás capaz de utilizar Apache Spark para el análisis de datos a gran escala, tanto en modo offline como en tiempo real con Spark Streaming.

Localización flexible

Realizamos cursos en sus instalaciones en Madrid

Horario flexible

Seleccione el calendario tentativo del curso

A partir 6 participantes

Organizamos cursos a medida a partir de seis participantes

Formación bonificable

Culture Lab es entidad organizadora en FUNDAE

 

Convocatorias Presenciales/Telepresenciales:

 

Marzo 2024
  • Mes de inicio:  Marzo de 2024
  • Horarios: Flexible según la empresa solicitante (mañana o tarde)
  • Nº Semanas: 3 semanas
  • Duración: 30 horas lectivas 
  • Modalidad: Presencial o Telepresencial según la necesidad de la empresa solicitante

El curso se realizará en las instalaciones del Centro Melior Azca, en calle Avenida de Brasil 6, 1º Planta, Madrid. Cercano al Metro de Santiago Bernabeu y Cuzco.

(Mapa Google de la localización del centro)

Temario del curso presencial en Big Data con Apache Hadoop y Apache Spark  

 

1. INTRODUCCIÓN A TECNOLOGÍAS BIG DATA, APACHE HADOOP Y APACHE SPARK

  • ¿Qué es Big Data y qué hay de nuevo?
  • Principales tecnologías Big Data.
  • Apache Hadoop: plataforma de almacenamiento y procesamiento de datos.
  • Apache Spark: procesamiento de datos.

2. APACHE HADOOP: CORE.

  • Almacenamiento de datos en Hadoop: HDFS.
  • Gestión de recursos y tareas: YARN.
  • Instalación, administración y monitorización del cluster con Apache Ambari.
  • Seguridad y gobierno de datos.

3. INGESTA Y TRANSFORMACIÓN DE DATOS EN APACHE HADOOP.

  •  Apache Sqoop: intercambio de datos con bases de datos relacionales.
  • Apache Flume y Apache Kafka: ingesta de datos.
  • Apache Pig: transformación de datos en Hadoop.
  • Herramientas ETL: Informatica PowerCenter, Pentaho Kettle.

4. ACCESO Y EXPLOTACIÓN DE DATOS EN APACHE HADOOP.

  • MapReduce: “antiguo” framework de procesamiento de datos.
  • Apache HBase: NoSQL sobre Hadoop.
  • Apache Hive: SQL sobre Hadoop.
  • Otras tecnologías de SQL sobre Hadoop: Cloudera Impala, Apache Drill, Apache Phoenix.
  • Procesamiento de eventos en tiempo real con Apache Storm.

   5.- APACHE SPARK

  • Introducción a Apache Spark. Spark vs MapReduce vs Tez
  • Introducción a Scala.
  • Conceptos básicos, RDDs, transformaciones y acciones.
  • Desarrollo de aplicaciones con Spark.

    6.- SPARK STREAMING

  • Introducción a Spark Streaming
  • Casos de uso. Apache Storm vs Spark Streaming.
  • Desarrollo de aplicaciones realtime con Spark Streaming.
  • Introducción a Spark Streaming
  • Casos de uso. Apache Storm vs Spark Streaming.
  • Desarrollo de aplicaciones realtime con Spark Streaming.

 

 

  • Entenderás el conjunto de tecnologías que dan soporte a Big Data y el posicionamiento de cada una.
  • Conocerás y practicarás con los componentes asociados al ecosistema Hadoop: Hive, HDFS, Pig, etc.
  • Conocerás Apache Spark y serás capaz de desarrollar programas de análisis de datos con esta tecnología.
  • En resumen, estarás preparado para participar en un proyecto Big Data real

Requisitos del curso: 

  • Es necesario disponer de experiencia en programación en torno a objetos tales como Python, Java o similares, así como nociones en bases de datos como SQL o similares.

Requisitos técnicos: 

  • El alumno tendrá que llevar su portátil durante la formación. (Culture Lab dispone de 5 equipos a disposición de los alumnos que no dispongan de portátil)
  • El curso se realizará en modalidad presencial en Madrid, en unos horarios determinados.
  • Cada sesión dispone de una duración de 3 horas en horario de lunes, miércoles y jueves de 18:00 a 21:30 durante 3 semanas, con un total de 30 horas lectivas.
  • Durante el curso tendrás que completar 6 temas dedicados,  prácticas y exámenes durante la formación.
  • En el momento que lo necesites podrás efectuar tus dudas al formador para resolver tus dudas relativas al curso.
  • Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L. 

Modalidad Telepresencial

  • La presente convocatoria tambíen está disponible en modalidad Telepresencial.
  • Una vez inscrito, te enviaremos el acceso a la plataforma Telepresencial, y un Drive Privado con toda la información y contenidos.
    Podrás realizar el curso a través de tu ordenador, móvil o tablet.
  • Los alumnos deberán conectarse en los mismos horarios que la modalidad Presencial, y disponer de conexión a internet y micrófono.
  • Durante la retransmisión curso, escucharás el discurso del formador en tiempo real, podrás ver la presentación, realizar ejercicios y consultar tus dudas al momento durante el curso.
  • Grabaremos todas las sesiones del curso, y las compartiremos a través de un Drive Privado a los alumnos participantes durante 3 meses tras la finalización del curso.
  • Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L.

Modalidad Presencial: 580€ IVA ext

Modalidad Telepresencial: 522€ IVA ext

Descuentos y bonificaciones

  • 10% de descuento para estudiantes y desempleados
  • Curso bonificable para trabajadores y empresas

Este curso se puede bonificar a través de FUNDAE para todas aquellas empresas que dispongan de los créditos necesarios durante el vigente año para poder establecer la bonificación. Puede solicitar más información en la página oficial de FUNDAE. 

 

Big Data con Apache Hadoop y Apache Spark

Aprende dos de las especialidades de Big Data más demandadas a través de Hadoop y Spark