Curso de BigData con Hadoop y Spark

Aprende Big Data a través de dos de sus principales herramientas para el análisis de datos

Duración: 30 horas lectivas

Participantes: A partir de 5 alumnos

Características Principales

  • Duración: 30 horas
  • Horarios: Martes, miércoles y jueves en horario de tarde
  • Precio presencial: 500€ IVA inc
  • Precio telepresencial: 450€ IVA inc
  • 10% Descuento a estudiantes y desempleados
  • 15% si te inscribes con otra persona
  • Bonificable a través de Fundae.

Descripción del curso:

 

Durante el curso estudiaremos en profundidad las principales funcionalidades de Apache Hadoop y Apache Spark en cuestiones relativas al almacenamiento, intercambio y procesamiento y seguridad de los datos entre otras, a través de numerosas prácticas durante la formación.

Al finalizar el curso, conocerás todos los componentes del ecosistema Hadoop que hoy se utilizan en proyectos Big Data (Hive, HDFS, Pig, etc.), y serás capaz de utilizar Apache Spark para el análisis de datos a gran escala, tanto en modo offline como en tiempo real con Spark Streaming.

Convocatoria abierta

Prácticas y exámenes

Certificado del curso

Bolsa activa de empleo

Bonificable a través de Fundae

Temario y ficha descriptiva del curso:

 

  • El presente curso podrá ejecutarse en modalidad Presencial o Telepresencial según las necesidades del cliente
  • El horario flexible se establecerá  ajustándose a la petición de la empresa solicitante y de la disponibilidad de Culture Lab,.
  • La impartición del curso podrá realizarse en las instalaciones de la empresa. En paralelo también se podrá estudiar su impartición en las instalaciones de Culture Lab.
  • Antes de la impartición del curso se realizará una llamada de control entre el formador del curso y uno de los responsables de la empresa para coordinar los objetivos clave y confirmar que el curso se adecua correctamente a sus requisitos.
  • Para aplicar esta modalidad de formación, se requiere un mínimo de 5 alumnos por parte de la empresa solicitante.
  • El precio final de la formación se establecerá  según el número de alumnos y el lugar de impartición.
Temario del curso.

1. INTRODUCCIÓN A TECNOLOGÍAS BIG DATA, APACHE HADOOP Y APACHE SPARK

  • ¿Qué es Big Data y qué hay de nuevo?
  • Principales tecnologías Big Data.
  • Apache Hadoop: plataforma de almacenamiento y procesamiento de datos.
  • Apache Spark: procesamiento de datos.

2. APACHE HADOOP: CORE.

  • Almacenamiento de datos en Hadoop: HDFS.
  • Gestión de recursos y tareas: YARN.
  • Instalación, administración y monitorización del cluster con Apache Ambari.
  • Seguridad y gobierno de datos.

  3. INGESTA Y TRANSFORMACIÓN DE DATOS EN APACHE HADOOP.

  •  Apache Sqoop: intercambio de datos con bases de datos relacionales.
  • Apache Flume y Apache Kafka: ingesta de datos.
  • Apache Pig: transformación de datos en Hadoop.
  • Herramientas ETL: Informatica PowerCenter, Pentaho Kettle.

4. ACCESO Y EXPLOTACIÓN DE DATOS EN APACHE HADOOP.

  • MapReduce: “antiguo” framework de procesamiento de datos.
  • Apache HBase: NoSQL sobre Hadoop.
  • Apache Hive: SQL sobre Hadoop.
  • Otras tecnologías de SQL sobre Hadoop: Cloudera Impala, Apache Drill, Apache Phoenix.
  • Procesamiento de eventos en tiempo real con Apache Storm.

   5.- APACHE SPARK

  • Introducción a Apache Spark. Spark vs MapReduce vs Tez
  • Introducción a Scala.
  • Conceptos básicos, RDDs, transformaciones y acciones.
  • Desarrollo de aplicaciones con Spark.

    6.- SPARK STREAMING

  • Introducción a Spark Streaming
  • Casos de uso. Apache Storm vs Spark Streaming.
  • Desarrollo de aplicaciones realtime con Spark Streaming.
  • La presente convocatoria tambíen está disponible en modalidad Telepresencial.
  • Una vez inscrito, te enviaremos el acceso a la plataforma Telepresencial, y un Drive Privado con toda la información y contenidos.
  • Podrás realizar el curso a través de tu ordenador, móvil o tablet. 
  • Los alumnos deberán conectarse en los mismos horarios que la modalidad Presencial, y disponer de conexión a internet y micrófono.
  • Durante la retransmisión curso, escucharás el discurso del formador en tiempo real, podrás ver la presentación,  realizar ejercicios y consultar tus dudas al momento durante el curso. 
  • Grabaremos todas las sesiones del curso, y las compartiremos a través de un Drive Privado a los alumnos participantes durante 3 meses tras la finalización del curso.
  • Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L. 
  • El curso tiene un coste de 500€ exentos de IVA en modalidad Presencial
  • El curso tiene un coste de 450€ exentos de IVA en modalidad Telepresencial

Una vez inscrito, el alumno se le enviará un correo recordatorio con la fecha de inicio y el lugar de impartición del curso. 

Requisitos del curso: 

  • Es preciso disponer de conocimientos básicos en lenguajes de programación en torno a objetos tales como Java, Pyhton o similares.
  • Se recomienda disponer de nociones en bases de datos tales como SQL o similares. .
  • Se recomienda disponer de una asistencia mínima del 80% para el correcto aprovechamiento de la materia. 

 

El curso está principalmente orientado a:  

  • Desarrolladores
  • Programadores
  • Analistas de datos

interesados en conocer el desarrollo Big Data con Hadoop y Spark así como sus posibilidades de implantación:

Objetivos del curso:

  • Entenderás el conjunto de tecnologías que dan soporte a Big Data y el posicionamiento de cada una.
  • Conocerás y practicarás con los componentes asociados al ecosistema Hadoop: Hive, HDFS, Pig, etc.
  • Conocerás Apache Spark y serás capaz de desarrollar programas de análisis de datos con esta tecnología.
  • En resumen, estarás preparado para participar en un proyecto Big Data real

Curso Presencial de Big Data con Hadoop y Spark

Aportamos los conocimientos para el uso en Big Data y ser capaces de preparar soluciones para la gestión de enormes volúmenes de datos en tiempo real.