Curso de BigData con Hadoop y Spark

Aprende Big Data a través de dos de sus principales herramientas para el análisis de datos

Duración: 30 horas lectivas

Participantes: A partir de 5 alumnos 

 

Características Principales

  • Duración: 30 horas
  • Horarios: Flexibles en horario a determinar
  • Localización: Flexible según las necesidades de la empresa soliciante
  • Bonificable a través de Fundae.
  •  

Descripción del curso:

 

Durante el curso estudiaremos en profundidad las principales funcionalidades de Apache Hadoop y Apache Spark en cuestiones relativas al almacenamiento, intercambio y procesamiento y seguridad de los datos entre otras, a través de numerosas prácticas durante la formación.

Al finalizar el curso, conocerás todos los componentes del ecosistema Hadoop que hoy se utilizan en proyectos Big Data (Hive, HDFS, Pig, etc.), y serás capaz de utilizar Apache Spark para el análisis de datos a gran escala, tanto en modo offline como en tiempo real con Spark Streaming.

Duración: 25 horas lectivas

Horario flexible según necesidades de la empresa

Curso bonificable a través de FUNDAE

Localización flexible según necesidades de la empresa

Temario y ficha descriptiva del curso:

  • El presente curso podrá ejecutarse en modalidad Presencial o Telepresencial según las necesidades del cliente
  • El horario flexible se establecerá  ajustándose a la petición de la empresa solicitante y de la disponibilidad de Culture Lab,. 
  • La impartición del curso podrá realizarse en las instalaciones de la empresa. En paralelo también se podrá estudiar su impartición en las instalaciones de Culture Lab.
  • Antes de la impartición del curso se realizará una llamada de control entre el formador del curso y uno de los responsables de la empresa para coordinar los objetivos clave y confirmar que el curso se adecua correctamente a sus requisitos. 
  • Para aplicar esta modalidad de formación, se requiere un mínimo de 5 alumnos por parte de la empresa solicitante.
  • El precio final de la formación se establecerá  según el número de alumnos y el lugar de impartición.
  • La empresa  podrá solicitar la bonificación del curso a través de FUNDAE (Antigua Fundación Tripartita) 
  • Culture Lab facilitará a la empresa solicitante la documentación necesaria para que la empresa pueda dar de alta el proceso de bonificación del curso.
  • El presente curso dispondrá de una bonificación máxima aplicable en modalidad Presencial de 13€/hora x 15 horas = 195€ por cada alumno

El crédito disponible para las empresas durante el presente ejercicio se calcula a partir de dos datos: lo cotizado por la empresa en concepto de Formación Profesional en el año anterior y el tamaño de su plantilla, que determinará el porcentaje del importe cotizado al cual tiene derecho la empresa:

Empresas de 1 a 9 trabajadores: 100%.
De 10 a 49 trabajadores: 75%.
De 50 a 249 trabajadores: 60%.
De 250 o más trabajadores: 50%.

  • Durante la impartición del curso Culture Lab se encargará  de los controles de asistencia diarios de los alumnos, así como de las encuestas de evaluación finales, las cuales serán entregadas al responsable de la empresa al finalizar el curso. 

 

Temario del curso.

1. INTRODUCCIÓN A TECNOLOGÍAS BIG DATA, APACHE HADOOP Y APACHE SPARK

  • ¿Qué es Big Data y qué hay de nuevo?
  • Principales tecnologías Big Data.
  • Apache Hadoop: plataforma de almacenamiento y procesamiento de datos.
  • Apache Spark: procesamiento de datos.

2. APACHE HADOOP: CORE.

  • Almacenamiento de datos en Hadoop: HDFS.
  • Gestión de recursos y tareas: YARN.
  • Instalación, administración y monitorización del cluster con Apache Ambari.
  • Seguridad y gobierno de datos.

  3. INGESTA Y TRANSFORMACIÓN DE DATOS EN APACHE HADOOP.

  •  Apache Sqoop: intercambio de datos con bases de datos relacionales.
  • Apache Flume y Apache Kafka: ingesta de datos.
  • Apache Pig: transformación de datos en Hadoop.
  • Herramientas ETL: Informatica PowerCenter, Pentaho Kettle.

4. ACCESO Y EXPLOTACIÓN DE DATOS EN APACHE HADOOP.

  • MapReduce: “antiguo” framework de procesamiento de datos.
  • Apache HBase: NoSQL sobre Hadoop.
  • Apache Hive: SQL sobre Hadoop.
  • Otras tecnologías de SQL sobre Hadoop: Cloudera Impala, Apache Drill, Apache Phoenix.
  • Procesamiento de eventos en tiempo real con Apache Storm.

   5.- APACHE SPARK

  • Introducción a Apache Spark. Spark vs MapReduce vs Tez
  • Introducción a Scala.
  • Conceptos básicos, RDDs, transformaciones y acciones.
  • Desarrollo de aplicaciones con Spark.

    6.- SPARK STREAMING

  • Introducción a Spark Streaming
  • Casos de uso. Apache Storm vs Spark Streaming.
  • Desarrollo de aplicaciones realtime con Spark Streaming.

 

Requisitos del curso: 

  • Es preciso disponer de conocimientos básicos en lenguajes de programación en torno a objetos tales como Java, Pyhton o similares.
  • Se recomienda disponer de nociones en bases de datos tales como SQL o similares. .
  • Se recomienda disponer de una asistencia mínima del 80% para el correcto aprovechamiento de la materia. 
  • El curso está principalmente orientado a:  

    • Desarrolladores
    • Programadores
    • Analistas de datos

    interesados en conocer el desarrollo Big Data con Hadoop y Spark así como sus posibilidades de implantación:

    Objetivos del curso:

    • Entenderás el conjunto de tecnologías que dan soporte a Big Data y el posicionamiento de cada una.
    • Conocerás y practicarás con los componentes asociados al ecosistema Hadoop: Hive, HDFS, Pig, etc.
    • Conocerás Apache Spark y serás capaz de desarrollar programas de análisis de datos con esta tecnología.
    • En resumen, estarás preparado para participar en un proyecto Big Data real
  • La presente convocatoria tambíen está disponible en modalidad Telepresencial.
  • Una vez inscrito, te enviaremos el acceso a la plataforma Telepresencial, y un Drive Privado con toda la información y contenidos.
  • Podrás realizar el curso a través de tu ordenador, móvil o tablet. 
  • Los alumnos deberán conectarse en los mismos horarios que la modalidad Presencial, y disponer de conexión a internet y micrófono.
  • Durante la retransmisión curso, escucharás el discurso del formador en tiempo real, podrás ver la presentación,  realizar ejercicios y consultar tus dudas al momento durante el curso. 
  • Grabaremos todas las sesiones del curso, y las compartiremos a través de un Drive Privado a los alumnos participantes durante 3 meses tras la finalización del curso.
  • Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L. 

Curso Presencial de Big Data con Hadoop y Spark

Aportamos los conocimientos para el uso en Big Data y ser capaces de preparar soluciones para la gestión de enormes volúmenes de datos en tiempo real.