BigData con Apache Hadoop y Apache Spark
Aprende Big Data a través de dos de sus principales herramientas para el análisis de datos
Precio: 250€ IVA inc
Características Principales
- Duración: 40 horas
- Elementos: 111 lecciones, 2 exámenes y 16 prácticas
- Precio: 250€ IVA inc
- 15% Descuento a estudiantes y desempleados
- 20% si te inscribes con otra persona
- Bonificable a través de Fundae
Descripción del curso:
El presente curso busca dotar al alumno del uso de las diferentes técnicas de ingesta masiva así como gestión de datos en tiempo real con Big Data a través de Apache Hadoop, una herramienta de creación de soluciones distribuidas a través de nodos así como el uso y aprendizaje de Open Source de Spark para la optimización de la velocidad de los datos.
Está principalmente orientado a personas con experiencia en programación en torno a objetos y nociones en bases de datos que quieran profundizar en el uso práctico de Big Data a través de numerosas prácticas y ejercicios.
Temario y ficha descriptiva del curso:
Tema 1º Introducción a las Tecnologías Big Data: Apache Hadoop y Apache Spark
- Lección 1º Introducción al curso
- Lección 2º ¿Qué es Big Data?
- Lección 3º Tipos de Big Data y fundamentos
- Lección 4º Introducción al ecosistema Hadoop
- Lección 5º Introducción al ecosistema Spark
- Lección 6º Hadoop VS Spark y casos de uso
- Instalación de Software
Tema 2º Apache Hadoop: Core
- Lección 7º Almacenamiento de los datos en Hadoop: HDFS
- Lección 8º Arquitectura y organización de HDFS
- Lección 9º Ejemplo de lectura en HDFS
-
Lección 10º Seguridad en HDFS
- Lección 11º Demostración práctica HDFS (Parte 1)
- Lección 12º Demostración práctica HDFS (Parte 2)
- Lección 13º Demostración práctica HDFS (Parte 3)
- Lección 14º Gestión de recursos y tareas con Yarn
-
Lección 15º Ejemplo de ejecución de una tarea con Yarn
-
Lección 16º Demostración práctica de Yarn (Parte 1)
-
Lección 17º Demostración práctica de Yarn (Parte 2)
-
Lección 18º Demostración práctica de Yarn (Parte 3)
-
Lección 19º Instalación, administración, y monitorización del Cluster con Apache Ambari
-
Lección 20º Pasos para la instalación del Cluster con Apache Ambari
-
Lección 21º Administración de Apache Ambari
-
Lección 22º Demostración práctica con Apache Ambari (Parte 1)
-
Lección 23º Demostración práctica con Apache Ambari (Parte 2)
-
Lección 24º Demostración práctica con Apache Ambari (Parte 3)
-
Lección 25º Seguridad y gobierno de datos con Apache Ragner
-
Lección 26º Seguridad y gobierno de datos con Apache Knox, Sentry y Rhino
Tema 3º Ingesta y transformación de datos en Apache Hadoop
- Lección 27º Formato de los datos en Apache Hadoop
-
Lección 28º Tipos de formatos, y como escogerlos.
-
Lección 29º Formatos de comprensión de los datos
-
Lección 30º Importación de los datos con Apache Sqoop
-
Lección 31º Herramientas para el uso de Apache Sqoop
-
Lección 32º Conectividad, exportación y rendimiento con Apache Sqoop
-
Lección 33º Problemas frecuentes y Sqoop Server
-
Lección 34º Estructura básica de Apache Flume
-
Lección 35º Eventos y fuentes de entrada de Apache Flume
-
Lección 36º Fuentes de salida, canales y configuración de Apache Flume
-
Lección 37º Ejemplo con Apache Flume
-
Lección 38º Introducción a Apache Kafka
-
Lección 39º Arquitectura y grupos de consumo de Apache Kafka
-
Lección 40º Zookeeper y casos de estudio en Apache Kafka
-
Lección 41º Introducción y funcionalidades con Apache Pig
-
Lección 42º Análisis con Apache Pig Ground
-
Lección 43º Proceso de ejecución con Apache Pig
-
Lección 44º Herramientas ETL: Power Center y Kettle
-
Ejercicios del Tema 3
-
Resolución de ejercicios del Tema 3
- Lección 45º Análisis de MapReduce
-
Lección 46º Las fases del MapReduce
-
Lección 47º Usos de Imput Format y Mapper
-
Lección 48º Reducer y ejecución especulativa en MapReduce
-
Lección 49º Proceso de ejecución en MapReduce
-
Lección 50º El Teorema CAP
-
Lección 51º Bases de datos NoSQL con HBase
-
Lección 52º Uso de las tablas y Row Key en HBase
-
Lección 53º Acceso, componentes y MasterServer en HBase
-
Lección 54º Operaciones con HBase
-
Lección 55º Origen y organización de Apache Hive
-
Lección 56º Arquitectura de Apache Hive
-
Lección 57º Simulación de consulta en Hive
-
Lección 58º Origen y características de Cloudera Impala
-
Lección 59º Arquitectura de Cloudera Impala y comparativa con Hive
-
Lección 60º Origen y características de Apache Drill
-
Lección 61º Funcionamiento de Apache Drill
-
Lección 62º Fundamentos de Cloudera Impala
-
Lección 63º Arquitectura de Cloudera Impala
-
Lección 64º Comandos y comparativa Impala VS Hive
-
Lección 65º Apache Phoenix
-
Lección 66º Apache Strom
-
Lección 67º Topografía de Apache Strom
- Ejercicios del Tema 4
- Resolución de ejercicios del Tema 4
- Examen 1º
Tema 5º Apache Spark
- Entorno de Prácticas – Instalación Apache Spark (Parte 1)
-
Entorno de Prácticas – Instalación Apache Spark (Parte 2)
-
Entorno de Prácticas – Primer Arranque con Hortonworks y Cloudera (Parte 1)
-
Entorno de Prácticas – Primer Arranque con Hortonworks y Cloudera (Parte 2)
-
Lección 68º Introducción a la arquitectura de Apache Spark
-
Lección 69º Tipologías de despliegue en Spark
-
Lección 70º Análisis del RDD, gestor de tareas, trasformaciones y persistencia en Spark
-
Lección 71º Componentes adicionales: Spark SQL, Datasets, Dataframes y conversión a RDD
-
Lección 72º Características y acciones principales de Spark Streaming
-
Lección 73º Análisis, usos y ejemplo de Spark Mlib
-
Lección 74º Análisis y usos de Spark GraphX y conclusiones
-
Lección 75º Demostración práctica de Spark con Scala (1º Parte)
-
Lección 76º Demostración práctica de Spark con Scala (2º Parte)
-
Lección 77º Demostración práctica de Spark con Scala (3º Parte)
-
Lección 78º Demostración práctica con MapReduce (1º Parte)
-
Lección 79º Demostración práctica con MapReduce (2º Parte)
-
Lección 80º Demostración práctica con FlatMap Scala (1º Parte)
-
Lección 81º Demostración práctica con FlatMap Scala (2º Parte)
-
Lección 82º Demostración práctica de Spark con Python (1º Parte)
-
Lección 83º Demostración práctica de Spark con Python (2º Parte)
-
Lección 84º Demostración práctica de Spark con Python (3º Parte)
-
Lección 85º Demostración práctica de Spark con R (1º Parte)
-
Lección 86º Demostración práctica de Spark con R (2º Parte)
-
Lección 87º Demostración práctica de Spark con R (3º Parte)
-
Lección 88º Demostración práctica de Spark con R (4º Parte)
-
Lección 89º Demostración práctica de Spark con Java (1º Parte)
-
Lección 90º Demostración práctica de Spark con Java (2º Parte)
-
Lección 91º Operaciones de Spark con Java (1º Parte)
-
Lección 92º Operaciones de Spark con Java (2º Parte)
- Lección 93º Introducción y características de Spark SQL
- Lección 94º Monitorización, ejecución, Dataframes, y fuentes de datos en Spark SQL
- Lección 95º Transformaciones y exportaciones con Datasets
- Lección 96º Características de los Datasets y conversión a RDD
- Lección 97º Análisis del Streaming estructurado
- Lección 98º Análisis del Streaming estructurado (2º Parte)
- Lección 99º Demostración práctica con Spark SQL (1º Parte)
- Lección 100º Demostración práctica con Spark SQL (2º Parte)
- Lección 101º Demostración práctica con Spark SQL (3º Parte)
- Lección 102º Demostración práctica con Spark SQL (4º Parte)
- Lección 103º Conceptos básicos de Spark Streaming
- Lección 104º Funciones del Socket Receiver y transformaciones en Spark Streaming
-
Lección 105º Operaciones de salida en Spark Streaming
-
Lección 106º Transformaciones con Spark Streaming (1º Parte)
-
Lección 107º Transformaciones con Spark Streaming (2º Parte)
-
Lección 108º Análisis del Checkpointing y persistencia
-
Lección 109º Spark MLib, Dataframes y tablas temporales
-
Lección 110º Práctica Spark Streaming
-
Lección 111º Conclusiones finales
-
Ejercicios del Tema 7
-
Resolución de ejercicios del Tema 7
-
Examen 2º
- Una vez inscrito en el curso Online, tendrás acceso a todo el contenido durante los próximos 3 meses
- Podrás realizar el curso a través de tu ordenador, móvil o tablet para realizar el curso cómodamente y a tu ritmo
- Durante el curso tendrás que completar 7 temas dedicados, con un total 111 lecciones, 20 prácticas y 2 exámenes tipo test durante la formación estimados en 40 horas
- En el momento que lo necesites podrás efectuar tus consultas al formador, a través de correo electrónico, para resolver tus dudas relativas al curso.
- Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L.
Requisitos técnicos:
- Para poder realizar el curso, los alumnos deberán tener experiencia previa en programación Java o similares, así como nociones en bases de datos SQL o similares.
- Para realizar el curso es necesario contar con un equipo con procesador Intel i7, con 16 GB de memoria RAM.
- El curso tiene un coste de 250€ exentos de IVA en modalidad Online
- El curso está principalmente orientado a:
- Desarrolladores
- Programadores
- Analistas de datos
interesados en conocer el desarrollo Big Data con Hadoop y Spark así como sus posibilidades de implantación:
Objetivos del curso:
- Entenderás el conjunto de tecnologías que dan soporte a Big Data y el posicionamiento de cada una.
- Conocerás y practicarás con los componentes asociados al ecosistema Hadoop: Hive, HDFS, Pig, etc.
- Conocerás Apache Spark y serás capaz de desarrollar programas de análisis de datos con esta tecnología.
- En resumen, estarás preparado para participar en un proyecto Big Data real
Culture Lab pone en marcha el Curso de Big Data con Apache Hadoop y Apache Spark, diseñado por Pablo Panero, Especialista en Big Data y Emilio Sarabia, Consultor en Business Inteligence y Spark.
- Modalidad Online
- Modalidad Telepresencial
- Modalidad Presencial
Curso de Big Data con Apache Hadoop y Apache Spark
Confiamos en poder aportar los conocimientos para iniciarnos en Big Data y poder ser capaces de preparar soluciones para la gestión de enormes volúmenes de datos en tiempo real.