R es un lenguaje muy útil, que permite manipular y organizar datos en gráficas.
La programación con R en entornos Big Data se trabaja de forma habitual en empresas como Google o Facebook
En este curso el alumno aprenderá a realizar todas las tareas del ciclo de análisis de datos con R: desde la extracción de la información, tratamiento de datos, modelización descriptiva y predictiva, hasta la visualización de la información, beneficiándose de la potencia y eficacia del amplio espectro de librerías de R con el objetivo de explicar la vinculación y el uso de R para procesos relacionados con Big Data.
Metodología
- Las convocatorias se celebran en horario de viernes tarde y sábado con un total de 12 horas lectivas.
- Una vez inscrito, te enviaremos el acceso a la plataforma Telepresencial, y un Drive Privado con toda la información y contenidos.
- Podrás realizar el curso a través de tu ordenador, móvil o tablet.
- Los alumnos deberán conectarse en los horarios marcados, y disponer de conexión a internet y micrófono.
- Durante la retransmisión curso, escucharás el discurso del formador en tiempo real, podrás ver la presentación, realizar ejercicios y consultar tus dudas al momento durante el curso.
- Una vez finalizada la formación, te enviaremos un Certificado del curso emitido por Culture Lab TS S.L.
Requisitos mínimos
- Para poder realizar el curso, los alumnos deberán tener experiencia básica en el lenguaje de Programación R.
Requisitos técnicos:
- Los alumnos deberán disponer de conexión a internet y micrófono durante las sesiones del curso.
- Los alumnos se descargarán el acceso a la plataforma telepresencial que les enviaremos tras su inscripción.
- Para realizar el curso es necesario contar con un equipo Intel i3, con 4 GB de memoria RAM.
Objetivos
El curso está principalmente orientado a:
- Programadores
- Desarrolladores
- Informáticos
interesados en profundizar en el lenguaje de programación R para su vinculación con herramientas Big Data:
Objetivos del curso:
-
Aprender como extraer información de fuentes externas y manipularlas con R.
-
Implementar procesos de análisis avanzado de datos con R.
-
Manejar las capacidades de visualización de información de R.
- Introducción a Big Data y al uso de R en estos entornos.
- Integración de R con procesos de Hadoop y Spark
Temario del curso.
Temario del curso:
1º Introducción a R:
- Orígenes y desarrollo R. Capacidades de la herramienta
- Instalación RStudio. Entorno de trabajo
- Instalación de paquetes y librerías
- Comandos básicos
2º Tratamiento de datos:
- Estructuras y tipos de datos
- Listas, vectores, matrices , conjuntos de datos y factores
- Interacción con diferentes fuentes de datos origen
- Fichero plano, csv, Excel, XML
- Conexión a SGDB
- Importación de datos
- Manipulación de datos:
- Estructuras iterativas y condicionales
- Transformaciones, ordenaciones, unicidad y filtros en conjuntos de datos
- Cruces y uniones de conjuntos de datos
- Creación y aplicación de funciones
- Exportación de datos
3º Visualización de datos:
- Representación unidimensional, bidimensional y tridimensional
- Datos estadísticos: Histograma, diagrama de caja, diagrama de tallo y hojas, gráficos dispersión
- Tipos de gráficos: puntos, barras, líneas, circular y contorno
- Gráficos especiales: coordenadas polares, burbujas, mapas, clusters, árboles y gráficos con movimiento.
4º Estadística descriptiva:
- Estadísticos descriptivos básicos: Agregados, medias, desviación típica, varianza, frecuencias y cuartiles.
- Análisis de varianza. Regresión lineal.
- Clusterización
5º Estadística predictiva:
- Uso de la estadística predictiva y los modelos matemáticos en el entorno empresarial
- Arboles de decisión
- Regresión logística
- Redes neuronales
- Series temporales
6º Introducción a big data. Integración de R con herramientas big data:
- Introducción a Big Data.
- Big Data Analytics. Aplicaciones. Data Science.
- Fuentes de datos big data. Heterogeneidad, información no estructurada.
- Crecimiento de información. Necesidades de procesamiento.
- Sistemas de computación distribuida. Fundamentos MapReduce.
- Bases de datos NoSQL.
- Ecosistema Hadoop: Pig, Hive, HDFS, YARN
- Integración de R con Hadoop.
- Integración de R con Spark
Precio y matriculación
- El curso tiene un coste de 200€ exentos de IVA.
- Para inscribirte tendrás que enviarnos un impreso de reserva de plaza del curso completado con tus datos
- Una vez abonado el curso, te remitiremos un correo para descargar la plataforma Telepresencial.
- Recibirás una acceso al Drive Privado del curso, en donde colgaremos todos los materiales, así como las sesiones del curso.
- Una vez finalizado el curso, te haremos entrega de un certificado del curso emitido por Culture Lab TS S.L.
- Tras finalizar la formación, tendrás 3 meses adicionales de acceso al Drive Privado del curso.
Horarios:
Convocatoria: Abierta:
Este curso no dispone de un horario definido. Las convocatorias se realizarán para grupos de particulares o empresas a partir de 5 participantes en adelante. Si quieres solicitar esta formación para tu empresa, te rogamos que envíes tu solicitud a través del formulario de contacto, y nos pondremos en contacto contigo lo antes posible.
Horarios:
Convocatoria: Abierta:
Este curso no dispone de un horario definido. Las convocatorias se realizarán para grupos de particulares o empresas a partir de 5 participantes en adelante. Si quieres solicitar esta formación para tu empresa, te rogamos que envíes tu solicitud a través del formulario de contacto, y nos pondremos en contacto contigo lo antes posible.
Precio: 200€ IVA ext
Duración: 12 horas

Las clases se realizarán en tiempo real
Podrás ver, escuchar, aprender y preguntar desde casa, con conexión a Internet.

Grabación de todas las sesiones del curso
Estarán a disposición de los alumnos durante 3 meses tras la finalización del curso.

Certificado de formación oficial emitido por Culture Lab TS S.L.
Al finalizar la formación, se hará entrega del Certificado del curso para asegurarte un mejor empleo.