IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS
Curso gratis para: Trabajadores y Empresas, consulta próxima convocatoria
Modalidad de realización del curso: Online
Número de Horas: 80 Horas
Titulación: Diploma acreditativo con las horas del curso
OBJETIVOS
CONTENIDO
UNIDAD DIDÁCTICA 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO
- Introducción a la minería de datos y el aprendizaje automático
- - Proceso KDD
- - Modelos y Técnicas de Data Mining
- - Áreas de aplicación
- - Minería de textos y Web Mining
- - Data mining y marketing
UNIDAD DIDÁCTICA 2. R COMO HERRAMIENTA PARA BIG DATA
- Instalación de R y RStudio
- - Introducción al lenguaje
- - Historia e Introducción a R
- - Operaciones Básicas y Números
- - Atributos, Entrada y Coerción
- - Matrices
- - Precedencia Operaciones Vectoriales
- - Manejo de fechas y tiempo
- - Listas, Factores, Valores Faltantes y Dataframes
- - Subconjuntos de Datos
- - Leer y Escribir Datos
- Uso del lenguaje
- - Estructuras de Control
- - Funciones
- - Reglas de Alcance
- Sistema de gráficos
- - Funciones *apply: apply
- - Funciones *apply: lapply / sappy
- - Funciones *apply: mapply / rep
- - Graficación con el Sistema de Base de Gráficos
- - Algunas Funciones Gráficas de Alto Nivel
- - Parámetros en el Sistema de Gráficos
- - Colores en el Sistema de Gráficos
- - Graficación con Notación Matemática
- - Graficación con texto y notación matemática
- - Creación de Gráficas en 3D
- Expresiones regulares. Gráficas con ggplot2 y Simulación
- - Expresiones Regulares
- - Paquete de gráficos ggplot2
- - Simulación
- R en el mundo real
- - Estadística Descriptiva y Predictiva con R
- - Integración de R en Hadoop
UNIDAD DIDÁCTICA 3. PRE-PROCESAMIENTO & , PROCESAMIENTO DE DATOS
- Obtención y limpieza de los datos (ETL)
- Inferencia estadística
- Pruebas de hipótesis
- Modelos de regresión
- Árboles de Decisión
- Algoritmos de Clasificación / Regresión (J48/C5. 0, M5P)
- Normalización, Tipos de distancia, Correlación
- Machine Learning
- Comparar Artículos (k-NN)
- Modelo predictivo de profit (k-NN, M5P. . . )
- Modelo predictivo de clasificación (J48, k-NN)
UNIDAD DIDÁCTICA 4. ANÁLISIS DE LOS DATOS
- Inteligencia Analítica de negocios
- La teoría de grafos y el análisis de redes sociales
- Presentación de resultados
UNIDAD DIDÁCTICA 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP
- ¿Qué es Hadoop?
- El sistema de archivos HDFS
- Algunos comandos de referencia
- Procesamiento MapReduce con Hadoop
- El concepto de los clusters en Hadoop
UNIDAD DIDÁCTICA 6. WEKA Y DATA MINING
- ¿Qué es Weka?
- Técnicas de Data Mining en Weka
- Interfaces de Weka
- Selección de atributos