Machine Learning con R
Curso en modalidad de videoconferencias en vivo o de instrucción remota.
En el horario establecido para el curso, los estudiantes tendrán clases en vivo a través de una plataforma de videoconferencias. Las clases se desarrollarán de forma participativa y dinámica (videoconferencias – 30 horas).
El curso contará con una aula virtual donde los participantes encontrarán material de apoyo y realizarán actividades complementarias de aprendizaje autónomo (actividades autónomas de aprendizaje – 10 horas).
El curso pretende explorar la teoría del aprendizaje de máquina, examinar sus aplicaciones y ofrecer las herramientas necesarias para descubrir información en conjuntos de datos grandes, por lo que al finalizar el curso, los participantes podrá extraer información relevante de los mismos, usando la rigurosidad científica de los métodos y aplicando soluciones prácticas con el software R.
General
Conocimientos:
Conocimientos básicos de Computación, Estadística y Matemáticas (Nivel intermedio).
Técnicos para las videoconferencias
- Navegador de internet: Mozilla Firefox o Google Chrome. No utilice el navegador Internet Explorer.
- JavaScript y cookies habilitadas en los navegadores.
- No se requiere Java para los usuarios de Mozilla Firefox y Google Chrome (si su sistema Operativo es Windows).
- Oracle Java 6 a Oracle Java 8 (si su sistema Operativo es Mac OS, versión 10.13 en adelante).
- Oracle Java 6 a Oracle Java 8, libstdc++ 6.0, sistema de ventanas GNOME/KDE (si su sistema Operativo es Linux).
- Procesador: 1GHz (mínimo), se recomienda 2 GHZ doble núcleo o más.
- Memoria 1 GB de RAM mínimo, se recomienda 2 GB.
- Audífonos o parlantes.
Estudiantes, profesionales, mandos medios.
Se entregará solamente cuando se haya aprobado el curso.
2525766 Ext. 122, 114, 145, 156
Contenido
UNIDAD 1. INTRODUCCIÓN AL MACHINE LEARNING (2 Horas)
1.1. Software R para modelación
1.2. Repaso de tidyverse
1.3. Revisión de fundamentos de modelación en R
UNIDAD 2. PREPROCESAMIENTO Y AJUSTE (6 Horas)
2.1. Feature Engineering (Librería recipes)
2.2. Ajuste de Modelos (Librería parsnip)
2.3. Flujo de modelos
2.4. Métricas de rendimiento
UNIDAD 3. ALGORITMOS DE REGRESIÓN Y CLASIFICACIÓN (15 Horas)
3.1. Algoritmos de regresión
3.1. Regresión lineal
3.1.1. Validación
3.1.2. Selección del mejor modelo
3.2. Algoritmos de clasificación
3.2.1. Regresión logística
3.2.2. Análisis discriminante
3.2.3. Naive Bayesiano
3.2.4. Máquina de soporte vectorial (SVM)
3.2.5. Evaluación de modelos de clasificación
UNIDAD 4. APRENDIZAJE DE MÁQUINA ESTADÍSTICO (9 Horas)
4.1. K-vecinos más cercanos
4.2. Árboles de decisión (CART)
4.3. Re-muestreo agregado (Bagging)
4.4. Boosting
UNIDAD 5. CLASIFICACIÓN NO SUPERVISADA (3 Horas)
5.1. Métodos de componentes principales
5.1.1. Análisis de componentes principales (Variables cuantitativas)
5.1.2. Análisis de correspondencia (Variables cualitativas)
UNIDAD 6. HERRAMIENTAS PARA CREACIÓN DE MODELOS EFECTIVOS (5 Horas)
6.1. Remuestreo para evaluación del rendimiento
6.2. Comparando modelos con remuestreo
6.3. Ajuste del modelo y desafíos con el sobre-ajuste
6.4. Búsqueda de parámetros a priori
6.5. Búsqueda iterativa de parámetros
6.6. Prospección eficiente de modelos
Instructor
INSTRUCCIÓN:
Doctor en Modelización, Investigación y Análisis del Riesgo en Medio Ambiente.
Master Universitario en Modelización, Investigación y Análisis del Riesgo en Medio Ambiente
Diplomado Superior en Seguridad y Salud Ocupacional
Magister en Gestión Ambiental
Ingeniero Geógrafo y del Medio Ambiente
EXPERIENCIA:
15 años de experiencia en modelación geoestadística, geoquímica, hidrogeología, climatológica. Data analytics. Gestión de base de datos geológica