Programa Data Science, Big Data & Machine Learning

Modalidad online
Modalidad Online en vivo

WhatsApp Conversemos

Duración
56 horas académicas
Certificación
Certificación internacional a nombre de New Horizons
Trainers
Trainers certificados
Clases grabadas
Clases grabadas hasta 90 días

Presentación

El programa ofrece una visión integral de cómo la ciencia de datos puede transformar datos en información valiosa para impulsar estrategias de negocio. A través de módulos teóricos y prácticos, los participantes aprenderán a recopilar, almacenar, analizar y visualizar datos, así como a implementar modelos de aprendizaje automático para resolver problemas empresariales. El curso abarca desde los fundamentos de la ciencia de datos hasta aplicaciones avanzadas en diversos sectores industriales.

Acceso para ingresar al curso por un año.
*Sujeto a la programación del año

Objetivos de aprendizaje

El curso busca que los participantes comprendan el flujo de trabajo de la ciencia de datos, desde la recopilación hasta la visualización, aplicando modelos estadísticos y de aprendizaje automático para la segmentación y predicción. Además, desarrollarán habilidades en visualización de datos y en la integración de insights en la estrategia empresarial para la toma de decisiones.
Módulos
1 - Fundamentos de Ciencia de Datos y Programación
  • Sesión 1: Introducción a la Ciencia de Datos y Python para Data Science
    • ¿Qué es la Ciencia de Datos? Ciclo de vida de un proyecto.
    • Roles en ciencia de datos (científico, analista, ingeniero, etc.).
    • Aplicaciones reales en distintas industrias.
    • Herramientas y entornos de trabajo.
    • Instalación y configuración (Anaconda, Jupyter).
    • Sintaxis básica de Python: tipos de datos, variables y operadores.
    • Estructuras de control (condicionales y bucles).
    • Funciones y manejo de errores.
  • Sesión 2: Librerías clave (NumPy, Pandas, Matplotlib/Seaborn)
    • Introducción a NumPy: arrays, operaciones y funciones.
    • Uso de Pandas: Series, DataFrames, importación/exportación.
    • Limpieza y transformación de datos.
    • Introducción a visualización con Matplotlib.
    • Visualizaciones estadísticas con Seaborn.
2 - Estadística y Matemáticas Aplicadas
  • Sesión 3: Estadística y Matemáticas Aplicadas
    • Estadística descriptiva: media, mediana, moda, varianza, desviación estándar.
    • Visualización de datos estadísticos.
    • Distribuciones de probabilidad (normal, binomial, etc.).
    • Inferencia estadística: estimaciones y pruebas de hipótesis.
    • Álgebra lineal: vectores, matrices, operaciones básicas.
    • Cálculo diferencial aplicado a funciones de costo.
    • Probabilidad y combinatoria.
    • Optimización: gradiente y mínimos locales/globales.
3 - Fundamentos de Big Data y Arquitecturas
  • Sesión 4: Fundamentos del Big Data (las 5V y casos de uso)
    • Definición de Big Data y las 5V (Volumen, Velocidad, Variedad, Veracidad, Valor).
    • Estructurados vs no estructurados vs semiestructurados.
    • Casos de uso en salud, retail, finanzas, etc.
  • Sesión 5: Arquitectura de Big Data (Hadoop, Spark, Data Lakes vs Warehouses)
    • Componentes del ecosistema Hadoop.
    • Introducción a Apache Spark: ventajas y casos de uso.
    • Data Lakes vs Data Warehouses.
    • Procesamiento batch vs streaming.
4 - Machine Learning
  • Sesión 6: Aprendizaje Supervisado y No Supervisado
    • Concepto de aprendizaje supervisado.
    • Regresión lineal y regresión logística.
    • Árboles de decisión y random forests.
    • Preparación de datos para modelos supervisados.
    • Concepto de aprendizaje no supervisado.
    • Clustering (K-means, DBSCAN) y reducción de dimensionalidad (PCA).
    • Casos de uso: segmentación de clientes, análisis exploratorio.
  • Sesión 7: Evaluación de Modelos
    • Conjuntos de entrenamiento, validación y prueba.
    • Métricas: accuracy, precision, recall, F1-score, ROC-AUC.
    • Overfitting vs underfitting y validación cruzada.
    • Ajuste de hiperparámetros (GridSearchCV, RandomizedSearchCV).
5 - Deep Learning y Redes Neuronales
  • Sesión 8: Fundamentos de Redes Neuronales
    • ¿Qué es el deep learning? Perceptrón y redes básicas.
    • Funciones de activación.
    • Propagación hacia adelante y retropropagación (backpropagation).
  • Sesión 9: Arquitecturas Avanzadas (CNN, RNN, LSTM)
    • CNN para imágenes.
    • RNN para datos secuenciales y LSTM para secuencias largas.
    • Casos de uso: visión computacional, series temporales.
    • Frameworks populares: TensorFlow, PyTorch, Keras.
6 - Procesamiento de Lenguaje Natural (NLP)
  • Sesión 10: Procesamiento de Lenguaje Natural (NLP)
    • Introducción al NLP y aplicaciones.
    • Preprocesamiento: tokenización, stemming, lematización.
    • Representación: Bag of Words, TF-IDF, Word Embeddings.
    • Modelos básicos para clasificación de texto.
    • Introducción conceptual a transformers y BERT.
7 - Inteligencia Artificial Aplicada
  • Sesión 11: IA generativa, chatbots y casos de uso
    • Diferencias entre Machine Learning, Deep Learning e Inteligencia Artificial.
    • IA generativa: definición y aplicaciones.
    • Funcionamiento básico de modelos generativos (p. ej. GPT, DALL·E).
    • Construcción y aplicación de chatbots.
    • Casos de uso reales en distintas industrias.
8 - Visualización y Business Intelligence
  • Sesión 12: Herramientas de Visualización y BI
    • Principios de visualización efectiva de datos.
    • Power BI y Tableau (introducción y comparativa).
    • Creación de dashboards interactivos.
    • Conexión a fuentes de datos.
    • Métricas e indicadores clave (KPIs).
9 - Ética y Gobernanza en IA
  • Sesión 13: Ética, Gobernanza y IA Responsable
    • Principios éticos en el desarrollo de IA.
    • Sesgos algorítmicos y sus riesgos.
    • Marco legal y regulaciones (conceptos generales).
    • Transparencia algorítmica y explicabilidad (XAI).
    • Gobernanza de datos: privacidad, seguridad y transparencia algorítmica.
    • Diseño de IA responsable y centrada en el ser humano.
10 - Proyecto Final Integrador
  • Sesión 14: Desarrollo de Proyecto
    • Definición del problema o caso a resolver.
    • Recolección, análisis y preparación de datos.
    • Aplicación de modelos aprendidos.
    • Visualización de resultados y conclusiones.
    • Presentación y defensa del proyecto final.

Este curso está dirigido a profesionales como gerentes, coordinadores y líderes interesados en aplicar ciencia de datos en el ámbito empresarial. Es ideal para quienes trabajan con equipos de análisis y desean potenciar su conocimiento en inteligencia artificial y analítica de datos. Se recomienda experiencia laboral de al menos 3 años y conocimientos básicos en estadística y herramientas como Excel.

Conoce a nuestro trainer

Foto de Sergio Luque Mamani

Sergio Luque Mamani

Maestría, Bioestadística – Universidad Nacional Mayor de San Marcos.

Profesional con posgrado en Bioestadística y Matemática Aplicada por la UNMSM, con especializaciones en Big Data, Machine Learning y Deep Learning.

Cuenta con amplia experiencia docente en universidades como la UNMSM y la UPCH, dictando cursos de modelamiento matemático, programación y ciencia de datos. Ha sido instructor en Python y R, así como mentor en programas de formación en análisis de datos. En el ámbito profesional, se ha desempeñado como especialista en modelamiento matemático en el Ministerio de Salud y en proyectos de investigación en CONIDA, desarrollando algoritmos para procesamiento de imágenes satelitales. Ha sido ponente en congresos nacionales e internacionales y autor de publicaciones en modelado computacional y machine learning aplicados a la salud pública.

Certificación Internacional

Los participantes que cumplan satisfactoriamente con los requisitos y normas del programa recibirán:

Certificado Internacional
Para aprobar el curso se requiere obtener una nota mínima de 12 y acreditar al menos el 75% de asistencia. Ambos criterios son obligatorios para la certificación.
Loading
  • ¿Tienes preguntas? Ponte en contacto con nosotros

Iniciar