Programa Data Science, Big Data & Machine Learning

Modalidad online
Modalidad Online en vivo

WhatsApp Conversemos

Duración
56 horas académicas
Certificación
Certificación internacional a nombre de New Horizons
Trainers
Trainers certificados
Clases grabadas
Clases grabadas hasta 90 días

Presentación

El programa ofrece una visión integral de cómo la ciencia de datos puede transformar datos en información valiosa para impulsar estrategias de negocio. A través de módulos teóricos y prácticos, los participantes aprenderán a recopilar, almacenar, analizar y visualizar datos, así como a implementar modelos de aprendizaje automático para resolver problemas empresariales. El curso abarca desde los fundamentos de la ciencia de datos hasta aplicaciones avanzadas en diversos sectores industriales.

Acceso para ingresar al curso por un año.
*Sujeto a la programación del año

Objetivos de aprendizaje

El curso busca que los participantes comprendan el flujo de trabajo de la ciencia de datos, desde la recopilación hasta la visualización, aplicando modelos estadísticos y de aprendizaje automático para la segmentación y predicción. Además, desarrollarán habilidades en visualización de datos y en la integración de insights en la estrategia empresarial para la toma de decisiones.
Módulos
1 - Fundamentos de Ciencia de Datos y Aplicaciones de IA
  • Introducción a la Ciencia de Datos y su impacto en industrias.
  • Etapas de un proyecto de datos: planteamiento, recolección, análisis, modelado.
  • Conceptos clave de IA: automatización, aprendizaje, toma de decisiones.
  • Rol de la IA generativa en el análisis de datos.
  • Herramientas y entornos del curso: Google Colab, GitHub, IA asistida.
  • Evolución del valor de los datos.
  • Metodología CRISP-DM (Cross Industry Standard Process for Data Mining).
  • Perspectiva laboral: el rol de los profesionales de datos.
2 - Python para Análisis de Datos
  • Sintaxis básica de Python: variables, estructuras, funciones.
  • Librerías para análisis de datos: NumPy, Pandas.
  • Limpieza de datos y diagnóstico de datos perdidos.
  • Web Scraping para Ciencia de Datos.
  • Lectura y transformación de datos: carga de archivos, limpieza, procesos ETL.
  • Google Colab como entorno colaborativo.
3 - Estadística Descriptiva e Inferencial
  • Medidas de tendencia central y dispersión.
  • Distribuciones de probabilidad y representación gráfica.
  • Pruebas de hipótesis e intervalos de confianza.
  • Correlaciones y regresión lineal básica.
  • Estadística inferencial con Python.
4 - (RENOVADA) Machine Learning & Deep Learning
  • Fundamentos de Machine Learning.
  • Modelos de aprendizaje supervisado.
  • Modelos de aprendizaje no supervisado.
  • Validación cruzada.
  • Redes neuronales y Deep Learning.
  • Uso de IA asistida para construir pipelines de modelado.
  • Creación de dashboards con Python, R y Power BI.
5 - Big Data y Procesamiento en la Nube
  • Fundamentos del Big Data: volumen, variedad, velocidad.
  • Tecnologías Cloud.
  • Tecnologías de almacenamiento.
  • Apache Spark, PySpark, Hadoop y procesamiento distribuido.
  • Herramientas cloud: Google Cloud y BigQuery (visión práctica).
  • Automatización de tareas en la nube con scripts.
  • Uso de IA para acelerar análisis a gran escala.
6 - Presentación de Proyecto Final
  • Estructura de presentación de proyectos de ciencia de datos.
  • Construcción de storytelling de datos.
  • Visualización final de resultados y modelos.
  • Uso de herramientas de IA para automatizar reportes y visuales.
  • Retroalimentación grupal y cierre.

Este curso está dirigido a profesionales como gerentes, coordinadores y líderes interesados en aplicar ciencia de datos en el ámbito empresarial. Es ideal para quienes trabajan con equipos de análisis y desean potenciar su conocimiento en inteligencia artificial y analítica de datos. Se recomienda experiencia laboral de al menos 3 años y conocimientos básicos en estadística y herramientas como Excel.

Conoce a nuestro trainer

Foto de Sergio Luque Mamani

Sergio Luque Mamani

Maestría, Bioestadística – Universidad Nacional Mayor de San Marcos.

Profesional con posgrado en Bioestadística y Matemática Aplicada por la UNMSM, con especializaciones en Big Data, Machine Learning y Deep Learning.

Cuenta con amplia experiencia docente en universidades como la UNMSM y la UPCH, dictando cursos de modelamiento matemático, programación y ciencia de datos. Ha sido instructor en Python y R, así como mentor en programas de formación en análisis de datos. En el ámbito profesional, se ha desempeñado como especialista en modelamiento matemático en el Ministerio de Salud y en proyectos de investigación en CONIDA, desarrollando algoritmos para procesamiento de imágenes satelitales. Ha sido ponente en congresos nacionales e internacionales y autor de publicaciones en modelado computacional y machine learning aplicados a la salud pública.

Certificación Internacional

Los participantes que cumplan satisfactoriamente con los requisitos y normas del programa recibirán:

Certificado Internacional
Para aprobar el curso se requiere obtener una nota mínima de 12 y acreditar al menos el 75% de asistencia. Ambos criterios son obligatorios para la certificación.
Loading
  • ¿Tienes preguntas? Ponte en contacto con nosotros

Iniciar