Módulos
1 - Fundamentos de Ciencia de Datos y Programación
- Sesión 1: Introducción a la Ciencia de Datos y Python para Data Science
- ¿Qué es la Ciencia de Datos? Ciclo de vida de un proyecto.
- Roles en ciencia de datos (científico, analista, ingeniero, etc.).
- Aplicaciones reales en distintas industrias.
- Herramientas y entornos de trabajo.
- Instalación y configuración (Anaconda, Jupyter).
- Sintaxis básica de Python: tipos de datos, variables y operadores.
- Estructuras de control (condicionales y bucles).
- Funciones y manejo de errores.
- Sesión 2: Librerías clave (NumPy, Pandas, Matplotlib/Seaborn)
- Introducción a NumPy: arrays, operaciones y funciones.
- Uso de Pandas: Series, DataFrames, importación/exportación.
- Limpieza y transformación de datos.
- Introducción a visualización con Matplotlib.
- Visualizaciones estadísticas con Seaborn.
2 - Estadística y Matemáticas Aplicadas
- Sesión 3: Estadística y Matemáticas Aplicadas
- Estadística descriptiva: media, mediana, moda, varianza, desviación estándar.
- Visualización de datos estadísticos.
- Distribuciones de probabilidad (normal, binomial, etc.).
- Inferencia estadística: estimaciones y pruebas de hipótesis.
- Álgebra lineal: vectores, matrices, operaciones básicas.
- Cálculo diferencial aplicado a funciones de costo.
- Probabilidad y combinatoria.
- Optimización: gradiente y mínimos locales/globales.
3 - Fundamentos de Big Data y Arquitecturas
- Sesión 4: Fundamentos del Big Data (las 5V y casos de uso)
- Definición de Big Data y las 5V (Volumen, Velocidad, Variedad, Veracidad, Valor).
- Estructurados vs no estructurados vs semiestructurados.
- Casos de uso en salud, retail, finanzas, etc.
- Sesión 5: Arquitectura de Big Data (Hadoop, Spark, Data Lakes vs Warehouses)
- Componentes del ecosistema Hadoop.
- Introducción a Apache Spark: ventajas y casos de uso.
- Data Lakes vs Data Warehouses.
- Procesamiento batch vs streaming.
4 - Machine Learning
- Sesión 6: Aprendizaje Supervisado y No Supervisado
- Concepto de aprendizaje supervisado.
- Regresión lineal y regresión logística.
- Árboles de decisión y random forests.
- Preparación de datos para modelos supervisados.
- Concepto de aprendizaje no supervisado.
- Clustering (K-means, DBSCAN) y reducción de dimensionalidad (PCA).
- Casos de uso: segmentación de clientes, análisis exploratorio.
- Sesión 7: Evaluación de Modelos
- Conjuntos de entrenamiento, validación y prueba.
- Métricas: accuracy, precision, recall, F1-score, ROC-AUC.
- Overfitting vs underfitting y validación cruzada.
- Ajuste de hiperparámetros (GridSearchCV, RandomizedSearchCV).
5 - Deep Learning y Redes Neuronales
- Sesión 8: Fundamentos de Redes Neuronales
- ¿Qué es el deep learning? Perceptrón y redes básicas.
- Funciones de activación.
- Propagación hacia adelante y retropropagación (backpropagation).
- Sesión 9: Arquitecturas Avanzadas (CNN, RNN, LSTM)
- CNN para imágenes.
- RNN para datos secuenciales y LSTM para secuencias largas.
- Casos de uso: visión computacional, series temporales.
- Frameworks populares: TensorFlow, PyTorch, Keras.
6 - Procesamiento de Lenguaje Natural (NLP)
- Sesión 10: Procesamiento de Lenguaje Natural (NLP)
- Introducción al NLP y aplicaciones.
- Preprocesamiento: tokenización, stemming, lematización.
- Representación: Bag of Words, TF-IDF, Word Embeddings.
- Modelos básicos para clasificación de texto.
- Introducción conceptual a transformers y BERT.
7 - Inteligencia Artificial Aplicada
- Sesión 11: IA generativa, chatbots y casos de uso
- Diferencias entre Machine Learning, Deep Learning e Inteligencia Artificial.
- IA generativa: definición y aplicaciones.
- Funcionamiento básico de modelos generativos (p. ej. GPT, DALL·E).
- Construcción y aplicación de chatbots.
- Casos de uso reales en distintas industrias.
8 - Visualización y Business Intelligence
- Sesión 12: Herramientas de Visualización y BI
- Principios de visualización efectiva de datos.
- Power BI y Tableau (introducción y comparativa).
- Creación de dashboards interactivos.
- Conexión a fuentes de datos.
- Métricas e indicadores clave (KPIs).
9 - Ética y Gobernanza en IA
- Sesión 13: Ética, Gobernanza y IA Responsable
- Principios éticos en el desarrollo de IA.
- Sesgos algorítmicos y sus riesgos.
- Marco legal y regulaciones (conceptos generales).
- Transparencia algorítmica y explicabilidad (XAI).
- Gobernanza de datos: privacidad, seguridad y transparencia algorítmica.
- Diseño de IA responsable y centrada en el ser humano.
10 - Proyecto Final Integrador
- Sesión 14: Desarrollo de Proyecto
- Definición del problema o caso a resolver.
- Recolección, análisis y preparación de datos.
- Aplicación de modelos aprendidos.
- Visualización de resultados y conclusiones.
- Presentación y defensa del proyecto final.
Este curso está dirigido a profesionales como gerentes, coordinadores y líderes interesados en aplicar ciencia de datos en el ámbito empresarial. Es ideal para quienes trabajan con equipos de análisis y desean potenciar su conocimiento en inteligencia artificial y analítica de datos. Se recomienda experiencia laboral de al menos 3 años y conocimientos básicos en estadística y herramientas como Excel.