Tecnicatura Universitaria en Ciencia de Datos: contenidos mínimos de asignaturas

Materias Obligatorias

Lógica: Cálculo proposicional. Cuantificación. Métodos de demostración. Conjuntos. Álgebra de conjuntos. Relaciones, equivalencia, orden, funciones y operaciones. Cardinalidad.

Geometría Analítica: Vectores, recta y plano en el espacio. Sistema de coordenadas cartesianas. Producto
interno, perpendicularidad y ángulo. Distancias en el espacio. Matrices y determinantes. Sistemas de
ecuaciones lineales. R2 y R3 como espacios vectoriales, subespacios e independencia lineal. Transformaciones lineales y matrices asociadas en R2 y R3. Cónicas, rectas tangentes y problemas relacionados. Cuádricas. Coordenadas polares y esféricas.

Álgebra y Teoría de Números: Números reales. Números naturales como el menor conjunto inductivo.
Principio de buena ordenación. Inducción completa y generalizada. Números enteros. Algoritmo de Euclides. Teorema fundamental de la aritmética. Congruencias, enteros módulo n. Números racionales. Números complejos. Anillo de polinomios. Introducción a las estructuras algebraicas.

Cálculo I: Números reales. Funciones. Límite de funciones, continuidad. Derivada y diferencial. Integración, integrales definidas. Sucesiones y límites. Series.

Programación y Algoritmos: Introducción a un lenguaje de programación y al pensamiento algorítmico.
Sintaxis del lenguaje. Tipos de datos básicos. Funciones. Estructuras de control: repetitivas, condicionales.
Subrutinas. Estructuras de datos: tuplas, arreglos, listas. Módulos y paquetes. Algoritmos de búsqueda,
recorrido y ordenamiento. Tipos de datos abstractos: Pila, Cola, Diccionario. Técnicas de diseño de algoritmos: divide y conquista, programación dinámica, greedy, backtracking. Archivos. Estructuras de lectura y escritura de datos.

Álgebra Lineal: Espacios vectoriales. Generadores. Bases. Matriz asociada a una transformación lineal.
Espacios vectoriales con producto interno. Bases ortonormales. Método de Gram-Schmidt. Autovalores y
autovectores. Polinomio característico y minimal. Formas normales. Operadores sobre espacios vectoriales con producto interno.

Cálculo II: Elementos de topología en Rn. Introducción al cálculo vectorial. Funciones de varias variables.
Límites. Continuidad. Derivadas parciales. Diferencial. Extremos. Integrales curvilíneas. Integrales de superficie. Integrales múltiples. Teoremas de Green, de Stokes y de la Divergencia.

Taller de Programación Orientada a Objetos: Conceptos básicos. Clases y objetos. Mensajes. Tipos de
relaciones: asociación, agregación y composición. Encapsulamiento. Herencia. Polimorfismo.

Laboratorio de Datos: Análisis exploratorio de datos unidimensionales y multidimensionales: representación gráfica y tabular, medidas descriptivas, medidas de asociación entre variables. Análisis
exploratorios basados en las preguntas de interés. Población y muestras. Herramientas para el análisis de datos en PC. Obtención y carga de datos. Limpieza y transformación de datos: eliminación de datos duplicados, normalización. Paquetes gráficos para la visualización de datos. Introducción a un lenguaje de programación estadístico.

Estructuras Discretas: Métodos de conteo. Permutaciones y combinaciones con y sin repetición. Grafos.
Caminos y ciclos. Subgrafos. Circuitos de Euler. Ciclos de Hamilton. Algoritmo de Dijkstra. Grafos planares.
Coloreo de vértices y de aristas. Árboles. Árboles generadores. Algoritmos de Primm y de Kruskal. Software aplicado a grafos. Matching. Flujo en redes. Teorema del flujo máximo y corte mínimo.

Bases de Datos: Estructuras clásicas de almacenamiento de datos: elementos de una base de datos, relación de datos, tablas, consultas, formularios, informes. Estructuras físicas y lógicas de datos. Virtualización de bases de datos. Arquitectura de servidores. Sistemas de gestión de bases de datos. Tecnologías propietarias y no propietarias. Aplicaciones más usuales, componentes y funciones principales: optimización de consultas, transacciones, concurrencia y recuperación. Implementaciones. Normativas nacionales sobre protección de datos personales y bases de datos en empresas.

Probabilidad y Estadística: Probabilidad. Probabilidad Condicional. Variables aleatorias. Distribuciones
discretas y continuas. Momentos. Función generadora. Ley de los grandes números. Tipos de convergencias. Teorema Central del Límite. Estimación puntual. Intervalos de confianza. Propiedades de los estimadores. Estimación por intervalos. Pruebas de Hipótesis.

Métodos Numéricos: Análisis de errores. Análisis de algoritmos. Resolución de ecuaciones no lineales.
Métodos de aproximación de funciones por interpolación y por mínimos cuadrados. Métodos de integración numérica. Métodos directos e iterativos para la resolución de sistemas lineales. Aproximación de autovalores y autovectores. Resolución de sistemas de ecuaciones no lineales.

Aprendizaje Automático: Tipos de aprendizaje automático. Conjunto de datos de entrenamiento,
validación y testeo. Clasificador de Naive-Bayes. Perceptrón. Redes neuronales. Retropropagación. Reducción de dimensionalidad. Aprendizaje probabilístico. Máquinas de Soporte Vectorial. Árboles de decisión. Métodos de ensamble: boosting, bagging, bosques aleatorios. Algoritmos de aprendizaje no supervisado. Ejemplos de sesgos para IA: de género, raciales, étnicos, ideológicos, etc.

Métodos Estadísticos para el Análisis de Datos I: Inferencias basadas en dos muestras. Análisis de
varianza (ANOVA). Regresión lineal simple y múltiple. Métodos de regularización (Ridge, Lasso). Regresión
logística y otros modelos. Nociones de regresión robusta y regresión no paramétrica. Técnicas y métricas de evaluación de modelos y métodos (validación cruzada, etc). Simulación de variables aleatorias. Métodos de remuestreo (bootstrap y jacknife). Introducción a los métodos bayesianos.

Métodos Estadísticos para el Análisis de Datos II: Métodos no paramétricos. Distribución empírica.
Tests de bondad de ajuste: chi-cuadrado para datos discretos, Kolmogorov-Smirnov para datos continuos, test de normalidad. Análisis de datos categóricos: tests de independencia y homogeneidad. Test de rangos de Mann-Whitney o Wilcoxon, test de Kruskal-Wallis. Visualización de datos multivariados. Distribución normal multivariada. Métodos de reducción de la dimensión: análisis de componentes principales, análisis factorial, análisis de correlación canónica y análisis de correspondencia. Análisis de agrupamientos; k-medias y técnicas de agrupamiento jerárquico.

Aprendizaje Profundo: Redes neuronales profundas. Regularización. Métodos de optimización para
entrenamiento. Redes neuronales convolucionales. Redes neuronales recurrentes y recursivas. Autoencoders. Aprendizaje por transferencia. Utilización de redes previamente entrenadas. Aplicaciones prácticas: visión por computadora, procesamiento de lenguaje natural (NLP), reconocimiento de voz. Herramientas computacionales para el aprendizaje profundo.