Minería de Datos

Profesor (Coordinador):
Francisco Javier Segovia
fsegovia@fi.upm.es
Profesor:
Ernestina Menasalvas
emenasalvas@fi.upm.es

Semestre

Segundo semestre

Créditos

4 ECTS

Resumen

En esta asignatura, se detallarán las técnicas, los procesos de desarrollo, los modelos y los retos para desarrollo de proyectos de minería de datos. Un impresionante 60% de los proyectos de inteligencia empresarial son abandonados o fracasan debido a una planificación inadecuada, tareas inacabadas, el incumplimiento de los plazos, una gestión defectuosa de los proyectos, la no entrega de los requisitos empresariales, o la entrega de productos de bajo calidad.

Todo proyecto de inteligencia empresarial implica el desarrollo de un proyecto de minería de datos concebido para descubrir la inteligencia empresarial. Se han propuesto muchos modelos de proceso para el desarrollo de proyectos de minería de datos. Es evidente que, a pesar de todas las investigaciones y proyectos que se han llevado a cabo, todavía hoy el modo en el que se desarrollan los proyectos de minería de datos se acerca más a un arte que a un proceso ingenieril. Los expertos en minería de datos traducen intuitivamente los requisitos empresariales a unos objetivos y técnicas para la minería de datos, lo que implica que los proyectos dependen completamente de sus desarrolladores. Si se marcha el experto en minería de datos, el proyecto fracasará porque no habrá indicado o documentado los pasos a seguir.

En la asignatura se aprenderá una metodología para convertir los objetivos empresariales en objetivos de análisis de datos, y se aprenderán las técnicas básicas de estadística e Inteligencia Artificial para alcanzar dichos objetivos practicando con una herramienta de Data Mining profesional y bases de datos reales.

Objetivos

  • Conocer ejemplos de aplicaciones reales y tendencias y líneas de investigación
  • Manejar aplicaciones software para realizar tareas de Data Mining
  • Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación

Programa

  1. Introducción a la ingeniería de datos
  2. La herramienta: IBM SPSS Modeler
  3. Análisis descriptivo, diagnóstico, predictivo y prescriptivo
  4. Análisis RFM
  5. Agrupamiento
  6. Regresión lineal
  7. Regresión logística
  8. Vecino más cercano
  9. Árboles de decisión
  10. Redes neuronales
  11. Métodos de conjunto
  12. Reglas de asociación
  13. Tratando con el tiempo

Bibliografía

Prerrequisitos

  • Inteligencia Artificial
  • Estadística

Idioma en que se imparte

Inglés

Competencias Específicas

Código, descripción y nivel de cada una de las competencias específicas de la asignatura
Código Competencia Nivel
CEM2 Analizar y sintetizar soluciones a problemas que requieran aproximaciones novedosas para la definición de la infraestructura computacional que permita el procesamiento y el análisis de datos de diversa naturaleza C
CEM7 Evaluar y aplicar las diversas teorías matemáticas y estadísticas, y los procesos, métodos y técnicas disponibles para la extracción y descubrimiento de conocimiento a partir de grandes volúmenes de datos. P
CEM8 Aplicar los fundamentos teóricos y matemáticos adecuados al procesamiento y análisis de funciones y datos de diversa naturaleza, y evaluar y diseñar los métodos relacionados para su aplicación en dominios prácticos P

Resultados de Aprendizaje

Código, descripción, competencias asociadas y nivel de adquisición de cada uno de los resultados de aprendizaje de la asignatura
Código Resultado de Aprendizaje Competencias asociadas Nivel de Adquisición
RA-APDI-20 Manejar aplicaciones software para realizar tareas de data mining CEM2, CEM7 P
RA-APDI-21 Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación. CEM2, CEM7, CEM8 P
RA-APDI-22 Conocer ejemplos de aplicaciones reales y tendencias y líneas de investigación CEM2, CEM7 P

Guía de Aprendizaje

Guía de aprendizaje: Minería de Datos