Minería de Datos

Profesor (Coordinador):
Francisco Javier Segovia
fsegovia@fi.upm.es
Profesor:
Ernestina Menasalvas
emenasalvas@fi.upm.es

Semestre

Segundo semestre

Créditos

4 ECTS

Resumen

En esta asignatura, se detallarán las técnicas, los procesos de desarrollo, los modelos y los retos para desarrollo de proyectos de minería de datos. Un impresionante 60% de los proyectos de inteligencia empresarial son abandonados o fracasan debido a una planificación inadecuada, tareas inacabadas, el incumplimiento de los plazos, una gestión defectuosa de los proyectos, la no entrega de los requisitos empresariales, o la entrega de productos de bajo calidad.

Todo proyecto de inteligencia empresarial implica el desarrollo de un proyecto de minería de datos concebido para descubrir la inteligencia empresarial. Se han propuesto muchos modelos de proceso para el desarrollo de proyectos de minería de datos. Es evidente que, a pesar de todas las investigaciones y proyectos que se han llevado a cabo, todavía hoy el modo en el que se desarrollan los proyectos de minería de datos se acerca más a un arte que a un proceso ingenieril. Los expertos en minería de datos traducen intuitivamente los requisitos empresariales a unos objetivos y técnicas para la minería de datos, lo que implica que los proyectos dependen completamente de sus desarrolladores. Si se marcha el experto en minería de datos, el proyecto fracasará porque no habrá indicado o documentado los pasos a seguir.

En la asignatura se aprenderá una metodología para convertir los objetivos empresariales en objetivos de análisis de datos, y se aprenderán las técnicas básicas de estadística e Inteligencia Artificial para alcanzar dichos objetivos practicando con una herramienta de Data Mining profesional y bases de datos reales.

Objetivos

  • Conocer ejemplos de aplicaciones reales y tendencias y líneas de investigación
  • Manejar aplicaciones software para realizar tareas de Data Mining
  • Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación

Programa

  1. Introducción a la ingeniería de datos
  2. La herramienta: IBM SPSS Modeler
  3. Análisis descriptivo, diagnóstico, predictivo y prescriptivo
  4. Análisis RFM
  5. Agrupamiento
  6. Regresión lineal
  7. Regresión logística
  8. Vecino más cercano
  9. Árboles de decisión
  10. Redes neuronales
  11. Métodos de conjunto
  12. Reglas de asociación
  13. Tratando con el tiempo

Bibliografía

Prerrequisitos

  • Inteligencia Artificial
  • Estadística

Idioma en que se imparte

Inglés

Competencias Específicas

Código, descripción y nivel de cada una de las competencias específicas de la asignatura
Código Competencia Nivel
CEM7 Evaluar y aplicar las diversas teorías matemáticas y estadísticas, y los procesos, métodos y técnicas disponibles para la extracción y descubrimiento de conocimiento a partir de grandes volúmenes de datos. P

Resultados de Aprendizaje

Código, descripción, competencias asociadas y nivel de adquisición de cada uno de los resultados de aprendizaje de la asignatura
Código Resultado de Aprendizaje Competencias asociadas Nivel de Adquisición
RA-APDI-19 Ser capaz de realizar data mining a través de un proceso, demostrando su competencia en un estándar incluyendo las fases de conocimiento del negocio, conocimiento de los datos, análisis exploratorio de los datos, modelado, evaluación y explotación CEM7 P
RA-APDI-21 Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación. CEM7 P

Guía de Aprendizaje

Guía de aprendizaje: Minería de Datos