Minería de Datos
- Profesor (Coordinador):
- Francisco Javier Segovia
- fsegovia@fi.upm.es
- Profesor:
- Ernestina Menasalvas
- emenasalvas@fi.upm.es
Semestre
Segundo semestre
Créditos
4 ECTS
Resumen
En esta asignatura, se detallarán las técnicas, los procesos de desarrollo, los modelos y los retos para desarrollo de proyectos de minería de datos. Un impresionante 60% de los proyectos de inteligencia empresarial son abandonados o fracasan debido a una planificación inadecuada, tareas inacabadas, el incumplimiento de los plazos, una gestión defectuosa de los proyectos, la no entrega de los requisitos empresariales, o la entrega de productos de bajo calidad.
Todo proyecto de inteligencia empresarial implica el desarrollo de un proyecto de minería de datos concebido para descubrir la inteligencia empresarial. Se han propuesto muchos modelos de proceso para el desarrollo de proyectos de minería de datos. Es evidente que, a pesar de todas las investigaciones y proyectos que se han llevado a cabo, todavía hoy el modo en el que se desarrollan los proyectos de minería de datos se acerca más a un arte que a un proceso ingenieril. Los expertos en minería de datos traducen intuitivamente los requisitos empresariales a unos objetivos y técnicas para la minería de datos, lo que implica que los proyectos dependen completamente de sus desarrolladores. Si se marcha el experto en minería de datos, el proyecto fracasará porque no habrá indicado o documentado los pasos a seguir.
En la asignatura se aprenderá una metodología para convertir los objetivos empresariales en objetivos de análisis de datos, y se aprenderán las técnicas básicas de estadística e Inteligencia Artificial para alcanzar dichos objetivos practicando con una herramienta de Data Mining profesional y bases de datos reales.
Objetivos
- Conocer ejemplos de aplicaciones reales y tendencias y líneas de investigación
- Manejar aplicaciones software para realizar tareas de Data Mining
- Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación
Programa
- Introducción a la ingeniería de datos
- La herramienta: IBM SPSS Modeler
- Análisis descriptivo, diagnóstico, predictivo y prescriptivo
- Análisis RFM
- Agrupamiento
- Regresión lineal
- Regresión logística
- Vecino más cercano
- Árboles de decisión
- Redes neuronales
- Métodos de conjunto
- Reglas de asociación
- Tratando con el tiempo
Bibliografía
- D. Hand: "Principles of Data Mining (Adaptive Computation and Machine Learning)", MIT Press, 2001
- J. Han, M. Kamber: "Data Mining: Concepts and Techniques", Morgan Kaufmann, 2006
- M. J. A. Berry, G. Linoff: "Data Mining Techniques: for Marketing, Sales and Customer Support", John Wiley & Sons, 1997
- P. Tan, M. Steinbach, V. Kumar: "Introduction to Data Mining", Pearson Addison Wesley, 2005
- I. Witten, E. Frank, M. Hall: "Data Mining: Practical Machine Learning Tools and Techniques", Morgan Kaufmann, 2011
Prerrequisitos
- Inteligencia Artificial
- Estadística
Idioma en que se imparte
Inglés
Competencias Específicas
Código | Competencia | Nivel |
---|---|---|
CEM7 | Evaluar y aplicar las diversas teorías matemáticas y estadísticas, y los procesos, métodos y técnicas disponibles para la extracción y descubrimiento de conocimiento a partir de grandes volúmenes de datos. | P |
Resultados de Aprendizaje
Código | Resultado de Aprendizaje | Competencias asociadas | Nivel de Adquisición |
---|---|---|---|
RA-APDI-19 | Ser capaz de realizar data mining a través de un proceso, demostrando su competencia en un estándar incluyendo las fases de conocimiento del negocio, conocimiento de los datos, análisis exploratorio de los datos, modelado, evaluación y explotación | CEM7 | P |
RA-APDI-21 | Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación. | CEM7 | P |