Máster Universitario en Software y Sistemas

Conceptos, Prácticas y Retos en Data Mining

Profesor:
Ernestina Menasalvas
emenasalvas@fi.upm.es
Profesor (Coordinador):
Francisco Javier Segovia
fsegovia@fi.upm.es

Semestre

Segundo semestre

Créditos

4 ECTS

Resumen

En esta asignatura, se detallarán las técnicas, los procesos de desarrollo, los modelos y los retos para desarrollo de proyectos de minería de datos. Un impresionante 60% de los proyectos de inteligencia empresarial son abandonados o fracasan debido a una planificación inadecuada, tareas inacabadas, el incumplimiento de los plazos, una gestión defectuosa de los proyectos, la no entrega de los requisitos empresariales, o la entrega de productos de bajo calidad.

Todo proyecto de inteligencia empresarial implica el desarrollo de un proyecto de minería de datos concebido para descubrir la inteligencia empresarial. Se han propuesto muchos modelos de proceso para el desarrollo de proyectos de minería de datos. Es evidente que, a pesar de todas las investigaciones y proyectos que se han llevado a cabo, todavía hoy el modo en el que se desarrollan los proyectos de minería de datos se acerca más a un arte que a un proceso ingenieril. Los expertos en minería de datos traducen intuitivamente los requisitos empresariales a unos objetivos y técnicas para la minería de datos, lo que implica que los proyectos dependen completamente de sus desarrolladores. Si se marcha el experto en minería de datos, el proyecto fracasará porque no habrá indicado o documentado los pasos a seguir.

La primera pregunta que se plantea es, ¿cuál es la metodología que se debe seguir para transformar los objetivos empresariales en objetivos para la minería de datos? Desgraciadamente, no existe hasta la fecha esta metodología. Para responder a esta pregunta, hay que abordar cuestiones como: ¿cómo se especifican los objetivos empresariales? ¿Qué es un objetivo en el campo de la minería de datos? ¿Qué tipos de problemas puede resolver la minería de datos? ¿Qué tienen en común todos los problemas? ¿Cuáles son los requisitos para resolver con éxito un problema dado? En esta asignatura, se abordará la multitud de aproximaciones que pretenden resolver estos problemas. Convertir el desarrollo de proyectos de inteligencia empresarial en una verdadera disciplina ingenieril implica la aplicación de metodologías que se ajustan a este nuevo tipo de proyectos. Las prácticas tradicionales de desarrollo son inadecuadas e inapropiadas ya que, en todas las organizaciones, la inteligencia empresarial es un área en evolución, sujeto a cambios y mejoras continuos basados en la información recibida de la comunidad empresarial.

Objetivos

Programa

  1. Proceso de Data Mining
    1. Comprensión de la empresa
    2. Comprensión de los datos
    3. Preprocesado
    4. Modelado
    5. Evaluación
    6. Implantación
  2. Modelado en Data Mining
    1. Reglas de asociación
    2. Clasificación
    3. Agrupamiento (clustering)
  3. Estudio de casos
    1. Objetivos empresariales
    2. Criterios de éxito empresarial
    3. Objetivos de la minería de datos
    4. Criterios de éxito de la minería de datos
    5. Descripción de los datos (informe)
    6. Exploración de los datos
    7. Selección de los datos
    8. Descripción de la técnica de modelado
    9. Diseño de las pruebas
    10. Construcción del modelo
    11. Descripción, evaluación y valoración del modelo
    12. Implantación del plan

Bibliografía

Prerrequisitos

Método de Evaluación

La asignatura se evaluara mediante los casos de estudio, los informes de los trabajos y la asistencia y participación en clase.

Idioma en que se imparte

Inglés

Competencias Específicas

Más información:

Esta tabla muestra el código, la descripción y el nivel de cada una de las competencias específicas de la asignatura

Código Competencia Nivel
CEM2 Analizar y sintetizar soluciones a problemas que requieran aproximaciones novedosas para la definición de la infraestructura computacional que permita el procesamiento y el análisis de datos de diversa naturaleza. P
CEM7 Evaluar y aplicar las diversas teorías matemáticas y estadísticas, y los procesos, métodos y técnicas disponibles para la extracción y descubrimiento de conocimiento a partir de grandes volúmenes de datos. P

Resultados de Aprendizaje

Más información:

Esta tabla muestra cada el código, la descripción, las competencias asociadas y el nivel de adquisición de cada uno de los resultados de aprendizaje de la asignatura

Código Resultado de Aprendizaje Competencias asociadas Nivel de Adquisición
RA-APDI-1 Ser capaz de realizar data mining a través de un proceso, demostrando su competencia en un estándar incluyendo las fases de conocimiento del negocio, conocimiento de los datos, análisis exploratorio de los datos, modelado, evaluación y explotación CEM2, CEM7 P
RA-APDI-2 Manejar aplicaciones software para realizar tareas de data mining CEM2, CEM7 P
RA-APDI-3 Comprender los fundamentos y aplicar un amplio y variado repertorio de algoritmos de clustering, estimación, predicción y clasificación. CEM2, CEM7 P
RA-APDI-4 Conocer ejemplos de aplicaciones reales y tendencias y líneas de investigación CEM2, CEM7 P

Guía de Aprendizaje

Guía de aprendizaje de la asignatura: Conceptos, Prácticas y Retos en Data Mining