Descubrimiento de Conocimiento en Bases de Datos
- Profesor (Coordinador):
- Juan Pedro Caraça-Valente
- jpvalente@fi.upm.es
- Profesor:
- Aurora Pérez
- aurora@fi.upm.es
Semestre
Primer semestre
Créditos
4 ECTS
Resumen
Las técnicas de Descubrimiento de Conocimiento (o de Data Mining) en grandes volúmenes de información son ampliamente utilizadas hoy en día en diferentes dominios como la medicina, entornos bancarios, sistemas industriales, etc. y tienen una gran variedad de aplicaciones como por ejemplo el análisis de datos, la detección de fraude, el análisis de riesgos, campañas de mailing, etc.
En esta asignatura se revisarán todas las etapas del proceso de Descubrimiento de Conocimiento y se enumerarán las técnicas más importantes para cada etapa. Se hará hincapié en las técnicas de limpieza y preprocesado de los datos, frecuentemente olvidadas.
A continuación se abordarán las principales técnicas de Data Mining incluyendo técnicas de Clasificación, Clustering y Reglas de Asociación. Los algoritmos genéticos han tenido un gran auge en los últimos años, surgiendo numerosas aplicaciones de dichos algoritmos en el área de Descubrimiento de Conocimiento, por lo que también serán tratados en profundidad en esta asignatura.
Recientemente se ha producido una tendencia a la incorporación de información de carácter temporal en grandes Bases de Datos para conservar información histórica, para poder analizar la evolución de una variable o conocer los instantes en que un dato es válido. Además, hay dominios donde la información se presenta mayoritariamente en forma de Series Temporales las cuales requieren un tratamiento muy especializado. Por ello, se abordarán las técnicas de descubrimiento de información en series temporales ya que este tipo de datos suponen un desafío a las técnicas tradicionales de Data Mining y requieren el uso de nuevas soluciones.
Objetivos
- Conocer todas las etapas del proceso de Descubrimiento de Conocimiento, las principales técnicas de cada etapa y saber aplicarlas a un dominio concreto.
- Saber analizar un dominio (el problema, los datos y los objetivos) para determinar sus características más relevantes y su influencia en las decisiones sobre las técnicas de Data Mining que se deberán aplicar.
- Conocer las técnicas de Data Mining y saber aplicarlas a problemas concretos.
- Evaluar el funcionamiento y los resultados de un sistema de Descubrimiento de Conocimiento.
Programa
- Introducción
- Tipos de datos, Series temporales
- Conceptos básicos
- Proceso de Descubrimiento de Conocimiento
- Etapas del Proceso de Descubrimiento de Conocimiento
- Preprocesamiento de los datos para tipos básicos de datos y series temporales
- Herramientas de KDD
- Visión general
- Una herramienta de KDD: WEKA
- Técnicas de Data Mining
- Clasificación
- Métodos avanzados para el análisis de datos
- Clustering
- Técnicas en series temporales
- Evaluación
- Objetivos
- Técnicas de evaluación
Bibliografía
- WEKA
- J. Han; M. Kamber: "Data Mining: Concepts and Techniques". Morgan Kauffman. 2006
- M. Kantardzic: "Data Mining: Concepts, Models, Methods, and Algorithms". John Wiley & Sons. 2003.
- U. Fayyad; G. Piatetsky-Shapiro; P. Smyth: "From Data Mining to Knowledge Discovery in Databases". AI Magazine 17(3), 1996.
Idioma en que se imparte
Inglés
Competencias Específicas
Código | Competencia | Nivel |
---|---|---|
CEM2 | Adquirir un nivel avanzado de conocimientos que permita el análisis y la sintesis de soluciones a problemas que requieran aproximaciones novedosas para la definición de la infraestructura computacional, el procesamiento y el análisis de datos de diversa naturaleza. | S |
CEM7 | Conocer los fundamentos teóricos y capacitarse para evaluar las diversas técnicas disponibles para la extracción y descubrimiento de conocimiento a partir de grandes volúmenes de datos, y temas de investigación relacionados | S |
CEM8 | Aplicar los fundamentos teóricos y matemáticos adecuados al procesamiento y análisis de funciones y datos de diversa naturaleza, y evaluar y diseñar los métodos relacionados para su aplicación en dominios prácticos | S |
Resultados de Aprendizaje
Código | Resultado de Aprendizaje | Competencias asociadas | Nivel de Adquisición |
---|---|---|---|
RA-APDI-68 | Ser capaz de analizar un dominio para determinar la relevancia de sus características temporales y las tareas de descubrimiento de conocimiento que se podrían plantear | CEM2, CEM7, CEM8 | S |
RA-APDI-69 | Ser capaz de utilizar las técnicas de descubrimiento de conocimiento y su aplicabilidad en cada caso | CEM2, CEM7, CEM8 | S |
RA-APDI-70 | Ser capaz de realizar una evaluación completa del funcionamiento y utilidad de un proyecto de este tipo. | CEM2, CEM7, CEM8 | S |
Guía de Aprendizaje
Guía de aprendizaje de la asignatura: Descubrimiento de Conocimiento en Bases de Datos