Skip to content

Selección de atributos con Support Vector Machines

Oferta de tesi de màster
Informació General

Títol de la tesi: Selección de atributos con Support Vector Machines

Data de caducitat: 31/12/2012
Orientació: recerca

Departament del director de la tesi: LSI
Director de la tesi: Enrique Romero
Correu electrònic: eromero@lsi.upc.edu

Descripció breu:
El proyecto tiene como objetivo principal estudiar el comportamiento de las Support Vector Machines en la selección de atributos, así como la implementación de un software eficiente.

Ampliació de la informació:
En los últimos años se ha observado un incremento considerable de la utilización de las Support Vector Machines (SVM) en tareas de aprendizaje, tanto por sus interesantes propiedades teóricas como por sus buenos resultados prácticos. En algunos casos, sin embargo, cuando se trabaja con datos reales, la presencia de ruido en los datos hace que el rendimiento empeore notablemente. Ejemplos de ruido pueden ser: presencia de variables irrelevantes, errores de medición en los datos, errores de etiquetado, etc. La selección de atributos intenta seleccionar el subconjunto óptimo (bajo un cierto criterio) de los atributos existentes. El proceso de selección puede ser dependiente o independiente del modelo que acabará usando esos atributos (las SVM en este caso).
Aunque han aparecido diferentes métodos de selección de atributos específicos para SVM, no está claro que superen a los métodos clásicos. Tampoco hay un consenso claro sobre qué método usar en un caso real. El proyecto consistiría en estudiar diferentes métodos de selección de atributos (básicamente las estrategias de búsqueda) con SVM. A partir del análisis de los resultados seguramente se podrán proponer variaciones de algunos de ellos y/o métodos nuevos, adaptados a las características específicas de las SVM. Dado que muchos de ellos pueden tener un coste computacional elevado, es fundamental que la implementación sea lo más eficiente posible.

Requisits mínims i coneixements previs:
Se recomienda tener conocimientos (mínimos, no es imprescindible) de análisis matemático y ser buen programador en C.