• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • Tagged with
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Metodología de Clasificación Lineal por Partes: Piecewise Linear Support Vector Machines (PL-SVM)

Thiele Horta, Andrés Rodrigo January 2011 (has links)
El siguiente trabajo de tesis tiene como objetivo plantear una nueva metodología de clasificación binaria que permita obtener resultados predictivos equivalentes a los de los métodos tradicionales, pero salvaguardando caer en el fenómeno de caja negra. Este fenómeno se presenta cuando la técnica de clasificación no entrega interpretabilidad de la forma en que se efectúa la clasificación. El paradigma que se presenta es que, a mayor precisión del método, menor es la interpretabilidad que se obtiene, y viceversa. Una de las técnicas de aprendizaje estadístico con mejores desempeños predictivos es Support Vector Machines. Pueden construir un estimador de clasificación simple e interpretable (SVM-Lineal), o uno complejo (SVM-RBF) con el fenómeno de caja negra. El estimador simple asume que la función subyacente que discrimina las clases binarias es lineal, mientras que el otro supone lo contrario, produciendo un estimador que no es directamente interpretable. Para enfrentar este problema, se propone una metodología que construye un estimador lineal por partes. Globalmente, el estimador no es lineal, pero está compuesto por un número fijo de componentes lineales (SVM-Lineal). Cada componente lineal clasifica un subconjunto independiente de puntos del problema global. Conceptualmente, esta metodología trata de trazar un puente entre las dos técnicas tradicionales anteriores, manteniendo niveles de precisión comparables y salvaguardando la interpretabilidad. En el 100% de las pruebas de precisión de clasificación binaria realizadas, se obtuvo resultados iguales o mejores que el estimador SVM-Lineal. Con la ventaja adicional de que el nuevo estimador entrega una frontera compuesta por distintas funciones lineales independientes entre sí, que a su vez caracterizan de manera distinta a grupos independientes de puntos. En vez de ofrecer un único perfil de comportamiento como lo hace SVM-Lineal, el modelo propuesto ofrece tantos perfiles como componentes integran el estimador lineal por partes. La principal desventaja del método consiste en la etapa de segmentación de los datos binarios. Esta etapa hace la diferencia con respecto a las técnicas tradicionales, y su orden de complejidad es inclusive mayor al de una técnica de aprendizaje estadístico no lineal. Precisamente, una línea de trabajo a futuro consiste en optimizar el algoritmo de segmentación.

Page generated in 0.067 seconds