Return to search

Combinando regressão linear clusterwise e k-means com ponderação automática das variáveis explicativas

Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-22T19:08:28Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-29T19:40:07Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5) / Made available in DSpace on 2018-08-29T19:40:07Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5)
Previous issue date: 2017-07-21 / Este trabalho propõe um método de regressão linear do tipo clusterwise cujo objetivo é fornecer modelos de regressão linear baseados em grupos homogêneos de observações em relação às variáveis explicativas e que são bem ajustados em relação à variável de resposta. Para atingir esse objetivo, este método combina o método regressão linear do tipo clusterwise padrão e o método de agrupamento K-means com a ponderação automática das variáveis explicativas. Os pesos das variáveis explicativas mudam em cada iteração do algoritmo e são diferentes de uma variável para outra. Assim, este método é capaz de selecionar as variáveis relevantes na busca por clusters homogêneos em relação às variáveis explicativas. Por fim, uma vez que ele aprende simultaneamente um protótipo de grupo e um modelo de regressão linear para cada cluster, ele é capaz de atribuir um modelo de regressão apropriado para uma observação desconhecida com base na sua descrição através de suas variáveis explicativas. Experimentos com conjuntos de dados sintéticos e reais corroboram a utilidade do método proposto. / This work gives a linear regression method of the clusterwise type aiming to provide linear regression models that are based on homogeneous clusters of observations w.r.t. the explanatory variables and that are well fitted w.r.t. the response variable. To achieve this goal, this method combines the standard clusterwise linear regression method and the K-means clustering method with the automatic weighting of the explanatory variables. The relevance weights of the explanatory variables change in each iteration of the algorithm and are different from one variable to another. Thus, this method is able to select the relevant variables in the search for homogeneous clusters w.r.t. the explanatory variables. Finally, since it simultaneously learns a prototype and a linear regression model for each cluster, this method is able to assign an appropriate regression model to an unknown observation based on its description through its explanatory variables. Experiments with synthetic and real datasets corroborate the utility of the proposed method.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/26011
Date21 July 2017
CreatorsSILVA, Ricardo Azevedo Moreira da
Contributorshttp://lattes.cnpq.br/3909162572623711, CARVALHO, Francisco de Assis Tenório de
PublisherUniversidade Federal de Pernambuco, Programa de Pos Graduacao em Ciencia da Computacao, UFPE, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0018 seconds