Global ETD Search

11	Uma abordagem adaptativa de learning vector quantization para classificação de dados intervalares Silva Filho, Telmo de Menezes e 27 February 2013 (has links) Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T14:01:45Z No. of bitstreams: 2 Dissertacao Telmo Filho_DEFINITIVA.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T14:01:45Z (GMT). No. of bitstreams: 2 Dissertacao Telmo Filho_DEFINITIVA.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-27 / A Análise de Dados Simbólicos lida com tipos de dados complexos, capazes de modelar a variabilidade interna dos dados e dados imprecisos. Dados simbólicos intervalares surgem naturalmente de valores como variação de temperatura diária, pressão sanguínea, entre outros. Esta dissertação introduz um algoritmo de Learning Vector Quantization para dados simbólicos intervalares, que usa uma distância Euclidiana intervalar ponderada e generalizada para medir a distância entre instâncias de dados e protótipos. A distância proposta tem quatro casos especiais. O primeiro caso é a distância Euclidiana intervalar e tende a modelar classes e clusters com formas esféricas. O segundo caso é uma distância intervalar baseada em protótipos que modela subregiões não-esféricas e de tamanhos similares dentro das classes. O terceiro caso permite à distância lidar com subregiões não-esféricas e de tamanhos variados dentro das classes. O último caso permite à distância modelar classes desbalanceadas, compostas de subregiões de várias formas e tamanhos. Experimentos são feitos para avaliar os desempenhos do Learning Vector Quantization intervalar proposto, usando todos os quatro casos da distância proposta. Três conjuntos de dados intervalares sintéticos e um conjunto de dados intervalares reais são usados nesses experimentos e seus resultados mostram a utilidade de uma distância localmente ponderada. Análise de Dados Simbólicos Learning Vector Quantization Distância Ponderada
12	Uma abordagem adaptativa de learning vector quantization para classificação de dados intervalares Silva Filho, Telmo de Menezes e 27 February 2013 (has links) Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T17:06:49Z No. of bitstreams: 2 Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:23:59Z (GMT) No. of bitstreams: 2 Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:23:59Z (GMT). No. of bitstreams: 2 Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-27 / A Análise de Dados Simbólicos lida com tipos de dados complexos, capazes de modelar a variabilidade interna dos dados e dados imprecisos. Dados simbólicos intervalares surgem naturalmente de valores como variação de temperatura diária, pressão sanguínea, entre outros. Esta dissertação introduz um algoritmo de Learning Vector Quantization para dados simbólicos intervalares, que usa uma distância Euclidiana intervalar ponderada e generalizada para medir a distância entre instâncias de dados e protótipos. A distância proposta tem quatro casos especiais. O primeiro caso é a distância Euclidiana intervalar e tende a modelar classes e clusters com formas esféricas. O segundo caso é uma distância intervalar baseada em protótipos que modela subregiões não-esféricas e de tamanhos similares dentro das classes. O terceiro caso permite à distância lidar com subregiões não-esféricas e de tamanhos variados dentro das classes. O último caso permite à distância modelar classes desbalanceadas, compostas de subregiões de várias formas e tamanhos. Experimentos são feitos para avaliar os desempenhos do Learning Vector Quantization intervalar proposto, usando todos os quatro casos da distância proposta. Três conjuntos de dados intervalares sintéticos e um conjunto de dados intervalares reais são usados nesses experimentos e seus resultados mostram a utilidade de uma distância localmente ponderada. Análise de dados simbólicos Learning Vector Quantization Distância ponderada
13	Modelo de Regressão Elíptico Bivariado Intervalar Paula, Laura Vicuña Torres de 21 August 2015 (has links) Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2016-02-25T15:12:18Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Laura_Torres.pdf: 863817 bytes, checksum: 8fa460a07a7a29d10e0b7a64d4674663 (MD5) / Made available in DSpace on 2016-02-25T15:12:18Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Laura_Torres.pdf: 863817 bytes, checksum: 8fa460a07a7a29d10e0b7a64d4674663 (MD5) Previous issue date: 2015-08-21 / Facepe / A análisededadossimbólicos(ADS)éumaabordagemestatísticabastanteutili- zada emgrandesbasesdedadosetemcomocaracterísticaagregardadosemgruposde interesse.Essestiposdedadospodemserrepresentadosporintervalos,conjuntosdecate- gorias, distribuiçãodefrequência,distribuiçãodeprobabilidade,entreoutrostipos.Neste trabalho abordaremosdadossimbólicosdotipointervaloquesãocomumenteutilizados em aplicações nanceiras,mineraçãodedados,tráfegoderedes,dadoscon denciais,etc. Inicialmente,ummodeloderegressãoelípticobivariadointervalarqueconsideraacor- relação entreoslimitesinferioresesuperioresdeumavariávelsimbólicaintervalarfoi proposto.Derivamosafunção escore e amatrizdeinformaçãode Fisher. Ométodo de máximaverossimilhançafoidesenvolvidoparaestimaçãodosparâmetrosdomodelo proposto.EstudosdesimulaçãodeMonteCarloemqueavaliamosasensibilidadedoerro de previsãoquantoapresençadeintervalos outliers foram apresentados.Osresultados mostraram queomodelo tStudentbivariadointervalarémenossensívelnapresençade intervalos outliers do queomodelonormalbivariadointervalar.Umconjuntodedados reais foiutilizadoparailustrarametodologiaabordada / The symbolicdataanalysis(SDA)isastatisticalapproachwidelyusedinlargedata- bases andthatischaracterizedbyaggregatedataintointerestgroups.Thesedatatypes mayberepresentedbyintervals,setsofcategories,frequencydistribution,probabilitydis- tribution, amongothertypes.Inthispaperwediscusssymbolicdataofintervaltypethat are commonlyusedin nancialapplications,datamining,networktra c,con dential data, etc.First,anintervalbivariateellipticalregressionmodelthatconsidersthecorre- lation betweentheupperandlowerlimitsofanintervalsymbolicvariablewasproposed. WederivethescorefunctionandtheFisherinformationmatrix.Themaximumlikelihood methodwasdevelopedtoestimatetheparametersoftheproposedmodel.MonteCarlo simulationstudieswasperformedtoevaluatethesensitivityofthepredictiveerrorfor the presenceofoutliersintervals.Theresultsshowedthattheintervalbivariate t-Student modelislesssensitiveinpresenceofoutliersintervalsthantheintervalbivariatenormal model.Arealdatasetswasusedtoillustratethediscussedmethodology. Análise de dados simbólicos Intervalos outliers Modelo de regressão elíptico bivariadointervalar
14	Uma solução em filtragem de informação para sistemas de recomendação baseada em análise de dados simbólicos Leite Dantas Bezerra, Byron January 2004 (has links) Made available in DSpace on 2014-06-12T15:58:32Z (GMT). No. of bitstreams: 2 arquivo4647_1.pdf: 2182294 bytes, checksum: 356178597c2bf16867ecf53d523ac6f8 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2004 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Sistemas de Recomendação permitem que sites de Comércio Eletrônico sugiram produtos aos consumidores provendo informações relevantes que os ajudem no processo de compra. Para isso é necessária a aquisição e a adequada utilização do perfil do usuário. O processo de aquisição pode ser implícito (comprar um livro ou consultar um item em uma loja on-line) ou explícito (dar uma nota a um filme ou recomendar um artigo a um amigo). Já as soluções propostas para o segundo problema podem ser classificadas em duas categorias principais com relação ao tipo de filtragem adotada: Filtragem Baseada em Conteúdo (baseia-se na análise da correlação entre o conteúdo dos itens com o perfil do usuário) e Filtragem Colaborativa (baseada na correlação de perfis de usuários). Tais técnicas possuem limitações, como escalabilidade na primeira abordagem e latência na segunda. Contudo, elas são complementares, o que impulsiona o surgimento de filtragens híbridas, cujo foco é aproveitar o melhor de cada método. Todavia, as filtragens híbridas não superam completamente os problemas principais de ambos os métodos. A motivação deste trabalho surge do desafio de superar os problemas principais existentes nos métodos de Filtragem Baseada em Conteúdo. Para isso, o trabalho concentra-se no domínio de recomendação de filmes, caracterizado por atributos complexos, como sinopse, e no qual predomina uma aquisição explícita do perfil do usuário. Diante disso, o presente trabalho apresenta um novo método de filtragem de informação baseado nas teorias de Análise de Dados Simbólicos. Na abordagem proposta o perfil é modelado através de um conjunto de descrições simbólicas modais que sumarizam as informações dos itens previamente avaliados. Uma função de dissimilaridade que leva em conta as diferenças em posição e em conteúdo foi criada a fim de possibilitar a comparação entre um novo item e o perfil do usuário. Para avaliar o desempenho deste novo método foi modelado um ambiente experimental baseado no EachMovie e definida uma metodologia para avaliação dos resultados. Para fins de comparação é utilizada a filtragem de informação por conteúdo baseado no algoritmo dos k Vizinhos Mais Próximos (kNN). A construção de um ambiente experimental de avaliação do modelo permitiu diagnosticar estatisticamente o melhor desempenho da filtragem baseada em dados simbólicos modais, tanto em velocidade quanto em memória, com relação ao método baseado no kNN Comércio eletrônico Personalização Sistemas de recomendação Filtragem de informação Análise de dados simbólicos
15	Agrupamento de dados simbólicos usando abordagem Possibilistic Pimentel, Bruno Almeida 25 February 2013 (has links) Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T13:28:57Z No. of bitstreams: 2 BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T13:28:57Z (GMT). No. of bitstreams: 2 BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-02-25 / CNPq / Este trabalho relata sobre os diferentes métodos de agrupamento presentes na literatura atual e introduz métodos de agrupamento baseado na abordagem possibilística para dados intervalares. Tem como objetivo estender os métodos clássicos de agrupamento possibilístico para dados intervalares simbólicos. Além disso, é proposto uma nova abordagem possibilística em que há um grau de pertinência diferente para cada variável e classe. A abordagem possibilística considera a pertinência como possibilidades dos objetos a classes e a partição resultante dos dados pode ser entendida como uma partição possibilística. O algoritmo conhecido dessa categoria é o Possibilístic C-Means (PCM). No PCM, a otimização da função objetivo em alguns conjuntos de dados pode ajudar a identificar outliers e dados ruidosos. A Análise de Dados Simbólico (ADS) surgiu para lidar com variáveis simbólicas, que podem ser do tipo intervalos, histogramas, e até mesmo funções, a fim de considerar a variabilidade e/ou a incerteza inata aos dados. As técnicas de ADS tornam-se uma poderosa ferramenta quando usadas em métodos de agrupamentos, o que causa um constante crescimento em pesquisas para o aprimoramento destas técnicas usadas nos mais variados algoritmos, tais como em K-Means, Support Vector Machine (SVM) e Kernel. Objetivando avaliar o desempenho dos métodos propostos e os presentes na literatura, um estudo comparativo destes métodos em relação ao agrupamento de objetos simbólicos do tipo intervalo é realizado. Foram planejados experimentos com dados sintéticos, usando o experimento Monte Carlo, e dados reais. O índice corrigido de Rand (CR) e a taxa de erro global de classificação (OERC) são usados para avaliar os métodos. Análise de Dados Simbólicos Dados Intervalares Ruido Outlier
16	Soluções em personalização de conteúdo baseadas em classificadores simbólicos modais Leite Dantas Bezerra, Byron 31 January 2008 (has links) Made available in DSpace on 2014-06-12T15:48:46Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Engenhos de Personalização são ferramentas úteis para se encontrar informações do interesse de uma pessoa de forma efetiva. Para isso, eles capturam informações sobre os usuários de um sistema para aprender sobre suas preferências. De posse destas informações, os Engenhos de Personalização adotam técnicas de filtragem de informação baseadas normalmente em classificadores com aprendizagem supervisionada. As técnicas mais comuns definem as correlações entre os usuários da comunidade e, a partir daí, disparam um processo conhecido popularmente como boca-à-boca . Outra técnica realiza uma filtragem com base no conteúdo descritivo dos itens no repositório como, o elenco e o gênero de um filme. Finalmente, existem abordagens híbridas que procuram combinar diferentes técnicas absorvendo o que há de melhor em cada uma. No presente trabalho fazemos uma leitura crítica do estado da arte relacionado aos Engenhos de Personalização e, a partir daí, apresentamos três novos métodos baseados em conceitos e ferramentas do domínio de Análise de Dados Simbólicos, em que cada um deles segue uma técnica diferente: o método Content Modal Based Filtering realiza filtragem de informação baseada no conteúdo; o método Social Modal Collaborative Filtering realiza filtragem colaborativa; e o método Hybrid Modal Based Filtering realiza filtragem híbrida. Definimos um processo de avaliação de desempenho das tecnologias de personalização e o aplicamos para efeito de comparação dos nossos métodos com abordagens clássicas. Em nossas análises consideramos dimensões relevantes para sistemas reais, mas pouco exploradas nos trabalhos atuais, como o impacto da quantidade de itens no perfil do usuário (associado ao Problema do Novo Usuário) e o tamanho da comunidade de usuários (associado ao Problema da Esparsidade). Nos experimentos realizados constatamos que duas de nossas abordagens de filtragem alcançaram desempenho em um cenário com pouca informação sobre o usuário e alta esparsidade pouco abaixo de 4% comparado ao desempenho obtido no cenário ideal. Nestas condições um dos métodos mais populares, a filtragem colaborativa com kNN, apresenta uma queda de desempenho de 18,5% Classificadores Simbólicos Modais Análise de Dados Simbólicos Sistemas de Recomendação Personalização Filtragem de Informação
17	Métodos robustos em regressão linear para dados simbólicos do tipo intervalo DOMINGUES, Marco Antonio de Oliveira 31 January 2010 (has links) Made available in DSpace on 2014-06-12T15:51:56Z (GMT). No. of bitstreams: 2 arquivo2961_1.pdf: 1358041 bytes, checksum: 6856c7acfe3c44063d89520f13a9da5f (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Fundação de Amparo à Pesquisa do Estado do Amazonas / A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas, listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais, análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo da regressão linear considerando apenas as informações sobre os pontos médios (centros) das variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos e considerando os valores dos pontos médios e das amplitudes dos intervalos. Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA, esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar a generalização de um conjunto de outras observações clássicas. Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados na literatura não estabelecem suposições probabilísticas. Além disso, considerando que a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de técnicas para a identificação de dados simbólicos intervalares atípicos Análise de dados simbólicos
18	Extensão de técnicas clássicas para análise de séries temporais do tipo intervalo Luis Santiago Maia, André 31 January 2010 (has links) Made available in DSpace on 2014-06-12T15:52:00Z (GMT). No. of bitstreams: 2 arquivo3072_1.pdf: 2151220 bytes, checksum: b28a86f3cf1758147db2ac214690331d (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Os dados simbólicos apresentam, em sua estrutura, formas interessantes para se transformar grandes bases de dados clássicos em novos conjuntos de dados de tamanho reduzido, facilitando a manipulação e proporcionando novas técnicas de análise dos mesmos. No entanto, mesmo com os recentes avanços promovidos por pesquisadores nesta área, o volume de técnicas de manipulação e, consequentemente, de análise de dados simbólicos (ADS) ainda é incipiente. Uma série temporal do tipo intervalo (STI), no campo de dados simbólicos, pode ser definida como um conjunto de intervalos observados sequencialmente no tempo, em que cada intervalo é descrito por um vetor bidimensional com elementos em IR representados pelo limite superior e pelo limite inferior. O desenvolvimento de técnicas para previsão de STI é uma área de pesquisa muito promissora e os poucos resultados relatados na literatura surgiram muito recentemente. Nesta tese, estendemos técnicas clássicas de análise de séries temporais para descrição, modelagem e previsão de STI no domínio de ADS. Neste contexto, nós apresentamos técnicas para descrição de uma STI, envolvendo cálculo de estatísticas sumárias e representação gráfica dos dados. Na modelagem, apresentamos métodos que consistem na explicação do processo gerador da STI a partir de certo modelo, bem como métodos de estimação de parâmetros e métodos para avaliação da qualidade do modelo, em termos do ajuste Análise de séries temporais Dados do tipo intervalo Análise de dados simbólicos Alisamento exponencial Modelos ARMA e ARIMA Redes neurais artificiais
19	Group recommendation strategies based on collaborative filtering Ricardo de Melo Queiroz, Sérgio January 2003 (has links) Made available in DSpace on 2014-06-12T15:59:01Z (GMT). No. of bitstreams: 2 arquivo4812_1.pdf: 2843132 bytes, checksum: cf053779fad5d73c77a2b107542256b3 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2003 / Ricardo de Melo Queiroz, Sérgio; de Assis Tenório Carvalho, Francisco. Group recommendation strategies based on collaborative filtering. 2003. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2003. Recommendations for groups Recommender systems Collaborative filtering symbolic data analysis Information filtering Recomendação para grupos Sistemas de recomendação Filtragem colaborativa Análise de dados simbólicos Filtragem de informação

Search results