Spelling suggestions: "subject:"dados simbólicos"" "subject:"dados imbólicos""
11 |
Uma abordagem adaptativa de learning vector quantization para classificação de dados intervalaresSilva Filho, Telmo de Menezes e 27 February 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T14:01:45Z
No. of bitstreams: 2
Dissertacao Telmo Filho_DEFINITIVA.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T14:01:45Z (GMT). No. of bitstreams: 2
Dissertacao Telmo Filho_DEFINITIVA.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-27 / A Análise de Dados Simbólicos lida com tipos de dados complexos, capazes de modelar a
variabilidade interna dos dados e dados imprecisos. Dados simbólicos intervalares surgem
naturalmente de valores como variação de temperatura diária, pressão sanguínea, entre
outros. Esta dissertação introduz um algoritmo de Learning Vector Quantization para
dados simbólicos intervalares, que usa uma distância Euclidiana intervalar ponderada e
generalizada para medir a distância entre instâncias de dados e protótipos.
A distância proposta tem quatro casos especiais. O primeiro caso é a distância
Euclidiana intervalar e tende a modelar classes e clusters com formas esféricas. O
segundo caso é uma distância intervalar baseada em protótipos que modela subregiões
não-esféricas e de tamanhos similares dentro das classes. O terceiro caso permite à
distância lidar com subregiões não-esféricas e de tamanhos variados dentro das classes. O
último caso permite à distância modelar classes desbalanceadas, compostas de subregiões
de várias formas e tamanhos. Experimentos são feitos para avaliar os desempenhos
do Learning Vector Quantization intervalar proposto, usando todos os quatro casos da
distância proposta. Três conjuntos de dados intervalares sintéticos e um conjunto de
dados intervalares reais são usados nesses experimentos e seus resultados mostram a
utilidade de uma distância localmente ponderada.
|
12 |
Uma abordagem adaptativa de learning vector quantization para classificação de dados intervalaresSilva Filho, Telmo de Menezes e 27 February 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T17:06:49Z
No. of bitstreams: 2
Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:23:59Z (GMT) No. of bitstreams: 2
Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:23:59Z (GMT). No. of bitstreams: 2
Dissertacao Telmo Silva Filho.pdf: 781380 bytes, checksum: fb398deff6f8aa856428277eb3236020 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-27 / A Análise de Dados Simbólicos lida com tipos de dados complexos, capazes de modelar a
variabilidade interna dos dados e dados imprecisos. Dados simbólicos intervalares surgem
naturalmente de valores como variação de temperatura diária, pressão sanguínea, entre
outros. Esta dissertação introduz um algoritmo de Learning Vector Quantization para
dados simbólicos intervalares, que usa uma distância Euclidiana intervalar ponderada e
generalizada para medir a distância entre instâncias de dados e protótipos.
A distância proposta tem quatro casos especiais. O primeiro caso é a distância
Euclidiana intervalar e tende a modelar classes e clusters com formas esféricas. O
segundo caso é uma distância intervalar baseada em protótipos que modela subregiões
não-esféricas e de tamanhos similares dentro das classes. O terceiro caso permite à
distância lidar com subregiões não-esféricas e de tamanhos variados dentro das classes. O
último caso permite à distância modelar classes desbalanceadas, compostas de subregiões
de várias formas e tamanhos. Experimentos são feitos para avaliar os desempenhos
do Learning Vector Quantization intervalar proposto, usando todos os quatro casos da
distância proposta. Três conjuntos de dados intervalares sintéticos e um conjunto de
dados intervalares reais são usados nesses experimentos e seus resultados mostram a
utilidade de uma distância localmente ponderada.
|
13 |
Modelo de Regressão Elíptico Bivariado IntervalarPaula, Laura Vicuña Torres de 21 August 2015 (has links)
Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2016-02-25T15:12:18Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Laura_Torres.pdf: 863817 bytes, checksum: 8fa460a07a7a29d10e0b7a64d4674663 (MD5) / Made available in DSpace on 2016-02-25T15:12:18Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Laura_Torres.pdf: 863817 bytes, checksum: 8fa460a07a7a29d10e0b7a64d4674663 (MD5)
Previous issue date: 2015-08-21 / Facepe / A análisededadossimbólicos(ADS)éumaabordagemestatísticabastanteutili-
zada emgrandesbasesdedadosetemcomocaracterísticaagregardadosemgruposde
interesse.Essestiposdedadospodemserrepresentadosporintervalos,conjuntosdecate-
gorias, distribuiçãodefrequência,distribuiçãodeprobabilidade,entreoutrostipos.Neste
trabalho abordaremosdadossimbólicosdotipointervaloquesãocomumenteutilizados
em aplicações nanceiras,mineraçãodedados,tráfegoderedes,dadoscon denciais,etc.
Inicialmente,ummodeloderegressãoelípticobivariadointervalarqueconsideraacor-
relação entreoslimitesinferioresesuperioresdeumavariávelsimbólicaintervalarfoi
proposto.Derivamosafunção escore e amatrizdeinformaçãode Fisher. Ométodo
de máximaverossimilhançafoidesenvolvidoparaestimaçãodosparâmetrosdomodelo
proposto.EstudosdesimulaçãodeMonteCarloemqueavaliamosasensibilidadedoerro
de previsãoquantoapresençadeintervalos outliers foram apresentados.Osresultados
mostraram queomodelo tStudentbivariadointervalarémenossensívelnapresençade
intervalos outliers do queomodelonormalbivariadointervalar.Umconjuntodedados
reais foiutilizadoparailustrarametodologiaabordada / The symbolicdataanalysis(SDA)isastatisticalapproachwidelyusedinlargedata-
bases andthatischaracterizedbyaggregatedataintointerestgroups.Thesedatatypes
mayberepresentedbyintervals,setsofcategories,frequencydistribution,probabilitydis-
tribution, amongothertypes.Inthispaperwediscusssymbolicdataofintervaltypethat
are commonlyusedin nancialapplications,datamining,networktra c,con dential
data, etc.First,anintervalbivariateellipticalregressionmodelthatconsidersthecorre-
lation betweentheupperandlowerlimitsofanintervalsymbolicvariablewasproposed.
WederivethescorefunctionandtheFisherinformationmatrix.Themaximumlikelihood
methodwasdevelopedtoestimatetheparametersoftheproposedmodel.MonteCarlo
simulationstudieswasperformedtoevaluatethesensitivityofthepredictiveerrorfor
the presenceofoutliersintervals.Theresultsshowedthattheintervalbivariate t-Student
modelislesssensitiveinpresenceofoutliersintervalsthantheintervalbivariatenormal
model.Arealdatasetswasusedtoillustratethediscussedmethodology.
|
14 |
Uma solução em filtragem de informação para sistemas de recomendação baseada em análise de dados simbólicosLeite Dantas Bezerra, Byron January 2004 (has links)
Made available in DSpace on 2014-06-12T15:58:32Z (GMT). No. of bitstreams: 2
arquivo4647_1.pdf: 2182294 bytes, checksum: 356178597c2bf16867ecf53d523ac6f8 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2004 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Sistemas de Recomendação permitem que sites de Comércio
Eletrônico sugiram produtos aos consumidores provendo informações
relevantes que os ajudem no processo de compra. Para isso é necessária
a aquisição e a adequada utilização do perfil do usuário. O processo de
aquisição pode ser implícito (comprar um livro ou consultar um item em
uma loja on-line) ou explícito (dar uma nota a um filme ou recomendar um
artigo a um amigo). Já as soluções propostas para o segundo problema
podem ser classificadas em duas categorias principais com relação ao tipo
de filtragem adotada: Filtragem Baseada em Conteúdo (baseia-se na
análise da correlação entre o conteúdo dos itens com o perfil do usuário) e
Filtragem Colaborativa (baseada na correlação de perfis de usuários). Tais
técnicas possuem limitações, como escalabilidade na primeira abordagem
e latência na segunda. Contudo, elas são complementares, o que
impulsiona o surgimento de filtragens híbridas, cujo foco é aproveitar o
melhor de cada método. Todavia, as filtragens híbridas não superam
completamente os problemas principais de ambos os métodos.
A motivação deste trabalho surge do desafio de superar os
problemas principais existentes nos métodos de Filtragem Baseada em
Conteúdo. Para isso, o trabalho concentra-se no domínio de recomendação
de filmes, caracterizado por atributos complexos, como sinopse, e no qual
predomina uma aquisição explícita do perfil do usuário. Diante disso, o
presente trabalho apresenta um novo método de filtragem de informação
baseado nas teorias de Análise de Dados Simbólicos.
Na abordagem proposta o perfil é modelado através de um
conjunto de descrições simbólicas modais que sumarizam as informações
dos itens previamente avaliados. Uma função de dissimilaridade que leva
em conta as diferenças em posição e em conteúdo foi criada a fim de
possibilitar a comparação entre um novo item e o perfil do usuário. Para
avaliar o desempenho deste novo método foi modelado um ambiente
experimental baseado no EachMovie e definida uma metodologia para
avaliação dos resultados. Para fins de comparação é utilizada a filtragem
de informação por conteúdo baseado no algoritmo dos k Vizinhos Mais
Próximos (kNN).
A construção de um ambiente experimental de avaliação do
modelo permitiu diagnosticar estatisticamente o melhor desempenho da
filtragem baseada em dados simbólicos modais, tanto em velocidade
quanto em memória, com relação ao método baseado no kNN
|
15 |
Agrupamento de dados simbólicos usando abordagem PossibilisticPimentel, Bruno Almeida 25 February 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-09T13:28:57Z
No. of bitstreams: 2
BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T13:28:57Z (GMT). No. of bitstreams: 2
BrunoAlmeidaPimentel.pdf: 2629725 bytes, checksum: 3c61892a3e135f9ca4c87c3fa5a73068 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-02-25 / CNPq / Este trabalho relata sobre os diferentes métodos de agrupamento presentes na literatura atual
e introduz métodos de agrupamento baseado na abordagem possibilística para dados intervalares.
Tem como objetivo estender os métodos clássicos de agrupamento possibilístico para
dados intervalares simbólicos. Além disso, é proposto uma nova abordagem possibilística em
que há um grau de pertinência diferente para cada variável e classe. A abordagem possibilística
considera a pertinência como possibilidades dos objetos a classes e a partição resultante dos
dados pode ser entendida como uma partição possibilística. O algoritmo conhecido dessa categoria
é o Possibilístic C-Means (PCM). No PCM, a otimização da função objetivo em alguns
conjuntos de dados pode ajudar a identificar outliers e dados ruidosos. A Análise de Dados
Simbólico (ADS) surgiu para lidar com variáveis simbólicas, que podem ser do tipo intervalos,
histogramas, e até mesmo funções, a fim de considerar a variabilidade e/ou a incerteza
inata aos dados. As técnicas de ADS tornam-se uma poderosa ferramenta quando usadas em
métodos de agrupamentos, o que causa um constante crescimento em pesquisas para o aprimoramento
destas técnicas usadas nos mais variados algoritmos, tais como em K-Means, Support
Vector Machine (SVM) e Kernel. Objetivando avaliar o desempenho dos métodos propostos e
os presentes na literatura, um estudo comparativo destes métodos em relação ao agrupamento
de objetos simbólicos do tipo intervalo é realizado. Foram planejados experimentos com dados
sintéticos, usando o experimento Monte Carlo, e dados reais. O índice corrigido de Rand (CR)
e a taxa de erro global de classificação (OERC) são usados para avaliar os métodos.
|
16 |
Soluções em personalização de conteúdo baseadas em classificadores simbólicos modaisLeite Dantas Bezerra, Byron 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T15:48:46Z (GMT). No. of bitstreams: 1
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2008 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Engenhos de Personalização são ferramentas úteis para se encontrar informações do
interesse de uma pessoa de forma efetiva. Para isso, eles capturam informações sobre os
usuários de um sistema para aprender sobre suas preferências. De posse destas
informações, os Engenhos de Personalização adotam técnicas de filtragem de informação
baseadas normalmente em classificadores com aprendizagem supervisionada. As técnicas
mais comuns definem as correlações entre os usuários da comunidade e, a partir daí,
disparam um processo conhecido popularmente como boca-à-boca . Outra técnica realiza
uma filtragem com base no conteúdo descritivo dos itens no repositório como, o elenco e o
gênero de um filme. Finalmente, existem abordagens híbridas que procuram combinar
diferentes técnicas absorvendo o que há de melhor em cada uma.
No presente trabalho fazemos uma leitura crítica do estado da arte relacionado aos
Engenhos de Personalização e, a partir daí, apresentamos três novos métodos baseados
em conceitos e ferramentas do domínio de Análise de Dados Simbólicos, em que cada um
deles segue uma técnica diferente: o método Content Modal Based Filtering realiza filtragem
de informação baseada no conteúdo; o método Social Modal Collaborative Filtering realiza
filtragem colaborativa; e o método Hybrid Modal Based Filtering realiza filtragem híbrida.
Definimos um processo de avaliação de desempenho das tecnologias de personalização
e o aplicamos para efeito de comparação dos nossos métodos com abordagens clássicas.
Em nossas análises consideramos dimensões relevantes para sistemas reais, mas pouco
exploradas nos trabalhos atuais, como o impacto da quantidade de itens no perfil do usuário
(associado ao Problema do Novo Usuário) e o tamanho da comunidade de usuários
(associado ao Problema da Esparsidade). Nos experimentos realizados constatamos que
duas de nossas abordagens de filtragem alcançaram desempenho em um cenário com
pouca informação sobre o usuário e alta esparsidade pouco abaixo de 4% comparado ao
desempenho obtido no cenário ideal. Nestas condições um dos métodos mais populares, a
filtragem colaborativa com kNN, apresenta uma queda de desempenho de 18,5%
|
17 |
Métodos robustos em regressão linear para dados simbólicos do tipo intervaloDOMINGUES, Marco Antonio de Oliveira 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:51:56Z (GMT). No. of bitstreams: 2
arquivo2961_1.pdf: 1358041 bytes, checksum: 6856c7acfe3c44063d89520f13a9da5f (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Pesquisa do Estado do Amazonas / A análise de dados simbólicos (Symbolic Data Analysis - SDA) tem se destacado como um
conjunto de ferramentas úteis à análise de grandes bases de dados, aprendizagem de máquina
e reconhecimento de padrões. Os dados simbólicos podem representar variáveis estruturadas,
listas, intervalos e distribuições. Nesse contexto, vários métodos estatísticos têm sido estendidos
para o domínio de SDA (análise de cluster, estatísticas descritivas, componentes principais,
análise fatorial, regressão linear, e outras). Como exemplo, os métodos de regressão linear
propostos recentemente para dados simbólicos são extensões do método dos mínimos quadrados
para minimização dos erros do modelo. Estes métodos estimam os parâmetros do modelo
da regressão linear considerando apenas as informações sobre os pontos médios (centros) das
variáveis simbólicas, considerando os valores dos limites inferiores e superiores dos intervalos
e considerando os valores dos pontos médios e das amplitudes dos intervalos.
Apesar da técnica dos mínimos quadrados ser computacionalmente simples, a qualidade
dos ajustes é degradada quando o conjunto sob investigação contém dados atípicos. Na análise
de regressão clássica, esses dados atípicos são frequentemente removidos do conjunto de dados
sob investigação, sendo normalmente considerados como erros do processo. Contudo, em SDA,
esse tipo de procedimento não é aconselhável, haja vista um dado simbólico poder representar
a generalização de um conjunto de outras observações clássicas.
Este trabalho propõe um método resistente (robusto) de regressão linear para dados simbólicos
do tipo intervalo, paramétrico, inspirado na análise de regressão simétrica, cujos estimadores
tenham alto ponto de ruptura . O método proposto permite ainda a construção de intervalos
de confiança e testes de hipóteses para os parâmetros do ajuste, enquanto os métodos encontrados
na literatura não estabelecem suposições probabilísticas. Além disso, considerando que
a ausência de observações atípicas em um conjunto de dados indica a possibilidade de utilização
de métodos baseados nos mínimos quadrados, esta tese também propõe um conjunto de
técnicas para a identificação de dados simbólicos intervalares atípicos
|
18 |
Extensão de técnicas clássicas para análise de séries temporais do tipo intervaloLuis Santiago Maia, André 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:52:00Z (GMT). No. of bitstreams: 2
arquivo3072_1.pdf: 2151220 bytes, checksum: b28a86f3cf1758147db2ac214690331d (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Os dados simbólicos apresentam, em sua estrutura, formas interessantes para se transformar grandes bases de dados clássicos em novos conjuntos de dados de tamanho reduzido, facilitando a manipulação e proporcionando novas técnicas de análise dos mesmos. No entanto, mesmo com os recentes avanços promovidos por pesquisadores nesta área, o volume de técnicas de manipulação e, consequentemente, de análise de dados simbólicos (ADS) ainda é incipiente.
Uma série temporal do tipo intervalo (STI), no campo de dados simbólicos, pode ser definida como um conjunto de intervalos observados sequencialmente no tempo, em que cada intervalo é descrito por um vetor bidimensional com elementos em IR representados pelo limite superior e pelo limite inferior. O desenvolvimento de técnicas para previsão de STI é uma área de pesquisa muito promissora e os poucos resultados relatados na literatura surgiram muito recentemente.
Nesta tese, estendemos técnicas clássicas de análise de séries temporais para descrição, modelagem e previsão de STI no domínio de ADS. Neste contexto, nós apresentamos técnicas para descrição de uma STI, envolvendo cálculo de estatísticas sumárias e representação gráfica dos dados.
Na modelagem, apresentamos métodos que consistem na explicação do processo gerador da STI a partir de certo modelo, bem como métodos de estimação de parâmetros e métodos para avaliação da qualidade do modelo, em termos do ajuste
|
19 |
Group recommendation strategies based on collaborative filteringRicardo de Melo Queiroz, Sérgio January 2003 (has links)
Made available in DSpace on 2014-06-12T15:59:01Z (GMT). No. of bitstreams: 2
arquivo4812_1.pdf: 2843132 bytes, checksum: cf053779fad5d73c77a2b107542256b3 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2003 / Ricardo de Melo Queiroz, Sérgio; de Assis Tenório Carvalho, Francisco. Group recommendation strategies based on collaborative filtering. 2003. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2003.
|
Page generated in 0.0672 seconds