Spelling suggestions: "subject:"aprendizagem não supervisionado"" "subject:"prendizagem não supervisionado""
1 |
Métodos de agrupamentos em dois estágios aplicados a problemas de reconhecimento de padrõesSOUZA, Jefferson Rodrigo de 31 January 2010 (has links)
Made available in DSpace on 2014-06-12T15:56:12Z (GMT). No. of bitstreams: 2
arquivo2764_1.pdf: 1664422 bytes, checksum: 79eaee65874c2baef2a7f616acbbb579 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2010 / Fundação de Amparo à Ciência e Tecnologia do Estado de Pernambuco / A proposta desta dissertação é a criação de sistemas de reconhecimento de padrões baseada em abordagens híbridas, com o intuito de reduzir o tempo computacional e
melhorar o desempenho quando comparado com outras técnicas de agrupamento.
Esta dissertação propõe os métodos de agrupamentos SOMAK, que é a combinação dos Mapas Auto-Organizáveis (SOM) seguido do algoritmo Ant Kmédias (AK), ASCAK,
composto pelos os algoritmos ASCA e AK e SOINAK, composto pela Rede Neural Incremental
Auto-Organizável (SOINN) e AK. SOM é uma Rede Neural Artificial (RNA)
que permite a visualização de dados de alta dimensionalidade e implementa um mapeamento
ordenado de uma distribuição de alta dimensão dentro de uma grade regular de
baixa dimensão. ASCA e AK são algoritmos de agrupamentos baseados na otimização
da colônia de formigas (ACO). ACO é uma abordagem meta-heurística recentemente
proposta para resolver problemas de difícil otimização combinatória. SOINN é uma rede
neural de representação topológica útil para solucionar problemas de aprendizagem não
supervisionada, gerando grupos de dados correlacionados e pode ser capaz de realizar
este aprendizado de forma incremental.
SOMAK, ASCAK e SOINAK empregam SOM, ASCA e a rede neural SOINN respectivamente
como classificadores de características sobre os dados de entrada, ao invés
de realizar o agrupamento dos dados diretamente. Primeiro, um conjunto grande de
protótipos é formado pela rede neural SOM, o algoritmo ASCA e a rede neural incremental
SOINN. Na segunda etapa, os protótipos são interpretados e então combinados para
formar os agrupamentos finais ou definitivos.
O benefício dos métodos propostos é a redução de ruídos. O algoritmo AK modifica
o algoritmo K-médias localizando os objetos em seguida agrupando-os de acordo com
probabilidades que são atualizadas pelo feromônio.
SOINAK tem apresentado um melhor desempenho quando comparado com algumas
outras técnicas híbridas de agrupamento, diferentemente do desempenho alcançado pelos
métodos de agrupamentos SOMAK e ASCAK
|
2 |
Aplicação de métodos não supervisionados: estudo empírico com os dados de segurança pública do estado do Rio de JaneiroNascimento, Otto Tavares 20 December 2016 (has links)
Submitted by Otto Tavares Nascimento (otavares93@gmail.com) on 2017-05-12T09:14:03Z
No. of bitstreams: 1
Dissertação_Otto_Tavares_Nascimento.pdf: 9875781 bytes, checksum: fe5bb21c41c1cb3b1dc79d84841fe938 (MD5) / Approved for entry into archive by Leiliane Silva (leiliane.silva@fgv.br) on 2017-05-12T20:37:41Z (GMT) No. of bitstreams: 1
Dissertação_Otto_Tavares_Nascimento.pdf: 9875781 bytes, checksum: fe5bb21c41c1cb3b1dc79d84841fe938 (MD5) / Made available in DSpace on 2017-05-30T14:11:36Z (GMT). No. of bitstreams: 1
Dissertação_Otto_Tavares_Nascimento.pdf: 9875781 bytes, checksum: fe5bb21c41c1cb3b1dc79d84841fe938 (MD5)
Previous issue date: 2016-12-20 / Este trabalho é uma abordagem multidisciplinar, o qual aplica-se a metodologia de matemática aplicada, em específico, aprendizagem não supervisionada, a dados de segurança pública. Busca-se identificar a semelhança entre batalhões da polícia, utilizando métodos de clusterização de modo a otimizar numericamente o critério de avaliação de McClain. Além da otimização, aborda-se intuitivamente o modelo de clusterização hierárquica, para posteriormente extrair ordem no padrão criminal dos clusters e, finalmente, aplicar o modelo de classificação OLogit, utilizando variáveis características desses clusters. Encontramos evidência de clusterização dos dados e significância na utilização de dados socioeconômicos e de policiamento na ordenação dos clusters. Resumindo, quanto maior o efetivo policial por habitante e o IDH de renda mínima em determinado batalhão maior a probabilidade de se estar em um cluster de menor incidência criminal. / This multidisciplinary work use an applied math methodology, especially unsupervised learning, in public security data. We seek to find the similiarity beetwen policies battalions, using clustering methods, while otimizing numerically the McCLain index. Besides that, we extract learning from data, using OLogit models in cluster's order with feature variables. We find data clustering evidence and extract significance of socioeconomic and policing data in cluster's order. In summary, a higher police force per inhabitant and a higher minimum income HDI in a given batallion results in a greater probability of being in a cluster of lower criminal incidence.
|
3 |
Abordagem semi-supervisionada para detecção de módulos de software defeituososOLIVEIRA, Paulo César de 31 August 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2017-07-24T12:11:04Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Dissertação Mestrado Paulo César de Oliveira.pdf: 2358509 bytes, checksum: 36436ca63e0a8098c05718bbee92d36e (MD5) / Made available in DSpace on 2017-07-24T12:11:04Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Dissertação Mestrado Paulo César de Oliveira.pdf: 2358509 bytes, checksum: 36436ca63e0a8098c05718bbee92d36e (MD5)
Previous issue date: 2015-08-31 / Com a competitividade cada vez maior do mercado, aplicações de alto nível de
qualidade são exigidas para a automação de um serviço. Para garantir qualidade de
um software, testá-lo visando encontrar falhas antecipadamente é essencial no ciclo
de vida de desenvolvimento. O objetivo do teste de software é encontrar falhas que
poderão ser corrigidas e consequentemente, aumentar a qualidade do software em
desenvolvimento. À medida que o software cresce, uma quantidade maior de testes
é necessária para prevenir ou encontrar defeitos, visando o aumento da qualidade.
Porém, quanto mais testes são criados e executados, mais recursos humanos e de
infraestrutura são necessários. Além disso, o tempo para realizar as atividades de
teste geralmente não é suficiente, fazendo com que os defeitos possam escapar.
Cada vez mais as empresas buscam maneiras mais baratas e efetivas para detectar
defeitos em software. Muitos pesquisadores têm buscado nos últimos anos,
mecanismos para prever automaticamente defeitos em software. Técnicas de
aprendizagem de máquina vêm sendo alvo das pesquisas, como uma forma de
encontrar defeitos em módulos de software. Tem-se utilizado muitas abordagens
supervisionadas para este fim, porém, rotular módulos de software como defeituosos
ou não para fins de treinamento de um classificador é uma atividade muito custosa e
que pode inviabilizar a utilização de aprendizagem de máquina. Neste contexto, este
trabalho propõe analisar e comparar abordagens não supervisionadas e semisupervisionadas
para detectar módulos de software defeituosos. Para isto, foram
utilizados métodos não supervisionados (de detecção de anomalias) e também
métodos semi-supervisionados, tendo como base os classificadores AutoMLP e
Naive Bayes. Para avaliar e comparar tais métodos, foram utilizadas bases de dados
da NASA disponíveis no PROMISE Software Engineering Repository. / Because the increase of market competition then high level of quality applications
are required to provide automate services. In order to achieve software quality testing
is essential in the development lifecycle with the purpose of finding defect as earlier
as possible. The testing purpose is not only to find failures that can be fixed, but
improve software correctness and quality. Once software gets more complex, a
greater number of tests will be necessary to prevent or find defects. Therefore, the
more tests are designed and exercised, the more human and infrastructure
resources are needed. However, time to run the testing activities are not enough,
thus, as a result, it causes escape defects. Companies are constantly trying to find
cheaper and effective ways to software defect detection in earlier stages. In the past
years, many researchers are trying to finding mechanisms to automatically predict
these software defects. Machine learning techniques are being a research target, as
a way of finding software modules detection. Many supervised approaches are being
used with this purpose, but labeling software modules as defective or not defective to
be used in training phase is very expensive and it can make difficult machine learning
use. Considering that this work aims to analyze and compare unsupervised and
semi-supervised approaches to software module defect detection. To do so,
unsupervised methods (of anomaly detection) and semi-supervised methods using
AutoMLP and Naive Bayes algorithms were used. To evaluate and compare these
approaches, NASA datasets were used at PROMISE Software Engineering
Repository.
|
Page generated in 0.1056 seconds