51 |
Mapeamento semântico incremental com aprendizagem online e não-supervisionadaSOUSA, Ygor César Nogueira 20 March 2017 (has links)
Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-01T20:14:58Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ygor Cesar Nogueira Sousa.pdf: 5852968 bytes, checksum: 99160f17e56209e78af6af2d703ca011 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-03T19:31:06Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ygor Cesar Nogueira Sousa.pdf: 5852968 bytes, checksum: 99160f17e56209e78af6af2d703ca011 (MD5) / Made available in DSpace on 2018-08-03T19:31:06Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ygor Cesar Nogueira Sousa.pdf: 5852968 bytes, checksum: 99160f17e56209e78af6af2d703ca011 (MD5)
Previous issue date: 2017-03-20 / CNPq / A crescente inclusão de robôs móveis na vida cotidiana das pessoas, compartilhando espaço como agentes em diferentes atividades, tem dado impulso à criação de uma série de novas tecnologias compostas. Neste contexto, aparece o Mapeamento Semântico, que visa criar uma abstração ou representação do espaço em que um robô navega, a fim de proporcionar um meio para comum entendimento e comunicação entre estes robôs e seres humanos. Essa abstração é criada sob a forma de um mapa que agrega informações semânticas (isto é, informações que façam sentido para um ser humano em termos de comunicação) sobre o ambiente no qual o robô se encontra. Desta forma, esta dissertação introduz uma abordagem de Mapeamento Semântico incremental, com aprendizagem online e não-supervisionada, baseada em Mapas Auto-organizáveis (SOMs) de topologia variante no tempo. A abordagem se divide no módulo de mapeamento, o qual cria mapas topológicos de ambientes incrementalmente, enriquecidos com objetos reconhecidos como informação semântica determinante, e no módulo de categorização de lugares, dotado de um método de aprendizagem incremental, não-supervisionado, com treinamento online, baseado em SOM. Com o intuito de avaliar a viabilidade da abordagem, a mesma foi testada a partir de experimentos realizados com uma base dados reais, os quais demonstraram de forma promissora sua capacidade na aquisição incremental de mapas topológicos enriquecidos com informações semânticas e na categorização de lugares mapeados a partir destas informações. / The increasing inclusion of mobile robots in people’s daily lives, sharing space as agents in a range of different activities, has given rise to the creation of a series of new composite technologies. In this context, it appears the Semantic Mapping, which aims to create an abstraction or representation of space in which a robot navigates in order to provide a means for common understanding and communication between these robots and humans. This abstraction is created in the form of a map that aggregates semantic information (i.e., information that makes sense to a human in terms of communication) about the environment in which the robot is. In this way, this dissertation introduces an incremental semantic mapping approach, with online and unsupervised learning, based on self-organizing maps (SOMs) with time-varying topology. The approach is divided into the mapping module, which incrementally creates topological maps of environments, enriched with recognized objects as determinant semantic information, and in the module of places categorization, endowed with an incremental, unsupervised learning method with online training, based on SOM. In order to evaluate the viability of the approach, it was tested in experiments with real world data, which demonstrated a promising capability for the incremental acquisition of topological maps enriched with semantic information and for the categorization of places based on this information.
|
52 |
Consenso de segmentações de imagens usando classificação de padrõesOLIVEIRA, Wendeson da Silva 22 February 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-14T18:05:13Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-16T20:09:40Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5) / Made available in DSpace on 2018-08-16T20:09:40Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Wendeson da Silva Oliveira.pdf: 6642155 bytes, checksum: e280283f3dc04c84da6f92e144a5155d (MD5)
Previous issue date: 2017-02-22 / FACEPE / O processamento e a análise de imagens caracterizam-se em 5 fases: aquisição, préprocessamento, segmentação, representação/descrição, e reconhecimento de imagens. Este trabalho situa-se na área de segmentação de imagens médicas 2D. O principal objetivo da segmentação consiste em dividir uma imagem em regiões ou objetos que a compõem. A segmentação de imagens é alvo de vários estudos e pesquisas para o desenvolvimento de métodos mais abrangentes e computacionalmente mais eficientes, principalmente em imagens médicas. Uma etapa crucial para a extração de informações automatizadas em imagens médicas, geralmente envolve a segmentação das regiões da imagem a fim de quantificar volumes e áreas de interesse de tecidos biológicos para posterior diagnóstico e localização de patologias. Um desafio importante que deve ser levado em consideração no desenvolvimento de algoritmos de segmentação de imagens médicas é como avaliar o desempenho do método. Este tipo de avaliação de desempenho geralmente é feito através da comparação dos resultados de algoritmos automáticos versus uma segmentação de referência, denominada de ground-truth. Em particular, a estimativa de ground-truth em imagens médicas pode ser obtida através do contorno manual ou ainda através de métodos interativos de segmentação. No entanto, essas abordagens podem ser extremamente trabalhosas e sujeitas a variabilidades inter e intra usuários. Uma alternativa para diminuir essa variabilidade é a segmentação utilizando o consenso da resposta de vários usuários para uma mesma imagem. Um método de consenso de segmentações tem a finalidade de combinar várias segmentações de uma mesma imagem. Este trabalho tem como principal objetivo propor uma abordagem para estimar o ground-truth em imagens médicas. A abordagem consiste nas duas principais contribuições deste trabalho. Na primeira, um novo sistema colaborativo COSE (Collaborative Segmentation) foi desenvolvido para obter várias segmentações de uma mesma imagem com o intuito de estimar o ground-truth. Já a segunda, propõe um novo método para o consenso de segmentações de imagens médicas, denominado ISECO (Intelligent SEgmentation COnsensus). Os principais métodos de consenso de segmentações utilizam apenas informações binárias. No entanto, o ISECO apresenta como principal diferencial o fato de utilizar informações extraídas da imagem em nível de cinza para auxiliar na classificação dos pixels em foreground ou background utilizando um modelo de aprendizagem. A extração de características é baseada em três extratores de textura: filtros de Gabor, Local Binary Pattern (LBP) e Local Directional Pattern (LDP). Outra abordagem para o consenso de segmentações, denominada Distance Transform Merge (DTM) também é proposta neste trabalho tendo como objetivo ser um método simples e rápido. Os métodos de consenso propostos são avaliados e comparados com outras abordagens disponíveis na literatura utilizando 4 bases de imagens. A avaliação das abordagens mostra que o ISECO apresenta resultado tão bom ou melhor que os principais métodos da literatura. / Image processing is characterized by five steps: acquisition, pre-processing, segmentation, representation/description and image recognition. In this thesis, we work with the problem the 2D medical image segmentation. The main purpose of image segmentation is to divide an image into regions. Image segmentation has been a subject of several studies and research for the development of more comprehensive and computationally more efficient methods, especially in medical imaging. A challenge that must be taken into account in the development of medical image segmentation algorithms is how to evaluate the performance of the method. This type of performance evaluation is usually done by comparing the results of automatic algorithms versus a reference segmentation, called the ground-truth. In particular, the estimation of ground-truth in medical images can be obtained through manual segmentation or interactive segmentation methods. However, these approaches can be extremely subjective and subject to both intra and inter user variability. An alternative to reduce this variability is image segmentation using the consensus of multiple segmentations of a single image. A segmentation consensus method has the purpose of combining multiple segmentations of the same image. This work proposes an approach to estimate the ground-truth in medical images. The approach consists of two parts. At first, we development a collaborative system called COSE (Collaborative SEgmentation) to obtain various segmentations of the same image in order to estimate the ground-truth. The second proposals is a new method for the consensus of medical image segmentations, called ISECO (Intelligent SEgmentation CCnsensus). The main consensus segmentation methods in the state-of-the-art uses only binary information. However, the ISECO proposes to use gray-scale image information to classify pixels in foreground or background. However, ISECO has as main differential the use of information extracted from the image in gray-scale to assist in the classification of pixels in foreground or background using a learning model. The features extraction is based on three texture extractors: Gabor filters, Local Binary Pattern (LBP) and Local Directional Pattern (LDP). Another approach to segmentation consensus, called Distance Transform Merge (DTM), is also proposed in this work, aiming to be a simple and fast method. The proposed consensus methods are evaluated and compared with other approaches available in the literature using 4 image database. Evaluation of the approaches shows that the ISECO presents better results than the main methods of the literature.
|
53 |
Um classificador baseado em perturbaçõesARAÚJO, Edson Leite 10 April 2017 (has links)
Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:44:41Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-24T21:24:41Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5) / Made available in DSpace on 2018-08-24T21:24:41Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Edson Leite de Araújo.pdf: 2460675 bytes, checksum: c90cfbf77664407874232bd551663f9c (MD5)
Previous issue date: 2017-04-10 / Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza fortemente dos vetores médios, μi, e matrizes de covariância, Σi, de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto, as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros μi e Σi sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros μi e Σi ou numa combinação de ambos. Nesta área, várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de vetores de suporte(SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente aos k-Nearest Neighboor com k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões. / Many pattern recognition algorithms are probabilistic in their structure and as such, they use statistical inference to determine the best label for a given instance to be classified. The statistical inference is based generally on Bayes theory which strongly uses the average vectors, μi, and covariance matrices, Σi, of existing classes in the training data. These parameters are unknown and estimates are made by following various algorithms. However, the estimates made exclusively from the training data are still the most used. Because they are estimates, the parameters μi and Σi are perturbed when a new vector is inserted into the class which they belong to. Evaluating the perturbations that occurred in all classes simulating a possible inclusion of the instance to be classified in the same one, we defined in this work a new decision rule which assigns the test instance to the class in which occurs the slightest perturbation μi and Σi parameters or the combination of both. In this area, several approaches are possible, it’s worth mentioning the decision trees, neural networks, instance-based learning and the support vector machine (SVM). However, until the moment of the writing of this text, was not found in the literature, approaches that use parameters perturbations to pattern’s classification. In tests performed initially on synthetic data and later on 21 real databases available in the UCI Repository Learning, was verified that perturbation-based classifier, which was denominated PerC (Perturbation Classifier), presented performance significantly superior to the versions of the SVM with polinomial kernels of degrees 2 and 3 and roughly equivalent to k-Nearest Neighboor with k = 3 and k = 5, Naïve Bayes, SVM with Gaussian kernel, CART and MLP neural networks, having the PerC the highest ranking according to the Friedman statistical test. The results demonstrated that the perturbation-based approach is therefore useful to pattern classification.
|
54 |
Combinando regressão linear clusterwise e k-means com ponderação automática das variáveis explicativasSILVA, Ricardo Azevedo Moreira da 21 July 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-22T19:08:28Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-29T19:40:07Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5) / Made available in DSpace on 2018-08-29T19:40:07Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Ricardo Azevedo Moreira da Silva.pdf: 3866848 bytes, checksum: 4fb1080cdd975057fc1dff03a0338e22 (MD5)
Previous issue date: 2017-07-21 / Este trabalho propõe um método de regressão linear do tipo clusterwise cujo objetivo é fornecer modelos de regressão linear baseados em grupos homogêneos de observações em relação às variáveis explicativas e que são bem ajustados em relação à variável de resposta. Para atingir esse objetivo, este método combina o método regressão linear do tipo clusterwise padrão e o método de agrupamento K-means com a ponderação automática das variáveis explicativas. Os pesos das variáveis explicativas mudam em cada iteração do algoritmo e são diferentes de uma variável para outra. Assim, este método é capaz de selecionar as variáveis relevantes na busca por clusters homogêneos em relação às variáveis explicativas. Por fim, uma vez que ele aprende simultaneamente um protótipo de grupo e um modelo de regressão linear para cada cluster, ele é capaz de atribuir um modelo de regressão apropriado para uma observação desconhecida com base na sua descrição através de suas variáveis explicativas. Experimentos com conjuntos de dados sintéticos e reais corroboram a utilidade do método proposto. / This work gives a linear regression method of the clusterwise type aiming to provide linear regression models that are based on homogeneous clusters of observations w.r.t. the explanatory variables and that are well fitted w.r.t. the response variable. To achieve this goal, this method combines the standard clusterwise linear regression method and the K-means clustering method with the automatic weighting of the explanatory variables. The relevance weights of the explanatory variables change in each iteration of the algorithm and are different from one variable to another. Thus, this method is able to select the relevant variables in the search for homogeneous clusters w.r.t. the explanatory variables. Finally, since it simultaneously learns a prototype and a linear regression model for each cluster, this method is able to assign an appropriate regression model to an unknown observation based on its description through its explanatory variables. Experiments with synthetic and real datasets corroborate the utility of the proposed method.
|
55 |
Integrando sensores para a criação de instrumentos musicais digitaisSILVA, Eduardo Santos 21 August 2015 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-28T17:45:05Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Eduardo Santos Silva.pdf: 3621665 bytes, checksum: 2c3ee25333f7c84e1c39a173cc05a849 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-09-05T22:33:01Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Eduardo Santos Silva.pdf: 3621665 bytes, checksum: 2c3ee25333f7c84e1c39a173cc05a849 (MD5) / Made available in DSpace on 2018-09-05T22:33:01Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Eduardo Santos Silva.pdf: 3621665 bytes, checksum: 2c3ee25333f7c84e1c39a173cc05a849 (MD5)
Previous issue date: 2015-08-21 / CNPq / Nos últimos anos, novas tecnologias de interface gestual emergiram com os lançamentos de eletrônicos como smartphones, tablets e controladores de videogames como o Nintendo Wii Remote© e o Microsoft Kinect©. O surgimento dessas novas interfaces proporcionou o crescimento em pesquisas na área de Interface Humano-Computador (HCI). Particularmente na área de Computação Musical, essas tecnologias oferecem a possibilidade de criação de novos Instrumentos Musicais Digitais (DMIs). Entretanto, apesar do grande número de demonstrações de DMIs (presentes em sites de compartilhamento de vídeos), os resultados da avaliação formal destas tecnologias muitas vezes não condizem com o que é apresentado ao público. Diversos trabalhos acadêmicos relatam grandes restrições de algumas dessas tecnologias de interface gestual, entre eles o reconhecimento de nuances gestuais, latência no sistema e ausência de feedback háptico. Estes são obstáculos na construção de um DMI que possa ser utilizado pelo público profissional. Neste contexto, este projeto busca avaliar novas tecnologias de interface gestual para analisar a capacidade de capturar as nuances gestuais visando aprimorar a expressividade musical destes instrumentos e solucionar problemas encontrados em pesquisas anteriores. Em particular, exploramos a ideia de integração de sensores como forma de proporcionar a captura de nuances expressivas a um baixo custo de desenvolvimento. Para testar e aprimorar esta abordagem, foi desenvolvido um DMI que busca simular um instrumento de percussão que integra 3 sensores: Leap Motion©, sensor piezoeléctrico e um sensor de pressão FSR. Tal DMI foi desenvolvido seguindo a filosofia de design iterativo que envolve as etapas de inspiração, investigação, ideação, prototipação e avaliação do artefato. Também seguimos os princípios do design centrado no usuário que procura solução para os problemas de uma determinada área a partir do conhecimento das pessoas que estão inseridas naquele contexto. Os protótipos desenvolvidos foram avaliados de forma quantitativa, investigando a capacidade do sistema de solucionar os problemas encontrados em trabalhos anteriores. Além disso, o instrumento foi apresentado a um músico profissional, de forma a coletar informações complementares sobre a experiência do usuário. Os resultados mostram que a abordagem de integração de múltiplos sensores apresenta um grande potencial (com baixo custo de implementação) para reconhecimento de nuances de expressividade e apresentando baixa latência, que podem contribuir no desenvolvimento de DMIs expressivos. Todavia, novos avanços nessa área ainda podem contribuir para a resolução de todos os problemas levantados durante a análise da literatura. / In recent years, new gestural interface technologies emerged after the release of consumer electronics such as smartphones, tablets and videogame controllers like the Nintendo Wii Remote© and Microsoft Kinect©. The rise of these new interfaces provided the growth in the Human-Computer Interaction (HCI) research field. Particularly in the Computer Music area, those technologies offer the possibility of creating new Digital Music Instruments (DMIs). However, despite the wide number of DMI demonstrations (available at video sharing websites), the findings from the formal evaluation of these technologies are not consistent with what is presented to the public. Several academic research describe the limitations of some of these gestural interface Technologies, including the tracking of gestural nuances, system latency and the lack of haptic feedback which become obstacles in developing a DMI for professional musicians. In that context, this project aims to evaluate new gestural interface technologies to investigate their capabilities to capture gestural nuances in order to enhance their musical expressivity and solve those problems found in previous research. Particularly, we explore the idea of multisensor integration as an approach to achieve gestural nuance tracking at low implementation cost. To test and enhance this approach, a DMI that simulates an acoustic percussion instrument was implemented integrating 3 sensors: the Leap Motion Controller©, a piezoelectric element and a FSR pressure sensor. This DMI was implemented following a philosophy of iterative design which involves the steps of inspiration, investigation, ideation, prototyping and evaluation of the artifact. It was also used a user-centered design approach which follows the principle that the solution of the problems of a certain area emerges from the knowledge of the people inserted in that context. The developed prototypes were evaluated following a quantitative approach, to investigate the system capabilities to solve problems found in previous research. Moreover, the instrument was presented to an professional musician to gather complementary information on the user’s experience. The findings show that the multisensor integration approach presents great potential (with low implementation cost) to capture nuances of expression and providing low latency, that can contribute to the development of expressive DMIs. However, new advances in this field of research can contribute to solve the problems found during the literature review.
|
56 |
Seleção e ponderação de características: uma metodologia que integra otimização global e localBARROS, Adélia Carolina de Andrade 28 August 2008 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-08-31T21:51:56Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Adélia Carolina de Andrade Barros.pdf: 665097 bytes, checksum: b0b790ccd11df62aac51b8ebc7d3b501 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-09-17T19:51:57Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Adélia Carolina de Andrade Barros.pdf: 665097 bytes, checksum: b0b790ccd11df62aac51b8ebc7d3b501 (MD5) / Made available in DSpace on 2018-09-17T19:51:57Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Adélia Carolina de Andrade Barros.pdf: 665097 bytes, checksum: b0b790ccd11df62aac51b8ebc7d3b501 (MD5)
Previous issue date: 2008-08-28 / Esta dissertação apresenta um estudo sobre o uso de Sistemas Híbridos para a tarefa de Seleção e Ponderação simultâneas de conjuntos de características. Ela é composto de três partes principais: (1) a apresentação de uma metodologia para lidar com Seleção e Ponderação como um problema de otimização global, (2) descrição do modelo híbrido que integra busca global e local e (3) avaliação das abordagens híbridas propostas. Foram investigadas duas arquiteturas híbridas inteligentes: a primeira delas combina Tabu Search com o algoritmo de busca local Relief e a segunda integra Simulated Annealing com o Relief. Ambas abordagens procuram combinar as principais vantagens dos métodos de otimização global com as dos métodos de convergência local: métodos de otimização são bastante eficientes na busca do espaço global enquanto métodos de convergência fazem uma busca local mais refinada. A metodologia utilizada neste trabalho para representar Seleção e Ponderação como um problema de busca foi proposta por Tahir et al. TAHIR; BOURIDANE; KORUGOLLU (2007). No referido trabalho, o método de busca utilizado foi apenas Tabu Search. O presente trabalho traz a adaptação desta metodologia também para o Simulated Annealing. Os resultados demonstraram que os conjuntos de características otimizados são mais eficientes que aqueles que não passaram por nenhum processo de otimização. Além disto, o modelo híbrido proposto, que faz uso também de otimização local, melhorou ainda mais o desempenho do classificador. As conclusões levaram em consideração não somente a taxa de acerto de classificação, mas também a redução da dimensão do conjunto de características. / This dissertation presents a study about the use of Hybrid Systems for simultaneous Feature Selection and Weighting. It is composed by three main parts: (1) the presentation of a methodology which handles to Selection and Weighting as a global optimization problem, (2) the description of the model composed by global and local searches, (3) the evaluation of the proposed hybrid approaches. Two intelligent hybrid architectures were investigated: the first one combines Tabu Search with the local search algorithm Relief and the second one integrates Simulated Annealing with Relief. Both approaches attempt to combine the main advantages of the global optimization methods with those of the local convergency methods: optimization methods are pretty efficient in the global search space while convergency methods make a more accurate local search. The methodology used in this work to formulate Feature Selection and Weighting as a search problem was proposed by Tahir et al. TAHIR; BOURIDANE; KORUGOLLU (2007). In the referred work, Tabu Search was used as search algorithm. This work brings an adaptation from that methodology for Simulated Annealing. The results evidenced that the features sets optimized were more efficient than those in which any optimization process was applied. Moreover, the proposed hybrid model, which uses also local optimization, improved even more the classifier accuracy. Conclusions consider not only the accuracy rate but also the reduction in feature sets dimension.
|
57 |
Inteligencia computacional distribuida : arquitetura especificação formal e aplicaçãoNakamiti, Gilberto Shigueo 30 May 1996 (has links)
Orientador: Fernando Antonio Campos Gomide / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-21T08:56:52Z (GMT). No. of bitstreams: 1
Nakamiti_GilbertoShigueo_D.pdf: 7528317 bytes, checksum: 169305dea03fa0a98dc876700c4a3b08 (MD5)
Previous issue date: 1996 / Resumo: A inteligência artificial distribuída tem como objetivo a criação de modelos flexíveis para a resolução de problemas através de um conjunto de agentes inteligentes. Cada um dos agentes, embora possuidor de conhecimento incompleto, incerto ou eventualmente inconsistente, deve interagir com seus pares, procurando resolver cooperativamente um problema comum. A teoria dos conjuntos nebulosos tem sido foco de intensa pesquisa, tanto no campo teórico quanto na área de aplicações nos últimos anos. Sua utilização tem se estendido pelos mecanismos de tratamento de incertezas e a flexibilidade que provê aos sistemas. Os sistemas baseados em casos provêem mecanismos que mimetizam características importantes do raciocínio humano na tomada de decisões, utilizando modelos e experiências de decisões anteriores para aplicá-las a situações similares novas. Permitem a tomada de decisões complexas, reaproveitando o esforço computacional anterior. Os algoritmos genéticos constituem-se em uma ferramenta para a resolução de problemas e tomada de decisões em ambientes pouco estruturados. Propiciam adaptação e aumento de desempenho nesses ambientes, evitando máximos ou mínimos locais. Este trabalho decorre da simbiose entre a inteligência artificial distribuída, a teoria dos conjuntos nebulosos, os sistemas baseados em casos e os algoritmos genéticos. Seu objetivo é o de propor uma abordagem única e coesa que apresente características de resolução distribuída de problemas, cooperação, manipulação de incertezas, flexibilidade, utilização de experiências anteriores e adaptação a novas situações. A abordagem proposta, denominada Inteligência Computacional Distribuída, fornece base para o desenvolvimento de um sistema distribuído de controle de tráfego urbano. Vários testes de desempenho são apresentados, comparando-se seus resultados com os de estratégias tradicionais de controle de tráfego urbano / Abstract: Distributed artificial intelligence aims at creating flexible models for problem solving through intelligent agents. Agents have to interact with one another seeking for cooperation, despite their incomplete, uncertain or even inconsistent knowledge. Fuzzy sets theory has been a focus of intense research in the last years, both in the theoretical as well as in the application fields. Its use has spread over for its mechanisms for handling uncertainties and for the flexibility it provides. Case-based systems provides mechanisms to mimic human behavior in decision making through the use of past decisions models in similar situations. They allow complex decision making, re-using previous computational effort. Genetic algorithms are often used for problem solving and decision making in new environments. They lead to adaptation and performance increase, avoiding local maxima or minima. This work constitutes a symbiosis among distributed artificial intelligence, fuzzy sets theory, case-based systems, and genetic algorithms. It aims at introducing an approach that provides distributed problem solving, cooperation, uncertainties handling, flexibility, use of past experiences, and adaptation to new situations. The Distributed Computational lntelligence approach is a basis for the development of a distributed traific control system. Several performance tests are presented, and their results are compared to conventional traific control strategies / Doutorado / Doutor em Engenharia Elétrica
|
58 |
Implementando um tradutor de linguagem natural para a linguagem LEGALLima, Sergio Muinhos Barroso 27 March 1997 (has links)
Orientador: Adriane Maria Brito R. de Carvalho / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-07-22T21:19:03Z (GMT). No. of bitstreams: 1
Lima_SergioMuinhosBarroso_M.pdf: 2073959 bytes, checksum: 569cb45e9ea6c4ef831d95ad96d1eb14 (MD5)
Previous issue date: 1997 / Resumo: Nesta dissertação é apresentada a implementação de um tradutor de linguagem Natural (LN) para a linguagem LEGAL, que é uma extensão da linguagem SQL que inclui operadores espaciais e facilidades para a manipulação de campos e objetos geográficos. O objetivo deste trabalho é auxiliar os usuários de um Sistema de Informação Geográfica, não especialistas em computação, na formulação de consultas através da utilização de LN. As vantagens e desvantagens da interação em LN são apresentadas, bem como a funcionalidade de cada módulo constituinte do tradutor: além disso, os problemas lingüísticos e as particularidades que as consultas espaciais possuem e que foram tratadas pelo tradutor são apresentadas. / Abstract: This dissertation presents the implementation of a Translator from Natural Language to LEGAL, which is an extension of the SQL language and which includes spatial operators to manipulate geo-fields and geo-objects. The goal of this dissertation is to help Geographical Information System users, who are not computer experts, on the query formulation, through the use of Natural Language. The advantages and disadvantages of a Natural Language interaction, the Translator's modules, the linguistic problems encountered and the spatial query's particularities are presented. / Mestrado / Mestre em Ciência da Computação
|
59 |
Agrupamento fuzzy c-medoids semi-supervisionado de dados relacionais representados por múltiplas matrizes de dissimilaridadeBRANCO, Diogo Philippini Pontual 21 July 2017 (has links)
Submitted by Pedro Barros (pedro.silvabarros@ufpe.br) on 2018-10-05T20:00:48Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Diogo Philippini Pontual Branco.pdf: 1129238 bytes, checksum: dfe9b5706880e9a9a4dd5acd39d83322 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-11-14T22:34:34Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Diogo Philippini Pontual Branco.pdf: 1129238 bytes, checksum: dfe9b5706880e9a9a4dd5acd39d83322 (MD5) / Made available in DSpace on 2018-11-14T22:34:34Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
DISSERTAÇÃO Diogo Philippini Pontual Branco.pdf: 1129238 bytes, checksum: dfe9b5706880e9a9a4dd5acd39d83322 (MD5)
Previous issue date: 2017-07-21 / Técnicas de agrupamento de dados geralmente operam em objetos que podem estar descritos pelos seus atributos (feature data) ou por dados relacionais. Em dados relacionais apenas a informação que representa o grau de relacionamento entre os pares de objetos está disponível. O caso mais comum de dados relacionais é quando se tem uma matriz de dissimilaridade () entre objetos e cada célula da matriz tem a informação do grau de relacionamento entre um par de objetos. Esses dados relacionais podem ser (e geralmente são) complexos, tais como objetos multimídia, o que faz com que o relacionamento entre objetos possa ser descrito por múltiplas matrizes de (dis)similaridade. Cada matriz é chamada de visão e dados descritos desta forma são ditos multi-view. Há três principais abordagens para administrar dados multi-view em análise de agrupamento no estado da arte: abordagem de concatenação (fusão de dados), abordagem distribuída e abordagem centralizada. Na abordagem centralizada, se utiliza as múltiplas visões de forma simultânea para encontrar padrões escondidos nos dados; representa um desafio importante pois requer uma modificação profunda do processo de particionamento. Em compensação, essa abordagem geralmente tem uma qualidade dos resultados superior em relação às outras duas abordagens. Agrupamento de dados é uma tarefa difícil, especialmente quando se trata de dados complexos, relacionais, de alta dimensionalidade e com múltiplas visões. Para facilitar o processo, não é incomum utilizar os rótulos dos objetos, contudo, dados rotulados geralmente são escassos; por isso é comum o uso de supervisão parcial, que necessita apenas o rótulo de alguns objetos de um dado conjunto. Este trabalho introduz o algoritmo SS-MVFCVSMdd (Semi-Supervised Multi-View Fuzzy Clustering Vector Set-Medoids), baseado no MVFCVSMdd e com funcionamento parecido com o SSMVFCSMdd. O SS-MVFCVSMdd é um algoritmo particional do tipo fuzzy c-medoids vectors semi-supervisionado de dados relacionais representados por múltiplas matrizes de dissimilaridade. O SS-MVFCVSMdd utiliza restrições par-a-par (must-link e cannot-link) entre objetos como supervisão parcial e é capaz de inferir representantes e pesos de relevância para cada visão. Experimentos são realizados em vários conjuntos de dados comparando seu desempenho com algoritmos de características similares ao SS-MVFCVSMdd. Os resultados apontam que o SS-MVFCVSMdd teve uma qualidade similar ou superior em relação aos outros algoritmos. / Data clustering techniques generally work with objects that can be described by either feature or relational data. In relational data only the information pertaining the relationship degree between pairs of objects is available. The most usual case of relational data is when there is a dissimilarity matrix () between objects and each cell of said matrix contains the relationship degree between a given pair of objects. These relational data may be (and generally are) complex, such as multimedia objects, which may cause the relationship between those objects to be described by multiple (dis)similarity matrices. Each matrix is called view and data described in that way are said to be multi-view. There are three main approaches to manage multi-view data in cluster analysis in the the state of the art: concatenation, distributed and centralized. In the centralized approach the views are considered simultaneously in order to find hidden patterns in the data. On one hand, this poses a great challenge as it requires a profound change in the clustering process. On the other hand, this approach generally offers results with superior quality in comparison with the other two approaches. Clustering is a hard task, specially when it concerns complex relational high-dimension multi-view data. To facilitate the process it is not unusual to use the object labels, although labeled data are generally scarce. Therefore the use of parcial supervision is common, which requires only some of the objects are labeled in a given dataset. This work introduces the SS-MVFCVSMdd (Semi-Supervised Multi-View Fuzzy Clustering Vector Set-Medoids) algorithm, based on the MVFCVSMdd and functions in a similar way as the SS-MVFCSMdd. The SS-MVFCVSMdd is a semi-supervised multi-view fuzzy c-medoids vectors partitional algorithm, which utilizes pairwise constraints (must-link and cannot-link) between objects as partial supervision and infers prototypes and relevance weights for each view. Experiments performed using several datasets comparing the performance of the proposed algorithm with algorithms that have similar characteristics as the proposed algorithm. The results indicate that the SS-MVFCVSMdd had a similar or superior quality than the other algorithms.
|
60 |
Métodos de agrupamento difuso multivariado baseados no Fuzzy C-meansPIMENTEL, Bruno Almeida 21 September 2017 (has links)
Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-10-05T21:21:36Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5) / Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-11-14T20:59:03Z (GMT) No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5) / Made available in DSpace on 2018-11-14T20:59:03Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
TESE Bruno Almeida Pimentel.pdf: 1823660 bytes, checksum: 2dda6d26c679f00a5e642b456730f356 (MD5)
Previous issue date: 2017-09-21 / CNPq / A prática de agrupar objetos de acordo com as similaridades e propriedades observadas é uma atividade importante para muitos ramos da ciência. A sua importância deve-se ao fato que a organização dos dados em grupos é uma forma fundamental para entender e aprender sobre eles. Em Biologia, por exemplo, existe a preocupação de dividir os diferentes animais ou plantas em grupos para melhor entendimento das funções biológicas. Em muitas problemas, além de informar a qual grupo um determinado objeto pertence, é necessário entender quão similar este objeto está para todos os grupos da partição devido à imprecisão ou incerteza dos dados, surgindo, assim, o agrupamento difuso. O principal método de agrupamento difuso bastante conhecido é o Fuzzy C-Means (FCM), o qual tem algumas desvantagens tal como considerar que todos os grupos possuem formas esféricas. Outra desvantagem é que não existe a possibilidade de analisar qual variável (ou um sub-conjunto delas) foi mais importante para definir o valor final do grau de pertinência. Este trabalho apresenta diferentes métodos de agrupamento usando a abordagem difusa presentes na literatura atual e introduz métodos de agrupamento difuso onde os graus de pertinência são multivariados. Desta forma, dado um objeto, é possível calcular o grau dele pertencer a um dado grupo segundo uma variável. A partir deste tipo de grau de pertinência multivariado, duas vantagens podem ser apontadas: 1 - capacidade de interpretar a pertinência de cada objeto para um dado grupo segundo cada variável; 2 - obtenção de mais informação dos dados levando a uma maior qualidade de agrupamento. O objetivo deste trabalho é propor duas categorias de métodos: a primeira é baseada no Fuzzy C-Means e a segunda é baseada no Possibilistic Fuzzy C-Means. Além disso, também são propostos índices de interpretação para avaliar a qualidade do agrupamento para grupo e variável a partir da partição difusa obtida por cada método proposto. Com o objetivo de avaliar o desempenho dos métodos, um estudo comparativo em relação ao agrupamento difuso usando o experimento Monte Carlo é realizado. Foram planejados experimentos com dados sintéticos e reais e um índice de validação é usado para avaliar os métodos. Além disso, aplicação com dados biológicos é apresentada mostrando a utilidade dos métodos propostos. Os resultados mostraram que os métodos multivariados são preferíveis quando as variáveis são independentes e possuem variabilidades intra-classe diferentes. / The practice of classifying objects according to the observed similarities and properties is an important activity for many branches of science. Its importance is due to the fact that the organization of data into groups is a fundamental mode to understand and learn about ones. In Biology, for example, there is concern divide the different animals or plants into groups for better understanding of biological functions. In many problems, besides informing the group which a particular object belongs, it is necessary to understand how this object is similar for all groups due to of the vagueness or uncertainty of the data, emerging, so the fuzzy clustering. The primary method of fuzzy clustering is the Fuzzy C-Means (FCM), which has some disadvantages as considering that all groups have spherical shapes. Another disadvantage is that there is not the possibility to analyze which variable (or a subset of them) was more important to set the final value of the degree of membership. This work presents different clustering methods using fuzzy approach present in the current literature and introduces fuzzy clustering methods where the degrees of membership are multivariate. Thus, given an object, it is possible to calculate the degree it belongs to a group according to a given variable. From this type of degree multivariate relevance, two advantages can be pointed out: 1 - ability to interpret the relevance of each object for a given group according to each variable; 2 – getting more information from the data leading to a better quality of clustering. The objective of this work is to propose two types of methods: the first one is based on the Fuzzy C-Means and the second one is based on the Possibilistic Fuzzy C-Means. Moreover, interpretation indices are also proposed for assessing the quality of the clustering according to each cluster and variable from a fuzzy partition obtained by each proposed method. Aiming to evaluate the performance of the methods, a comparative study with respect to fuzzy clustering using the Monte Carlo experiment is carried out. Experiments with synthetic and real data and a validation index is used to evaluate the methods were planned. Furthermore, application with biological data is presented showing the usefulness of the proposed methods. The results showed that multivariate methods are preferable when the variables are independent and have different intra-class variabilities.
|
Page generated in 0.0356 seconds