Global ETD Search

11	Aprendizado de máquina baseado em tensores e suas aplicacções para floresta de caminhos ótimos / Lopes, Ricardo Ricci. January 2015 (has links) Orientador: João Paulo Papa / Banca: Alexandre Levada / Banca: Antônio Carlos Sementille / Resumo: Técnicas de aprendizado de máquina, usualmente, objetivam aprender alguma superfície que separe amostras de classes diferentes por meio de sua representação vetorial. Entretanto, existem muitas aplicações que podem, eventualmente, perder informações essenciais e inerentes da estrutura dos dados em tal representação e, com o crescimento de base de dados com alta dimensionalidade, essas informações se tornam cada vez mais importantes. Os espaços de representação de dados com curvatura, baseados em trabalhos na area da Matemática e Física, têm despertado interesse por parte da comunidade de aprendizado de máquina com o intuito de resolver tal situação. Esses espaços de representação são baseados em tensores, os quais mantém a estrutura original dos dados, bem como permitem a utilização de variedades em superfícies com curvatura não nula. Esta dissertação de mestrado apresenta uma revisão bibliográfica sobre abordagens de aprendizado de máquina baseadas em tensores, bem como um referencial teórico sobre algebra multilinear. Também e apresentado um estudo da aplicabilidade do classificador Floresta de Caminhos Otimos, do inglês Optimum-Path Forest - OPF, em espaços tensoriais através da técnica Análise de Componentes Principais Multilineares, bem como a comparação dos resultados obtidos com outras técnicas conhecidas na literatura em contexto de reconhecimento em fotos e vídeos. Também foi demonstrado que o OPF pode obter maior acurácia em algumas situações quando se trabalha com características no espaço tensorial / Abstract: Machine learning techniques usually learn some decision surface that separates samples from di erent classes by means of their vectorial representation. However, there exist many applications that might lose important information that are strongly related to the data itself. Additionally, such information has gained importance with the popularity of high-dimensional datasets. As such, works based on Mathematics and Physics, where curvature-based space representations have been used in several application, have gained attention by the machine learning community. Such representations are based on tensors, which keep the original structure of the data, as well as they allow us to use manifolds in curvature-based spaces. This master's dissertation presents a review of the literature with respect to tensor-based machine learning techniques, as well as a brief review about multilinear algebra. We also evaluate the performance of the Optimum-Path Forest classi er (OPF) in tensor-oriented spaces by means of the Multilinear Principal Component Analysis, as well as its comparison against with other related techniques is also performed. It is shown OPF can bene t from such feature space representation in some situations / Mestre Computação - Matematica. Reconhecimento de padrões. Álgebra tensorial. Aprendizado do computador. Floresta de caminhos ótimos. Computer science Mathematics
12	Aprendizado de máquina baseado em tensores e suas aplicacções para floresta de caminhos ótimos Lopes, Ricardo Ricci [UNESP] 21 August 2015 (has links) (PDF) Made available in DSpace on 2016-04-01T17:54:36Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-08-21. Added 1 bitstream(s) on 2016-04-01T18:00:15Z : No. of bitstreams: 1 000859943.pdf: 1070364 bytes, checksum: 04d8c74205b7c2df31f68a75600abada (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / Técnicas de aprendizado de máquina, usualmente, objetivam aprender alguma superfície que separe amostras de classes diferentes por meio de sua representação vetorial. Entretanto, existem muitas aplicações que podem, eventualmente, perder informações essenciais e inerentes da estrutura dos dados em tal representação e, com o crescimento de base de dados com alta dimensionalidade, essas informações se tornam cada vez mais importantes. Os espaços de representação de dados com curvatura, baseados em trabalhos na area da Matemática e Física, têm despertado interesse por parte da comunidade de aprendizado de máquina com o intuito de resolver tal situação. Esses espaços de representação são baseados em tensores, os quais mantém a estrutura original dos dados, bem como permitem a utilização de variedades em superfícies com curvatura não nula. Esta dissertação de mestrado apresenta uma revisão bibliográfica sobre abordagens de aprendizado de máquina baseadas em tensores, bem como um referencial teórico sobre algebra multilinear. Também e apresentado um estudo da aplicabilidade do classificador Floresta de Caminhos Otimos, do inglês Optimum-Path Forest - OPF, em espaços tensoriais através da técnica Análise de Componentes Principais Multilineares, bem como a comparação dos resultados obtidos com outras técnicas conhecidas na literatura em contexto de reconhecimento em fotos e vídeos. Também foi demonstrado que o OPF pode obter maior acurácia em algumas situações quando se trabalha com características no espaço tensorial / Machine learning techniques usually learn some decision surface that separates samples from di erent classes by means of their vectorial representation. However, there exist many applications that might lose important information that are strongly related to the data itself. Additionally, such information has gained importance with the popularity of high-dimensional datasets. As such, works based on Mathematics and Physics, where curvature-based space representations have been used in several application, have gained attention by the machine learning community. Such representations are based on tensors, which keep the original structure of the data, as well as they allow us to use manifolds in curvature-based spaces. This master's dissertation presents a review of the literature with respect to tensor-based machine learning techniques, as well as a brief review about multilinear algebra. We also evaluate the performance of the Optimum-Path Forest classi er (OPF) in tensor-oriented spaces by means of the Multilinear Principal Component Analysis, as well as its comparison against with other related techniques is also performed. It is shown OPF can bene t from such feature space representation in some situations Computação - Matematica Reconhecimento de padrões Álgebra tensorial Aprendizado do computador Floresta de caminhos ótimos Computer science Mathematics
13	Explorando abordagens de aprendizado sequencial para floresta de caminhos ótimos Nakamura, Rodrigo Yuji Mizobe [UNESP] 25 February 2014 (has links) (PDF) Made available in DSpace on 2015-04-09T12:28:25Z (GMT). No. of bitstreams: 0 Previous issue date: 2014-02-25Bitstream added on 2015-04-09T12:47:36Z : No. of bitstreams: 1 000813449.pdf: 748488 bytes, checksum: d9474f03d8434bb9f3d905323e3bf032 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / A modelagem do problema de classificação como um problema de busca em um grafo fornece uma estrutura elegante, rica em algoritmos eficientes e comprovadamente corretos. A abordagem Floresta de Caminhos Ótimos reduz o problema de classificação para o cálculo de uma floresta de cami- nhos ótimos relativa a uma função de conectividade, a qual atribui um valor a qualquer caminho no grafo. Considerando o valor máximo entre todos os caminhos possíveis com término em cada vértice, o caminho ideal é trivial para alguns vértices, chamados raízes, e para os vértices restantes, a minimi- zação da função de conectividade atribui a cada vértice um caminho de custo mínimo a partir de sua raiz mais fortemente conectada. Não obstante, para a classificação de novos conjuntos de dados, assume-se que cada amostra compõe um vértice pertecente ao grafo e calcula-se a afinidade deste vértice às árvores geradoras mínimas respectivas a cada classe. Este procedimento não utiliza a estrutura inerente da aplicação que pode ser fundamental para uma melhor precisão dos resultados. Dentro desse contexto, este trabalho avalia a contribuição de técnicas de modelagem contextual como os campos aleatórios Markovianos e as abordagens de empilhamento de classificado- res. A modelagem do campo aleatório sumariza o comportamento global do sistema através de suas interações locais. Os métodos baseados em empilha- mento de classificadores interpretam as interações entre as amostras como uma análise no espaço escala, capturando as interações de longa distância de forma eficiente através da definição das regiões de vizinhança em múltiplas escalas. Resultados obtidos para a classificação de estruturas anatômicas do cérebro em imagens de ressonância magnética e de coberturas do solo em imagens multi-espectrais de sensoriamento remoto monstram que a inclusão da informação contextual é de fato capaz de melhorar ... / The interpretation of classification problem as a graph search provides a rich framework with correct and efficient algorithms. The Optimum-Path Fo- rest classifier can reduce classification to the the computation of an optimum- path forest according to a connectivity function, which assigns a value to any path in the graph. Considering the maximum value among all possible paths with terminus at each node, the optimum path is trivial for some nodes, cal- led roots, and the remaining nodes will have an optimum path coming from their most strongly connected root, partitioning the graph into an optimum- path forest (disjoint sets of optimum-path trees). Notwithstanding, to clas- sify out-of-sample, we assume that each sample in the new dataset composes one node in the graph and we compute their most strongly connected root within all spanning trees. As one can see, this procedure do not take advan- tage of the problem structure information, which can be fundamental for a better precision of the results. In this context, the purpose of this work is to evaluate the contribution of contextual modelling techniques, such as Mar- kov random fields and stacked classifiers. The first approach, called Markov random fields, sumarizes the system overall behavior through its local inte- ractions. The second approach, based on combination of classifiers, model the interaction between samples in the space scale, which provides effici- ent implementations of long interaction by defining neighborly relations in multiple scales. The results for brain tissue segmentation of magnetic reso- nance images and land-cover classification of multi-spectral satellite images show that the contextual information can improve the effectiveness of the Optimum-Path Forest classifier Computação Floresta de caminhos ótimos Markov, Campos aleatórios de Arvores (Teoria dos grafos) Computer science
14	Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos Pereira, Luís Augusto Martins [UNESP] 25 February 2013 (has links) (PDF) Made available in DSpace on 2015-04-09T12:28:25Z (GMT). No. of bitstreams: 0 Previous issue date: 2013-02-25Bitstream added on 2015-04-09T12:47:36Z : No. of bitstreams: 1 000811257.pdf: 6065923 bytes, checksum: 2f62e4d931cb75542832b3627b24b710 (MD5) / Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) / Em problemas convencionais de reconhecimento de padrões, dado um conjunto de classes, cada instância do problema e associada a uma e somente uma classe. No entanto, alguns problemas reais de classificaço apresentam instâncias que podem ser associadas a mais de uma classe simultaneamente, esses problemas são denotados como classificação com múltiplos rótulos. Entre problemas dessa natureza, podemos destacar categorização de filmes e músicas, classificação de documentos, análise funcional de genes etc. Contudo, os problemas de classificação com múltiplos rótulos não são diretamente tratáveis por técnicas convencionais, o que justifica o interesse da comunidade de reconhecimento de padrões nesses tipos de problemas. Embora muitos métodos tenham sido propostos na literatura, há ainda muito a ser explorado, principalmente no uso de novos algoritmos convencionais de aprendizado de máquinas adaptados ou não aos problemas com múltiplos rótulos. O classificador supervisionado Floresta de Caminhos Otimos (Optimum- Path Forest - OPF) e um algoritmo determinístico aplicado a problemas convencionais de classificação, no entanto, ainda não foi investigado em problemas com múltiplos rótulos. Nesse contexto, investigamos neste trabalho a aplicação de classificadores baseados em OPF em problemas de múltiplos rótulos. Analisamos duas versões do classificador OPF: (i) a tradicional baseada em grafo completo e (ii) a versão baseada no grafo k-vizinhos mais próximos (OPFkNN). Para manipulação das bases com múltiplos rótulos, utilizamos dois métodos de transformação de problemas, o Binary Relevance e Label Powerset. Propusemos também algumas modificações nas fases de treinamento e classificação do OPFkNN com o objetivo de melhor os resultados desse classificador combinado a métodos de transformação de problemas. Os experimentos realizados em sete bases de dados públicas mostraram que as modifica ções ... / In conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ... / FAPESP: 2011/14094-1 Computação - Matematica Reconhecimento de padrões Floresta de caminhos ótimos Arvores (Teoria dos grafos) Computer science Mathematics
15	Detecção de anomalias por Floresta caminhos ótimos / Passos Júnior, Leandro Aparecido January 2015 (has links) Orientador: João Paulo Papa / Coorientador: Kelton Augusto Pontara da Costa / Banca: Alexandre Luís Magalhães Levada / Banca: Antonio Carlos Sementille / Resumo: O problema de detecção de anomalias vem sendo estudado há vários anos, dado que esta área é de grande interesse por parte de indústrias e também da comunidade científica. Basicamente, a detecção de anomalias difere da tarefa de reconhecimento de padrões convencional pelo fato de apenas amostras não anômalas (normais) estarem disponíveis para o treinamento da técnica de aprendizado de máquina. Assim, quando uma nova amostra é classificada, o sistema deve reconhecer a mesma como pertencente ou não ao modelo de dados "normais" que o mesmo aprendeu. Dentre as várias técnicas disponíveis, uma das mais antigas e populares é a que faz uso de distribuições Gaussianas multivariadas, as quais modelam o conjunto de dados normais como sendo distribuições Gaussianas e, qualquer amostra que não pertençaa a essas distribuições, é considerada anômala. Entretanto, um grande problema dessa abordagem está relacionado à etapa de estimação dos parãmetros dessas distribuições Gaussianas, a qual é realizada de maneira não supervisionada. Na presente dissertação, objetivamos estudar o comportamento do classificador Floresta de Caminhos Ótimos (Optimum-Path Forest - OPF) para (i) estimação dos parâmetros das distribuições Gaussianas, bem como compará-lo com várias outras técnicas comumente utilizadas para esta tarefa, e (ii) desenvolver uma nova técnica de detecção de anomalias centralizada nas funcionalidades do OPF. Os resultados experimentais em bases de dados sintéticas e reais demonstraram que o classificador OPF obteve melhores resultados em ambas as tarefas, dado que o mesmo é menos sensível à escolha dos parâmetros iniciais, o que é de grande valia em bases de dados cujas amostras "normais" estão representadas por múltiplos agrupamentos / Abstract: Anomaly detection has a massive literature, since detecting such anomalies are of great interest for big companies and also the scientific community. Basically, anomaly detection differs from regular pattern recognition task by the fact that only nom-anomalous (normal) samples are available for training the machine learning technique. Therefore, when a new a sample is classified, the system should recognize whether the sample belongs or not to the "normal" data model. Multivariate Gaussian Distributions is one of the oldest and most used techniques among others available, which models the set of normal samples as Gaussian Distributions, and classifies any sample outside those distributions as an anomaly. However, this approach presents a problem related to the parameter estimation, which is performed in a non-supervised classification. In this work, we propose to study the behavior of the Optimum Path Forest (OPF) classifier to (i) estimate the parameters of Gaussian distributions, as well as to compare it against with some of the most used techniques for this task, and (ii) to develop a new anomaly detection technique centered in the OPF functionalities. The experimental results applied in synthetic and real datasets show that OPF classifier achieved best results for both tasks, since its initial parameters are less sensible than the other techniques, which makes a great difference for datasets when "normal" samples are represented by many clusters / Mestre Ciência da computação. Floresta de caminhos ótimos. Distribuição Gaussiana. Computer science
16	Classificação de conteúdo malicioso baseado em Floresta de Caminhos Ótimos / Malicious content classification based on Optimum-path Forest Fernandes, Dheny [UNESP] 19 May 2016 (has links) Submitted by DHENY FERNANDES null (dfernandes@fc.unesp.br) on 2016-06-15T17:19:42Z No. of bitstreams: 1 Dissertação.pdf: 1456402 bytes, checksum: 56f028f949d37b33c377e1c247b0fd43 (MD5) / Approved for entry into archive by Ana Paula Grisoto (grisotoana@reitoria.unesp.br) on 2016-06-21T17:18:53Z (GMT) No. of bitstreams: 1 fernandes_d_me_bauru.pdf: 1456402 bytes, checksum: 56f028f949d37b33c377e1c247b0fd43 (MD5) / Made available in DSpace on 2016-06-21T17:18:53Z (GMT). No. of bitstreams: 1 fernandes_d_me_bauru.pdf: 1456402 bytes, checksum: 56f028f949d37b33c377e1c247b0fd43 (MD5) Previous issue date: 2016-05-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O advento da Internet trouxe amplos benefícios nas áreas de comunicação, entretenimento, compras, relações sociais, entre outras. Entretanto, várias ameaças começaram a surgir nesse cenário, levando pesquisadores a criar ferramentas para lidar com elas. Spam, malwares, con- teúdos maliciosos, pishing, fraudes e falsas URLs são exemplos de ameaças. Em contrapartida, sistemas antivírus, firewalls e sistemas de detecção e prevenção de intrusão são exemplos de ferramentas de combate às tais ameaças. Principalmente a partir de 2010, encabeçado pelo malware Stuxnet, as ameaças tornaram-se muito mais complexas e persistentes, fazendo com que as ferramentas até então utilizadas se tornassem obsoletas. O motivo é que tais ferra- mentas, baseadas em assinaturas e anomalias, não conseguem acompanhar tanto a velocidade de desenvolvimento das ameaças quanto sua complexidade. Desde então, pesquisadores têm voltado suas atenções a métodos mais eficazes para se combater ciberameaças. Nesse contexto, algoritmos de aprendizagem de máquina estão sendo explorados na busca por soluções que analisem em tempo real ameaças provenientes da internet. Assim sendo, este trabalho tem como objetivo analisar o desempenho dos classificadores baseados em Floresta de Caminhos Ótimos, do inglês Optimum-path Forest (OPF), comparando-os com os demais classificadores do estado-da-arte. Para tanto, serão analisados dois métodos de extração de características: um baseado em tokens e o outro baseado em Ngrams, sendo N igual a 3. De maneira geral, o OPF mais se destacou no não bloqueio de mensagens legítimas e no tempo de treinamento. Em algumas bases a quantidade de spam corretamente classificada também foi alta. A versão do OPF que utiliza grafo completo foi melhor, apesar de que em alguns casos a versão com grafo knn se sobressaiu. Devido às exigências atuais em questões de segurança, o OPF, pelo seu rápido tempo de treinamento, pode ser melhorado em sua eficácia visando uma aplicação real. Em relação aos métodos de extração de características, 3gram foi superior, melhorando os resultados obtidos pelo OPF. / The advent of Internet has brought widespread benefits in the areas of communication, entertainment, shopping, social relations, among others. However, several threats began to emerge in this scenario, leading researchers to create tools to deal with them. Spam, malware, malicious content, phishing, fraud and false URLs are some examples of these threats. In contrast, anti-virus systems, firewalls and intrusion detection and prevention systems are examples of tools to combat such threats. Especially since 2010, headed by the Stuxnet malware, threats have become more complex and persistent, making the tools previously used became obsolete. The reason is that such tools based on signatures and anomalies can not follow both the speed of development of the threats and their complexity. Since then, researchers have turned their attention to more effective methods to combat cyber threats. In this context, machine learning algorithms are being exploited in the search for solutions to analyze real-time threats from the internet. Therefore, this study aims to analyze the performance of classifiers based on Optimum-path Forest, OPF, comparing them with the other state-of-the-art classifiers. To do so, two features extraction methods will be analyzed: one based on tokens and other based on Ngrams, considering N equal 3. Overall, OPF stood out in not blocking legitimate messages and training time. In some bases the amount of spam classified correctly was high as well. The version that uses complete graph was better, although in some cases the version that makes use of knn graph outperformed it. Due to the current demands on security issues, OPF, considering its fast training time, can be improved in its effectiveness aiming at a real application. In relation to feature extraction methods, 3gram was better, improving OPF’s results. Segurança em redes de computadores Floresta de Caminhos Ótimos Spam Classificação Aprendizado de máquina Computer network security Optimum-path Forest Classification Machine learning
17	Estudo comparativo de técnicas para segmentação e classificação de imagens de lesões de pele / Santos, Fernando Pereira dos. January 2016 (has links) Orientador: Aledir Silveira Pereira / Banca: Maurílio Boaventura / Banca: Ivan Nunes da Silva / Resumo: Neste trabalho é apresentada uma nova metodologia para a análise e classificação de lesões de pele. O modelo proposto foi dividido em quatro etapas que compreende o pré-processamento das imagens, a segmentação do objeto desejado, a extração de características e a classificação das lesões. Na etapa de pré-processamento, aplica-se o modelo de cor RGB, a quantização de cores e o filtro de difusão anisotrópica. Na segmentação, a imagem suavizada é submetida à operação de fechamento da morfologia matemática, estimativa de peso nos arcos do grafo e à transformada imagem-floresta com apenas duas sementes. A extração de características foi baseada na aplicação da regra ABCD. Na assimetria foi aplicado o conceito de razão de perpendiculares sobre a maior diagonal obtida e, para a borda, o produto vetorial e o ponto de inflexão foram implementados para fornecer o porcentual de curvatura do contorno. Para a cor, valores de média, variância, desvio padrão, homogeneidade e contraste foram calculados. Para a estrutura diferencial foi desenvolvido a dimensão fractal e a energia. Na última etapa, classificação, a floresta de caminhos ótimos foi utilizada. Os resultados da classificação são apresentados por malignidade, quando todos os tipos de lesões estão juntos, e por categorias, quando os tipos de lesão são agrupados dois a dois. Para obter o modelo proposto foram efetuados diversos testes com modelos de cor diferentes, forma de aplicação da quantização, diferenciação no cálculo da quantidade de iterações do filtro de difusão anisotrópica e possibilidade de não aplicar a morfologia matemática / Abstract:In this paper a new methodology for the analysis and classification of skin lesions is presented. The suggested model is divided into four steps which comprise the pre processing of images, segmentation of the desired object, feature extraction and lesions classification. In the pre processing step, it is applied the RGB color model, color quantization and anisotropic diffusion filter. In segmentation, the smoothed image is submitted to the closing operation of mathematical morphology, arc-weight estimation in the graph and the image-foresting transform with only two seeds. The feature extraction is based on the application of ABCD rule. In asymmetry was applied the perpendicular ratio concept on the greater diagonal obtained and, to the border, the vector product and the inflection point were implemented to provide the contour curvature percentage. For color, average values, variance, standard deviation, homogeneity and contrast were calculated. For differential structure was developed fractal dimension and energy. In the last stage, classification, optimum-path forest was used. The classification results are presented by malignancy, when all types of lesions are together, and by categories, when the types of lesions are grouped two by two. For the model were performed several tests with different color models, the form of application the quantization, differentiation in the calculation of the quantity of filter iterations of anisotropic diffusion and the possibility of not applying the mathematical morphology / Mestre Ciência da computação - Matematica. Morfologia matemática. Floresta de caminhos ótimos. Computer science
18	Processamento e análise de vídeos utilizando floresta de caminhos ótimos / Martins, Guilherme Brandão. January 2016 (has links) Orientador: João Paulo Papa / Coorientador: Jurandy Gomes de Almeida Junior / Banca: Fábio Faria / Banca: José Remo Ferreira Brega / Resumo: Com os avanços relacionados às tecnologias de redes computacionais e armazenamento de dados observa-se que, atualmente, uma grande quantidade de conteúdo digital está sendo disponibilizada via internet, em especial por meio de redes sociais. A fim de explorar esse contexto, abordagens relacionadas ao processamento e apredizado de padrões em vídeos têm recebido crescente atenção nos últimos anos. Sistemas de recomendação de filmes, amplamente empregados em lojas virtuais, são umas das principais aplicações no que se refere aos avanços de pesquisa na área de processamento de vídeos. Com o objetivo de acelerar o processo de recomendação e redução de armazenamento, técnicas para classificação e sumarização de vídeos por meio de aprendizado de máquina têm sido utilizadas para explorar conteúdo informativo e também redundante. Por meio de técnicas de agrupamento e descrição de dados, é possível identificar quadros-chave de um conjunto de amostras a fim de que, posteriormente, estes sejam usados para sumarização do vídeo. Além disso, por meio de bases de vídeos rotulados, podemos classificar amostras de modo a organizá-las por gêneros de vídeo. O presente trabalho objetiva utilizar o classificador Floresta de Caminhos Ótimos para sumarização automática e classificação de vídeos por gênero, bem como o estudo de sua viabilidade nestes contextos. Os resultados obtidos mostram que o referido classificador obteve desempenho bastante promissor e próximo à algumas das técnicas de sumarização automática e classificação de vídeos que, atualmente, representam o estado-da-arte no atual contexto / Abstract: Currently, a number of improvements related to computational networks and data storage technologies have allowed a considerable amount of digital content to be provided on the internet, mainly through social networks. In order to exploit this context, video processing and pattern recognition approaches have received a considerable attention in the last years. Movie recommendation systems are widely employed in virtual stores, thus being one of the main applications regarding to research advances in the video processing field. Aiming to boost the content recommendation and storage cutback, different video categorization and video summarization techniques have been applied to handle with more informative and redundant content. By availing clustering and data description techniques, it is possible to identify keyframes from a given samples set in order to consider them as part of the video summarization process. Furthermore, through labeled video data collections it is possible to classify samples in order to arrange them by video genres. The main goal of this work is to employ the Optimum-Path Forest classifier in both video summarization and video genre classification processes as well as to conduct a viability study of such classifier in the aforementioned contexts. The results have shown this classifier can achieve promising performance, being very close in terms of summary quality and consistent recognition rates to some state-of-the-art video summarization and classification approaches / Mestre Ciência da computação - Matemática. Sistemas de reconhecimento de padrões. Floresta de caminhos ótimos. Redes de computadores. Armazenamento de dados. Vídeo digital - Classificação. Computer science
19	Seleção de características utilizando algoritmos evolucionistas e suas aplicações em reconhecimento de padrões / Rodrigues, Douglas. January 2014 (has links) Orientador: João Paulo Papa / Banca: Roberta Spolon / Banca: Alexandre Luís Magalhães Levada / Resumo: Técnicas para seleção de características tem sido amplamente estudadas pela comunidade científica de reconhecimento de padrões e areas afins, dado que o problema de encontrar o subconjunto das características que maximiza a taxa de acerto de uma técnica de classificação de padrões pode ser modelado como um problema de otimização. Metodologias baseadas em inteligência evolucionista, tais como aquelas que simulam dinâmicas sociais e de interação entre morcegos, algumas espécies de aves e outros insetos, tem sido recentemente aplicadas nesse contexto. Assim sendo, o presente trabalho visou o estudo e desenvolvimento de técnicas de seleção de características utilizando abordagens de otimização evolucionistas, sendo elas: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experimentos realizados em seis bases de dados utilizando as técnicas propostas em conjunto com outras cinco técnicas (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) mostraram a eficácia das técnicas evolucionistas propostas quando utilizadas em conjunto com o classificador OPF. O BSSO - Binary Social-Spider Optimization apresentou a melhor acurácia em 3 bases, chegando a aumentar a taxa de acerto do classificador OPF em até 19%, bem como, selecionou o menor número de características em cinco das seis bases. Em relação ao tempo de execuçãao, o BKH - Binary Krill Herd obteve o segundo melhor tempo em cinco bases, ficando atrás somente do BHS - Binary Harmony Search / Abstract: Techniques for feature selection have been widely studied by the pattern recognition scientific community and related fields, as the problem of finding the subset of features that maximizes the classifier rate can be modeled as a optimization problem. Methodologies based on evolutionary intelligence, such as those that simulate social dynamics and interaction between bats, some species of birds and other insects, have recently been applied in this context. Therefore, this work aimed to the study and development of feature selection techniques using evolutionary optimization approaches: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experiments conducted in six databases using the proposed techniques together with ve other techniques (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) have shown the efiectiveness of proposed evolutionary techniques when used with the OPF classifier. The BSSO - Binary Social-Spider Optimization showed the best accuracy on 3 datasets coming to increase the OPF classification rate in up to 19%. Also, SSO has selected the smallest number features in ve of the six datasets. Regarding the runtime, BKH - Binary Krill Herd was the second fastest technique in ve datasets, being only slower then BHS - Binary Harmony Search technique / Mestre Computação - Matematica. Reconhecimento de padrões. Aprendizado do computador. Floresta de caminhos ótimos. Algoritmos evolutivos Computer science Mathematics
20	Explorando abordagens de múltiplos rótulos por floresta de caminhos ótimos / Pereira, Luís Augusto Martins January 2014 (has links) Orientador: João Paulo Papa / Banca: José Remo Ferreira Brega / Banca: Estevam Rafael Hruschka Júnior / Resumo: Em problemas convencionais de reconhecimento de padrões, dado um conjunto de classes, cada instância do problema e associada a uma e somente uma classe. No entanto, alguns problemas reais de classificaço apresentam instâncias que podem ser associadas a mais de uma classe simultaneamente, esses problemas são denotados como classificação com múltiplos rótulos. Entre problemas dessa natureza, podemos destacar categorização de filmes e músicas, classificação de documentos, análise funcional de genes etc. Contudo, os problemas de classificação com múltiplos rótulos não são diretamente tratáveis por técnicas convencionais, o que justifica o interesse da comunidade de reconhecimento de padrões nesses tipos de problemas. Embora muitos métodos tenham sido propostos na literatura, há ainda muito a ser explorado, principalmente no uso de novos algoritmos convencionais de aprendizado de máquinas adaptados ou não aos problemas com múltiplos rótulos. O classificador supervisionado Floresta de Caminhos Otimos (Optimum- Path Forest - OPF) e um algoritmo determinístico aplicado a problemas convencionais de classificação, no entanto, ainda não foi investigado em problemas com múltiplos rótulos. Nesse contexto, investigamos neste trabalho a aplicação de classificadores baseados em OPF em problemas de múltiplos rótulos. Analisamos duas versões do classificador OPF: (i) a tradicional baseada em grafo completo e (ii) a versão baseada no grafo k-vizinhos mais próximos (OPFkNN). Para manipulação das bases com múltiplos rótulos, utilizamos dois métodos de transformação de problemas, o Binary Relevance e Label Powerset. Propusemos também algumas modificações nas fases de treinamento e classificação do OPFkNN com o objetivo de melhor os resultados desse classificador combinado a métodos de transformação de problemas. Os experimentos realizados em sete bases de dados públicas mostraram que as modifica ções ... / Abstract: In conventional problems of pattern recognition, given a set of classes, each instance of the problem is associated with one and only one class. However, some real classification problems have instances that can be associated with more than one class at the same time, these problems are denoted as classification with multilabel. Among such problems, we highlight movies and music categorization, document classification, functional gene analysis etc. Nevertheless, the classification problems with multilabel are not directly treatable by conventional techniques, which explains the interest of pattern recognition community in these types of problems. Although many methods have been proposed in the literature, there is still much to be explored, especially in the use of novel conventional machine learning algorithms adapted or not to problems with multlabels. The Optimum-Path Forest (OPF) classifier is a supervised and deterministic algorithm applied to conventional classification problems, however, it has been not investigated in problems with multilabel. In this context, we investigated in this work the application of OPF-based classifiers on multilabel problems. We analyzed two versions of OPF-based classi ers: (i) the traditional one based on complete graph and (ii) the one based on k-nearest neighbors graph (OPFkNN). For manipulation of multilabel datasets, we used two transformation methods, the Binary Relevance and Label Powerset. We also proposed some changes in the training and classification phases of OPFkNN aiming to achieve better results when combined it with transformation methods. Experiments performed in seven public datasets showed that changes in OPFkNN improve outcomes. Comparison with the J48 classifier, ... / Mestre Computação - Matematica. Reconhecimento de padrões. Floresta de caminhos ótimos. Árvores (Teoria dos grafos) Computer science Mathematics

Search results