• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1019
  • 175
  • 34
  • 24
  • 24
  • 24
  • 19
  • 14
  • 5
  • 4
  • 4
  • 4
  • 1
  • Tagged with
  • 1240
  • 1001
  • 587
  • 413
  • 199
  • 176
  • 174
  • 151
  • 143
  • 135
  • 129
  • 123
  • 120
  • 117
  • 116
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
151

Super-resolução de imagens baseada em aprendizado utilizando descritores de características / Images super-resolution based learning using feature descriptors

Rezio, Ana Carolina Correia, 1986- 19 August 2018 (has links)
Orientador: Hélio Pedrini / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-19T11:40:39Z (GMT). No. of bitstreams: 1 Rezio_AnaCarolinaCorreia_M.pdf: 2407538 bytes, checksum: cbf48e9214024f2478edcaa47e002852 (MD5) Previous issue date: 2011 / Resumo: Atualmente, há uma crescente demanda por imagens de alta resolução em diversos domínios de conhecimento, como sensoriamento remoto, medicina, automação industrial, microscopia, entre outros. Imagens de alta resolução fornecem detalhes que são importantes para as tarefas de análise e visualização dos dados presentes nas imagens. Entretanto, devido ainda ao custo elevado dos sensores de alta precisão e às limitações existentes para redução do tamanho dos pixels das imagens encontradas no próprio sensor, as imagens de alta resolução têm sido adquiridas a partir de métodos de super-resolução. Este trabalho propõe um método para super-resolver uma imagem ou uma sequência de imagens a partir da compensação residual aprendida pelas características extraídas na imagem residual e no conjunto de treinamento. Resultados experimentais mostram que, na maioria casos, o método proposto provê menores erros quando comparado com outras abordagens do estado da arte. Medidas quantitativas e qualitativas são utilizadas na comparação dos resultados obtidos com as técnicas de super-resolução consideradas nos experimentos / Abstract: There is currently a growing demand for high-resolution images in several domains of knowledge, such as remote sensing, medicine, industrial automation, microscopy, among others. High resolution images provide details that are important to tasks of analysis and visualization of data present in the images. However, due to the cost of high precision sensors and the limitations that exist for reducing the size of the image pixels in the sensor itself, high-resolution images have been acquired from super-resolution methods This work proposes a method for super-resolving an image or a sequence of images from the compensation residual learned by the features extracted in the residual image and the training set. The results are compared with some methods available in the literature. Quantitative and qualitative measures are used to compare the results obtained with the super-resolution techniques considered in the experiments / Mestrado / Ciência da Computação / Mestre em Ciência da Computação
152

Modelo de excelência em gestão da qualidade no setor público : estudo de caso em um hospital militar

SILVA, Marcos Carneiro da 31 January 2008 (has links)
Made available in DSpace on 2014-06-12T18:32:47Z (GMT). No. of bitstreams: 2 arquivo3911_1.pdf: 3377808 bytes, checksum: cf3b95c8ba781cc92bc798f6375257e4 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / A presente pesquisa teve como objetivo utilizar o Modelo de Excelência em Gestão preconizado pelo GESPÚBLICA como base para a análise das práticas de qualidade encontradas no Hospital Geral de Recife (HGeR), bem como verificar o estágio de aprendizado alcançado. O estudo na área hospitalar justifica-se devido à natureza peculiar e ao alto grau de complexidade deste tipo de organização, conforme bem acentua Drucker (1999) quando afirma: o gerenciamento na área da saúde é mais complexo do que em qualquer outro tipo de organização. O referencial teórico apóia-se no gerencialismo, que influenciou conceitos, modelos e diretrizes adotados pelo Governo Federal em suas ações no processo de Reforma do Estado, destacando-se o GESPÚBLICA, que visa basicamente melhorar, de forma contínua, a qualidade gerencial dos órgãos que compõem o setor público brasileiro, de modo a alcançar um nível de excelência no atendimento dos seus produtos, serviços ou processos com alto nível de qualidade ao cidadão/cliente. A metodologia utilizada foi a do estudo de caso, tendo se empregado o uso de pesquisa bibliográfica, entrevistas semi-estruturadas, análise documental dos Relatórios de Gestão do HGeR, no período de 2005 - 2007, bem como dos resultados da pesquisa de opinião, realizada junto aos seus usuários, além de se recorrer à observação pessoal. A pesquisa foi de natureza qualitativa, sendo os dados coletados e trabalhados conforme análise de conteúdo. As conclusões do trabalho apontam para o ano de 2005 como aquele em que o HGeR alcançou os melhores resultados em relação ao seu nível de qualidade. Contudo, no período de 2006 a 2007, passou a configurar-se uma tendência desfavorável por conta das crescentes demandas impostas ao hospital sem o correspondente investimento no efetivo de pessoal. Mesmo assim, destaca-se o papel desempenhado pela alta liderança, engajada nos processos de melhoria de atendimento ao cliente ao lado de uma gestão participativa. Verificou-se que a gestão do conhecimento ainda é um item pouco conhecido e explorado no HGeR, porquanto os resultados mais críticos recaem nos critérios que requerem maior domínio desse modelo inovador de gestão. Finalmente, cabe apontar a existência, no atual momento, de condições propícias à apresentação de sugestões que conduzam a estágios de aprendizado mais avançados, principalmente nos pontos em que foram identificadas mais deficiências em relação às práticas de qualidade já adotadas
153

Redes probabilísticas fuzzy naive bayes

Moura, Gabriel Barreto January 2016 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016 / Made available in DSpace on 2016-09-20T04:19:30Z (GMT). No. of bitstreams: 1 341498.pdf: 2702580 bytes, checksum: ac52d986bff31a48f53a987366f89c76 (MD5) Previous issue date: 2016 / Redes bayesianas são modelos gráficos probabilísticos capazes de modelar a incerteza estocástica e são vastamente aplicados em vários problemas de classificação. Especificamente, a estrutura naïve bayes são largamente utilizadas devido aos bons resultados atingidos, apesar da sua estrutura simples e 'ingênua'. Sistemas fuzzy, por outro lado, são modelos bem conhecidos para lidar com a imprecisão linguística por representar o conhecimento através de regras e funções de pertinências simples e interpretáveis. Porém, sistemas fuzzy tradicionais não são capazes de modelar a incerteza estocástica e, por isso, sistemas fuzzy probabilísticos foram desenvolvidos de forma a levar em consideração ambas as incertezas. Neste trabalho é proposta a rede probabilística fuzzy naïve bayes, uma combinação de sistemas fuzzy probabilísticos e redes bayesianas naïve, também capaz de modelar ambas as incertezas simultaneamente. O modelo proposto é primeiramente aplicado a um problema simples e didático de classificação para demonstrar o seu potencial e vantagem em relação a classificadores naïve bayes, enquanto mantém-se a interpretabilidade do modelo tradicional. Para testar o modelo, experimentos foram realizados em conjuntos de dados de benchmark e seus resultados são comparados a modelos de outros autores que utilizam os mesmos conjuntos de dados. A rede proposta apresenta resultados levemente inferiores a outros modelos. Porém, é observada uma vantagem qualitativa da rede proposta devido a seu alto nível de interpretabilidade.<br> / Abstract: Bayesian networks are probabilistic graphical models capable of modeling statistical uncertainty and are widely applied in many classification problems. Specifically, Naive Bayesian networks are largely used due to their simple, naive structure, while still producing precise results. Fuzzy systems, on the other hand, are a well known technique capable of dealing with linguistic vagueness by representing knowledge with simple and interpretable rules and membership functions. As traditional fuzzy systems are unable to model statistical uncertainty, Probabilistic Fuzzy Systems were developed in order to account for both kinds of uncertainties. In this work we propose the Probabilistic Fuzzy Naive Bayes classifier as a combination of both probabilistic fuzzy systems and naive bayesian networks, also capable of simultaneously modeling both kinds of uncertainties. The proposed model is firstly applied in a very simple classification problem in order to show its potential and advantage over traditional naive bayes classifiers, while maintaining their interpretability. For validation, experiments were done using benchmark classification data sets from the UCI machine learning repository and the results are then compared with other similar alternate methods.
154

Uso de redes complexas na classificação relacional / Use of complex networks in relational classification

Robson Carlos da Motta 26 June 2009 (has links)
A vasta quantidade de informações disponível sobre qualquer área de conhecimento torna cada vez mais difícil selecionar e analisar informações específicas e relevantes sobre determinado assunto. Com isso, faz-se necessário o aprimoramento de técnicas automáticas para recuperação, análise e extração de conhecimento em conjuntos de dados, destacando-se dessa forma as pesquisas em Aprendizado de Máquina e em Mineração de Dados. Em aprendizado de máquina e em mineração, a grande maioria das técnicas utiliza-se de uma representação proposicional dos dados, que considera apenas caracter características individuais dos objetos descritos em uma tabela atributo-valor. Porém, existem aplicações nas quais além da descrição dos objetos também estão disponíveis informações sobre relações existentes entre eles. Esses domínios podem ser representados via grafos, nos quais vértices representam objetos e arestas relações entre objetos, possibilitando a aplicação de técnicas relacionais aos dados. Conceitos de Redes Complexas (RC) podem ser utilizados neste contexto. RC é um campo de pesquisa recente e ativo, que estuda o comportamento de diversos sistemas reais, modelados via grafos. Entretanto, ainda há poucos trabalhos que utilizam Redes Complexas em aprendizado de máquina ou mineração de dados. Este projeto apresenta uma proposta de utilização do formalismo de redes complexas e grafos para descoberta de padrões no contexto de aprendizado supervisionado. O formalismo de grafos permite representar as relações entre objetos e características particulares do domínio, permitindo agregar informações estruturais das relações à descoberta de conhecimento. Especificamente, neste trabalho desenvolve-se uma representação relacional baseada em grafos construídos a partir de relações de similaridade entre objetos. Baseado nesta representação são propostas abordagens de classificação relacional. Também é proposto um modelo de rede denominado K-Associados. Propriedades da rede K-Associados foram investigadas. Os resultados experimentais demonstram um grande potencial para classificação utilizando os algoritmos de classificação e de formação de redes propostos / The vast amount of information available on any area of knowledge makes selecting and analyzing information on a specific topic increasingly dificult. Therefore, it is necessary the improvement of techniques for automatic information retrieval, analysis, and knowledge extraction from data sets. In this scenario, especial attention must be addressed for Machine Learning and Data Mining researches. In machine learning and data mining, most of the techniques uses a propositional representation, which considers only the characteristics of the objects described into an attribute-value table. However, there are domains where, in addition to the description of the objects, it is also available information about relationship between them. Such domains can be represented by graphs where vertices represent objects and edges relationship between objects, enabling the application of techniques for relational data. Concepts of complex networks (CN) can be useful in this context. CN is a recent and active research field, which studies the behavior of many real systems modeled by graphs. However, there is little work in machine learning or data mining applying CN concepts. This project presents a proposal to use the formalism of complex networks and graphs to discover patterns in the context of supervised learning. The formalism of graphs can represent relationships between objects and characteristics of the domain, allowing adding structural knowledge embedded in a graph into the data mining process. Specifically, this work develops a relational representation based on graphs constructed taking into consideration the similarity between objects. Based on this representation, relational classification approaches are proposed. It is also proposed a network referred to K-Associate Network. Properties of the K-Associate Network were investigated. The experimental results show great potential for the proposed classification and network construction algorithms
155

Análise do conhecimento extraído de classificadores simbólicos utilizando medidas de avaliação e de interessabilidade.

Alan Keller Gomes 02 May 2002 (has links)
Com o avanço da tecnologia, grandes volumes de dados estão sendo coletados e acumulados numa velocidade espantosa. Data Mining constitui um campo de pesquisa recente em Inteligência Artificial, cujo objetivo é extrair conhecimento de grandes bases de dados. Um dos tópicos tratados em Data Mining para extrair conhecimento é o uso de algoritmos de Aprendizado de Máquina em grandes volumes de dados. Alguns algoritmos de Aprendizado de Máquina são capazes de criar generalizações, ou descrever conceitos, a partir de um conjunto de dados previamente rotulados. Esses algoritmos são conhecidos como indutores e são capazes de induzir uma hipótese (ou classificador). Um classificador pode estar descrito sob uma forma simbólica explícita, e assim, apresentar uma explicação do conceito aprendido de forma inteligível ao ser humano. Uma dessas formas de representação simbólica explícita são as regras de conhecimento. Especialmente em Data Mining, o volume de regras de conhecimento que descrevem um classificador simbólico pode ser muito grande. Isso dificulta muito a análise de regras individuais ou de um grupo de regras por parte do usuário desse conhecimento. No intuito de propor uma solução para essa dificuldade, a análise automática de regras, utilizando medidas de avaliação e de interessabilidade, destaca-se como uma das fontes de resultados positivos da aplicação do Aprendizado de Máquina na área de Data Mining. Neste trabalho é apresentado o RuleSystem, um sistema computacional protótipo que implementa funcionalidades voltadas para Aprendizado de Máquina e Data Mining. Uma dessas funcionalidades, implementadas no RuleSystem, refere-se à análise automática de regras. O Módulo de Análise de regras, proposto neste trabalho, implementa diversas medidas de avaliação e de interessabilidade de regras, permitindo assim realizar uma análise tanto quantitativa quanto qualitativa das regras que constituem a(s) hipótese(s) induzida(s) por algoritmos de Aprendizado de Maquina simbólico.
156

Computação inteligente no estudo de variantes de hemoglobina / Intelligent computation applied to the study of hemoglobin variants

Thaís Helena Samed e Sousa 29 October 2004 (has links)
A evolução in vitro é um método laboratorial criado para a evolução de moléculas, principalmente de proteínas. Por meio de mutações, o método busca novas propriedades de moléculas, objetivando criar novas proteínas e, com isso, intensificar o estudo e a cura de doenças, pelo desenvolvimento de novos fármacos. O grande desafio na evolução in vitro é criar o maior número possível de moléculas de proteínas que atinjam propriedades desejadas, uma vez que apenas uma fração infinitesimal das diversidades geradas utilizando-se seqüências de DNA é aproveitada. Para se obter moléculas com funcionalidade adequada por meio dessa técnica, é requerido muito tempo e aporte financeiro. Com o objetivo de avaliar computacionalmente a funcionalidade de proteínas variantes a partir das seqüências de aminoácidos buscando reduzir o custo e o tempo desprendido em laboratório, este trabalho propõe o uso de técnicas de computação inteligentes (evolução in silicio), baseadas em aprendizado de máquina e computação evolutiva. Para o emprego de técnicas de AM, bancos de dados com elevado número de informações são fundamentais. Neste sentido, escolheu-se investigar as moléculas mutantes de hemoglobina, uma vez que a quantidade de informações disponíveis sobre a mesma é bastante extensa na literatura. Os resultados obtidos mostram que é possível desenvolver algoritmos eficientes para determinar a funcionalidade de variantes de hemoglobina. Com esses resultados, busca-se contribuir no desenvolvimento de técnicas de evolução dirigida com suporte computacional / In vitro evolution is a laboratorial method developed to molecule evolution mainly proteins. By producing mutations, this method looks for new molecule properties, aiming achieve new proteins for the development of drugs for diseases. The great challenge of in vitro evolution is the development of the highest possible number of molecules that reaches desired properties. This objective is a great challenge to be transposed, since only one infinitesimal fraction of generated proteins using DNA sequencies is usefull to obtain molecules with the desired function. Besides high financial support and time are required to apply this technique. With the objective of evaluating computacionaly and functionality of proteins mutants starting from aminoacids sequences looking for to reduce the cost and the time loosened at laboratory, this work proposes the use of intelligent computation techniques based on learning of it conspires and evolutionary computation. On the other hand, when machine learning techniques are used, it is fundamental to access data mining with high number of information. In order to reduce these difficulties, this work proposes a machine learning (ML) based on approach to evaluate computationaly hemoglobin variants. ML techniques require, in general, large data base. In order to supply this requirement, hemoglobin variants were used because there is a large number of hemoglobin variants available in the literature. The obtained results shown that is possible to develop efficient algorithms to determine hemoglobin variant function. These results can contribute for development of molecule evolution techniques
157

Promoção da Conscientização da Proficiência em Língua Portuguesa entre Falantes Avançados

Carvalho da Cruz Teixeira, Diomar 22 April 2022 (has links) (PDF)
Nesta pesquisa do tipo qualitativa será caracterizada a consciência da proficiência linguística dos estudantes da disciplina PORT 321 na Brigham Young University. Os professores do departamento de Espanhol e Português identificaram a limitação dos MRs (missionários retornados) em falar fluentemente para além de temas religiosos. Objetivando discernir os pontos fortes e os fracos do aprendizado, foi investigada a eficácia do conteúdo e da didática em PORT 321, sondando a consciência da proficiência linguística e possíveis meios de promover uma diretriz de ensino para o professor. Os dados coletados deram origem aos temas: (1) a consciência linguística e sociolinguística; (2) as funções linguísticas identificadas no ACTFL Proficiency Guidelines; e (3) as características individuais dos aprendizes de segunda língua e seus subtemas. O resultado, em conformidade com os textos redigidos pelos estudantes, mostra que eles são muito motivados a falar português brasileiro e ambicionam chegar a fluência, pois idealizam trabalhar tendo português-L2 como suporte na rotina do emprego. Essa reflexão mostra, parcamente, a necessidade que o aluno sente de entender mais profundamente o idioma estudado.
158

Classificação semi-supervisionada baseada em desacordo por similaridade / Semi-supervised learning based in disagreement by similarity

Gutiérrez, Victor Antonio Laguna 03 May 2010 (has links)
O aprendizado semi-supervisionado é um paradigma do aprendizado de máquina no qual a hipótese é induzida aproveitando tanto os dados rotulados quantos os dados não rotulados. Este paradigma é particularmente útil quando a quantidade de exemplos rotulados é muito pequena e a rotulação manual dos exemplos é uma tarefa muito custosa. Nesse contexto, foi proposto o algoritmo Cotraining, que é um algoritmo muito utilizado no cenário semi-supervisionado, especialmente quando existe mais de uma visão dos dados. Esta característica do algoritmo Cotraining faz com que a sua aplicabilidade seja restrita a domínios multi-visão, o que diminui muito o potencial do algoritmo para resolver problemas reais. Nesta dissertação, é proposto o algoritmo Co2KNN, que é uma versão mono-visão do algoritmo Cotraining na qual, ao invés de combinar duas visões dos dados, combina duas estratégias diferentes de induzir classificadores utilizando a mesma visão dos dados. Tais estratégias são chamados de k-vizinhos mais próximos (KNN) Local e Global. No KNN Global, a vizinhança utilizada para predizer o rótulo de um exemplo não rotulado é conformada por aqueles exemplos que contém o novo exemplo entre os seus k vizinhos mais próximos. Entretanto, o KNN Local considera a estratégia tradicional do KNN para recuperar a vizinhança de um novo exemplo. A teoria do Aprendizado Semi-supervisionado Baseado em Desacordo foi utilizada para definir a base teórica do algoritmo Co2KNN, pois argumenta que para o sucesso do algoritmo Cotraining, é suficiente que os classificadores mantenham um grau de desacordo que permita o processo de aprendizado conjunto. Para avaliar o desempenho do Co2KNN, foram executados diversos experimentos que sugerem que o algoritmo Co2KNN tem melhor performance que diferentes algoritmos do estado da arte, especificamente, em domínios mono-visão. Adicionalmente, foi proposto um algoritmo otimizado para diminuir a complexidade computacional do KNN Global, permitindo o uso do Co2KNN em problemas reais de classificação / Semi-supervised learning is a machine learning paradigm in which the induced hypothesis is improved by taking advantage of unlabeled data. Semi-supervised learning is particularly useful when labeled data is scarce and difficult to obtain. In this context, the Cotraining algorithm was proposed. Cotraining is a widely used semisupervised approach that assumes the availability of two independent views of the data. In most real world scenarios, the multi-view assumption is highly restrictive, impairing its usability for classifification purposes. In this work, we propose the Co2KNN algorithm, which is a one-view Cotraining approach that combines two different k-Nearest Neighbors (KNN) strategies referred to as global and local k-Nearest Neighbors. In the global KNN, the nearest neighbors used to classify a new instance are given by the set of training examples which contains this instance within its k-nearest neighbors. In the local KNN, on the other hand, the neighborhood considered to classify a new instance is the set of training examples computed by the traditional KNN approach. The Co2KNN algorithm is based on the theoretical background given by the Semi-supervised Learning by Disagreement, which claims that the success of the combination of two classifiers in the Cotraining framework is due to the disagreement between the classifiers. We carried out experiments showing that Co2KNN improves significatively the classification accuracy specially when just one view of training data is available. Moreover, we present an optimized algorithm to cope with time complexity of computing the global KNN, allowing Co2KNN to tackle real classification problems
159

Abordagens para aprendizado semissupervisionado multirrótulo e hierárquico / Multi-label and hierarchical semi-supervised learning approaches

Metz, Jean 25 October 2011 (has links)
A tarefa de classificação em Aprendizado de Máquina consiste da criação de modelos computacionais capazes de identificar automaticamente a classe de objetos pertencentes a um domínio pré-definido a partir de um conjunto de exemplos cuja classe é conhecida. Existem alguns cenários de classificação nos quais cada objeto pode estar associado não somente a uma classe, mas a várias classes ao mesmo tempo. Adicionalmente, nesses cenários denominados multirrótulo, as classes podem ser organizadas em uma taxonomia que representa as relações de generalização e especialização entre as diferentes classes, definindo uma hierarquia de classes, o que torna a tarefa de classificação ainda mais específica, denominada classificação hierárquica. Os métodos utilizados para a construção desses modelos de classificação são complexos e dependem fortemente da disponibilidade de uma quantidade expressiva de exemplos previamente classificados. Entretanto, para muitas aplicações é difícil encontrar um número significativo desses exemplos. Além disso, com poucos exemplos, os algoritmos de aprendizado supervisionado não são capazes de construir modelos de classificação eficazes. Nesses casos, é possível utilizar métodos de aprendizado semissupervisionado, cujo objetivo é aprender as classes do domínio utilizando poucos exemplos conhecidos conjuntamente com um número considerável de exemplos sem a classe especificada. Neste trabalho são propostos, entre outros, métodos que fazem uso do aprendizado semissupervisionado baseado em desacordo coperspectiva, tanto para a tarefa de classificação multirrótulo plana quanto para a tarefa de classificação hierárquica. São propostos, também, outros métodos que utilizam o aprendizado ativo com intuito de melhorar a performance de algoritmos de classificação semissupervisionada. Além disso, são propostos dois métodos para avaliação de algoritmos multirrótulo e hierárquico, os quais definem estratégias para identificação dos multirrótulos majoritários, que são utilizados para calcular os valores baseline das medidas de avaliação. Foi desenvolvido um framework para realizar a avaliação experimental da classificação hierárquica, no qual foram implementados os métodos propostos e um módulo completo para realizar a avaliação experimental de algoritmos hierárquicos. Os métodos propostos foram avaliados e comparados empiricamente, considerando conjuntos de dados de diversos domínios. A partir da análise dos resultados observa-se que os métodos baseados em desacordo não são eficazes para tarefas de classificação complexas como multirrótulo e hierárquica. Também é observado que o problema central de degradação do modelo dos algoritmos semissupervisionados agrava-se nos casos de classificação multirrótulo e hierárquica, pois, nesses casos, há um incremento nos fatores responsáveis pela degradação nos modelos construídos utilizando aprendizado semissupervisionado baseado em desacordo coperspectiva / In machine learning, the task of classification consists on creating computational models that are able to automatically identify the class of objects belonging to a predefined domain from a set of examples whose class is known a priori. There are some classification scenarios in which each object can be associated to more than one class at the same time. Moreover, in such multilabeled scenarios, classes can be organized in a taxonomy that represents the generalization and specialization relationships among the different classes, which defines a class hierarchy, making the classification task, known as hierarchical classification, even more specific. The methods used to build such classification models are complex and highly dependent on the availability of an expressive quantity of previously classified examples. However, for a large number of applications, it is difficult to find a significant number of such examples. Moreover, when few examples are available, supervised learning algorithms are not able to build efficient classification models. In such situations it is possible to use semi-supervised learning, whose aim is to learn the classes of the domain using a few classified examples in conjunction to a considerable number of examples with no specified class. In this work, we propose methods that use the co-perspective disagreement based learning approach for both, the flat multilabel classification and the hierarchical classification tasks, among others. We also propose other methods that use active learning, aiming at improving the performance of semi-supervised learning algorithms. Additionally, two methods for the evaluation of multilabel and hierarchical learning algorithms are proposed. These methods define strategies for the identification of the majority multilabels, which are used to estimate the baseline evaluation measures. A framework for the experimental evaluation of the hierarchical classification was developed. This framework includes the implementations of the proposed methods as well as a complete module for the experimental evaluation of the hierarchical algorithms. The proposed methods were empirically evaluated considering datasets from various domains. From the analysis of the results, it can be observed that the methods based on co-perspective disagreement are not effective for complex classification tasks, such as the multilabel and hierarchical classification. It can also be observed that the main degradation problem of the models of the semi-supervised algorithms worsens for the multilabel and hierarchical classification due to the fact that, for these cases, there is an increase in the causes of the degradation of the models built using semi-supervised learning based on co-perspective disagreement
160

Model selection for learning boolean hypothesis / Seleção de modelos para o aprendizado de hipóteses booleanas

Castro, Joel Edu Sanchez 10 August 2018 (has links)
The state of the art in machine learning of Boolean functions is to learn a hypothesis h, which is similar to a target hypothesis f, using a training sample of size N and a family of a priori models in a given hypothesis set H, such that h must belong to some model in this family. An important characteristic in learning is that h should also predict outcome values of f for previously unseen data, so the learning algorithm should minimize the generalization error which is the discrepancy measure between outcome values of f and h. The method proposed in this thesis learns family of models compatible with training samples of size N. Taking into account that generalizations are performed through equivalence classes in the Boolean function domain, the search space for finding the correct model is the projection of H in all possible partitions of the domain. This projection can be seen as a model lattice which is anti-isomorphic to the partition lattice and also has the property that for every chain in the lattice there exists a relation order given by the VC dimension of the models. Hence, we propose a model selector that uses the model lattice for selecting the best model with VC dimension compatible to a training sample of size N, which is closely related to the classical sample complexity theorem. Moreover, this model selector generalizes a set of learning methods in the literature (i.e, it unifies methods such as: the feature selection problem, multiresolution representation and decision tree representation) using models generated from a subset of partitions of the partition space. Furthermore, considering as measure associated to the models the estimated error of the learned hypothesis, the chains in the lattice present the so-called U-curve phenomenon. Therefore, we can use U-curve search algorithms in the model lattice to select the best models and, consequently, the corresponding VC dimension. However, this new generation of learning algorithms requires an increment of computational power. In order to face this problem, we introduce a stochastic U-curve algorithm to work on bigger lattices. Stochastic search algorithms do not guarantee finding optimal solutions, but maximize the mean quality of the solution for a given amount of computational power. The contribution of this thesis advances both the state of the art in machine learning theory and in practical problem solutions in learning. / O estado da arte em aprendizado de funções Booleanas é aprender uma hipótese h, que é similar a uma hipótese objetivo f, a partir de uma amostra de tamanho N e uma família de modelos a priori em um dado conjunto de hipóteses H, tal que h deve pertencer a algum modelo nesta família. Uma característica importante no aprendizado é que h deve também predizer resultados de f para elementos que não aparecem no conjunto de treinamento, então o algoritmo de aprendizado deve minimizar o erro de generalização, o qual mede a discrepância entre os resultados de f e h. O método proposto nesta tese aprende uma família de modelos compatíveis com um conjunto de treinamento de tamanho N. Tomando em consideração que as generalizações são realizadas através de classes de equivalência no domínio da função Booleana, o espaço de busca para encontrar um modelo apropriado é a projeção de H em todas as possíveis partições do domínio. Esta projeção pode ser vista como um reticulado de modelos que é anti-isomórfica ao reticulado de partições e também tem a propriedade que para cada cadeia no reticulado existe uma relação de ordem dada pela dimensão VC dos modelos. Portanto, propomos um seletor de modelos que usa o reticulado de modelos para selecionar o melhor modelo com dimensão VC compatível ao conjunto de treinamento de tamanho N, o qual é intimamente relacionado ao teorema clássico de complexidade da amostra. Além disso, este seletor de modelos generaliza um conjunto de métodos de aprendizado na literatura (i.e, ele unifica métodos tais como: o problema de seleção de características, a representação multiresolução e a representação por árvores de decisão) usando modelos gerados por um subconjunto de partições do espaço de partições. Ademais, considerando como medida associada aos modelos o erro de estimação da hipótese aprendida, as cadeias no reticulado apresentam o fenômeno chamado U-curve. Portanto, podemos usar algoritmos de busca $U$-curve no reticulado de modelos para selecionar os melhores modelos, consequentemente, a correspondente dimensão VC. No entanto, esta nova geração de algoritmos de aprendizado requerem um incremento de poder computacional. Para enfrentar este problema, introduzimos o algoritmo Stochastic $U$-curve para trabalhar em reticulados maiores. Algoritmos de busca estocásticos não garantem encontrar soluções ótimas, mas maximizam a qualidade média das soluções para uma determinada quantidade de poder computacional. A contribuição desta tese avança ambos o estado da arte na teoria de aprendizado de máquina e soluções a problemas práticos em aprendizado.

Page generated in 0.07 seconds