• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 163
  • 7
  • 2
  • Tagged with
  • 173
  • 72
  • 41
  • 37
  • 34
  • 25
  • 24
  • 24
  • 20
  • 17
  • 17
  • 15
  • 14
  • 14
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Uma extensão à teoria matemática da evidência

Ferreira da Costa Campos, Fábio January 2005 (has links)
Made available in DSpace on 2014-06-12T15:55:07Z (GMT). No. of bitstreams: 2 arquivo9565_1.pdf: 714901 bytes, checksum: e1602dd43ff228b49b6ff591a1e8915a (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2005 / O presente trabalho estabelece uma extensão `a Teoria Matemática da Evidência, também conhecida como Teoria de Dempster-Shafer, através da adoção de uma nova regra de combinação de evidências e de um arcabouço conceitual associado. Essa extensão resolve os problemas de comportamento contra-intuitivo apresentados originalmente pela teoria, amplia o poder expressional da mesma e permite a representação da incerteza nos resultados. A representação da incerteza implica a disponibilidade da mesma como um recurso estratégico a ser utilizado nas decisões baseadas nas evidências combinadas, bem como deixa explícita a relação entre os resultados numéricos obtidos e a probabilidade clássica
72

Wavelets na compactação e processamento de sinais de distúrbios em sistemas de potência para classificação via redes neurais artificiais

LIRA, Milde Maria da Silva January 2004 (has links)
Made available in DSpace on 2014-06-12T17:35:41Z (GMT). No. of bitstreams: 2 arquivo6994_1.pdf: 1435653 bytes, checksum: 4e1bdb7a745c9aaae76de273132b51f9 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2004 / Neste trabalho, são desenvolvidos novos tipos de Wavelets para análise de sinais, um Algoritmo de Compactação e um Sistema de Classificação de sinais de tensões com distúrbio. A compactação do sinal é realizada eliminando-se os coeficientes wavelets cujos módulos estão abaixo de um determinado limiar de corte. Os resultados para sinais reais obtidos em registradores digitais forneceram altas taxas de compactação, tipicamente em torno de 82%, demonstrando a potencialidade deste método. Na classificação, o sinal de tensão é pré-processado via Wavelets e em seguida submetido a uma redução dimensional por meio da ferramenta estatística, Análises de Componentes Principais, e finalmente é submetido à Rede Neural tipo Multilayer Perceptrons - MLP, que indicará o tipo de distúrbio presente no sinal. Cada rede implementada foi treinada com uma base de conhecimento, cujos atributos foram constituídos dos coeficientes wavelets de aproximação, ou de detalhes, ou de ambos. Na combinação das Redes Neurais, em cada um dos seis nós de saída, aplicou-se a média entre as três saídas das redes individuais. A decisão final do classificador corresponde à saída combinada de maior valor. A técnica de combinação de modelos diferentes na classificação mostra excelentes resultados ao corrigir os casos mal classificados pelas redes individuais. O percentual de acerto da combinação da rede treinada com os coeficientes de detalhes com a aquela treinada com os coeficientes de aproximação para um conjunto de teste formado por 306 padrões foi de 99,3%, enquanto que na rede individual treinada com ambos coeficientes, esse índice foi de 96,4%. Estes resultados demonstram a superioridade do Sistema de Classificação baseado na combinação de redes com arquiteturas diferentes
73

Investigação de combinações de técnicas de detecção de ruído para dados de expressão gênica / Investigation of ensembles of noise detection techniques for gene expression data.

Giampaolo Luiz Libralon 09 November 2007 (has links)
Ruído pode ser definido como um exemplo em um conjunto de dados que aparentemente é inconsistente com o restante dos dados existentes, pois não segue o mesmo padrão dos demais. Ruídos em conjuntos de dados podem reduzir o desempenho das técnicas de Aprendizado de Máquina (AM) empregadas e aumentar o tempo de construção da hipótese induzida, assim como sua complexidade. Dados são geralmente coletados por meio de medições realizadas em um domínio de interesse. Nesse sentido, nenhum conjunto de dados é perfeito. Erros de medições, dados incompletos, errados, corrompidos ou distorcidos, falhas humanas ou dos equipamentos utilizados, dentre muitos outros fatores, contribuem para a contaminação dos dados, e isso é particularmente verdadeiro para dados com elevada dimensionalidade. Sendo assim, a detecção de ruídos é uma tarefa crítica, principalmente em ambientes que exigem segurança e confiabilidade, uma vez que a presença desses pode indicar situações que degradam o desempenho do sistema ou a segurança e confiabilidade das informações. Algoritmos para a detecção e remoção de ruídos podem aumentar a confiabilidade de conjuntos de dados ruidosos. Nesse âmbito, esse trabalho investiga técnicas de detecção de ruído baseadas em distância, em que a remoção de ruídos é feita em uma etapa de pré-processamento, aplicadas a problemas de classificação de dados de Expressão Gênica, caracterizados pela presença de ruídos, elevada dimensionalidade e complexidade. O objetivo é melhorar o desempenho das técnicas de AM empregadas para solucioná-los. Por fim, combinações de técnicas de detecção de ruído são implementadas de modo a analisar a possibilidade de melhorar, ainda mais, o desempenho obtido. / Noise can be defined as an example which seems to be inconsistent with the remaining ones in a data set. The presence of noise in data sets can decrease the performance of Machine Learning (ML) techniques in the problem analysis and also increase the time taken to build the induced hypothesis and its complexity. Data are collected from measurements made which represent a given domain of interest. In this sense, no data set is perfect. Measurement errors, incomplete, corrupted, wrong or distorted examples, equipment problems or human fails, besides many other related factors, help contaminating the data, and this is particularly true for data sets with high dimensionality. For this reason, noise detection is a critical task, specially in domains which demand security and trustworthiness, since the presence of noise can lead to situations which degrade the system performance or the security and trustworthiness of the involved information. Algorithms to detect and remove noise may increase trustworthiness of noisy data sets. Based on that, this work evaluates distance-based noise detection techniques, in which noise removal is done by a pre-processing phase, in gene expression classification problems, characterized by the presence of noise, high dimensionality and complexity. The objective is to improve the performance of ML techniques used to solve these problems. Next, ensembles of noise detection techniques are developed in order to analyze the possibility to further improve the performance obtained.
74

Combinação de classificadores para detecção de fraudes em sinistros de automóveis.

Rodrigues, Luis Alexandre 05 August 2014 (has links)
Made available in DSpace on 2016-03-15T19:37:51Z (GMT). No. of bitstreams: 1 Luis Alexandre Rodrigues.pdf: 1364668 bytes, checksum: ac6c4273730fb6f75f7a0ceead7e4c1f (MD5) Previous issue date: 2014-08-05 / Universidade Presbiteriana Mackenzie / This work presents a process to detect suspected cases of fraud at automobile claims dataset, which is evaluated the economic created by it. Because of a detection process presenting misclassific ation, it is necessary to evaluate the financial economy made by the process not only its accuracy in detecting suspected cases of fraud. This process uses a combination of classifiers, with C4.5 Decision Tree, Naive Bayes and Support Vector Machine, const ructed by samples of the data set with automobile claims. This way, the process defined by this work can obtain the balance between the accuracy of classification and the financial economy. / Este trabalho apresenta um processo para detectar casos suspeitos de fraude em conjunto de dados com sinistros de automóvel, em que é avaliada a economia financeira gerada por ele. Devido ao fato de um processo de detecção apresentar erros de classificação, é necessário avaliar a economia financeira apresentada pelo processo e não somente a sua precisão na detecção de casos suspeitos de fraude. Este processo utiliza a combinação de classificadores, sendo Árvore de Decisão C4.5, Naive Bayes e Support Vector Machine, construídos por amostras do conjunto de dados com sinistros de automóvel. Desta forma, o processo definido por este trabalho pode obter o equilíbrio entre a precisão da classificação e a economia financeira.
75

Análise cladística e revisão de Heliura Butler, com notas sobre Delphyre Walker e Eucereon Hübner (Lepidoptera, Erebidae, Arctiinae, Arctiini, Ctenuchina) / Cladistic analysis and revision of Heliura Butler, with notes on Delphyre Walker and Eucereon Hübner (Lepidoptera, Erebidae, Arctiinae, Arctiini, Ctenuchina)

Lívia Rodrigues Pinheiro 14 January 2014 (has links)
O gênero Heliura Butler contava, no início deste trabalho, com 53 nomes e 40 espécies válidas. Foi realizada uma análise cladística com o intuito de testar o monofiletismo do gênero e construir uma hipótese de relações filogenéticas entre suas espécies. A análise mostrou que o conceito prévio de Heliura era polifilético, o que também se revelou verdadeiro para todos os gêneros estudados que tiveram mais de uma espécie incluída nas análises. Este gênero, como aqui redefinido, é composto por 66 espécies no sensu stricto, dentre as quais 16 são espécies novas, e 76 no sensu lato (incluindo as espécies incertae sedis). Tal rearranjo conta com dois novos sinônimos para Heliura, Ptychotricos Schaus, sin. nov. e Mesocerea Hampson, sin. nov. Todas as espécies que pertencem a Heliura no senso revisado foram redescritas e ilustradas, e tiveram sua distribuição geográfica mapeada. As demais foram realocadas de acordo com o que foi possível apurar a respeito de suas relações filogenéticas. Dentre as que foram realocadas com sucesso, estão Eucereon baleris Dyar, comb. nov. e Pseudaethria cosmosomodes Dognin, comb. nov. Dois gêneros novos são criados para realocar outras espécies que não pertencem a Heliura: Bus, gen. nov. e Dus, gen. nov. Entretanto, não foi possível realocar todas elas, de modo que as demais receberam o status de incertae sedis. Onze novos sinônimos foram descobertos: Heliura cadroe Schaus (= Acridopsis lucis Butler), Pseudaethria cessogae Schaus (= Heliura cosmosomodes Dognin), Pseudohyaleucerea manicorensis Rego Barros & Machado (= Heliura quadriflavata Kaye), Delphyre nilammon Schaus (= Eucereon inconspícua Kaye), Heliura klagesi meridionalis Rothschild, Delphyre lemoulti Draudt (= Neacerea rhodocrypta Druce), Automolis oviplaga Rothschild (= Delphyre subapicalis Dukinfield-Jones), Theages quadricolor Walker, Eucereon quadricolor boreale Rothschild e E. quadricolor meridionale Rothschild (estes três = Chelonia punctata Guérin-Meneville) e Eucereon tigrisoma Rothschild (= Galethalea pica Walker). Outras duas espécies também tratadas aqui em Heliura, H. pierus Cramer e H. dares Cramer, são declaradas species inquirendae. Heliura distincta Rothschild passa a ser conhecida como Heliura rothschildi nom. nov., uma vez que ,Teucer distincta Rothschild, um ano mais antiga, também passa a fazer parte de Heliura. A combinação nova Heliura elongata (Schaus), comb. nov. é mais antiga que H. elongata Rothschild, e, portanto, este último nome passa a ser conhecido como H. umbrimaculodes nom. nov. São apresentadas notas sobre Delphyre Walker e Eucereon Hübner, com a revalidação de alguns de seus sinônimos (Neacerea Druce, gen. revalid. e Erithales Poey, gen. revalid.), além da criação de um gênero novo, Aus, gen. nov., para algumas espécies previamente alocadas em Delphyre. As identidades de Eucereon archias e E. punctatum são discutidas à luz de novas descobertas. Novas combinações são propostas em Galethalea Butler, Pseudohyaleucerea Rego Barros & Machado, Diabaena Felder, Pseudopharus Hampson, Eucereon Hübner e Rhipha Walker. Outras duas espécies novas são descritas, em Delphyre e Erithales. Lectótipos foram designados quando apropriado para todos os nomes descritos ou presumivelmente descritos a partir de mais de um espécime / The genus Heliura Butler had 53 names and 40 valid species at the beginning of this study. A cladistic analysis was performed to test its monophyletism, which results showed that it is polyphyletic, as well as all other genera included in the analysis and represented by more than one taxon. Heliura, as defined here, comprises 66 species in its sensu stricto, 16 of which are new, and 76 in its sensu lato (which includes incertae sedis species). This arrangement counts with two new synonyms for Heliura, Ptychotricos Schaus, sin. nov. e Mesocerea Hampson, sin. nov. All the species belonging to Heliura in the sense here defended were redescribed, illustrated and mapped. The other ones were rearranged according to the results obtained at the analysis. Among those successfully placed in genera already described are Eucereon baleris Dyar, comb. nov. and Pseudaethria cosmosomodes Dognin, comb. nov. Two new genera were created to place other species that do not belong in Heliura: Bus, gen. nov. and Dusi, gen. nov. However, it was not possible to place confidently all the species that do not belong in Heliura, and those which phylogenetic positions remain a mistery were given the status of incertae sedis. Eleven new synonyms were discovered: Heliura cadroe Schaus (= Acridopsis lucis Butler), Pseudohyaleucerea manicorensis Rego Barros & Machado (= Heliura quadriflavata Kaye), Delphyre nilammon Schaus (= Eucereon inconspicua Kaye), Heliura klagesi meridionalis Rothschild, Delphyre lemoulti Draudt (= Neacerea rhodocrypta Druce), Automolis oviplaga Rothschild (= Delphyre subapicalis Dukinfield-Jones), Theages quadricolor Walker, Eucereon quadricolor boreale Rothschild e E. quadricolor meridionale Rothschild (these three = Chelonia punctata Guérin-Meneville), and Eucereon tigrisoma Rothschild (= Galethalea pica Walker). Two other species here treated in Heliura were declared species inquirendae: H. Pierus Cramer and H. Dares Cramer. Heliura distinct Rothschild received a new name, Heliura rothschildi, nom. nov., because Teucer distinct Rothschild, which is one year older, is now also part of Heliura. At last, notes on Delphyre Walker and Eucereon Hübner are provided, with the revalidation of some of its synonyms (Neacerea Druce, gen. revalid. and Erithales Poey, gen. revalid.), plus the creation of a new genus, Aus, gen. nov., for some species previously placed in Delphyre. The identities of Eucereon archias and E. Punctatum are discussed based on new evidence. New combinations are proposed in Galethalea Butler, Pseudohyaleucerea Rego Barros & Machado, Diabaena Felder, Pseudopharus Hampson, Eucereon Hübner, and <i.Rhipha Walker. Two other new species are described, in Delphyre and Erithales. Lectotypes were designated when appropriated for all names described or supposedly described from more than one specimen
76

Avaliação dos Efeitos Antineoplásicos da Zebularina em Linhagens Pediátricas de Leucemia Linfoide Aguda. / Evaluation of Antineoplastic Effects of Zebularine on Childhood Acute Lymphoblastic Leukemia Cell Lines.

Augusto Faria Andrade 26 March 2012 (has links)
A leucemia linfóide aguda (LLA) é a neoplasia hematológica mais comum na infância e representa uma doença heterogênea em relação à biologia e ao prognóstico e seu tratamento consiste principalmente em quimioterapia. Apesar dos avanços no tratamento, cerca de 20% dos pacientes apresentam recaída da doença e/ou óbito indicando a necessidade de terapias diferenciadas para esse grupo. Recentemente, drogas epigenéticas como inibidores de DNA metiltransferases (iDNMTs) tem mostrado efeitos anti-neoplásicos promissores para o tratamento de diversos tipos de neoplasias incluindo a LLA. Nos tumores, a hipermetilação gênica é encontrada em vários genes, incluindo genes de reparo do DNA, reguladores do ciclo celular e apoptose. Sendo assim, drogas desmetilantes estão sendo apontadas como promissores agentes para o tratamento do câncer. A Zebularina (ZB) é um iDNMT análogo de citidina que inibe a metilação do DNA. Esta droga tem mostrado resultados animadores para o tratamento de diversas neoplasias, incluindo glioblastoma, leucemia mielóide aguda, câncer de mama, próstata e outros. O objetivo deste trabalho foi avaliar os efeitos do tratamento com a ZB, associada ou não à quimioterápicos, em linhagens celulares pediátricas de LLA, por meio de ensaios funcionais como proliferação celular, capacidade clonogênica, apoptose e ciclo celular. Além disso, foi analisada a capacidade desmetilante da droga e a expressão dos genes DNMT1, DNMT3a e DNMT3b após o tratamento com a ZB. A ZB inibiu a proliferação celular de maneira dose e tempo-dependente e agiu sinergicamente quando combinada com o MTX em ambas as linhagens. Ela também diminuiu a capacidade clonogênica e aumentou a taxa de apoptose nas duas linhagens estudadas. Além disso, o tratamento com ZB causou uma parada na fase S do ciclo celular na linhagem ReH. A ZB foi capaz de desmetilar parcialmente o gene AhR e reduzir a expressão dos genes DNMT1, DNMT3a e DNMT3b. Todos os dados encontrados no presente trabalho sugerem que as drogas desmetilantes podem ser interessantes agentes para o tratamento da LLA pediátrica. / Acute lymphoblastic leukemia (ALL) is the most common hematologic malignancy in childhood and represents a heterogeneous disease regarding its biology and prognosis. Its treatment consists mainly of chemotherapy. Despite advances in treatment, about 20% of patients experience disease recurrence and/or death indicating the need for differentiated therapies for this group. Recently, epigenetic drugs such as DNA methyltransferases inhibitors (iDNMTs) has shown antineoplastic and promising results for several types of tumors including ALL. Gene hypermethylation is found in several genes in tumors cells, including genes responsible for DNA repair, cell cycle and apoptosis regulators. Therefore, demethylating agents may be promising agents for cancer treatment. Zebularine (ZB) an iDNMT is a cytidine analogue that inhibits DNA methylation. This drug has shown promising results for the treatment of many cancers, including glioblastoma, acute myeloid leukemia, breast and prostate cancer and others. The aim of this study was to evaluate the effects of ZB treatment, associated or not with chemotherapeutic agents, in childhood ALL cell lines through functional tests such as cell proliferation, clonogenic capacity, apoptosis and cell cycle. In addition, we examined the demethylating ability of ZB and the expression of DNMT1, DNMT3a and DNMT3b genes after treatment with this agent. ZB inhibited cell proliferation in a dose- and time-dependent manner and showed synergistic effects when combined with MTX in both cell lines. ZB treatment also reduced clonogenic capacity and increased the number of apoptotic cells in both cell lines studied. Furthermore, treatment with ZB caused an S phase cell cycle arrest in ReH cell line. ZB was able to partially demethylate AhR gene and reduce the expression of genes DNMT1, DNMT3a and DNMT3b. These results suggest that demethylating drugs may be interesting agents for the treatment of childhood ALL.
77

Avaliação da sensibilidade in vitro de agentes causadores de cromoblastomicose frente a diferentes antifúngicos, isolados e associados / In vitro susceptibility assessment of agents of the chromoblastomycosis againts different antifungals, isolated and combination (association)

Viviane Mazo Fávero Gimenes 29 September 2003 (has links)
O objetivo do presente trabalho foi estudar a ação de diversos antifúngicos isolados e associados a anfotericina B contra amostras sequenciais ou não recuperadas de pacientes com cromoblastomicose e submetidas ou não a tratamento. A partir de 18 pacientes foram isoladas 39 cepas, submetidas a testes de diluição em ágar contendo anfotericina B, cetoconazol, itraconazol, terbinafina, 5-fluorocitosina, fluconazol ou griseofulvina. Com base nas CIMs e nas concentrações séricas desses antifúngicos verificou-se que as amostras foram, de modo geral, sensíveis ao cetoconazol, a terbinafina e ao itraconazol. Somente 13 amostras foram sensíveis a anfotericina, 7 a 5-FC, 2 ao fluconazol e nenhuma à griseofulvina.Com relação as CFMs, 2 cepas foram sensíveis a AnB, 11 ao itraconazol, 20 ao cetoconazol e 3 a 5-FC. Seis não responderam a terbinafina e 38 ao fluconazol. As combinações de antifúngicos resultaram em interações principalmente aditivas ou indiferentes. O estudo de isolados seqüenciais evidenciou um ponto de corte para sensibilidade desses agentes ao itraconazol, correspondente a ClMs &#8804;0,06&#181;g/ml desse azol. / The aim of the present work was to study the action of several antifungals isolated and combined with amphotericin B against sequential or non-sequential samples in patients infected with chromoblastomycosis and treated or not treated. Thirty nine strains from 18 patients were isolated and submitted to agar dilution testing containing amphotericin B, cetoconazole, itraconazole, terbinafine, 5-flucytosin, fluconazole or griseofulvin. Based on the CIMs and on the serum levels of these antifungals, the isolates were susceptible to ketoconazole, terbinafine and itraconazole. Only 13 of the isolates were susceptible to amphotericin; seven to 5-FC, two to fluconazole and none to a griseofulvin. Regarding the CFMs two strains were susceptible to AnB, 11 for itraconazole, 20 for ketoconazole and three for 5-FC. Six didn\'t respond to terbinafine and 38 for fluconazole. The combination of antifungals resulted in mainly additive or indifferent interaction. The study of the sequential isolated sample showed a breaking point for the susceptibility of these agents to itraconazole, corresponding CIMs &#8804;0,06&#181;g/ml of this azole.
78

Bi-clustering de Dados Genéticos Binários Baseado em Modelos de Classificação Logística

Claudia da Rocha Rego Monteiro, Carla 31 January 2009 (has links)
Made available in DSpace on 2014-06-12T18:28:11Z (GMT). No. of bitstreams: 2 arquivo2996_1.pdf: 1090235 bytes, checksum: c9df39a664777bc77995e62019585122 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2009 / Informações de interações de proteínas são fundamentais para a compreensão dos processos celulares. Por esta razão, várias abordagens têm sido propostas para inferir sobre pares de proteínas de redes de todos os tipos de dados biológicos. Nesta tese é proposto um método de bi-clustering, Lbic, baseado num modelo de classificação logística, para analisar dados biológicos binários. O Lbic é comparado com outros dois métodos de bi-clustering apresentados na literatura, mostrando melhores resultados. Seu desempenho também é comparado àqueles de um método supervisionado, análise de correlação canônica com Kernel, aplicado aos mesmos conjuntos de dados. Os resultados mostram que o Lbic alcança desempenho superior aos da aborgadem supervisionada treinada com até 25% do conhecimento da rede alvo
79

"Novas abordagens em aprendizado de máquina para a geração de regras, classes desbalanceadas e ordenação de casos" / "New approaches in machine learning for rule generation, class imbalance and rankings"

Ronaldo Cristiano Prati 07 July 2006 (has links)
Algoritmos de aprendizado de máquina são frequentemente os mais indicados em uma grande variedade de aplicações de mineração dados. Entretanto, a maioria das pesquisas em aprendizado de máquina refere-se ao problema bem definido de encontrar um modelo (geralmente de classificação) de um conjunto de dados pequeno, relativamente bem preparado para o aprendizado, no formato atributo-valor, no qual os atributos foram previamente selecionados para facilitar o aprendizado. Além disso, o objetivo a ser alcançado é simples e bem definido (modelos de classificação precisos, no caso de problemas de classificação). Mineração de dados propicia novas direções para pesquisas em aprendizado de máquina e impõe novas necessidades para outras. Com a mineração de dados, algoritmos de aprendizado estão quebrando as restrições descritas anteriormente. Dessa maneira, a grande contribuição da área de aprendizado de máquina para a mineração de dados é retribuída pelo efeito inovador que a mineração de dados provoca em aprendizado de máquina. Nesta tese, exploramos alguns desses problemas que surgiram (ou reaparecem) com o uso de algoritmos de aprendizado de máquina para mineração de dados. Mais especificamente, nos concentramos seguintes problemas: Novas abordagens para a geração de regras. Dentro dessa categoria, propomos dois novos métodos para o aprendizado de regras. No primeiro, propomos um novo método para gerar regras de exceção a partir de regras gerais. No segundo, propomos um algoritmo para a seleção de regras denominado Roccer. Esse algoritmo é baseado na análise ROC. Regras provêm de um grande conjunto externo de regras e o algoritmo proposto seleciona regras baseado na região convexa do gráfico ROC. Proporção de exemplos entre as classes. Investigamos vários aspectos relacionados a esse tópico. Primeiramente, realizamos uma série de experimentos em conjuntos de dados artificiais com o objetivo de testar nossa hipótese de que o grau de sobreposição entre as classes é um fator complicante em conjuntos de dados muito desbalanceados. Também executamos uma extensa análise experimental com vários métodos (alguns deles propostos neste trabalho) para balancear artificialmente conjuntos de dados desbalanceados. Finalmente, investigamos o relacionamento entre classes desbalanceadas e pequenos disjuntos, e a influência da proporção de classes no processo de rotulação de exemplos no algoritmo de aprendizado de máquina semi-supervisionado Co-training. Novo método para a combinação de rankings. Propomos um novo método, chamado BordaRank, para construir ensembles de rankings baseado no método de votação borda count. BordaRank pode ser aplicado em qualquer problema de ordenação binária no qual vários rankings estejam disponíveis. Resultados experimentais mostram uma melhora no desempenho com relação aos rankings individuais, alem de um desempenho comparável com algoritmos mais sofisticados que utilizam a predição numérica, e não rankings, para a criação de ensembles para o problema de ordenação binária. / Machine learning algorithms are often the most appropriate algorithms for a great variety of data mining applications. However, most machine learning research to date has mainly dealt with the well-circumscribed problem of finding a model (generally a classifier) given a single, small and relatively clean dataset in the attribute-value form, where the attributes have previously been chosen to facilitate learning. Furthermore, the end-goal is simple and well-defined, such as accurate classifiers in the classification problem. Data mining opens up new directions for machine learning research, and lends new urgency to others. With data mining, machine learning is now removing each one of these constraints. Therefore, machine learning's many valuable contributions to data mining are reciprocated by the latter's invigorating effect on it. In this thesis, we explore this interaction by proposing new solutions to some problems due to the application of machine learning algorithms to data mining applications. More specifically, we contribute to the following problems. New approaches to rule learning. In this category, we propose two new methods for rule learning. In the first one, we propose a new method for finding exceptions to general rules. The second one is a rule selection algorithm based on the ROC graph. Rules come from an external larger set of rules and the algorithm performs a selection step based on the current convex hull in the ROC graph. Proportion of examples among classes. We investigated several aspects related to this issue. Firstly, we carried out a series of experiments on artificial data sets in order to verify our hypothesis that overlapping among classes is a complicating factor in highly skewed data sets. We also carried out a broadly experimental analysis with several methods (some of them proposed by us) that artificially balance skewed datasets. Our experiments show that, in general, over-sampling methods perform better than under-sampling methods. Finally, we investigated the relationship between class imbalance and small disjuncts, as well as the influence of the proportion of examples among classes in the process of labelling unlabelled cases in the semi-supervised learning algorithm Co-training. New method for combining rankings. We propose a new method called BordaRanking to construct ensembles of rankings based on borda count voting, which could be applied whenever only the rankings are available. Results show an improvement upon the base-rankings constructed by taking into account the ordering given by classifiers which output continuous-valued scores, as well as a comparable performance with the fusion of such scores.
80

Recomendação de conteúdo baseada em interações multimodais / Content recommendation based on multimodal interactions

Arthur Fortes da Costa 29 January 2015 (has links)
A oferta de produtos,informação e serviços a partir de perfis de usuários tem tornado os sistemas de recomendação cada vez mais presentes na Web, aumentando a facilidade de escolha e de permanência dos usuários nestes sistemas. Entretanto, existem otimizações a serem feitas principalmente com relação à modelagem do perfil do usuário. Geralmente, suas preferências são modeladas de modo superficial, devido à escassez das informações coletadas,como notas ou comentários, ou devido a informações indutivas que estão suscetíveis a erros. Esta dissertação propõe uma ferramenta de recomendação baseado em interações multimodais, capaz de combinar informações de usuários processadas individualmente por algoritmos de recomendação tradicionais. Nesta ferramenta desenvolveram-se quatro técnicas de combinação afim fornecer aos sistemas de recomendação, subsídios para melhoria na qualidade das predições em diversos domínios. / Providing products, information and services from user profiles has made the recommendation systems to be increasingly present, increasing the ease of selection and retention of users in Webservices. However, there are optimizations to be made in these systems mainly with respect to modeling the user profile. Generally, the preferences are modeled superficially, due to the scarcity of information collected, as notes or comments, or because of inductive information that is susceptible to errors. This work proposes are commendation tool based on multimodal interactions that combines users\' interactions, wich are processed individually by traditional recommendation algorithms. In this tool developed four combination of techniques in order to provide recommendation systems subsidies to improve the quality of predictions.

Page generated in 0.051 seconds