• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 136
  • 10
  • 3
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 147
  • 32
  • 30
  • 26
  • 22
  • 16
  • 15
  • 11
  • 11
  • 11
  • 11
  • 11
  • 10
  • 9
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
131

Aspectos bioecológicos do pulgão-gigante-do-pinus, Cinara atlantica (Wilson, 1919) (Hemiptera: Aphididae), em Pinus spp. (Pinaceae)

Ottati, Angelo Luiz Tadeu [UNESP] 17 February 2004 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:35:00Z (GMT). No. of bitstreams: 0 Previous issue date: 2004-02-17Bitstream added on 2014-06-13T18:45:55Z : No. of bitstreams: 1 ottati_alt_dr_botfca.pdf: 651467 bytes, checksum: a1b92614d7fbcfa2a73dbf3cf0eb427b (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Universidade Estadual Paulista (UNESP) / Empresa Privada / Os afídeos são um dos grupos de pragas amplamente distribuídos, causando perdas consideráveis em sistemas agrícolas e florestais. O pulgão-gigante-do-pinus, Cinara atlantica, é atualmente a espécie de pulgão mais disseminada nos plantios de Pinus no Brasil. Devido à sua importância econômica, esse trabalho objetivou avaliar o efeito de diferentes temperaturas e da espécie hospedeira no desenvolvimento de ninfas e na longevidade e capacidade reprodutiva de adultos de C. atlantica, sob condições de laboratório, e determinar a flutuação populacional, a estrutura etária e a caracterização da estrutura espacial do afídeo em áreas florestadas com Pinus taeda e P. caribaea var. caribaea. A determinação do efeito de diferentes temperaturas (18o C, 22o C, 26o C e 30o C) e de hospedeiros (P. taeda e P. caribaea var. hondurensis) no desenvolvimento de C. atlantica foi conduzida sob fotofase de 12 h e umidade relativa do ar de 70 10%. Utilizaram-se 20 insetos (repetições) para cada combinação dos fatores temperatura e hospedeiro e obtiveram-se resultados para variáveis nos estágios ninfal e adulto e ciclo de vida. A determinação da flutuação populacional e da caracterização espacial (50 árvores/avaliação) e da estrutura etária (cinco colônias/avaliação) de C. atlantica foi realizada em áreas de 1 ha com P. taeda e P. caribaea var. caribaea nos municípios de Buri e Nova Campina/SP em 21 avaliações entre julho de 2001 e agosto de 2002. Concluiu-se que o desenvolvimento de ninfas e a longevidade e potencial reprodutivo dos adultos de C. atlantica não foram influenciados pelos hospedeiros P. taeda e P. caribaea var. hondurensis. Entretanto, as temperaturas constantes de 18o C e 22o C conferem as melhores condições, enquanto a de 30o C as piores condições de desenvolvimento aos insetos mantidos em P. taeda e P. caribaea var. hondurensis. C. atlantica... . / Aphids are one of the most widespread groups of pests, causing severe damages on agricultural and forestry systems. Nowadays, the giant conifer aphid, C. atlantica, is widely distributed on pine forests in Brazil. Due to its economic importance, this study aimed to evaluate the effects of different constant temperatures and host plants on the development of nymphs and adults and reproductive capacity in adult of C. atlantica in laboratory, monitoring the populational fluctuation, the age structure and to characterize spatial pattern of C. atlantica in Pinus taeda and P. caribaea var. caribaea plantations. The effect of constant temperatures (18o C, 22o C, 26o C e 30o C) and host plants (P. taeda and P. caribaea var. hondurensis) on the development of C. atlantica was carried out at 12 h of photophase (12 h) and 70 + 10% relative humidity. Twenty nymphs (replications) were tested for each treatment (temperature x host plant) to estimated biological variables of nymph and adult stages and life span. The study of the populational fluctuation, the spatial characterization (50 trees sampled per sampling date) and the age structure (5 aphid colonies per sampling date) of C. atlantica was carried out on P. taeda and P. caribaea var. caribaea plantations in 1 ha area in Buri and Nova Campina municipalities (SP, Brazil), between July 2001 and August 2002 (21 sampling dates). This research indicated that nymph and adult development and reproductive capacity of C. atlantica were not affected by host plants. However, temperatures of 18o C and 22o C provided better conditions for aphid development than 30o C when reared on P. taeda and P. caribaea var. hondurensis. In the field, C. atlantica had highest peaks of abundance in the winter and spring and lowest during the summer. The age structure study can give support to predict population peaks and the occurrence of stable populations indicates a low... (Complete abstract, click electronic address below).
132

Biomassa e produtividade subterrânea no cerrado: relações com solo, topografia e fogo

Loiola, Priscilla de Paula 11 July 2014 (has links)
Made available in DSpace on 2016-06-02T19:30:04Z (GMT). No. of bitstreams: 1 6174.pdf: 1522034 bytes, checksum: 23f91c32606478def4ff95b2a113c91d (MD5) Previous issue date: 2014-07-11 / Universidade Federal de Minas Gerais / Plant biomass and productivity are ecological properties that affect community functioning. The belowground biomass of cerrado is underestimated and, therefore, it is important that we know how it is related to biotic and abiotic variables. In the first chapter, we tested for the relationship between different diversity indices and aboveB and belowground biomass. Species diversity and functional divergence positively affected the aboveground biomass, but not the belowground biomass, both in the cerrado and in the seasonal forest. Resource use complementarity led to a better community functioning, but did not predict all the community biomass production, as it disregarded the belowground component. Inclusion of environmental variables and functional traits, in the second chapter, was important to generate models that predicted the belowground biomass. The models were significant, even tough they showed low explanatory power for the cerrado. Foraging for limiting nutrients, altitude, and functional traits related to disturbance were selected in the models predicting the belowground biomass. In the third chapter, we separated fine and coarse roots in two depths. We used structural equation modeling to test for the effects of environmental variables on the belowground biomass in each root category and each depth. We identified soil fertility causing less fine root biomass and recent fire causing less coarse root in the deep soil layer. Shallow root biomass was not caused by any of the ecological processes we studied. Also, aluminum content led to low soil fertility and recent fire caused higher soil fertility, as we expected. The carbon stock of the cerrado and the seasonal forest is large and should not be neglected when estimating the impacts caused by climate and landBuse changes. / A biomassa e a produtividade das plantas são propriedades ecológicas importantes para o funcionamento das comunidades. A biomassa hipógea do cerrado é subestimada, por isso, é importante sabermos sua dimensão e como ela se relaciona com fatores bióticos e abióticos. No primeiro capítulo, testamos a relação entre índices de diversidade e as biomassas epígea e hipógea. A diversidade de espécies e a divergência funcional estiveram relacionadas com a biomassa epígea, mas não com a biomassa hipógea, tanto no cerrado quanto na floresta estacional. A complementaridade no uso dos recursos levou a um melhor funcionamento das comunidades, mas não explicou toda a produção de biomassa vegetal. A inclusão de variáveis ambientais e traços funcionais, no segundo capítulo, gerou modelos que explicaram a alocação da biomassa e produtividade hipógeas. Os modelos foram significativos, apesar de terem baixo poder preditivo no cerrado. O forrageamento por nutrientes, a altitude e os traços funcionais relacionados aos distúrbios foram selecionados nos modelos prevendo a biomassa hipógea. No terceiro capítulo, separamos as raízes em finas e grossas e em dois estratos de profundidade. Usamos modelos de equações estruturais para testar os efeitos das variáveis ambientais na biomassa das raízes de cada estrato. Identificamos a fertilidade do solo causando menor biomassa de raízes finas e fogos recentes levando a menor biomassa de raízes grossas profundas. A biomassa das raízes superficiais não foi causada por nenhum dos processos ecológicos estudados e deve estar relacionada a interações bióticas. Há também relação entre a quantidade de alumínio e menor fertilidade do solo, e fogos recentes causaram maior fertilidade do solo. O estoque de carbono no cerrado e na floresta estacional semidecidual são grandes e não devem ser ignorados quando estimamos o impacto causado por mudanças climáticas e no uso da terra.
133

Modelação e análise da vida útil (metrológica) de medidores tipo indução de energia elétrica ativa /

Silva, Marcelo Rubia da. January 2010 (has links)
Orientador: Carlos Alberto Canesin / Banca: Júlio Borges de Souza / Banca: Denizar Cruz Martins / Resumo: O estudo da confiabilidade operacional de equipamentos se tornou fundamental para as empresas possuírem o devido controle dos seus ativos, tanto pelo lado financeiro quanto em questões de segurança. O estudo da taxa de falha de equipamentos prevê quando as falhas irão ocorrer possibilitando estabelecer atitudes preventivas, porém, seu estudo deve ser realizado em condições de operação estabelecidas e fixas. Os medidores de energia elétrica, parte do ativo financeiro das concessionárias de energia, são equipamentos utilizados em diversas condições de operação, tanto nas condições do fluxo de energia, tais como presenças de harmônicos, subtensões, sobre-tensões e padrões de consumo distintos, quanto pelo local físico de instalação, tais como maresia, temperatura, umidade, etc. As falhas nos medidores eletromecânicos de energia elétrica são de difícil constatação uma vez que a maioria dos erros de medição, ocasionados principalmente por envelhecimento de componentes, não alteram a qualidade da energia fornecida e nem interrompem o seu fornecimento. Neste sentido, este trabalho propõe uma nova metodologia de determinação de falhas em medidores eletromecânicos de energia elétrica ativa. Faz-se uso de banco de dados de uma concessionária de energia elétrica e do processo de descoberta de conhecimento em bases de dados para selecionar as variáveis mais significativas na determinação de falhas em medidores eletromecânicos de energia elétrica ativa, incluindo no conjunto de falhas a operação com erros de medição acima do permitido pela legislação nacional (2010). Duas técnicas de mineração de dados foram utilizadas: regressão stepwise e árvores de decisão. As variáveis obtidas foram utilizadas na construção de um modelo de agrupamento de equipamentos associando a cada grupo uma probabilidade... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The operational reliability study of equipments has become primal in order to enterprises have the righteous control over their assets, both by financial side as by security reasons. The study for the hazard rate of equipments allows to foresee the failures for the equipments and to act preventively, but this study must be accomplished under established and fixed operation conditions. The energy meters, for their part, are equipments utilized in several operating conditions so on the utilization manner, like presence of harmonics, undervoltages and over-voltages and distinct consumption patterns, as on the installation location, like swel, temperature, humidity, etc. Failures in electromechanical Wh-meters are difficult to detect once that the majority of metering errors occurred mainly by aging of components do not change the quality of offered energy neither disrupt its supply. In this context, this work proposes a novel methodology to obtain failure determination for electromechanical Whmeters. It utilizes Wh-databases from an electrical company and of the process of knowledge discovery in databases to specify the most significant variables in determining failures in electromechanical Wh-meters, including in the failure set the operation with metering errors above those permitted by national regulations (2010). Two techniques of data mining were used in this work: stepwise regression and decision trees. The obtained variables were utilized on the construction of a model of clustering similar equipments and the probability of failure of those clusters were determined. As final results, an application in a friendly platform were developed in order to apply the methodology, and a case study was accomplished in order to demonstrate its feasibility. / Mestre
134

Efficient modularity density heuristics in graph clustering and their applications

Santiago, Rafael de January 2017 (has links)
Modularity Density Maximization is a graph clustering problem which avoids the resolution limit degeneracy of the Modularity Maximization problem. This thesis aims at solving larger instances than current Modularity Density heuristics do, and show how close the obtained solutions are to the expected clustering. Three main contributions arise from this objective. The first one is about the theoretical contributions about properties of Modularity Density based prioritizers. The second one is the development of eight Modularity Density Maximization heuristics. Our heuristics are compared with optimal results from the literature, and with GAOD, iMeme-Net, HAIN, BMD- heuristics. Our results are also compared with CNM and Louvain which are heuristics for Modularity Maximization that solve instances with thousands of nodes. The tests were carried out by using graphs from the “Stanford Large Network Dataset Collection”. The experiments have shown that our eight heuristics found solutions for graphs with hundreds of thousands of nodes. Our results have also shown that five of our heuristics surpassed the current state-of-the-art Modularity Density Maximization heuristic solvers for large graphs. A third contribution is the proposal of six column generation methods. These methods use exact and heuristic auxiliary solvers and an initial variable generator. Comparisons among our proposed column generations and state-of-the-art algorithms were also carried out. The results showed that: (i) two of our methods surpassed the state-of-the-art algorithms in terms of time, and (ii) our methods proved the optimal value for larger instances than current approaches can tackle. Our results suggest clear improvements to the state-of-the-art results for the Modularity Density Maximization problem.
135

Aneis de crescimento como indicadores de contaminação ambiental : o uso da tecnica de fluorescencia de raios X por reflexão total com radiação sincrotron (SR-TXRF) / Tree-rings as indicator of contamination for metals : the use of technique X-ray total reflection fluorescence with synchroton radiation (SR-TXRF)

Faria, Bruna Fernanda de 05 April 2007 (has links)
Orientadores: Silvana Moreira, Ana Elisa Sirito de Vives / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Civil, Arquitetura e Urbanismo / Made available in DSpace on 2018-08-11T19:56:25Z (GMT). No. of bitstreams: 1 Faria_BrunaFernandade_M.pdf: 1377597 bytes, checksum: deab1af287e4ac2f8ed56f29f61ab45d (MD5) Previous issue date: 2007 / Resumo: O crescimento populacional acompanhado de um aumento dos parques industriais trouxe alguns problemas a serem enfrentados por toda a sociedade, como a emissão de poluentes. As árvores registram em seu lenho reações às variáveis ambientais podendo assimilar e armazenar contaminantes de ação antropogênica. Para identificar e quantificar tais elementos pode-se realizar um estudo dos anéis de crescimento anuais. O presente trabalho teve como objetivo principal a determinação de contaminantes em uma seqüência de anéis de crescimento, previamente datados de árvores da espécie Copaífera langsdorfii (Copaíba), utilizando a Fluorescência de Raios X por Reflexão Total com Radiação Síncrotron (SR-TXRF) para a quantificação dos elementos presentes. O estudo foi realizado em uma área pertencente ao Jardim Botânico Municipal de Bauru, SP, local de provável contaminação por metais pesados devido à presença de indústrias de acumuladores de energia que utilizam chumbo em seu processo. A amostragem foi realizada em diferentes pontos (quatro sítios) ao redor da indústria com a finalidade de se verificar a dispersão dos poluentes. As concentrações de alguns elementos foram comparadas com os valores de referência e de alerta para solos estabelecidos pela CETESB, visto não haver legislação para amostras de madeira. Desta forma, foi verificado que para o chumbo, o valor de referência (17 µg.g-1) chegou a ser ultrapassado nos 3 sítios mais próximos da fábrica de baterias Ájax. No caso do Cr, o sítio mais próximo da indústria (220 m) a concentração média deste elemento ficou acima do valor de alerta (75 µg.g-1) em praticamente todos as amostras e o mesmo ocorreu para o segundo sítio localizado a 500 m da indústria. Para o outro local de amostragem, localizado a 1400 m da indústria, a concentração média do Cr ultrapassou até mesmo o valor de intervenção residencial (300 µg.g-1). Para o Ni o valor de alerta também foi atingido para alguns períodos para o local mais próximo da indústria, mas a tendência foi de uma diminuição da concentração média com o aumento da distância em relação à indústria. O Cu apresentou comportamento similar ao Ni. A concentração média de Cu foi superior ao valor de alerta (60 µg.g-1) para os locais mais próximos da fábrica de baterias, chegando até a atingir o valor de intervenção agrícola (200 µg.g-1). Pelos resultados obtidos, foi possível demonstrar que a Copaífera Langsdorff L pode ser usada como bioindicadora da contaminação ambiental e ainda que a indústria de baterias foi responsável pela contaminação ambiental local. A técnica de SR-TXRF apresentou limites de detecção na faixa de 90 ng.g-1 para Cu e 270 ng.g-1 para Pb, demonstrando sua potencialidade principalmente na análise de amostras de massa reduzida. / Abstract: The continuous population growth associated to an increase of the industrial parks brought some problems for the society, as the emission of pollutants. The tree rings register in its log the reactions to the environmental changes being able to assimilate and to store pollutants of anthropogenic origin. To identify and to quantify such elements an analysis of its annual rings were performed. The present work had as main objective the determination of the contamination in tree rings previously dated of Copaifera langsdorfii species using Synchrotron Radiation Total Reflection X-ray Fluorescence technique (SR-TXRF). This study was carried out in an area near to botanical garden of Bauru city (SP) site where occurred a probable contamination by heavy metals due to an energy accumulator plants that use lead in its process. The sampling was accomplished in different locations (four sites) around the industry in order to verify the dispersion of the pollutants. The concentrations of some elements were compared with reference and alert values for soils established by Brazilian legislation CETESB, since there isn't legislation for wood samples. For Pb the reference value (17 µg.g-1) was exceeded for the three sites closed to the industry. For the site nearest for the industry (220 m) the average concentration for Cr surpassed the alert value (75 µg.g-1) in the majority of the samples and the same fact was observed for the second site located to 500 m from the industry. And even for the site located to 1400 m faraway of the industry the average concentration exceed the residential intervention value (300 µg.g-1). For Ni the alert value was reached for some periods for the site nearest the industry, but was observed a tendency to decrease of the average concentration with the increase of the distance. For Cu the behavior was similar to Ni that is to say the average concentration reached the alert value (60 µg.g-1) for locations near to the industry. By the results was possible show that Copaífera Langsdorff L can be used as bioindicator of the environmental contamination and although the accumulator industry was responsible by local contamination. SR-TXRF technique presented detection limits in the range of 90 ng.g-1 for copper and 270 ng.g-1 for lead, demonstrating its potentiality mainly for samples with restrictive masses. / Mestrado / Saneamento e Ambiente / Mestre em Engenharia Civil
136

Estudo comparativo avaliando três modalidades de diagnóstico médico parecer médico, buscas no Google e sistema especialista de apoio à decisão médica /

Souza, Ademar Rosa de January 2020 (has links)
Orientador: Luís Cuadrado Martin / Resumo: O conhecimento sobre qualquer patologia pode ser facilmente encontrado na internet, mas dificilmente encontra-se alguma ferramenta que faça a análise e o raciocínio entre os dados de um paciente e se obtenha o diagnóstico mais provável. Em nosso cotidiano, em virtude de uma maior demanda na área da saúde, existe uma necessidade crescente de diagnósticos médicos rápidos e precisos. Em virtude disso, foi elaborado um Sistema de Apoio à Decisão Médica com o intuito de otimizar e agilizar de forma confiável os diagnósticos médicos. A ideia é dar qualidade e agilidade à prática médica, adotando a tecnologia como ferramenta básica: “Quem tem mais informação, tem melhores condições para escolher e tomar decisões”. Na construção deste sistema, foram utilizados um banco de dados relacional (MySQL) e aplicadas técnicas de inteligência artificial, tais como: a construção de Árvores de Decisão, Aprendizado não supervisionado e a utilização das Redes de Bayes (onde estão envolvidos domínios de conhecimento com significativo grau de incerteza, como é o caso da área médica). Através da união destas técnicas, são feitas a seleção e classificação das doenças mais prováveis, onde as mesmas podem ser examinadas com mais detalhes pelo médico, garantindo assim uma maior segurança na escolha dos possíveis diagnósticos. Visando uma maior abrangência e rapidez na disseminação do conhecimento humano, o sistema foi disponibilizado via internet (www.danton.med.br). Para a concepção do projeto foi reali... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The knowledge about any pathology can be easily found on the internet, but it is difficult to find any tool that makes the analysis and reasoning between the data of a patient and obtain the most probable diagnosis. In our daily lives, due to a greater demand in the health area, there is a growing need for fast and accurate medical diagnoses. As a result, a Medical Decision Support System was developed in order to reliably optimize and streamline medical diagnostics. The idea is to give quality and agility to medical practice, adopting technology as a basic tool: “Who has more information, has better conditions to choose and make decisions”. In the construction of this system, a relational database (MySQL) was used and artificial intelligence techniques were applied, such as: the construction of Decision Trees, Unsupervised Learning and the use of Bayes Networks (where knowledge domains are involved with significant degree of uncertainty, as is the case in the medical field). Through the union of these techniques, the selection and classification of the most probable diseases are made, where they can be examined in more detail by the doctor, thus ensuring greater security in the choice of possible diagnoses. Aiming at a greater scope and speed in the dissemination of human knowledge, the system was made available via internet (www.danton.med.br). To design the project, a prospective, randomized, crossover and open study was carried out; in which 3 groups of doctors (called gr... (Complete abstract click electronic access below) / Doutor
137

[en] A KEYWORD-BASED QUERY PROCESSING METHOD FOR DATASETS WITH SCHEMAS / [pt] MÉTODO PARA O PROCESSAMENTO DE CONSULTAS POR PALAVRAS-CHAVES PARA BASES DE DADOS COM ESQUEMAS

GRETTEL MONTEAGUDO GARCÍA 23 June 2020 (has links)
[pt] Usuários atualmente esperam consultar dados de maneira semelhante ao Google, digitando alguns termos, chamados palavras-chave, e deixando para o sistema recuperar os dados que melhor correspondem ao conjunto de palavras-chave. O cenário é bem diferente em sistemas de gerenciamento de banco de dados em que os usuários precisam conhecer linguagens de consulta sofisticadas para recuperar dados, ou em aplicações de banco de dados em que as interfaces de usuário são projetadas como inúmeras caixas que o usuário deve preencher com seus parâmetros de pesquisa. Esta tese descreve um algoritmo e um framework projetados para processar consultas baseadas em palavras-chave para bases de dados com esquema, especificamente bancos relacionais e bases de dados em RDF. O algoritmo primeiro converte uma consulta baseada em palavras-chave em uma consulta abstrata e, em seguida, compila a consulta abstrata em uma consulta SPARQL ou SQL, de modo que cada resultado da consulta SPARQL (resp. SQL) seja uma resposta para a consulta baseada em palavras-chave. O algoritmo explora o esquema para evitar a intervenção do usuário durante o processo de busca e oferece um mecanismo de feedback para gerar novas respostas. A tese termina com experimentos nas bases de dados Mondial, IMDb e Musicbrainz. O algoritmo proposto obtém resultados satisfatórios para os benchmarks. Como parte dos experimentos, a tese também compara os resultados e o desempenho obtidos com bases de dados em RDF e bancos de dados relacionais. / [en] Users currently expect to query data in a Google-like style, by simply typing some terms, called keywords, and leaving it to the system to retrieve the data that best match the set of keywords. The scenario is quite different in database management systems, where users need to know sophisticated query languages to retrieve data, and in database applications, where the user interfaces are designed as a stack of pages with numerous boxes that the user must fill with his search parameters. This thesis describes an algorithm and a framework designed to support keywordbased queries for datasets with schema, specifically RDF datasets and relational databases. The algorithm first translates a keyword-based query into an abstract query, and then compiles the abstract query into a SPARQL or a SQL query such that each result of the SPARQL (resp. SQL) query is an answer for the keywordbased query. It explores the schema to avoid user intervention during the translation process and offers a feedback mechanism to generate new answers. The thesis concludes with experiments over the Mondial, IMDb, and Musicbrainz databases. The proposed translation algorithm achieves satisfactory results and good performance for the benchmarks. The experiments also compare the RDF and the relational alternatives.
138

[en] COREFERENCE RESOLUTION USING LATENT TREES WITH CONTEXTUAL EMBEDDING / [pt] RESOLUÇÃO DE CORREFERÊNCIA UTILIZANDO ÁRVORES LATENTES COM REPRESENTAÇÃO CONTEXTUAL

LEONARDO BARBOSA DE OLIVEIRA 19 January 2021 (has links)
[pt] A tarefa de resolução de correferência consiste em identificar e agrupar trechos de um texto de acordo com as entidades do mundo real a que se referem. Apesar de já ter sido abordada em outras conferências, a CoNLL de 2012 é um marco pela qualidade das bases de dados, das métricas e das soluções apresentadas. Naquela edição, o modelo vencedor utilizou um perceptron estruturado para otimizar uma árvore latente de antecedentes, atingindo a pontuação de 63.4 na métrica oficial para o dataset de teste em inglês. Nos anos seguintes, as bases e métricas apresentadas na conferência se tornaram o benchmark para a tarefa de correferência. Com novas técnicas de aprendizado de máquina desenvolvidas, soluções mais elaboradas foram apresentadas. A utilização de redes neurais rasas atingiu a pontuação de 68.8; a adição de representação contextual elevou o estado da arte para 73.0; redes neurais profundas melhoraram o baseline para 76.9 e o estado da arte atual, que é uma combinação de várias dessas técnicas, está em 79.6. Neste trabalho é apresentado uma análise de como as técnicas de representação de palavras Bag of Words, GloVe, BERT e SpanBERT utilizadas com árvores latentes de antecedentes se comparam com o modelo original de 2012. O melhor modelo encontrado foi o que utiliza SpanBERT com uma margem muito larga, o qual atingiu pontuação de 61.3 na métrica da CoNLL 2012, utilizando o dataset de teste. Com estes resultados, mostramos que é possível utilizar técnicas avançadas em estruturas mais simples e ainda obter resultados competitivos na tarefa de correferência. Além disso, melhoramos a performance de um framework de código aberto para correferência, a fim de contemplar soluções com maior demanda de memória e processamento. / [en] The coreference resolution task consists of to identify and group spans of text related to the same real-world entity. Although it has been approached in other conferences, the 2012 CoNLL is a milestone due to the improvement in the quality of its dataset, metrics, and the presented solutions. In that edition, the winning model used a structured perceptron to optimize an antecedent latent tree, achieving 63.4 on the official metric for the English test dataset. During the following years, the metrics and dataset presented in that conference became the benchmark for the coreference task. With new machine learning techniques, more elaborated solutions were presented. The use of shallow neural networks achieved 68.8; adding contextual representation raised the state-of-the-art to 73.0; deep neural networks improved the baseline to 76.9 and the current state-of-the-art, which is a combination of many of these techniques, is at 79.6. This work presents an analysis of how the word embedding mechanisms Bag of Words, GloVe, BERT and SpanBERT, used with antecedent latent trees, are compared to the original model of 2012. The best model found used SpanBERT with a very large margin, achieving 61.3 in the CoNLL 2012 metric using the test dataset. With these results, we show that it is possible to use advanced techniques in simpler structures and still achieve competitive results in the coreference task. Besides that, we improved the performance of an open source framework for coreference, so it can manage solution that demand more memory and processing.
139

[en] APPROXIMATE BORN AGAIN TREE ENSEMBLES / [pt] ÁRVORES BA APROXIMADAS

MATHEUS DE SOUSA SUKNAIC 28 October 2021 (has links)
[pt] Métodos ensemble como random forest, boosting e bagging foram extensivamente estudados e provaram ter uma acurácia melhor do que usar apenas um preditor. Entretanto, a desvantagem é que os modelos obtidos utilizando esses métodos podem ser muito mais difíceis de serem interpretados do que por exemplo, uma árvore de decisão. Neste trabalho, nós abordamos o problema de construir uma árvore de decisão que aproximadamente reproduza um conjunto de árvores, explorando o tradeoff entre acurácia e interpretabilidade, que pode ser alcançado quando a reprodução exata do conjunto de árvores é relaxada. Primeiramente, nós formalizamos o problem de obter uma árvore de decisão de uma determinada profundidade que seja a mais aderente ao conjunto de árvores e propomos um algoritmo de programação dinâmica para resolver esse problema. Nós também provamos que a árvore de decisão obtida por esse procedimento satisfaz garantias de generalização relacionadas a generalização do modelo original de conjuntos de árvores, um elemento crucial para a efetividade dessa árvore de decisão em prática. Visto que a complexidade computacional do algoritmo de programação dinâmica é exponencial no número de features, nós propomos duas heurísticas para gerar árvores de uma determinada profundidade com boa aderência em relação ao conjunto de árvores. Por fim, nós conduzimos experimentos computacionais para avaliar os algoritmos propostos. Quando utilizados classificadores mais interpretáveis, os resultados indicam que em diversas situações a perda em acurácia é pequena ou inexistente: restrigindo a árvores de decisão de profundidade 6, nossos algoritmos produzem árvores que em média possuem acurácias que estão a 1 por cento (considerando o algoritmo de programção dinâmica) ou 2 por cento (considerando os algoritmos heurísticos) do conjunto original de árvores. / [en] Ensemble methods in machine learning such as random forest, boosting, and bagging have been thoroughly studied and proven to have better accuracy than using a single predictor. However, their drawback is that they give models that can be much harder to interpret than those given by, for example, decision trees. In this work, we approach in a principled way the problem of constructing a decision tree that approximately reproduces a tree ensemble, exploring the tradeoff between accuracy and interpretability that can be obtained once exact reproduction is relaxed. First, we formally define the problem of obtaining the decision tree of a given depth that is most adherent to a tree ensemble and give a Dynamic Programming algorithm for solving this problem. We also prove that the decision trees obtained by this procedure satisfy generalization guarantees related to the generalization of the original tree ensembles, a crucial element for their effectiveness in practice. Since the computational complexity of the Dynamic Programming algorithm is exponential in the number of features, we also design heuristics to compute trees of a given depth with good adherence to a tree ensemble. Finally, we conduct a comprehensive computational evaluation of the algorithms proposed. The results indicate that in many situations, there is little or no loss in accuracy in working more interpretable classifiers: even restricting to only depth-6 decision trees, our algorithms produce trees with average accuracies that are within 1 percent (for the Dynamic Programming algorithm) or 2 percent (heuristics) of the original random forest.
140

[pt] DESENVOLVIMENTO DE MODELOS PARA PREVISÃO DE QUALIDADE DE SISTEMAS DE RECONHECIMENTO DE VOZ / [en] DEVELOPMENT OF PREDICTION MODELS FOR THE QUALITY OF SPOKEN DIALOGUE SYSTEMS

BERNARDO LINS DE ALBUQUERQUE COMPAGNONI 12 November 2021 (has links)
[pt] Spoken Dialogue Systems (SDS s) são sistemas baseados em computadores desenvolvidos para fornecerem informações e realizar tarefas utilizando o diálogo como forma de interação. Eles são capazes de reconhecimento de voz, interpretação, gerenciamento de diálogo e são capazes de ter uma voz como saída de dados, tentando reproduzir uma interação natural falada entre um usuário humano e um sistema. SDS s provém diferentes serviços, todos através de linguagem falada com um sistema. Mesmo com todo o desenvolvimento nesta área, há escassez de informações sobre como avaliar a qualidade de tais sistemas com o propósito de otimização do mesmo. Com dois destes sistemas, BoRIS e INSPIRE, usados para reservas de restaurantes e gerenciamento de casas inteligentes, diversos experimentos foram conduzidos no passado, onde tais sistemas foram utilizados para resolver tarefas específicas. Os participantes avaliaram a qualidade do sistema em uma série de questões. Além disso, todas as interações foram gravadas e anotadas por um especialista.O desenvolvimento de métodos para avaliação de performance é um tópico aberto de pesquisa na área de SDS s. Seguindo a idéia do modelo PARADISE (PARAdigm for DIalogue System Evaluation – desenvolvido pro Walker e colaboradores na AT&T em 1998), diversos experimentos foram conduzidos para desenvolver modelos de previsão de performance de sistemas de reconhecimento de voz e linguagem falada. O objetivo desta dissertação de mestrado é desenvolver modelos que permitam a previsão de dimensões de qualidade percebidas por um usuário humano, baseado em parâmetros instrumentalmente mensuráveis utilizando dados coletados nos experimentos realizados com os sistemas BoRIS e INSPIRE , dois sistemas de reconhecimento de voz (o primeiro para busca de restaurantes e o segundo para Smart Homes). Diferentes algoritmos serão utilizados para análise (Regressão linear, Árvores de Regressão, Árvores de Classificação e Redes Neurais) e para cada um dos algoritmos, uma ferramenta diferente será programada em MATLAB, para poder servir de base para análise de experimentos futuros, sendo facilmente modificado para sistemas e parâmetros novos em estudos subsequentes.A idéia principal é desenvolver ferramentas que possam ajudar na otimização de um SDS sem o envolvimento direto de um usuário humano ou servir de ferramenta para estudos futuros na área. / [en] Spoken Dialogue Systems (SDS s) are computer-based systems developed to provide information and carry out tasks using speech as the interaction mode. They are capable of speech recognition, interpretation, management of dialogue and have speech output capabilities, trying to reproduce a more or less natural spoken interaction between a human user and the system. SDS s provide several different services, all through spoken language. Even with all this development, there is scarcity of information on ways to assess and evaluate the quality of such systems with the purpose of optimization. With two of these SDS s ,BoRIS and INSPIRE, (used for Restaurant Booking Services and Smart Home Systems), extensive experiments were conducted in the past, where the systems were used to resolve specific tasks. The evaluators rated the quality of the system on a multitude of scales. In addition to that, the interactions were recorded and annotated by an expert. The development of methods for performance evaluation is an open research issue in this area of SDS s. Following the idea of the PARADISE model (PARAdigm for DIalogue System Evaluation model, the most well-known model for this purpose (developed by Walker and co-workers at AT&T in 1998), several experiments were conducted to develop predictive models of spoken dialogue performance. The objective of this dissertation is to develop and assess models which allow the prediction of quality dimensions as perceived by the human user, based on instrumentally measurable variables using all the collected data from the BoRIS and INSPIRE systems. Different types of algorithms will be compared to their prediction performance and to how generic they are. Four different approaches will be used for these analyses: Linear regression, Regression Trees, Classification Trees and Neural Networks. For each of these methods, a different tool will be programmed using MATLAB, that can carry out all experiments from this work and be easily modified for new experiments with data from new systems or new variables on future studies. All the used MATLAB programs will be made available on the attached CD with an operation manual for future users as well as a guide to modify the existing programs to work on new data. The main idea is to develop tools that would help on the optimization of a spoken dialogue system without a direct involvement of the human user or serve as tools for future studies in this area.

Page generated in 0.0522 seconds