• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 74
  • 21
  • Tagged with
  • 95
  • 68
  • 63
  • 10
  • 9
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • 7
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
61

[pt] AVALIAÇÃO DA RESPOSTA DE CONGELAMENTO E ESTRUTURA FATORIAL DO PROTOCOLO EMPREGADO PARA A CRIAÇÃO SELETIVA DAS LINHAGENS DE RATOS CARIOCAS ALTO E BAIXO CONGELAMENTO CONDICIONADO / [en] EVALUATION OF THE FREEZING RESPONSE AND FACTOR STRUCTURE OF THE SELECTIVE BREEDING PROTOCOL USED FOR THE SELECTIVE BREEDING OF CARIOCAS HIGH AND LOW CONDITIONED FREEZING RATS

18 February 2022 (has links)
[pt] No presente estudo, foi investigada a ocorrência da resposta de congelamento de defesa durante o período pré- e pós-choque empregado no protocolo para a criação seletiva das linhagens de ratos Cariocas alto- e baixo-congelamento condicionado na PUC-Rio. Além disso, para obter uma maior clareza da estrutura deste comportamento defensivo e sua relação com as duas linhagens, foi realizada uma extração de componentes. Foram detectadas diferenças significativas entre as linhagens nos períodos pré- e pós-choque, com a diferença no período pré-choque sendo proporcional à encontrada no fenótipo. A análise fatorial revelou 4 componentes, o primeiro relacionado ao fenótipo, o segundo à parcela final do período pré-choque, o terceiro ao período pós-choque e o quarto à parcela inicial do período pré-choque. Estes resultados demonstram que o protocolo empregado foi capaz de produzir diferenças significativas nas linhagens selecionadas para alto e baixo congelamento condicionado em paradigmas de ansiedade incondicionada, indicando um mutualismo genético por trás destes mecanismos, observado pela primeira vez com ratos selecionados apenas pelo medo contextual condicionado. O componente que carregou a parcela final do período de habituação (pré-choque) mostrou-se mais responsável por explicar a variação individual do que a parcela inicial ou o pós-choque, indicando que este período dos minutos 5 a 8 é um intervalo ideal para obter de forma mais eficaz o traço comportamental do animal. / [en] The present study investigated freezing behavior patterns during the selective breeding protocol employed in the creation of the Cariocas High- and Low- Conditioned Freezing in PUC-Rio s Neuroscience Laboratory. There were significant differences found in the baseline, post-shock and retrieval (phenotype) freezing means of the High-, Low- and Control lines over the generations of selective breeding. A Principal Component Analysis of the freezing means in each minute of the contextual fear conditioning protocol revealed four components, the First loading the freezing in the retrieval period, the Second the final half of the baseline period, the Third loads the 3 minutes of freezing measured after foot shocks are received and the Fourth loads the first half of the baseline period. The analysis of the means shows that the selective breeding protocol employed successfully produced differences in anxiety in the selected lines. It s the first time this baseline difference in freezing is observed in Rats. Indicates that there s a genetic pleiotropy behind the underlying mechanisms that allow for a stronger or smaller fear response in response to contextual cues, conditioned or unconditioned. We hypothesize that this might be related to genetic differences in fear related spatial learning modulated by the selection process. Finally, the Second component loading the final half of the baseline period shows that this period (between 5 and 8 minutes) is better at producing a stable behavior pattern which more aptly reproduces the rat s individual identity.
62

[en] MAX-LINK RELAY SELECTION TECHNIQUES FOR MULTI-WAY COOPERATIVE MULTI-ANTENNA SYSTEMS / [pt] TÉCNICAS MAX- LINK DE SELEÇÃO DE REPETIDORES PARA SISTEMAS COOPERATIVOS MULTI-WAY COM MÚLTIPLAS ANTENAS

FLAVIO LUIZ DUARTE 24 June 2020 (has links)
[pt] Em redes sem fio, o desvanecimento do sinal causado pela propagação por caminhos múltiplos pode ser mitigado através do uso de diversidade cooperativa [1–3]. Neste contexto, esquemas de seleção de repetidores são essenciais por causa de seu alto desempenho [4–6]. Esta tese é focada no desenvolvimento de técnicas de seleção de repetidores, que utilizam buffers. Como primeira contribuição, apresentamos uma estrutura de chaveamento para sistemas de repetidores MIMO em que um nó de origem pode transmitir diretamente para um nó de destino ou auxiliado por repetidores. Em particular, apresentamos uma nova técnica de seleção de repetidores baseada no chaveamento e seleção do melhor canal, denominada Switched Max-Link, que faz uso do critério de seleção Maximum Minimum Distance (MMD). Como segunda contribuição, apresentamos uma estratégia de seleção de repetidores para sistemas cooperativos de múltiplas antenas que são auxiliados por um nó processador central, em que um cluster formado por dois usuários é selecionado para transmitir simultaneamente um ao outro com a ajuda de repetidores. Em particular, apresentamos uma nova estratégia de seleção de repetidores Multi-Way com base na seleção do melhor link, explorando o uso de buffers e codificação de rede em camada física (PLNC), denominada Multi-Way Buffer-Aided Max-Link (MW-Max-Link). Como terceira contribuição, apresentamos uma estrutura de uplink dirigida por nuvem para sistemas de repetidores Multi-Way de múltiplas antenas, que ajuda na detecção conjunta de símbolos na nuvem, onde os usuários são selecionados para transmitir simultaneamente uns aos outros auxiliados por repetidores. Em particular, desenvolvemos um novo protocolo de seleção de repetidores Multi-Way com base na seleção do melhor link, explorando o uso de buffers em nuvem e PLNC, denominado Multi-Way Cloud-Driven Best-User-Link (MWC-Best-User-Link). É realizada uma análise das técnicas propostas e existentes em termos de custo computacional, probabilidade de erro de pareamento, soma das taxas e atraso médio e simulações são empregadas para avaliar o desempenho dessas técnicas. / [en] In wireless networks, signal fading caused by multipath propagation can be mitigated through the use of cooperative diversity [1–3]. In this context, relay selection schemes are key because of their high performance [4–6]. Thus, this thesis is focused on developing relay selection techniques, that uses buffers. In this work, as a first contribution, we present a switched relaying framework for multiple-input multiple-output (MIMO) relay systems where a source node may transmit directly to a destination node or aided by relays equipped with buffers. In particular, we develop a novel relay selection protocol based on switching and the selection of the best link, denoted as Switched Max-Link, that uses the novel Maximum Minimum Distance (MMD) relay selection criterion. After that, as a second contribution, we present a relay-selection strategy for multi-way cooperative multi-antenna systems that are aided by a central processor node, where a cluster formed by two users is selected to simultaneously transmit to each other with the help of relays. In particular, we present a novel multi-way relay selection strategy based on the selection of the best link, exploiting the use of buffers and physical-layer network coding (PLNC), that is called Multi-Way Buffer-Aided Max-Link (MW-Max-Link). Moreover, as a third contribution, we present a cloud-driven uplink framework for multi-way multiple-antenna relay systems which aids joint symbol detection in the cloud and where users are selected to simultaneously transmit to each other aided by relays. In particular, we develop a novel multi-way relay selection protocol based on the selection of the best link, exploiting the use of cloud buffers and PLNC, denoted as Multi-Way Cloud- Driven Best-User-Link (MWC-Best-User-Link). An analysis of the proposed and existing techniques in terms of computational cost, pairwise error probability, sum-rate and average delay is carried out. Simulations are then employed to evaluate the performance of these techniques.
63

[pt] OTIMIZAÇÃO DE ESTRATÉGIAS DINÂMICAS DE COMERCIALIZAÇÃO DE ENERGIA COM RESTRIÇÕES DE RISCO SOB INCERTEZAS DE CURTO E LONGO PRAZO / [en] RISK-CONSTRAINED OPTIMAL DYNAMIC TRADING STRATEGIES UNDER SHORT- AND LONG-TERM UNCERTAINTIES

ANA SOFIA VIOTTI DAKER ARANHA 23 November 2021 (has links)
[pt] Mudanças recentes em mercados de energia com alta penetração de fontes renováveis destacaram a necessidade de estratégias complexas que, além de maximizar o lucro, proporcionam proteção contra a volatilidade de preços e incerteza na geração. Neste contexto, este trabalho propõe um modelo dinâmico para representar a tomada de decisão sequencial no cenário atual. Ao contrário de trabalhos relatados anteriormente, este método fornece uma estrutura para considerar as incertezas nos níveis estratégico (longo prazo) e operacional (curto prazo) simultaneamente. É utilizado um modelo de programação estocástica multiestágio em que as correlações entre previsões de vazão, geração renovável, preços spot e preços contratuais são consideradas por meio de uma árvore de decisão multi-escala. Além disso, a aversão ao risco do agente comercializador é considerada por meio de restrições intuitivas e consistentes no tempo. É apresentado um estudo de caso do setor elétrico brasileiro, no qual dados reais foram utilizados para definir a estratégia ótima de comercialização de um gerador de energia eólica, condicionada à evolução futura dos preços de mercado. O modelo fornece ao comercializador informações úteis, como o montante contratado ideal, além do momento ótimo de negociação e duração dos contratos. Além disso, o valor desta solução é demonstrado quando comparado a abordagens estáticas, através de uma medida de desempenho baseada no equivalente de certo do problema multiestágio. / [en] Recent market changes in power systems with high renewable energy penetration highlighted the need for complex profit maximization and protection against price volatility and generation uncertainty. This work proposes a dynamic model to represent sequential decision making in this current scenario. Unlike previously reported works, we contemplate uncertainties in both strategic (long-term) and operational (short-term) levels, all considered as pathdependent stochastic processes. The problem is represented as a multistage stochastic programming model in which the correlations between inflow forecasts, renewable generation, spot and contract prices are accounted for by means of interconnected long- and short-term decision trees. Additionally, risk aversion is considered through intuitive time-consistent constraints. A case study of the Brazilian power sector is presented, in which real data was used to define the optimal trading strategy of a wind power generator, conditioned to the future evolution of market prices. The model provides the trader with useful information such as the optimal contractual amount, settlement timing, and term. Furthermore, the value of this solution is demonstrated when compared to state-of-the-art static approaches using a multistage-based certainty equivalent performance measure.
64

[en] FORECASTING INDUSTRIAL PRODUCTION IN BRAZIL USING MANY PREDICTORS / [pt] PREVENDO A PRODUÇÃO INDUSTRIAL BRASILEIRA USANDO MUITOS PREDITORES

LEONARDO DE PAOLI CARDOSO DE CASTRO 23 December 2016 (has links)
[pt] Nesse artigo, utilizamos o índice de produção industrial brasileira para comparar a capacidade preditiva de regressões irrestritas e regressões sujeitas a penalidades usando muitos preditores. Focamos no least absolute shrinkage and selection operator (LASSO) e suas extensões. Propomos também uma combinação entre métodos de encolhimento e um algorítmo de seleção de variáveis (PVSA). A performance desses métodos foi comparada com a de um modelo de fatores. Nosso estudo apresenta três principais resultados. Em primeiro lugar, os modelos baseados no LASSO apresentaram performance superior a do modelo usado como benchmark em projeções de curto prazo. Segundo, o PSVA teve desempenho superior ao benchmark independente do horizonte de projeção. Finalmente, as variáveis com a maior capacidade preditiva foram consistentemente selecionadas pelos métodos considerados. Como esperado, essas variáveis são intimamente relacionadas à atividade industrial brasileira. Exemplos incluem a produção de veículos e a expedição de papelão. / [en] In this article we compared the forecasting accuracy of unrestricted and penalized regressions using many predictors for the Brazilian industrial production index. We focused on the least absolute shrinkage and selection operator (Lasso) and its extensions. We also proposed a combination between penalized regressions and a variable search algorithm (PVSA). Factor-based models were used as our benchmark specification. Our study produced three main findings. First, Lasso-based models over-performed the benchmark in short-term forecasts. Second, the PSVA over-performed the proposed benchmark, regardless of the horizon. Finally, the best predictive variables are consistently chosen by all methods considered. As expected, these variables are closely related to Brazilian industrial activity. Examples include vehicle production and cardboard production.
65

[pt] A SELEÇÃO DOS MINISTROS DO SUPREMO TRIBUNAL FEDERAL: UM ESTUDO DESCRITIVO SOBRE SUAS NORMAS, BASTIDORES, CRÍTICAS E PROPOSIÇÕES / [en] THE SELECTION OF THE MINISTERS OF THE FEDERAL SUPREME COURT: A DESCRIPTIVE STUDY ABOUT IT S NORMS, BACKSTAGE, CRITICISMS AND PROPOSITIONS

VICTOR MAGARIAN CHILELLI 21 September 2023 (has links)
[pt] Esta dissertação de mestrado explora a seleção dos Ministros do Supremo Tribunal Federal do Brasil. Tem por escopo oferecer estudo descritivo e detalhado sobre os dados e discussões sobre o assunto. Para tanto, quatro tópicos foram elaborados e concatenados. Primeiramente, são apresentados os aspectos jurídicos da progressão da forma de ingresso e as normas que são base à relevância atual da Suprema Corte e seus juízes. Em seguida, essa exploração é expandida com a demonstração da aplicação prática da norma por parte dos agentes oficiais competentes. Como isso atrai muitos debates na literatura acadêmica, o terceiro item é responsável por classificar as críticas existentes ao modelo vigente. Por fim, o mesmo é feito quanto às proposições de modificação do sistema, filtrando e organizando as Propostas de Emenda à Constituição atinentes ao tema. / [en] This master s dissertation explores the selection of the Ministers of the Brazil s Federal Supreme Court. It intents to offer a descriptive and detailed study about the data and discussions about the subject. In order to do that, four topics were elaborated and concatenated. Firstly, the legal aspects of the progression of selection and the norms that grounds the current relevancy of the Supreme Court and it s judges are presented. Following, that analysis is expanded with the demonstration of the pratical aplication of the norm by it s official competent agents. As that attracts a lot of debates in the academic literature, the third item is responsible for classifying the existing critics about the current model. Lastly, the same is done with the propositions for reforming the system, by filtering and organizing the Constitucional Amendment Proposals related to the theme.
66

[pt] CODIFICAÇÃO DE ÍNDICE, SELEÇÃO DE ANTENAS E DETECÇÃO DE SINAIS EM SISTEMAS MU-MIMO COM GPSM / [en] INDEX ENCODING, ANTENNA SELECTION AND SIGNAL DETECTION ON GPSM MU-MIMO SYSTEMS

AZUCENA MIREYA DUARTE ZELAYA 05 August 2019 (has links)
[pt] Modulação Espacial com Pré-codificação Generalizada (Generalized Precoding Aided Spatial Modulation, GPSM) é uma estratégia de comunicação em sistemas MIMO em que o transmissor codifica a informação em duas entidades: a transmissão paralela de símbolos pertencentes à constelação de uma modulação digital, e os índices das posições do vetor de informação que transportam estes símbolos, denominada information bearing positions (IBP), enquanto as demais posições transportam zero. Além disto, o transmissor, previamente à transmissão dos dados pré-codifica o vetor de informação, possibilitando a redução da complexidade do nó receptor. Entre as vantagens desta estratégia destaca-se a concentração da energia transmitida apenas nas posições do vetor de informação que efetivamente contém símbolos, favorecendo o desempenho do sistema. Esta tese considera um sistema MIMO multiusuário (MU-MIMO) que emprega GPSM no enlace direto. O modelo de sinais desenvolvido para descrever este sistema evidencia a influência das matrizes que codificam as IBP no desempenho do sistema. Com base neste modelo, o sistema GPSM MU-MIMO é apresentado para três pré-codificadores lineares: Zero-Forcing, Block Diagonalization e Block Diagonalization de Duas Fases. Para cada um destes pré-codificadores são propostas estratégias de seleção das matrizes de codificação IBP, de acordo com a matriz que descreve o canal MU-MIMO corrente, a serem empregadas pelo transmissor visando melhorar o desempenho de detecção do sistema. As curvas de desempenho de detecção são comparadas a limitantes semianalíticos desenvolvidos. Por fim, considera-se o cenário em que existem mais antenas disponíveis na estação rádio-base e/ou nos usuários do que o número de cadeias de radiofrequência que os equipam. Esta tese apresenta estratégias ótimas e de complexidade reduzida de se explorar o uso das antenas mais favoráveis à transmissão e/ou recepção, em adição à escolha das matrizes de codificação IBP, com o objetivo de prover melhorias ao desempenho do sistema. / [en] Generalized Pre-coding Aided Spatial Modulation (GPSM) is a MIMO system communication strategy in which the transmitter encodes the information in two entities: the parallel transmission of symbols belonging to a digital modulation constellation, and the choice of the indices of the information vector elements that carries the informaiton symbols, denoted information bearing positions (IBP), while the remaing positions are set to zero. Besides, the transmitter precodes, prior to transmission, the information vector, which lets the receiver node benefit from complexity reduction. Among the advantages of this strategies, the concentration of the transmitted energy only on the information vector positions that transports modulated symbols, resulting in system performance improvement. This thesis considers a multiuser MIMO (MU-MIMO) that employs GPSM in the donwlink transmission. The presented signal model to describe this system evidences the influence of the IBP coding matrices on the system performance. Based on this model, GPSM MU-MIMO system is presented considering three linear precoders: Zero-Forcing, Block Diagonalization and Double-Stage Block Diagonalization. For each precoder, strategies to select the IBP encoding matrix, acording to the matrix that describes the current MU-MIMO channel, is proposed. These matrices are to be employed by the user, aiming at system detection performance improvement. Detection performance curves are compared to semianalytic lower bounds. Finally, a scenario in which that are a number of available antennas at the BS and/or at the users that exceed the number of radiofrequency chains. this thesis porposes optimal and reduced complexity strategies that exploit the use of the most favorable antennas for transmission and/or reception, in addition to the choice of the IBP enconding matrices, aiming at system performance improvement.
67

[en] GETTING THE MOST OUT OF THE WISDOM OF THE CROWDS: IMPROVING FORECASTING PERFORMANCE THROUGH ENSEMBLE METHODS AND VARIABLE SELECTION TECHNIQUES / [pt] TIRANDO O MÁXIMO PROVEITO DA SABEDORIA DAS MASSAS: APRIMORANDO PREVISÕES POR MEIO DE MÉTODOS DE ENSEMBLE E TÉCNICAS DE SELEÇÃO DE VARIÁVEIS

ERICK MEIRA DE OLIVEIRA 03 June 2020 (has links)
[pt] A presente pesquisa tem como foco o desenvolvimento de abordagens híbridas que combinam algoritmos de aprendizado de máquina baseados em conjuntos (ensembles) e técnicas de modelagem e previsão de séries temporais. A pesquisa também inclui o desenvolvimento de heurísticas inteligentes de seleção, isto é, procedimentos capazes de selecionar, dentre o pool de preditores originados por meio dos métodos de conjunto, aqueles com os maiores potenciais de originar previsões agregadas mais acuradas. A agregação de funcionalidades de diferentes métodos visa à obtenção de previsões mais acuradas sobre o comportamento de uma vasta gama de eventos/séries temporais. A tese está dividida em uma sequência de ensaios. Como primeiro esforço, propôsse um método alternativo de geração de conjunto de previsões, o que resultou em previsões satisfatórias para certos tipos de séries temporais de consumo de energia elétrica. A segunda iniciativa consistiu na proposição de uma nova abordagem de previsão combinando algoritmos de Bootstrap Aggregation (Bagging) e técnicas de regularização para se obter previsões acuradas de consumo de gás natural e de abastecimento de energia em diferentes países. Uma nova variante de Bagging, na qual a construção do conjunto de classificadores é feita por meio de uma reamostragem de máxima entropia, também foi proposta. A terceira contribuição trouxe uma série de inovações na maneira pela qual são conduzidas as rotinas de seleção e combinação de modelos de previsão. Os ganhos em acurácia oriundos dos procedimentos propostos são demonstrados por meio de um experimento extensivo utilizando séries das Competições M1, M3 e M4. / [en] This research focuses on the development of hybrid approaches that combine ensemble-based supervised machine learning techniques and time series methods to obtain accurate forecasts for a wide range of variables and processes. It also includes the development of smart selection heuristics, i.e., procedures that can select, among the pool of forecasts originated via ensemble methods, those with the greatest potential of delivering accurate forecasts after aggregation. Such combinatorial approaches allow the forecasting practitioner to deal with different stylized facts that may be present in time series, such as nonlinearities, stochastic components, heteroscedasticity, structural breaks, among others, and deliver satisfactory forecasting results, outperforming benchmarks on many occasions. The thesis is divided into a series of essays. The first endeavor proposed an alternative method to generate ensemble forecasts which delivered satisfactory forecasting results for certain types of electricity consumption time series. In a second effort, a novel forecasting approach combining Bootstrap aggregating (Bagging) algorithms, time series methods and regularization techniques was introduced to obtain accurate forecasts of natural gas consumption and energy supplied series across different countries. A new variant of Bagging, in which the set of classifiers is built by means of a Maximum Entropy Bootstrap routine, was also put forth. The third contribution brought a series of innovations to model selection and model combination in forecasting routines. Gains in accuracy for both point forecasts and prediction intervals were demonstrated by means of an extensive empirical experiment conducted on a wide range of series from the M- Competitions.
68

[pt] PROCESSO SELETIVO E DIVERSIDADE DA FORÇA DE TRABALHO: COMO AS EMPRESAS VEM RESOLVENDO ESSE DESAFIO? / [en] SELECTION PROCESS AND WORKFORCE DIVERSITY: HOW COMPANIES ARE SOLVING THIS CHALLANGE?

ALEXANDRE WELMOWICKI 01 June 2021 (has links)
[pt] Lutas identitárias ganharam relevância nos últimos anos no Brasil e no mundo, o que vem motivando as corporações a responderem, de diversas formas, a esta demanda social. Dentre as respostas mais relevantes, contar com maior diversidade em sua força de trabalho passa a ser uma preocupação crescente das empresas, o que vem obrigando-as a repensarem seus processos seletivos para atrair e contratar, cada vez mais, indivíduos identificados como integrantes de grupos minoritários. A presente dissertação buscou entender como as práticas de recrutamento e seleção de empresas atentas a esta demanda vêm sendo estruturadas e conduzidas. Para alcançar este objetivo optou-se pela realização de estudos de casos múltiplos. Foram realizadas entrevistas com lideranças de empresas que possuem práticas de diversidade e inclusão maduras. Adicionalmente, foram analisados documentos internos, peças de divulgação de vagas em redes sociais, matérias na imprensa entre outros materiais produzidos pelas empresas. Os resultados da pesquisa indicam que os eixos de diversidade mais explorados pelas empresas são os de gênero, raça, pessoas com deficiência e grupo LGBTQIA+. A ações afirmativas nos processos seletivos são focadas para as posições de entrada com estágio e trainee. Educação da liderança e patrocínio da alta gestão são cruciais para o avanço do tema. Finalmente, identificou-se que para a perenidade do progresso em direção à maior diversidade da força de trabalho são fundamentais atualizações na legislação e ações práticas para aumentar a confiança dos públicos em relação a autodeclaração de pertencimento aos grupos minoritários. / [en] Identity struggles have been gaining relevance in recent years in Brazil and worldwide, which has motivated corporations to respond, in various ways, to this social demand. Among the most relevant responses, having more diversity in their workforce becomes a growing concern for companies, which has forced them to rethink their selection processes in order to attract and hire more and more individuals identified as members of groups. monitored. This dissertation sought to understand how the recruitment and selection practices of companies attentive to this demand have been structured and conducted. To achieve this goal, multiple case studies were chosen. Interviews were conducted with leaders of companies that have mature diversity and inclusion practices. In addition, internal documents, disclosure of vacancies on social networks, articles in the press and other materials produced by the companies were analyzed. The survey results indicate that the diversity axes most explored by companies are those of gender, race, people with disabilities and the LGBTQIA + group. Affirmative actions in the selection processes are focused on the positions of entry with internship and trainee. Leadership education and sponsorship from top management are crucial for advancing the theme. Finally, it was identified that for the continuity of progress towards greater diversity of the workforce, updates to legislation and practical actions are essential to increase public confidence in the self-declaration of belonging to the monitored groups.
69

[en] CAN MACHINE LEARNING REPLACE A REVIEWER IN THE SELECTION OF STUDIES FOR SYSTEMATIC LITERATURE REVIEW UPDATES? / [pt] MACHINE LEARNING PODE SUBSTITUIR UM REVISOR NA SELEÇÃO DE ESTUDOS DE ATUALIZAÇÕES DE REVISÕES SISTEMÁTICAS DA LITERATURA?

MARCELO COSTALONGA CARDOSO 19 September 2024 (has links)
[pt] [Contexto] A importância das revisões sistemáticas da literatura (RSLs) para encontrar e sintetizar novas evidências para Engenharia de Software (ES) é bem conhecida, mas realizar e manter as RSLs atualizadas ainda é um grande desafio. Uma das atividades mais exaustivas durante uma RSL é a seleção de estudos, devido ao grande número de estudos a serem analisados. Além disso, para evitar viés, a seleção de estudos deve ser conduzida por mais de um revisor. [Objetivo] Esta dissertação tem como objetivo avaliar o uso de modelos de classificação de texto de machine learning (ML) para apoiar a seleção de estudos em atualizações de RSL e verificar se tais modelos podem substituir um revisor adicional. [Método] Reproduzimos a seleção de estudos de uma atualização de RSL realizada por três pesquisadores experientes, aplicando os modelos de ML ao mesmo conjunto de dados que eles utilizaram. Utilizamos dois algoritmos de ML supervisionado com configurações diferentes (Random Forest e Support Vector Machines) para treinar os modelos com base na RSL original. Calculamos a eficácia da seleção de estudos dos modelos de ML em termos de precisão, recall e f-measure. Também comparamos o nível de semelhança e concordância entre os estudos selecionados pelos modelos de ML e os revisores originais, realizando uma análise de Kappa e da Distância Euclidiana. [Resultados] Em nossa investigação, os modelos de ML alcançaram um f-score de 0.33 para a seleção de estudos, o que é insuficiente para conduzir a tarefa de forma automatizada. No entanto, descobrimos que tais modelos poderiam reduzir o esforço de seleção de estudos em 33.9 por cento sem perda de evidências (mantendo um recall de 100 por cento), descartando estudos com baixa probabilidade de inclusão. Além disso, os modelos de ML alcançaram em média um nível de concordância moderado com os revisores, com um valor médio de 0.42 para o coeficiente de Kappa. [Conclusões] Os resultados indicam que o ML não está pronto para substituir a seleção de estudos por revisores humanos e também pode não ser usado para substituir a necessidade de um revisor adicional. No entanto, há potencial para reduzir o esforço de seleção de estudos das atualizações de RSL. / [en] [Context] The importance of systematic literature reviews (SLRs) to find and synthesize new evidence for Software Engineering (SE) is well known, yet performing and keeping SLRs up-to-date is still a big challenge. One of the most exhaustive activities during an SLR is the study selection because of the large number of studies to be analyzed. Furthermore, to avoid bias, study selection should be conducted by more than one reviewer. [Objective] This dissertation aims to evaluate the use of machine learning (ML) text classification models to support the study selection in SLR updates and verify if such models can replace an additional reviewer. [Method] We reproduce the study selection of an SLR update performed by three experienced researchers, applying the ML models to the same dataset they used. We used two supervised ML algorithms with different configurations (Random Forest and Support Vector Machines) to train the models based on the original SLR. We calculated the study selection effectiveness of the ML models in terms of precision, recall, and f-measure. We also compared the level of similarity and agreement between the studies selected by the ML models and the original reviewers by performing a Kappa Analysis and Euclidean Distance Analysis. [Results] In our investigation, the ML models achieved an f-score of 0.33 for study selection, which is insufficient for conducting the task in an automated way. However, we found that such models could reduce the study selection effort by 33.9 percent without loss of evidence (keeping a 100 percent recall), discarding studies with a low probability of being included. In addition, the ML models achieved a moderate average kappa level of agreement of 0.42 with the reviewers. [Conclusion] The results indicate that ML is not ready to replace study selection by human reviewers and may also not be used to replace the need for an additional reviewer. However, there is potential for reducing the study selection effort of SLR updates.
70

[en] VARIABLE SELECTION FOR LINEAR AND SMOOTH TRANSITION MODELS VIA LASSO: COMPARISONS, APPLICATIONS AND NEW METHODOLOGY / [pt] SELEÇÃO DE VARIÁVEIS PARA MODELOS LINEARES E DE TRANSIÇÃO SUAVE VIA LASSO: COMPARAÇÕES, APLICAÇÕES E NOVA METODOLOGIA

CAMILA ROSA EPPRECHT 10 June 2016 (has links)
[pt] A seleção de variáveis em modelos estatísticos é um problema importante, para o qual diferentes soluções foram propostas. Tradicionalmente, pode-se escolher o conjunto de variáveis explicativas usando critérios de informação ou informação à priori, mas o número total de modelos a serem estimados cresce exponencialmente a medida que o número de variáveis candidatas aumenta. Um problema adicional é a presença de mais variáveis candidatas que observações. Nesta tese nós estudamos diversos aspectos do problema de seleção de variáveis. No Capítulo 2, comparamos duas metodologias para regressão linear: Autometrics, que é uma abordagem geral para específico (GETS) baseada em testes estatísticos, e LASSO, um método de regularização. Diferentes cenários foram contemplados para a comparação no experimento de simulação, variando o tamanho da amostra, o número de variáveis relevantes e o número de variáveis candidatas. Em uma aplicação a dados reais, os métodos foram comparados para a previsão do PIB dos EUA. No Capítulo 3, introduzimos uma metodologia para seleção de variáveis em modelos regressivos e autoregressivos de transição suave (STR e STAR) baseada na regularização do LASSO. Apresentamos uma abordagem direta e uma escalonada (stepwise). Ambos os métodos foram testados com exercícios de simulação exaustivos e uma aplicação a dados genéticos. Finalmente, no Capítulo 4, propomos um critério de mínimos quadrados penalizado baseado na penalidade l1 do LASSO e no CVaR (Conditional Value at Risk) dos erros da regressão out-of-sample. Este é um problema de otimização quadrática resolvido pelo método de pontos interiores. Em um estudo de simulação usando modelos de regressão linear, mostra-se que o método proposto apresenta performance superior a do LASSO quando os dados são contaminados por outliers, mostrando ser um método robusto de estimação e seleção de variáveis. / [en] Variable selection in statistical models is an important problem, for which many different solutions have been proposed. Traditionally, one can choose the set of explanatory variables using information criteria or prior information, but the total number of models to evaluate increases exponentially as the number of candidate variables increases. One additional problem is the presence of more candidate variables than observations. In this thesis we study several aspects of the variable selection problem. First, we compare two procedures for linear regression: Autometrics, which is a general-to-specific (GETS) approach based on statistical tests, and LASSO, a shrinkage method. Different scenarios were contemplated for the comparison in a simulation experiment, varying the sample size, the number of relevant variables and the number of candidate variables. In a real data application, we compare the methods for GDP forecasting. In a second part, we introduce a variable selection methodology for smooth transition regressive (STR) and autoregressive (STAR) models based on LASSO regularization. We present a direct and a stepwise approach. Both methods are tested with extensive simulation exercises and an application to genetic data. Finally, we introduce a penalized least square criterion based on the LASSO l1- penalty and the CVaR (Conditional Value at Risk) of the out-of-sample regression errors. This is a quadratic optimization problem solved by interior point methods. In a simulation study in a linear regression framework, we show that the proposed method outperforms the LASSO when the data is contaminated by outliers, showing to be a robust method of estimation and variable selection.

Page generated in 0.044 seconds