Global ETD Search

321	[pt] APRENDIZADO ESTRUTURADO COM INDUÇÃO E SELEÇÃO INCREMENTAIS DE ATRIBUTOS PARA ANÁLISE DE DEPENDÊNCIA EM PORTUGUÊS / [en] STRUCTURED LEARNING WITH INCREMENTAL FEATURE INDUCTION AND SELECTION FOR PORTUGUESE DEPENDENCY PARSING YANELY MILANES BARROSO 09 November 2016 (has links) [pt] O processamento de linguagem natural busca resolver várias tarefas de complexidade crescente que envolvem o aprendizado de estruturas complexas, como grafos e sequências, para um determinado texto. Por exemplo, a análise de dependência envolve o aprendizado de uma árvore que descreve a estrutura sintática de uma sentença dada. Um método amplamente utilizado para melhorar a representação do conhecimento de domínio em esta tarefa é considerar combinações de atributos usando conjunções lógicas que codificam informação útil com um padrão não-linear. O número total de todas as combinações possíveis para uma conjunção dada cresce exponencialmente no número de atributos e pode resultar em intratabilidade computacional. Também, pode levar a overfitting. Neste cenário, uma técnica para evitar o superajuste e reduzir o conjunto de atributos faz-se necessário. Uma abordagem comum para esta tarefa baseia-se em atribuir uma pontuação a uma árvore de dependência, usando uma função linear do conjunto de atributos. Sabe-se que os modelos lineares esparsos resolvem simultaneamente o problema de seleção de atributos e a estimativa de um modelo linear, através da combinação de um pequeno conjunto de atributos. Neste caso, promover a esparsidade ajuda no controle do superajuste e na compactação do conjunto de atributos. Devido a sua exibilidade, robustez e simplicidade, o algoritmo de perceptron é um método linear discriminante amplamente usado que pode ser modificado para produzir modelos esparsos e para lidar com atributos não-lineares. Propomos a aprendizagem incremental da combinação de um modelo linear esparso com um procedimento de indução de variáveis não-lineares, num cénario de predição estruturada. O modelo linear esparso é obtido através de uma modificação do algoritmo perceptron. O método de indução é Entropy-Guided Feature Generation. A avaliação empírica é realizada usando o conjunto de dados para português da CoNLL 2006 Shared Task. O analisador resultante alcança 92,98 por cento de precisão, que é um desempenho competitivo quando comparado com os sistemas de estado- da-arte. Em sua versão regularizada, o analizador alcança uma precisão de 92,83 por cento , também mostra uma redução notável de 96,17 por cento do número de atributos binários e, reduz o tempo de aprendizagem em quase 90 por cento, quando comparado com a sua versão não regularizada. / [en] Natural language processing requires solving several tasks of increasing complexity, which involve learning to associate structures like graphs and sequences to a given text. For instance, dependency parsing involves learning of a tree that describes the dependency-based syntactic structure of a given sentence. A widely used method to improve domain knowledge representation in this task is to consider combinations of features, called templates, which are used to encode useful information with nonlinear pattern. The total number of all possible feature combinations for a given template grows exponentialy in the number of features and can result in computational intractability. Also, from an statistical point of view, it can lead to overfitting. In this scenario, it is required a technique that avoids overfitting and that reduces the feature set. A very common approach to solve this task is based on scoring a parse tree, using a linear function of a defined set of features. It is well known that sparse linear models simultaneously address the feature selection problem and the estimation of a linear model, by combining a small subset of available features. In this case, sparseness helps control overfitting and performs the selection of the most informative features, which reduces the feature set. Due to its exibility, robustness and simplicity, the perceptron algorithm is one of the most popular linear discriminant methods used to learn such complex representations. This algorithm can be modified to produce sparse models and to handle nonlinear features. We propose the incremental learning of the combination of a sparse linear model with an induction procedure of non-linear variables in a structured prediction scenario. The sparse linear model is obtained through a modifications of the perceptron algorithm. The induction method is the Entropy-Guided Feature Generation. The empirical evaluation is performed using the Portuguese Dependency Parsing data set from the CoNLL 2006 Shared Task. The resulting parser attains 92.98 per cent of accuracy, which is a competitive performance when compared against the state-of-art systems. On its regularized version, it accomplishes an accuracy of 92.83 per cent, shows a striking reduction of 96.17 per cent in the number of binary features and reduces the learning time in almost 90 per cent, when compared to its non regularized version. [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [pt] INDUCAO DE ATRIBUTO [pt] MODELO LINEAR ESPARSO [pt] ANALISE DE DEPENDENCIA DE PORTUGUES [en] NATURAL LANGUAGE PROCESSING [en] FEATURE INDUCTION [en] SPARSE LINEAR MODEL [en] PORTUGUESE DEPENDENCY PARSING [en] SUPERVISED MACHINE LEARNING
322	[pt] FORMAÇÃO PROFISSIONAL EM SERVIÇO SOCIAL ANTE A PANDEMIA DA COVID-19 NO BRASIL: OS REBATIMENTOS NA EXPERIÊNCIA DE ESTÁGIO CURRICULAR DAS/OS ALUNAS/OS DE GRADUAÇÃO DA PUC-RIO / [en] PROFESSIONAL TRAINING IN SOCIAL WORK IN THE FACE OF THE COVID-19 PANDEMIC IN BRAZIL: THE REPERCUSSIONS ON THE CURRICULAR INTERNSHIP EXPERIENCE OF UNDERGRADUATE STUDENTS AT PUC-RIO TAMARA MESQUITA OLIVEIRA SILVA 08 August 2023 (has links) [pt] O cenário de crise sanitária provocado pela pandemia da Covid-19, assolou a população mundial a partir do ano de 2020, impondo desafios às Instituições de Ensino, quanto à organização dos processos de ensino, pesquisa e extensão. Docentes, discentes e assistentes sociais que atuam em Instituições concedentes de estágio, se viram impelidos a enfrentar um contexto adverso, de agudização das expressões da questão social, que influenciaram diretamente a rotina do exercício profissional, bem como de ensino-aprendizagem das/dos discentes em processo de formação acadêmica. A presente dissertação, ancorada em correntes teóricas críticas, tem como objetivo principal analisar a formação acadêmica, com ênfase na experiência de estágio curricular, de discentes do curso de graduação, em Serviço Social, da Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), ante a pandemia da Covid-19. Para tanto, apontamos, a trajetória da Educação Superior no Brasil, a partir da década de 1990, bem como os marcos na história do Serviço Social, a partir da recusa ao conservadorismo e a construção do Projeto Ético-Político da profissão, que constitui a base para a formação e exercício profissional, o que consequentemente influencia diretamente o processo de estágio. Trata-se de uma pesquisa com abordagem qualitativa, cujo principal instrumento para a produção de dados, consistiu em 27 (vinte e sete) entrevistas, realizadas com 20 (vinte) discentes do curso de graduação em Serviço Social da PUC-Rio, 04 (quatro) assistentes sociais que realizam supervisão de estágio em Serviço Social, em instituições conveniadas com a PUC-Rio, 02 (dois) docentes que ministram disciplinas de estágio no curso de graduação em Serviço Social da PUC-Rio e com a coordenadora de estágios do Departamento de Serviço Social da PUC-Rio, nos meses de novembro e dezembro de 2022. Ao final desse estudo foi possível delinear o perfil das/os discentes que realizaram estágio no primeiro semestre do ano de 2020 e analisar a experiência de estágio, tendo em vista a implantação do Ensino Remoto Emergencial e o distanciamento físico de suas/seus respectivos supervisoras/es e Campos de Estágio, o que gerou desafios inéditos a serem enfrentados pela categoria, tendo como norteador o Projeto Ético-Político do Serviço Social, materializado nas normatizações que regem a profissão tais como, Lei de Regulamentação da Profissão (n 8.662/93), Código de Ética (1993), Diretrizes Curriculares de 1996 (ABEPSS) e demais regulamentações específicas para o estágio em Serviço Social no Brasil. Os resultados foram analisados a partir das fundamentações teóricas que basearam esse estudo, considerando as principais categorias de análise – Ensino Remoto Emergencial, Estágio em Serviço Social, Projeto Ético-Político – que nortearam a pesquisa. / [en] The health crisis scenario caused by the Covid-19 pandemic has devastated the world population since the year 2020, imposing challenges to educational institutions regarding the organization of teaching, research, and extension processes. Teachers, students, and social workers who work in Institutions that grant internships have been forced to face an adverse context of worsening expressions of the social issue, which directly influenced the routine of professional practice, as well as the teaching-learning of students in the process of academic education. The present dissertation, anchored in critical theoretical currents, has as its main objective to analyze the academic education, with emphasis on the experience of curricular internship, of undergraduate students in Social Work at the Pontifical Catholic University of Rio de Janeiro (PUC-Rio), in the face of the Covid-19 pandemic. For this, we point to the trajectory of Higher Education in Brazil, from the 1990 s, as well as the milestones in the history of Social Service, from the refusal of conservatism and the construction of the Ethical-Political Project of the profession, which constitutes the basis for professional qualification and practice, which consequently directly influences the internship process. This is a research with a qualitative approach, whose main instrument for the production of data consisted of 27 (twenty-seven) interviews, carried out with 20 (twenty) students of the undergraduate course in Social Work at PUC-Rio, 04 (four) social workers who supervise Social Work internships in institutions associated with PUC-Rio, 02 (two) professors who teach internship disciplines in the undergraduate course in Social Work at PUC-Rio, and with the Coordinator of Internships of the Department of Social Work at PUC-Rio, in the months of November and December 2022. At the end of this study, it was possible to delineate the profile of the students who did their internship in the first semester of 2020 and to analyze the internship experience, considering the implementation of Emergency Remote Teaching and the physical distance from their respective supervisors and internship fields, which created unprecedented challenges to be faced by the category, guided by the Ethical-Political Project of Social Service, materialized in the norms that govern the profession, such as the Profession Regulation Law (no. 8. 662/93), Code of Ethics (1993), Curricular Guidelines of 1996 (ABEPSS) and other specific regulations for the internship in Social Service in Brazil. The results were analyzed based on the theoretical foundations of this study, considering the main categories of analysis - Emergency Remote Teaching, Internship in Social Work, Ethical-Political Project - that guided the research. [pt] ESTAGIO SUPERVISIONADO [pt] PROJETO ETICO-POLITICO [pt] FORMACAO ACADEMICO-PROFISSIONAL [pt] SERVICO SOCIAL [pt] ENSINO REMOTO EMERGENCIAL [en] EMERGENCY REMOTE TEACHING [en] ETHICAL-POLITICAL PROJECT [en] ACADEMIC-PROFESSIONAL TRAINING [en] SOCIAL WORK
323	[en] A MIP APPROACH FOR COMMUNITY DETECTION IN THE STOCHASTIC BLOCK MODEL / [pt] UMA ABORDAGEM DE PROGRAMAÇÃO INTEIRA MISTA PARA DETECÇÃO DE COMUNIDADES NO STOCHASTIC BLOCK MODEL BRENO SERRANO DE ARAUJO 04 November 2020 (has links) [pt] O Degree-Corrected Stochastic Block Model (DCSBM) é um modelo popular para geração de grafos aleatórios com estrutura de comunidade, dada uma sequência de graus esperados. O princípio básico de algoritmos que utilizam o DCSBM para detecção de comunidades é ajustar os parâmetros do modelo a dados observados, de forma a encontrar a estimativa de máxima verossimilhança, ou maximum likelihood estimate (MLE), dos parâmetros do modelo. O problema de otimização para o MLE é comumente resolvido por meio de heurísticas. Neste trabalho, propomos métodos de programação matemática, para resolver de forma exata o problema de otimização descrito, e comparamos os métodos propostos com heurísticas baseadas no algoritmo de expectation-maximization (EM). Métodos exatos são uma ferramenta fundamental para a avaliação de heurísticas, já que nos permitem identificar se uma solução heurística é sub-ótima e medir seu gap de otimalidade. / [en] The Degree-Corrected Stochastic Block Model (DCSBM) is a popular model to generate random graphs with community structure given an expected degree sequence. The standard approach of community detection algorithms based on the DCSBM is to search for the model parameters which are the most likely to have produced the observed network data, via maximum likelihood estimation (MLE). Current techniques for the MLE problem are heuristics and therefore do not guarantee convergence to the optimum. We present mathematical programming formulations and exact solution methods that can provably find the model parameters and community assignments of maximum likelihood given an observed graph. We compare the proposed exact methods with classical heuristic algorithms based on expectation-maximization (EM). The solutions given by exact methods give us a principled way of recognizing when heuristic solutions are sub-optimal and measuring how far they are from optimality. [pt] PROGRAMACAO INTEIRA MISTA [pt] APRENDIZADO NAO SUPERVISIONADO [pt] STOCHASTIC BLOCK MODEL [pt] DETECCAO DE COMUNIDADES [pt] BUSCA LOCAL [pt] MACHINE LEARNING [en] MIXED INTEGER PROGRAMMING [en] UNSUPERVISED LEARNING [en] STOCHASTIC BLOCK MODEL [en] COMMUNITY DETECTION [en] LOCAL SEARCH [en] MACHINE LEARNING
324	[en] HEURISTICS FOR DATA POINT SELECTION FOR LABELING IN SEMI-SUPERVISED AND ACTIVE LEARNING CONTEXTS / [pt] HEURÍSTICAS PARA SELEÇÃO DE PONTOS PARA SEREM ANOTADOS NO CONTEXTO DEAPRENDIZADO SEMI- SUPERVISIONADO E ATIVO SONIA FIOL GONZALEZ 16 September 2021 (has links) [pt] O aprendizado supervisionado é, hoje, o ramo do aprendizado de máquina central para a maioria das inovações nos negócios. A abordagem depende de ter grandes quantidades de dados rotulados, suficiente para ajustar funções com a precisão necessária. No entanto, pode ser caro obter dados rotulados ou criar os rótulos através de um processo de anotação. O aprendizado semisupervisionado (SSL) é usado para rotular com precisão os dados a partir de pequenas quantidades de dados rotulados utilizando técnicas de aprendizado não supervisionado. Uma técnica de rotulagem é a propagação de rótulos. Neste trabalho, usamos especificamente o algoritmo Consensus rate-based label propagation (CRLP). Este algoritmo depende do uma função de consenso para a propagação. Uma possível função de consenso é a matriz de co-associação que estima a probabilidade dos pontos i e j pertencem ao mesmo grupo. Neste trabalho, observamos que a matriz de co-associação contém informações valiosas para tratar esse tipo de problema. Quando nenhum dado está rotulado, é comum escolher aleatoriamente, com probabilidade uniforme, os dados a serem rotulados manualmente, a partir dos quais a propagação procede. Este trabalho aborda o problema de seleção de um conjunto de tamanho fixo de dados para serem rotulados manualmente que propiciem uma melhor precisão no algoritmo de propagação de rótulos. Três técnicas de seleção, baseadas em princípios de amostragem estocástica, são propostas: Stratified Sampling (SS), Probability (P), and Stratified Sampling - Probability (SSP). Eles são todos baseados nas informações embutidas na matriz de co-associação. Os experimentos foram realizados em 15 conjuntos de benchmarks e mostraram resultados muito interessantes. Não só, porque eles fornecem uma seleção mais equilibrada quando comparados a uma seleção aleatória, mas também melhoram os resultados de precisão na propagação de rótulos. Em outro contexto, essas estratégias também foram testadas dentro de um processo de aprendizagem ativa, obtendo também bons resultados. / [en] Supervised learning is, today, the branch of Machine Learning central to most business disruption. The approach relies on having amounts of labeled data large enough to learn functions with the required approximation. However, labeled data may be expensive, to obtain or to construct through a labeling process. Semi-supervised learning (SSL) strives to label accurately data from small amounts of labeled data and the use of unsupervised learning techniques. One labeling technique is label propagation. We use specifically the Consensus rate-based label propagation (CRLP) in this work. A consensus function is central to the propagation. A possible consensus function is a coassociation matrix that estimates the probability of data points i and j belong to the same group. In this work, we observe that the co-association matrix has valuable information embedded in it. When no data is labeled, it is common to choose with a uniform probability randomly, the data to manually label, from which the propagation proceeds. This work addresses the problem of selecting a fixed-size set of data points to label (manually), to improve the label propagation algorithm s accuracy. Three selection techniques, based on stochastic sampling principles, are proposed: Stratified Sampling (SP), Probability (P), and Stratified Sampling - Probability (SSP). They are all based on the information embedded in the co-association matrix. Experiments were carried out on 15 benchmark sets and showed exciting results. Not only because they provide a more balanced selection when compared to a uniform random selection, but also improved the accuracy results of a label propagation method. These strategies were also tested inside an active learning process in a different context, also achieving good results. [pt] APRENDIZADO SEMI-SUPERVISIONADO [pt] PROPAGACAO DE ROTULOS [pt] MATRIZ DE CO-ASSOCIACAO [pt] SELECAO DE PONTOS [pt] APRENDIZADO ATIVO [en] SEMI-SUPERVISED LEARNING [en] LABEL PROPAGATION [en] CO-ASSOCIATION MATRIX [en] DATA POINT SELECTION [en] ACTIVE LEARNING
325	Percepção da escola-campo sobre o estágio supervisionado em Biologia: contribuições para uma avaliação curricular. / Perception of School-field on the Stage Supervised in Biology: an assessment of contributions to Curriculum Evaluation SOUSA, Ana Lourdes Lucena de January 2009 (has links) SOUSA, Ana Lourdes Lucena de. Percepção da escola-campo sobre o estágio supervisionado em biologia: contribuições para uma avaliação curricular. 2009. 168f. Dissertação (Mestrado em Educação) – Universidade Federal do Ceará, Faculdade de Educação, Programa de Pós-Graduação em Educação Brasileira, Fortaleza-CE, 2009. / Submitted by Raul Oliveira (raulcmo@hotmail.com) on 2012-07-03T16:35:24Z No. of bitstreams: 1 2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5) / Approved for entry into archive by Maria Josineide Góis(josineide@ufc.br) on 2012-07-20T16:12:36Z (GMT) No. of bitstreams: 1 2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5) / Made available in DSpace on 2012-07-20T16:12:36Z (GMT). No. of bitstreams: 1 2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5) Previous issue date: 2009 / This research project has as main purpose understanding supervised stage activities, under school manager’s and teacher´s point-of-view, seeing that they are responsible for the teachers-students reception at school. For one semester class period, the field-school was analyzed in its structure and action, as well as the supervised stage considering practical reflexive documental theory. Gestalt’s theory was used to comprehend the researched object that is the relationship between field-school and university reffering to a Biology major, through supervised stage. This work’s components are introduction and four chapters supplied in Franco and Ghedin’s (2008) Marleau Ponty’s (2006) Vianna´s (2000) Romanelli’s (2006) Fusary’s (1987) Pimenta and Lima’s (1993) studies, among others, beyond legal documents published by MEC and CNE. The research has based itself in the evaluative methodology, that can make possible the aggregation of the qualitative research procedures in the knowledge and learning construction. Both of these can give real mean to the study purpose reflection, analysis and evaluation. The qualitative research in phenomenological basis helped to understand data that has marked the space/time of the research. The most important results in this investigation are constituted by these points of reflection: the school managers and Biology teachers perception about supervised stage offered formative elements to the searcher, because they increased the learning field in education area and in the time spent inside public school. That was very important also for the teachers involved in this research through the opportunity of reflection, when they discussed their life experience. Biology teachers respect their knowledge area and hava Biology as The Science of Life. They also hope the teachers-students can help them encourage the students, because keeping the dialog is very difficult, when the class is disarticulated. The searcher marked her presence in the school, inviting to do a work involving school and university, that is an emergency. Teachers formation needs to increase the dialogue in the real spaces where it happens. / A presente pesquisa teve como objetivo principal compreender o Estágio a partir da percepção e avaliação dos gestores e dos professores que recebem os estagiários. Teve a preocupação de conhecer a escola-campo, em sua estrutura e funcionamento, no decorrer de um semestre letivo, bem como investigar o Estágio curricular supervisionado a partir das reflexões teóricas, práticas, documentais. Foi utilizada a teoria da Gestalt para compreender o objeto de estudo – a relação entre a Escola-Campo e a universidade, no tocante à formação de professores, através do Estágio Curricular Supervisionado, nos cursos de Licenciatura em Biologia. Distribuído em introdução e quatro capítulos, utilizou como aporte teórico os estudos de Franco e Ghedin (2008), Merleau Ponty (2006), Vianna (2000), Saviani (1996, 2009), Pimenta (1993, 2002, 2006), Romanelli (2006), Fusari (1987), Pimenta e Lima (2004), entre outros, além dos documentos legais redigidos e publicados pelo MEC e CNE. A pesquisa apoiou-se na metodologia avaliativa, que permite que os procedimentos da pesquisa qualitativa se agreguem na construção de conhecimentos e aprendizagens que dão significado à reflexão - análise e avaliação curricular. A entrevista qualitativa de base fenomenológica auxiliou na compreensão dos dados que marcaram o espaço/tempo da pesquisa. Os principais achados desta investigação constituíram os seguintes pontos de reflexão: a percepção dos gestores e professores de Biologia sobre o Estágio, os quais ofereceram elementos formativos para a pesquisadora, uma vez que alargou o campo de aprendizagens no campo da pesquisa educacional e na vivência com o cotidiano da escola pública. Para os educadores entrevistados foi também uma oportunidade de reflexão, quando passaram a elaborar suas experiências de vida, formação. Os professores de Biologia demonstram respeito por sua área de conhecimento e reafirmam a valorização da Biologia, enquanto ciência da vida. Esperam que os estagiários os ajudem a incentivar os alunos, pois estes se encontram desmotivados, o que dificulta o diálogo. Esta pesquisa registra um tempo difícil para a escola, por conta do envolvimento dos seus gestores com processos eletivos. Na passagem dos estagiários e da pesquisadora, ficou o convite para a reflexão e a proposta de um trabalho coletivo que envolva a escola e a universidade; A complexidade das relações entre a Universidade e as Escolas está longe de ser compreendida se não houver diálogo sobre a formação com qualidade do professor, nos espaços concretos em que ela acontece. Estágio Supervisionado Percepção Escola-campo Avaliação Curricular. Estagiários(Educação) - Fortaleza(CE) Prática de ensino - Fortaleza(CE)
326	Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafos Kasahara, Viviani Akemi 12 August 2016 (has links) Submitted by Izabel Franco (izabel-franco@ufscar.br) on 2016-10-11T17:36:54Z No. of bitstreams: 1 DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:21Z (GMT) No. of bitstreams: 1 DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:27Z (GMT) No. of bitstreams: 1 DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Made available in DSpace on 2016-10-21T13:03:34Z (GMT). No. of bitstreams: 1 DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) Previous issue date: 2016-08-12 / Não recebi financiamento / Cluster analysis is the organization of a collection of patterns into clusters based on similarity which is determined by using properties of data. Clustering techniques can be useful in a variety of knowledge domains such as biotechnology, computer vision, document retrieval and many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in gene regulation. Clustering miRNA sequences can help to understand and explore sequences belonging to the same cluster that has similar biological functions. This research work investigates and explores seven unsupervised clustering algorithms based on graphs that can be divided into three categories: algorithm based on region of influence, algorithm based on minimum spanning tree and spectral algorithm. To assess the contribution of the proposed algorithms, data from miRNA families stored in the online miRBase database were used in the conducted experiments. The results of these experiments were presented, analysed and evaluated using clustering validation indexes as well as visual analysis. / A análise de agrupamento é uma organização de coleção de padrões em grupos, baseando-se na similaridade das propriedades pertencentes aos dados. A técnica de agrupamento pode ser utilizado em muitas áreas de conhecimento como biotecnologia, visão computacional, recuperação de documentos, entre outras. Uma área interessante da biologia envolve o conceito de microRNAs (miRNAs), que são moléculas não-codificadas de RNA com aproximadamente 22 nucleotídeos e que desempenham um papel importante na regulação dos genes. O agrupamento de sequências de miRNA podem ajudar em sua exploração e entendimento, pois as sequências que pertencem ao mesmo grupo possuem uma função biológica similar. Esse trabalho explora e investiga sete algoritmos de agrupamentos não-supervisionados baseados em grafos que podem ser divididos em três categorias: algoritmos baseados em região de influência, algoritmos baseados em árvore spanning minimal e algoritmo espectral. Para avaliar a contribuição dos algoritmos propostos, os experimentos conduzidos utilizaram os dados das famílias de miRNAs disponíveis no banco de dados denominado miRBase. Os resultados dos experimentos foram apresentados, analisados e avaliados usando índices de validação de agrupamento e análise visual. Agrupamento de miRNA Mineração de dados Teoria dos grafos Algoritmo espectral Aprendizado não-supervisionado Clustering miRNA clustering Data mining Unsupervised learning Graph theory Graph based clustering algorithms Algorithm based on region of influence Algorithm based on minimum spanning tree Spectral algorithm
327	[en] CONVOLUTIONAL NETWORKS APPLIED TO SEMANTIC SEGMENTATION OF SEISMIC IMAGES / [pt] REDES CONVOLUCIONAIS APLICADAS À SEGMENTAÇÃO SEMÂNTICA DE IMAGENS SÍSMICAS MATEUS CABRAL TORRES 10 August 2021 (has links) [pt] A partir de melhorias incrementais em uma conhecida rede neural convolucional (U-Net), diferentes técnicas são avaliadas quanto às suas performances na tarefa de segmentação semântica em imagens sísmicas. Mais especificamente, procura-se a identificação e delineamento de estruturas salinas no subsolo, o que é de grande relevância na indústria de óleo e gás para a exploração de petróleo em camadas pré-sal, por exemplo. Além disso, os desafios apresentados no tratamento destas imagens sísmicas se assemelham em muito aos encontrados em tarefas de áreas médicas como identificação de tumores e segmentação de tecidos, o que torna o estudo da tarefa em questão ainda mais valioso. Este trabalho pretende sugerir uma metodologia adequada de abordagem à tarefa e produzir redes neurais capazes de segmentar imagens sísmicas com bons resultados dentro das métricas utilizadas. Para alcançar estes objetivos, diferentes estruturas de redes, transferência de aprendizado e técnicas de aumentação de dados são testadas em dois datasets com diferentes níveis de complexidade. / [en] Through incremental improvements in a well-known convolutional neural network (U-Net), different techniques are evaluated regarding their performance on the task of semantic segmentation of seismic images. More specifically, the objective is the better identification and outline of subsurface salt structures, which is a task of great relevance for the oil and gas industry in the exploration of pre-salt layers, for example. Besides that application, the challenges imposed by the treatment of seismic images also resemble those found in medical fields like tumor detection and tissue segmentation, which makes the study of this task even more valuable. This work seeks to suggest a suitable methodology for the task and to yield neural networks that are capable of performing semantic segmentation of seismic images with good results regarding specific metrics. For that purpose, different network structures, transfer learning and data augmentation techniques are applied in two datasets with different levels of complexity. [pt] PROCESSAMENTO DE IMAGENS [pt] FCN [pt] U-NET [pt] DETECCAO DE SAL [pt] AUMENTO DE DADOS [pt] SEGMENTACAO SEMANTICA [pt] REDES NEURAIS CONVOLUCIONAIS [pt] TRANSFERENCIA DE APRENDIZADO [pt] APRENDIZADO PROFUNDO [pt] APRENDIZADO SUPERVISIONADO [en] IMAGE PROCESSING [en] FCN [en] U-NET [en] SALT DETECTION [en] DATA AUGMENTATION [en] PIXEL-WISE SEMANTIC SEGMENTATION [en] CONVOLUTIONAL NEURAL NETWORKS [en] TRANSFER LEARNING [en] DEEP LEARNING [en] SUPERVISED LEARNING
328	[en] A SUPERVISED LEARNING APPROACH TO PREDICT HOUSEHOLD AID DEMAND FOR RECURRENT CLIME-RELATED DISASTERS IN PERU / [pt] UMA ABORDAGEM DE APRENDIZADO SUPERVISIONADO PARA PREVER A DEMANDA DE AJUDA FAMILIAR PARA DESASTRES CLIMÁTICOS RECORRENTES NO PERU RENATO JOSE QUILICHE ALTAMIRANO 21 November 2023 (has links) [pt] Esta dissertação apresenta uma abordagem baseada em dados para o problema de predição de desastres recorrentes em países em desenvolvimento. Métodos de aprendizado de máquina supervisionado são usados para treinar classificadores que visam prever se uma família seria afetada por ameaças climáticas recorrentes (um classificador é treinado para cada perigo natural). A abordagem desenvolvida é válida para perigos naturais recorrentes que afetam um país e permite que os gerentes de risco de desastres direcionem suas operações com mais conhecimento. Além disso, a avaliação preditiva permite que os gerentes entendam os impulsionadores dessas previsões, levando à formulação proativa de políticas e planejamento de operações para mitigar riscos e preparar comunidades para desastres recorrentes. A metodologia proposta foi aplicada ao estudo de caso do Peru, onde foram treinados classificadores para ondas de frio, inundações e deslizamentos de terra. No caso das ondas de frio, o classificador tem 73,82% de precisão. A pesquisa descobriu que famílias pobres em áreas rurais são vulneráveis a desastres relacionados a ondas de frio e precisam de intervenção humanitária proativa. Famílias vulneráveis têm infraestrutura urbana precária, incluindo trilhas, caminhos, postes de iluminação e redes de água e drenagem. O papel do seguro saúde, estado de saúde e educação é menor. Domicílios com membros doentes levam a maiores probabilidades de serem afetados por ondas de frio. Maior realização educacional do chefe da família está associada a uma menor probabilidade de ser afetado por ondas de frio. No caso das inundações, o classificador tem 82.57% de precisão. Certas condições urbanas podem tornar as famílias rurais mais suscetíveis a inundações, como acesso à água potável, postes de iluminação e redes de drenagem. Possuir um computador ou laptop diminui a probabilidade de ser afetado por inundações, enquanto possuir uma bicicleta e ser chefiado por indivíduos casados aumenta. Inundações são mais comuns em assentamentos urbanos menos desenvolvidos do que em famílias rurais isoladas. No caso dos deslizamentos de terra, o classificador tem 88.85% de precisão, e é segue uma lógica diferente do das inundações. A importância na previsão é mais uniformemente distribuída entre as características consideradas no aprendizado do classificador. Assim, o impacto de um recurso individual na previsão é pequeno. A riqueza a longo prazo parece ser mais crítica: a probabilidade de ser afetado por um deslizamento é menor para famílias com certos aparelhos e materiais domésticos de construção. Comunidades rurais são mais afetadas por deslizamentos, especialmente aquelas localizadas em altitudes mais elevadas e maiores distâncias das cidades e mercados. O impacto marginal médio da altitude é não linear. Os classificadores fornecem um método inteligente baseado em dados que economiza recursos garantindo precisão. Além disso, a pesquisa fornece diretrizes para abordar a eficiência na distribuição da ajuda, como formulações de localização da instalação e roteamento de veículos. Os resultados da pesquisa têm várias implicações gerenciais, então os autores convocam à ação gestores de risco de desastres e outros interessados relevantes. Desastres recorrentes desafiam toda a humanidade. / [en] This dissertation presents a data-driven approach to the problem of predicting recurrent disasters in developing countries. Supervised machine learning methods are used to train classifiers that aim to predict whether a household would be affected by recurrent climate threats (one classifier is trained for each natural hazard). The approach developed is valid for recurrent natural hazards affecting a country and allows disaster risk managers to target their operations with more knowledge. In addition, predictive assessment allows managers to understand the drivers of these predictions, leading to proactive policy formulation and operations planning to mitigate risks and prepare communities for recurring disasters. The proposed methodology was applied to the case study of Peru, where classifiers were trained for cold waves, floods, and landslides. In the case of cold waves, the classifier was 73.82% accurate. The research found that low-income families in rural areas are vulnerable to cold wave related disasters and need proactive humanitarian intervention. Vulnerable families have poor urban infrastructure, including footpaths, roads, lampposts, and water and drainage networks. The role of health insurance, health status, and education is minor. Households with sick members are more likely to be affected by cold waves. Higher educational attainment of the head of the household is associated with a lower probability of being affected by cold snaps.In the case of flooding, the classifier is 82.57% accurate. Certain urban conditions, such as access to drinking water, lampposts, and drainage networks, can make rural households more susceptible to flooding. Owning a computer or laptop decreases the likelihood of being affected by flooding while owning a bicycle and being headed by married individuals increases it. Flooding is more common in less developed urban settlements than isolated rural families.In the case of landslides, the classifier is 88.85% accurate and follows a different logic than that of floods. The importance of the prediction is more evenly distributed among the features considered when learning the classifier. Thus, the impact of an individual feature on the prediction is small. Long-term wealth is more critical: the probability of being affected by a landslide is lower for families with specific appliances and household building materials. Rural communities are more affected by landslides, especially those located at higher altitudes and greater distances from cities and markets. The average marginal impact of altitude is non-linear.The classifiers provide an intelligent data-driven method that saves resources by ensuring accuracy. In addition, the research provides guidelines for addressing efficiency in aid distribution, such as facility location formulations and vehicle routing.The research results have several managerial implications, so the authors call for action from disaster risk managers and other relevant stakeholders. Recurrent disasters challenge all of humanity. [pt] REGRESSAO LOGISTICA [pt] HOUSEHOLDS FEATURES [pt] INUNDACOES [pt] ONDAS DE FRIO [pt] CLASSIFICADOR DE RISCO DE DESASTRE [pt] XGBOOST [pt] RANDOM FOREST [pt] DESLIZAMENTO DE TERRA [en] LOGISTIC REGRESSION [en] HOUSEHOLDS FEATURES [en] FLOODS [en] COLD WAVES [en] DISASTER RISK CLASSIFIER [en] XGBOOST [en] RANDOM FOREST [en] LANDSLIDE [en] SUPERVISED MACHINE LEARNING

Search results