321 |
[pt] APRENDIZADO ESTRUTURADO COM INDUÇÃO E SELEÇÃO INCREMENTAIS DE ATRIBUTOS PARA ANÁLISE DE DEPENDÊNCIA EM PORTUGUÊS / [en] STRUCTURED LEARNING WITH INCREMENTAL FEATURE INDUCTION AND SELECTION FOR PORTUGUESE DEPENDENCY PARSINGYANELY MILANES BARROSO 09 November 2016 (has links)
[pt] O processamento de linguagem natural busca resolver várias tarefas de complexidade crescente que envolvem o aprendizado de estruturas complexas, como grafos e sequências, para um determinado texto. Por exemplo, a análise de dependência envolve o aprendizado de uma árvore que descreve a estrutura sintática de uma sentença dada. Um método amplamente utilizado para melhorar a representação do conhecimento de domínio em esta tarefa é considerar combinações de atributos usando conjunções lógicas que codificam informação útil com um padrão não-linear. O número total de todas as combinações possíveis para uma conjunção dada cresce exponencialmente no número de atributos e pode resultar em intratabilidade computacional. Também, pode levar a overfitting. Neste cenário, uma técnica para evitar o superajuste e reduzir o conjunto de atributos faz-se necessário. Uma abordagem comum para esta tarefa baseia-se em atribuir uma pontuação a uma árvore de dependência, usando uma função linear do conjunto de atributos. Sabe-se que os modelos lineares esparsos resolvem simultaneamente o problema de seleção de atributos e a estimativa de um modelo linear, através da combinação de um pequeno conjunto de atributos. Neste caso, promover a esparsidade ajuda no controle do superajuste e na compactação do conjunto de atributos. Devido a sua exibilidade, robustez e simplicidade, o algoritmo de perceptron é um método linear discriminante amplamente usado que pode ser modificado para produzir modelos esparsos e para lidar com atributos não-lineares. Propomos a aprendizagem incremental da combinação de um modelo linear esparso com um procedimento de indução de variáveis não-lineares, num cénario de predição estruturada. O modelo linear esparso é obtido através de uma modificação do algoritmo perceptron. O método de indução é Entropy-Guided Feature Generation. A avaliação empírica é realizada usando o conjunto de dados para português da CoNLL 2006 Shared Task. O analisador resultante alcança 92,98 por cento de precisão, que é um desempenho competitivo quando comparado com os sistemas de estado- da-arte. Em sua versão regularizada, o analizador alcança uma precisão de 92,83 por cento , também mostra uma redução notável de 96,17 por cento do número de atributos binários e, reduz o tempo de aprendizagem em quase 90 por cento, quando comparado com a sua versão não regularizada. / [en] Natural language processing requires solving several tasks of increasing
complexity, which involve learning to associate structures like graphs and
sequences to a given text. For instance, dependency parsing involves learning
of a tree that describes the dependency-based syntactic structure of a
given sentence. A widely used method to improve domain knowledge
representation in this task is to consider combinations of features, called
templates, which are used to encode useful information with nonlinear
pattern. The total number of all possible feature combinations for a given
template grows exponentialy in the number of features and can result in
computational intractability. Also, from an statistical point of view, it can
lead to overfitting. In this scenario, it is required a technique that avoids
overfitting and that reduces the feature set. A very common approach to
solve this task is based on scoring a parse tree, using a linear function
of a defined set of features. It is well known that sparse linear models
simultaneously address the feature selection problem and the estimation
of a linear model, by combining a small subset of available features. In
this case, sparseness helps control overfitting and performs the selection
of the most informative features, which reduces the feature set. Due to
its
exibility, robustness and simplicity, the perceptron algorithm is one of
the most popular linear discriminant methods used to learn such complex
representations. This algorithm can be modified to produce sparse models
and to handle nonlinear features. We propose the incremental learning of
the combination of a sparse linear model with an induction procedure of
non-linear variables in a structured prediction scenario. The sparse linear
model is obtained through a modifications of the perceptron algorithm. The
induction method is the Entropy-Guided Feature Generation. The empirical
evaluation is performed using the Portuguese Dependency Parsing data set
from the CoNLL 2006 Shared Task. The resulting parser attains 92.98 per cent of
accuracy, which is a competitive performance when compared against the
state-of-art systems. On its regularized version, it accomplishes an accuracy
of 92.83 per cent, shows a striking reduction of 96.17 per cent in the number of binary
features and reduces the learning time in almost 90 per cent, when compared to
its non regularized version.
|
322 |
[pt] FORMAÇÃO PROFISSIONAL EM SERVIÇO SOCIAL ANTE A PANDEMIA DA COVID-19 NO BRASIL: OS REBATIMENTOS NA EXPERIÊNCIA DE ESTÁGIO CURRICULAR DAS/OS ALUNAS/OS DE GRADUAÇÃO DA PUC-RIO / [en] PROFESSIONAL TRAINING IN SOCIAL WORK IN THE FACE OF THE COVID-19 PANDEMIC IN BRAZIL: THE REPERCUSSIONS ON THE CURRICULAR INTERNSHIP EXPERIENCE OF UNDERGRADUATE STUDENTS AT PUC-RIOTAMARA MESQUITA OLIVEIRA SILVA 08 August 2023 (has links)
[pt] O cenário de crise sanitária provocado pela pandemia da Covid-19, assolou a população mundial a partir do ano de 2020, impondo desafios às Instituições de Ensino, quanto à organização dos processos de ensino, pesquisa e extensão. Docentes, discentes e assistentes sociais que atuam em Instituições concedentes de estágio, se viram impelidos a enfrentar um contexto adverso, de agudização das expressões da questão social, que influenciaram diretamente a rotina do exercício profissional, bem como de ensino-aprendizagem das/dos discentes em processo de formação acadêmica. A presente dissertação, ancorada em correntes teóricas críticas, tem como objetivo principal analisar a formação acadêmica, com ênfase na experiência de estágio curricular, de discentes do curso de graduação, em Serviço Social, da Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), ante a pandemia da Covid-19. Para tanto, apontamos, a trajetória da Educação Superior no Brasil, a partir da década de 1990, bem como os marcos na história do Serviço Social, a partir da recusa ao conservadorismo e a construção do Projeto Ético-Político da profissão, que constitui a base para a formação e exercício profissional, o que consequentemente influencia diretamente o processo de estágio. Trata-se de uma pesquisa com abordagem qualitativa, cujo principal instrumento para a produção de dados, consistiu em 27 (vinte e sete) entrevistas, realizadas com 20 (vinte) discentes do curso de graduação em Serviço Social da PUC-Rio, 04 (quatro) assistentes sociais que realizam supervisão de estágio em Serviço Social, em instituições conveniadas com a PUC-Rio, 02 (dois) docentes que ministram disciplinas de estágio no curso de graduação em Serviço Social da PUC-Rio e com a coordenadora de estágios do Departamento de Serviço Social da PUC-Rio, nos meses de novembro e dezembro de 2022. Ao final desse estudo foi possível delinear o perfil das/os discentes que realizaram estágio no primeiro semestre do ano de
2020 e analisar a experiência de estágio, tendo em vista a implantação do Ensino Remoto Emergencial e o distanciamento físico de suas/seus respectivos supervisoras/es e Campos de Estágio, o que gerou desafios inéditos a serem enfrentados pela categoria, tendo como norteador o Projeto Ético-Político do Serviço Social, materializado nas normatizações que regem a profissão tais como, Lei de Regulamentação da Profissão (n 8.662/93), Código de Ética (1993), Diretrizes Curriculares de 1996 (ABEPSS) e demais regulamentações específicas para o estágio em Serviço Social no Brasil. Os resultados foram analisados a partir das fundamentações teóricas que basearam esse estudo, considerando as principais categorias de análise – Ensino Remoto Emergencial, Estágio em Serviço Social, Projeto Ético-Político – que nortearam a pesquisa. / [en] The health crisis scenario caused by the Covid-19 pandemic has devastated the world population since the year 2020, imposing challenges to educational institutions regarding the organization of teaching, research, and extension processes. Teachers, students, and social workers who work in Institutions that grant internships have been forced to face an adverse context of worsening expressions of the social issue, which directly influenced the routine of professional practice, as well as the teaching-learning of students in the process of academic education. The present dissertation, anchored in critical theoretical currents, has as its main objective to analyze the academic education, with emphasis on the experience of curricular internship, of undergraduate students in Social Work at the Pontifical Catholic University of Rio de Janeiro (PUC-Rio), in the face of the Covid-19 pandemic. For this, we point to the trajectory of Higher Education in Brazil, from the 1990 s, as well as the milestones in the history of Social Service, from the refusal of conservatism and the construction of the Ethical-Political Project of the profession, which constitutes the basis for professional qualification and practice, which consequently directly influences the internship process. This is a research with a qualitative approach, whose main instrument for the production of data consisted of 27 (twenty-seven) interviews, carried out with 20 (twenty) students of the undergraduate course in Social Work at PUC-Rio, 04 (four) social workers who supervise Social Work internships in institutions associated with PUC-Rio, 02 (two) professors who teach internship disciplines in the undergraduate course in Social Work at PUC-Rio, and with the Coordinator of Internships of the Department of Social Work at PUC-Rio, in the months of November and December 2022. At the end of this study, it was possible to delineate the profile of the students who did their internship in the first semester of 2020 and to analyze the internship
experience, considering the implementation of Emergency Remote Teaching and the physical distance from their respective supervisors and internship fields, which created unprecedented challenges to be faced by the category, guided by the Ethical-Political Project of Social Service, materialized in the norms that govern the profession, such as the Profession Regulation Law (no. 8. 662/93), Code of Ethics (1993), Curricular Guidelines of 1996 (ABEPSS) and other specific regulations for the internship in Social Service in Brazil. The results were analyzed based on the theoretical foundations of this study, considering the main categories of analysis - Emergency Remote Teaching, Internship in Social Work, Ethical-Political Project - that guided the research.
|
323 |
[en] A MIP APPROACH FOR COMMUNITY DETECTION IN THE STOCHASTIC BLOCK MODEL / [pt] UMA ABORDAGEM DE PROGRAMAÇÃO INTEIRA MISTA PARA DETECÇÃO DE COMUNIDADES NO STOCHASTIC BLOCK MODELBRENO SERRANO DE ARAUJO 04 November 2020 (has links)
[pt] O Degree-Corrected Stochastic Block Model (DCSBM) é um modelo popular para geração de grafos aleatórios com estrutura de comunidade, dada uma sequência de graus esperados. O princípio básico de algoritmos que utilizam o DCSBM para detecção de comunidades é ajustar os parâmetros do modelo a dados observados, de forma a encontrar a estimativa de máxima verossimilhança, ou maximum likelihood estimate (MLE), dos parâmetros do modelo. O problema de otimização para o MLE é comumente resolvido por meio de heurísticas. Neste trabalho, propomos métodos de programação matemática, para resolver de forma exata o problema de otimização descrito, e comparamos os métodos propostos com heurísticas baseadas no algoritmo de expectation-maximization (EM). Métodos exatos são uma ferramenta fundamental para a avaliação de heurísticas, já que nos permitem identificar se uma solução heurística é sub-ótima e medir seu gap de otimalidade. / [en] The Degree-Corrected Stochastic Block Model (DCSBM) is a popular model to generate random graphs with community structure given an expected degree sequence. The standard approach of community detection algorithms based on the DCSBM is to search for the model parameters which are the most likely to have produced the observed network data, via maximum likelihood estimation (MLE). Current techniques for the MLE problem are heuristics and therefore do not guarantee convergence to the optimum. We present
mathematical programming formulations and exact solution methods that can provably find the model parameters and community assignments of maximum likelihood given an observed graph. We compare the proposed exact methods with classical heuristic algorithms based on expectation-maximization (EM).
The solutions given by exact methods give us a principled way of recognizing when heuristic solutions are sub-optimal and measuring how far they are from optimality.
|
324 |
[en] HEURISTICS FOR DATA POINT SELECTION FOR LABELING IN SEMI-SUPERVISED AND ACTIVE LEARNING CONTEXTS / [pt] HEURÍSTICAS PARA SELEÇÃO DE PONTOS PARA SEREM ANOTADOS NO CONTEXTO DEAPRENDIZADO SEMI- SUPERVISIONADO E ATIVOSONIA FIOL GONZALEZ 16 September 2021 (has links)
[pt] O aprendizado supervisionado é, hoje, o ramo do aprendizado de máquina
central para a maioria das inovações nos negócios. A abordagem depende de
ter grandes quantidades de dados rotulados, suficiente para ajustar funções com a precisão necessária. No entanto, pode ser caro obter dados rotulados ou criar os rótulos através de um processo de anotação. O aprendizado semisupervisionado (SSL) é usado para rotular com precisão os dados a partir de
pequenas quantidades de dados rotulados utilizando técnicas de aprendizado
não supervisionado. Uma técnica de rotulagem é a propagação de rótulos.
Neste trabalho, usamos especificamente o algoritmo Consensus rate-based label
propagation (CRLP). Este algoritmo depende do uma função de consenso para
a propagação. Uma possível função de consenso é a matriz de co-associação
que estima a probabilidade dos pontos i e j pertencem ao mesmo grupo. Neste trabalho, observamos que a matriz de co-associação contém informações
valiosas para tratar esse tipo de problema. Quando nenhum dado está rotulado, é comum escolher aleatoriamente, com probabilidade uniforme, os dados a serem rotulados manualmente, a partir dos quais a propagação procede. Este
trabalho aborda o problema de seleção de um conjunto de tamanho fixo de
dados para serem rotulados manualmente que propiciem uma melhor precisão
no algoritmo de propagação de rótulos. Três técnicas de seleção, baseadas
em princípios de amostragem estocástica, são propostas: Stratified Sampling
(SS), Probability (P), and Stratified Sampling - Probability (SSP). Eles são
todos baseados nas informações embutidas na matriz de co-associação. Os
experimentos foram realizados em 15 conjuntos de benchmarks e mostraram
resultados muito interessantes. Não só, porque eles fornecem uma seleção
mais equilibrada quando comparados a uma seleção aleatória, mas também
melhoram os resultados de precisão na propagação de rótulos. Em outro
contexto, essas estratégias também foram testadas dentro de um processo de
aprendizagem ativa, obtendo também bons resultados. / [en] Supervised learning is, today, the branch of Machine Learning central
to most business disruption. The approach relies on having amounts of labeled
data large enough to learn functions with the required approximation.
However, labeled data may be expensive, to obtain or to construct through
a labeling process. Semi-supervised learning (SSL) strives to label accurately data from small amounts of labeled data and the use of unsupervised learning techniques. One labeling technique is label propagation. We use specifically the Consensus rate-based label propagation (CRLP) in this work. A consensus function is central to the propagation. A possible consensus function is a coassociation
matrix that estimates the probability of data points i and j belong to the same group. In this work, we observe that the co-association matrix has valuable information embedded in it. When no data is labeled, it is common to choose with a uniform probability randomly, the data to manually label, from which the propagation proceeds. This work addresses the problem of selecting
a fixed-size set of data points to label (manually), to improve the label propagation algorithm s accuracy. Three selection techniques, based on stochastic sampling principles, are proposed: Stratified Sampling (SP), Probability (P), and Stratified Sampling - Probability (SSP). They are all based on the information embedded in the co-association matrix. Experiments were carried out on 15 benchmark sets and showed exciting results. Not only because they provide a more balanced selection when compared to a uniform random selection, but also improved the accuracy results of a label propagation method. These strategies were also tested inside an active learning process in a different
context, also achieving good results.
|
325 |
Percepção da escola-campo sobre o estágio supervisionado em Biologia: contribuições para uma avaliação curricular. / Perception of School-field on the Stage Supervised in Biology: an assessment of contributions to Curriculum EvaluationSOUSA, Ana Lourdes Lucena de January 2009 (has links)
SOUSA, Ana Lourdes Lucena de. Percepção da escola-campo sobre o estágio supervisionado em biologia: contribuições para uma avaliação curricular. 2009. 168f. Dissertação (Mestrado em Educação) – Universidade Federal do Ceará, Faculdade de Educação, Programa de Pós-Graduação em Educação Brasileira, Fortaleza-CE, 2009. / Submitted by Raul Oliveira (raulcmo@hotmail.com) on 2012-07-03T16:35:24Z
No. of bitstreams: 1
2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5) / Approved for entry into archive by Maria Josineide Góis(josineide@ufc.br) on 2012-07-20T16:12:36Z (GMT) No. of bitstreams: 1
2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5) / Made available in DSpace on 2012-07-20T16:12:36Z (GMT). No. of bitstreams: 1
2009_dis_ALLSousa.pdf: 892196 bytes, checksum: 700159549eb556b82af6de4051c25ba3 (MD5)
Previous issue date: 2009 / This research project has as main purpose understanding supervised stage activities, under school manager’s and teacher´s point-of-view, seeing that they are responsible for the teachers-students reception at school. For one semester class period, the field-school was analyzed in its structure and action, as well as the supervised stage considering practical reflexive documental theory. Gestalt’s theory was used to comprehend the researched object that is the relationship between field-school and university reffering to a Biology major, through supervised stage. This work’s components are introduction and four chapters supplied in Franco and Ghedin’s (2008) Marleau Ponty’s (2006) Vianna´s (2000) Romanelli’s (2006) Fusary’s (1987) Pimenta and Lima’s (1993) studies, among others, beyond legal documents published by MEC and CNE. The research has based itself in the evaluative methodology, that can make possible the aggregation of the qualitative research procedures in the knowledge and learning construction. Both of these can give real mean to the study purpose reflection, analysis and evaluation. The qualitative research in phenomenological basis helped to understand data that has marked the space/time of the research. The most important results in this investigation are constituted by these points of reflection: the school managers and Biology teachers perception about supervised stage offered formative elements to the searcher, because they increased the learning field in education area and in the time spent inside public school. That was very important also for the teachers involved in this research through the opportunity of reflection, when they discussed their life experience. Biology teachers respect their knowledge area and hava Biology as The Science of Life. They also hope the teachers-students can help them encourage the students, because keeping the dialog is very difficult, when the class is disarticulated. The searcher marked her presence in the school, inviting to do a work involving school and university, that is an emergency. Teachers formation needs to increase the dialogue in the real spaces where it happens. / A presente pesquisa teve como objetivo principal compreender o Estágio a partir da percepção e avaliação dos gestores e dos professores que recebem os estagiários. Teve a preocupação de conhecer a escola-campo, em sua estrutura e funcionamento, no decorrer de um semestre letivo, bem como investigar o Estágio curricular supervisionado a partir das reflexões teóricas, práticas, documentais. Foi utilizada a teoria da Gestalt para compreender o objeto de estudo – a relação entre a Escola-Campo e a universidade, no tocante à formação de professores, através do Estágio Curricular Supervisionado, nos cursos de Licenciatura em Biologia. Distribuído em introdução e quatro capítulos, utilizou como aporte teórico os estudos de Franco e Ghedin (2008), Merleau Ponty (2006), Vianna (2000), Saviani (1996, 2009), Pimenta (1993, 2002, 2006), Romanelli (2006), Fusari (1987), Pimenta e Lima (2004), entre outros, além dos documentos legais redigidos e publicados pelo MEC e CNE. A pesquisa apoiou-se na metodologia avaliativa, que permite que os procedimentos da pesquisa qualitativa se agreguem na construção de conhecimentos e aprendizagens que dão significado à reflexão - análise e avaliação curricular. A entrevista qualitativa de base fenomenológica auxiliou na compreensão dos dados que marcaram o espaço/tempo da pesquisa. Os principais achados desta investigação constituíram os seguintes pontos de reflexão: a percepção dos gestores e professores de Biologia sobre o Estágio, os quais ofereceram elementos formativos para a pesquisadora, uma vez que alargou o campo de aprendizagens no campo da pesquisa educacional e na vivência com o cotidiano da escola pública. Para os educadores entrevistados foi também uma oportunidade de reflexão, quando passaram a elaborar suas experiências de vida, formação. Os professores de Biologia demonstram respeito por sua área de conhecimento e reafirmam a valorização da Biologia, enquanto ciência da vida. Esperam que os estagiários os ajudem a incentivar os alunos, pois estes se encontram desmotivados, o que dificulta o diálogo. Esta pesquisa registra um tempo difícil para a escola, por conta do envolvimento dos seus gestores com processos eletivos. Na passagem dos estagiários e da pesquisadora, ficou o convite para a reflexão e a proposta de um trabalho coletivo que envolva a escola e a universidade; A complexidade das relações entre a Universidade e as Escolas está longe de ser compreendida se não houver diálogo sobre a formação com qualidade do professor, nos espaços concretos em que ela acontece.
|
326 |
Agrupamento de sequências de miRNA utilizando aprendizado não-supervisionado baseado em grafosKasahara, Viviani Akemi 12 August 2016 (has links)
Submitted by Izabel Franco (izabel-franco@ufscar.br) on 2016-10-11T17:36:54Z
No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:21Z (GMT) No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-21T13:03:27Z (GMT) No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5) / Made available in DSpace on 2016-10-21T13:03:34Z (GMT). No. of bitstreams: 1
DissVAK.pdf: 4608619 bytes, checksum: 3022034b9035e4e8caf1195902d24581 (MD5)
Previous issue date: 2016-08-12 / Não recebi financiamento / Cluster analysis is the organization of a collection of patterns into clusters based on similarity
which is determined by using properties of data. Clustering techniques can be useful in a
variety of knowledge domains such as biotechnology, computer vision, document retrieval and
many others. An interesting area of biology involves the concept of microRNAs (miRNAs) that
are approximately 22 nucleotide-long non-coding RNA molecules that play important roles in
gene regulation. Clustering miRNA sequences can help to understand and explore sequences
belonging to the same cluster that has similar biological functions. This research work
investigates and explores seven unsupervised clustering algorithms based on graphs that can be
divided into three categories: algorithm based on region of influence, algorithm based on
minimum spanning tree and spectral algorithm. To assess the contribution of the proposed
algorithms, data from miRNA families stored in the online miRBase database were used in the
conducted experiments. The results of these experiments were presented, analysed and
evaluated using clustering validation indexes as well as visual analysis. / A análise de agrupamento é uma organização de coleção de padrões em grupos, baseando-se na
similaridade das propriedades pertencentes aos dados. A técnica de agrupamento pode ser
utilizado em muitas áreas de conhecimento como biotecnologia, visão computacional,
recuperação de documentos, entre outras. Uma área interessante da biologia envolve o conceito
de microRNAs (miRNAs), que são moléculas não-codificadas de RNA com aproximadamente
22 nucleotídeos e que desempenham um papel importante na regulação dos genes. O
agrupamento de sequências de miRNA podem ajudar em sua exploração e entendimento, pois
as sequências que pertencem ao mesmo grupo possuem uma função biológica similar. Esse
trabalho explora e investiga sete algoritmos de agrupamentos não-supervisionados baseados em
grafos que podem ser divididos em três categorias: algoritmos baseados em região de
influência, algoritmos baseados em árvore spanning minimal e algoritmo espectral. Para avaliar
a contribuição dos algoritmos propostos, os experimentos conduzidos utilizaram os dados das
famílias de miRNAs disponíveis no banco de dados denominado miRBase. Os resultados dos
experimentos foram apresentados, analisados e avaliados usando índices de validação de
agrupamento e análise visual.
|
327 |
[en] CONVOLUTIONAL NETWORKS APPLIED TO SEMANTIC SEGMENTATION OF SEISMIC IMAGES / [pt] REDES CONVOLUCIONAIS APLICADAS À SEGMENTAÇÃO SEMÂNTICA DE IMAGENS SÍSMICASMATEUS CABRAL TORRES 10 August 2021 (has links)
[pt] A partir de melhorias incrementais em uma conhecida rede neural convolucional (U-Net), diferentes técnicas são avaliadas quanto às suas performances na tarefa de segmentação semântica em imagens sísmicas. Mais especificamente, procura-se a identificação e delineamento de estruturas salinas no subsolo, o que é de grande relevância na indústria de óleo e gás para a exploração de petróleo em camadas pré-sal, por exemplo. Além disso, os desafios apresentados no tratamento destas imagens sísmicas se assemelham em muito aos encontrados em tarefas de áreas médicas como identificação de tumores e segmentação de tecidos, o que torna o estudo da tarefa em questão ainda mais valioso.
Este trabalho pretende sugerir uma metodologia adequada de abordagem à tarefa e produzir redes neurais capazes de segmentar imagens sísmicas com bons resultados dentro das métricas utilizadas. Para alcançar estes objetivos, diferentes estruturas de redes, transferência de aprendizado e técnicas de aumentação de dados são testadas em dois datasets com diferentes níveis de complexidade. / [en] Through incremental improvements in a well-known convolutional neural network (U-Net), different techniques are evaluated regarding their performance on the task of semantic segmentation of seismic images. More specifically, the objective is the better identification and outline of subsurface salt structures, which is a task of great relevance for the oil and gas industry in the exploration of pre-salt layers, for example. Besides that application, the challenges imposed by the treatment of seismic images also resemble those found in medical fields like tumor detection and tissue segmentation, which makes the study of this task even more valuable. This work seeks to suggest a suitable methodology for the task and to yield neural networks that are capable of performing semantic segmentation of seismic images with good results regarding specific metrics. For that purpose, different network structures, transfer learning and data augmentation techniques are applied in two datasets with different levels of complexity.
|
328 |
[en] A SUPERVISED LEARNING APPROACH TO PREDICT HOUSEHOLD AID DEMAND FOR RECURRENT CLIME-RELATED DISASTERS IN PERU / [pt] UMA ABORDAGEM DE APRENDIZADO SUPERVISIONADO PARA PREVER A DEMANDA DE AJUDA FAMILIAR PARA DESASTRES CLIMÁTICOS RECORRENTES NO PERURENATO JOSE QUILICHE ALTAMIRANO 21 November 2023 (has links)
[pt] Esta dissertação apresenta uma abordagem baseada em dados para
o problema de predição de desastres recorrentes em países em
desenvolvimento. Métodos de aprendizado de máquina supervisionado são
usados para treinar classificadores que visam prever se uma família seria
afetada por ameaças climáticas recorrentes (um classificador é treinado
para cada perigo natural). A abordagem desenvolvida é válida para perigos
naturais recorrentes que afetam um país e permite que os gerentes de risco
de desastres direcionem suas operações com mais conhecimento. Além
disso, a avaliação preditiva permite que os gerentes entendam os
impulsionadores dessas previsões, levando à formulação proativa de
políticas e planejamento de operações para mitigar riscos e preparar
comunidades para desastres recorrentes.
A metodologia proposta foi aplicada ao estudo de caso do Peru, onde
foram treinados classificadores para ondas de frio, inundações e
deslizamentos de terra. No caso das ondas de frio, o classificador tem
73,82% de precisão. A pesquisa descobriu que famílias pobres em áreas
rurais são vulneráveis a desastres relacionados a ondas de frio e precisam
de intervenção humanitária proativa. Famílias vulneráveis têm
infraestrutura urbana precária, incluindo trilhas, caminhos, postes de
iluminação e redes de água e drenagem. O papel do seguro saúde, estado
de saúde e educação é menor. Domicílios com membros doentes levam a
maiores probabilidades de serem afetados por ondas de frio. Maior
realização educacional do chefe da família está associada a uma menor
probabilidade de ser afetado por ondas de frio. No caso das inundações, o classificador tem 82.57% de precisão.
Certas condições urbanas podem tornar as famílias rurais mais suscetíveis
a inundações, como acesso à água potável, postes de iluminação e redes
de drenagem. Possuir um computador ou laptop diminui a probabilidade de
ser afetado por inundações, enquanto possuir uma bicicleta e ser chefiado
por indivíduos casados aumenta. Inundações são mais comuns em
assentamentos urbanos menos desenvolvidos do que em famílias rurais
isoladas.
No caso dos deslizamentos de terra, o classificador tem 88.85% de
precisão, e é segue uma lógica diferente do das inundações. A importância
na previsão é mais uniformemente distribuída entre as características
consideradas no aprendizado do classificador. Assim, o impacto de um
recurso individual na previsão é pequeno. A riqueza a longo prazo parece
ser mais crítica: a probabilidade de ser afetado por um deslizamento é
menor para famílias com certos aparelhos e materiais domésticos de
construção. Comunidades rurais são mais afetadas por deslizamentos,
especialmente aquelas localizadas em altitudes mais elevadas e maiores
distâncias das cidades e mercados. O impacto marginal médio da altitude
é não linear.
Os classificadores fornecem um método inteligente baseado em
dados que economiza recursos garantindo precisão. Além disso, a
pesquisa fornece diretrizes para abordar a eficiência na distribuição da
ajuda, como formulações de localização da instalação e roteamento de
veículos.
Os resultados da pesquisa têm várias implicações gerenciais, então
os autores convocam à ação gestores de risco de desastres e outros
interessados relevantes. Desastres recorrentes desafiam toda a
humanidade. / [en] This dissertation presents a data-driven approach to the problem of predicting recurrent disasters in developing countries. Supervised machine learning methods are used to train classifiers that aim to predict whether a household would be affected by recurrent climate threats (one classifier is trained for each natural hazard). The approach developed is valid for recurrent natural hazards affecting a country and allows disaster risk managers to target their operations with more knowledge. In addition, predictive assessment allows managers to understand the drivers of these predictions, leading to proactive policy formulation and operations planning to mitigate risks and prepare communities for recurring disasters. The proposed methodology was applied to the case study of Peru, where classifiers were trained for cold waves, floods, and landslides. In the case of cold waves, the classifier was 73.82% accurate. The research found that low-income families in rural areas are vulnerable to cold wave related disasters and need proactive humanitarian intervention. Vulnerable families have poor urban infrastructure, including footpaths, roads, lampposts, and water and drainage networks. The role of health insurance, health status, and education is minor. Households with sick members are more likely to be affected by cold waves. Higher educational attainment of the head of the household is associated with a lower probability of being affected by cold snaps.In the case of flooding, the classifier is 82.57% accurate. Certain urban conditions, such as access to drinking water, lampposts, and drainage networks, can make rural households more susceptible to flooding. Owning a computer or laptop decreases the likelihood of being affected by flooding while owning a bicycle and being headed by married individuals increases it. Flooding is more common in less developed urban settlements than isolated rural families.In the case of landslides, the classifier is 88.85% accurate and follows a different logic than that of floods. The importance of the prediction is more evenly distributed among the features considered when learning the classifier. Thus, the impact of an individual feature on the prediction is small. Long-term wealth is more critical: the probability of being affected by a landslide is lower for families with specific appliances and household building materials. Rural communities are more affected by landslides, especially those located at higher altitudes and greater distances from cities and markets. The average marginal impact of altitude is non-linear.The classifiers provide an intelligent data-driven method that saves resources by ensuring accuracy. In addition, the research provides guidelines for addressing efficiency in aid distribution, such as facility location formulations and vehicle routing.The research results have several managerial implications, so the authors call for action from disaster risk managers and other relevant stakeholders. Recurrent disasters challenge all of humanity.
|
Page generated in 0.0998 seconds