• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 124
  • 7
  • 1
  • Tagged with
  • 132
  • 132
  • 82
  • 55
  • 25
  • 24
  • 24
  • 23
  • 22
  • 19
  • 16
  • 15
  • 14
  • 14
  • 14
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Avaliação estocástica de consumo de energia no projeto de sistemas embarcados

Ferreira de Carvalho, Fernando January 1900 (has links)
Made available in DSpace on 2014-06-12T16:01:10Z (GMT). No. of bitstreams: 2 arquivo7172_1.pdf: 1565371 bytes, checksum: a4c9f8056570573663538f45f3b2ce86 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 1 / Universidade de Pernambuco / Em metodologias de projeto de sistemas embarcados, ambientes de suporte à tomada de decisões são de grande importância, principalmente quando o projeto de tais sistemas deve considerar restrições de desempenho, consumo de energia etc. Este trabalho trata sobre estimativa de potência no desenvolvimento de sistemas digitais embarcado. A metodologia proposta baseia-se em uma extensão de modelo das redes de Petri estocástica generalizadas (Generalized Stochastic Petri Net - GSPN), denominada Power-GSPN. Este trabalho apresenta um conjunto de métricas que permitem avaliar o consumo de energia, potência, autonomia e o desempenho dos sistemas. A utilização das redes de Petri é de grande importância dada sua fundamentação matemática, a possibilidade de representar sistemas paralelos, síncronos e concorrentes, além de suportar, em um único modelo, especificação, validação, análise de desempenho, estimativa e documentação
52

Introdução ao Cálculo de Malliavin e uma Aplicação em Finanças

Antunes, Camilla 06 July 2018 (has links)
Submitted by Camilla Antunes Silva (camillantunes@gmail.com) on 2018-08-03T17:19:02Z No. of bitstreams: 1 DissertacaoCamilla.pdf: 5244367 bytes, checksum: 9756ab39ef0bc845b78f13156bb9eee7 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2018-09-03T18:50:34Z (GMT) No. of bitstreams: 1 DissertacaoCamilla.pdf: 5244367 bytes, checksum: 9756ab39ef0bc845b78f13156bb9eee7 (MD5) / Made available in DSpace on 2018-09-11T13:51:44Z (GMT). No. of bitstreams: 1 DissertacaoCamilla.pdf: 5244367 bytes, checksum: 9756ab39ef0bc845b78f13156bb9eee7 (MD5) Previous issue date: 2018-07-06 / Um dos métodos de análise de derivativos financeiros é o estudo de seu comportamento em relação a variações do seu ativo subjacente. Quando o payoff do derivativo não é uma função suave, temos problemas para calcular esse comportamento. Usamos o Cálculo de Malliavin para encontrar um método para calcular a primeira derivada do preço em relação ao valor inicial do ativo subjacente mesmo quando o payoff correspondente não é diferenciável. Para isso, estudamos a derivada de Malliavin e seu adjunto, a integral de Skorohod. / One of the methods of analyzing financial derivatives is the study of their behavior in relation to variations in the underlying asset. When the derivative payoff is not a smooth function, we have trouble calculating this behavior. We use Malliavin calculus to find a method to calculate the first derivative of price in relation to the initial value of the underlying asset even when the corresponding payoff is not differentiable. For this, we study the derivative of Malliavin and its adjoint, the Skorohod integral.
53

Teoria do momento angular em sistemas complexos / Theory of angular momentum in complex systems

Gilberto Medeiros Nakamura 16 May 2017 (has links)
A emergência de fenômenos coletivos e correlações de longo alcance impossibilitam a inferência de propriedades de sistemas como um todo a partir de suas partes componentes. A modelagem destes sistemas frequentemente ocorre mediante emprego de operadores de spin localizados em grafos com topologias não-triviais. Aqui, mostramos que o operador de momento angular de muitos corpos une o estudo de diversos sistemas complexos, desde a sistemas epidêmicos até cadeias magnéticas de spin. Para o modelo epidêmico SIS, determinamos a matriz de transição do processo estocástico correspondente e mostramos suas soluções para grafos regulares e aleatórios, por meio de técnicas geralmente empregadas em sistemas fortemente correlacionados. Já no modelo de Dicke, identificamos o vínculo que explica a relevância e o efeito finito de operadores anti-girantes para duas espécies atômicas confinadas numa cavidade óptica que interagem com radiação eletromagnética. Por fim, o papel do momento angular também é identificado para duas cadeias quânticas de spin 1/2 acopladas, as quais modelam nanoestruturas magnéticas heterogêneas. A estrutura de bandas é calculada, enquanto efeitos espúrios de superfície são removidos pela introdução de quasipartículas dotadas de grau de liberdade de spin adicional / The emergence of collective phenomena and long range correlations makes it impossible to infer the properties of whole systems from their components. Their modeling often occurs through the use of localized spin operators, taking place within graphs with non-trivial topologies. Here, we show that the many-body angular momentum operator connects the study of several complex systems, ranging from epidemic systems to magnetic spinchains. For the SIS epidemic model, we calculate the transition matrix of the corresponding stochastic process and show the corresponding solutions for regular and random graphs, using techniques generally employed in strongly correlated systems. For the Dicke model we identify the constraint that explains the relevance and finite size effect of anti-rotating operators, for two atomic species, confined within an optical cavity, and interacting with electromagnetic radiation. Finally, the role of angular momentum is also identified for two coupled quantum spinchains 1/2 which model heterogeneous magnetic nanostructures. The band structure is calculated, while spurious surface effects are removed due to the introduction of quasiparticles with an additional spin degree of freedom.
54

Otimização de amostragem espacial / Optimization of sampling space

Luciana Pagliosa Carvalho Guedes 10 April 2008 (has links)
O objetivo desse trabalho foi estabelecer planos de amostragem com redução no tamanho amostral, a partir de conjuntos de dados com dependência espacial, que fossem eficientes na predição de localizações não amostradas e que gerassem estimativas eficientes de características relacionadas na predição espacial. Esses planos amostrais reduzidos foram obtidos por processos de otimização denominados recozimento simulado e algoritmo genético híbrido, considerando a média da variância da predição espacial, obtida pelo método de interpolação chamado krigagem, como função objetivo minimizada. Para isso, utilizaram-se conjuntos de dados simulados, com diferentes valores de alcance e efeito pepita, cujo intuito foi identificar a influência que esses parâmetros exercem na escolha da configuração amostral otimizada. Para cada conjunto de dados simulados, foram obtidas amostras pelos processos de otimização e seus resultados foram comparados aos esquemas de amostragem: aleatório, sistemático, sistemático centrado adicionado de delineamentos menores e sistemático centrado adicionado de pontos próximos. Os resultados mostraram que os planos de amostragem otimizados, principalmente os planos obtidos pelo algoritmo genético híbrido, produziram menores estimativas para a média da variância da krigagem e melhores estimativas para a porcentagem e soma de valores preditos acima do terceiro quartil e do percentil 90, que s~ao características relacionadas na predição espacial. Observou-se, também, que o aumento do tamanho amostral produziu melhores estimativas para todos os resultados analisados e, independente do valor de alcance e efeito pepita, a amostragem otimizada pelo algoritmo genético híbrido produziu melhores resultados. Além disso, obtiveram-se conjuntos amostrais reduzidos de 128 parcelas pelo algoritmo genético híbrido, pelo processo de recozimento simulado e pelas amostragens aleatória e sistemática, para a propriedade química teor de potássio pertencente ao conjunto de dados, com 256 parcelas, de um experimento de agricultura de precisão em uma área experimental. Por intermédio dos dados resultantes dessas amostragens, realizou-se uma analise geoestatística para identificar o comportamento de dependência espacial da variável potássio na área e foram feitas predições espaciais do potássio em localizações n~ao amostradas nessa mesma área. Em todos os esquemas de amostragem utilizados, os valores preditos foram classificados segundo o critério de adubação do potássio no Paraná em culturas de soja (EMATER - Empresa Paranaense de Assistência Técnica e Extensão Rural, 1998). Esses resultados foram comparados com a analise realizada no conjunto de dados inicial e observou-se uma maior similaridade desses resultados com os obtidos pela analise realizada através dos dados da amostragem obtida pelo algoritmo genético híbrido. Assim, tiveram-se evidências de que a redução em 50% do tamanho amostral do conjunto de dados da variável potássio, utilizando nessa redução uma amostragem obtida pelo algoritmo genético híbrido, produziu resultados eficientes para a classificação de adubação de potássio na área em estudo, reduzindo em 50% os custos 8 com analise química do solo, sem grande perda de eficiência nas conclusões obtidas pela predição espacial. / The aim of this work was to establish plans for sampling with reduced in the sample size, from sets of dependent spatial data, and they are eficients in terms of prediction of the nonsampled observations and prediction of linear targets. These plans were obtained by sampling reduced processes optimization of the algorithm called simulated annealing and hybrid genetic algorithm, considering the average kriging variance as objective function to be minimised. Therefore, it was used simulated data sets, With diferent values of range and nugget efect, whose aim was to identify the in uence that these exercise parameters in choosing the sample configuration foptimized. For each set of data simulated samples were obtained through the optimization process and its results were compared to sampling schemes: random, systematic, lattice plus in ll and lattice plus close pairs. The results show that the sampling plans optimized, especially the plans obtained by hybrid genetic algorithm, produced lower estimates for the average kriging variance and best estimates for the percentage and amount of predicted values above the third quartile and the 90 percentile, which are characteristics related to spatial prediction. It was also observed that the increase of sample size produces best estimate for all results analyzed and independent of the value range and nugget efect, sampling optimized by the hybrid genetic algorithm produced better results. In addition, sets up sampling reduced of 128 samples by sampling schemes: hybrid genetic algorithm, simulated annealing, random and systematic, for the property belonging to the chemical potassium set data, with 256 samples, an experiment of precision agriculture, in an experimental area. Through these sampling data, an analysis was carried out geostatistics to identify the behavior of spatial dependence of the variable potassium in the area under study and predictions were made of potassium space in locations not sampled that same area. In all sampling schemes used, the predicted values were classified at the discretion of the potassium fertilization in the cultivation of soybeans in Parana (EMATER-PARANA, 1998). These results were compared with the analysis in the initial set of data and there was a greater similarity of these results with those obtained by the analysis performed by data obtained by the sampling hybrid genetic algorithm. So there has been evidence that the reduction by 50% of the sample size of the data set of variable potassium, using this reduction a sample obtained by the hybrid genetic algorithm, produced efective results for classification of potassium fertilizer in the area under study, reducing by 50% the costs with chemical analysis of soil, without much loss of eficiency in the conclusions obtained by predicting space.
55

Estudo matemático do mecanismo de regulação da esquistossomíase / Mathematical study of the mechanism of regulation of schistosomiasis

Hyun Mo Yang 16 October 1990 (has links)
Neste trabalho foram estudados dois mecanismos de regulação de esquistossomíase: a nível de hospedeiro intermediário (Modelo de May) e a nível de hospedeiro definitivo (Modelo de Imunidade Concomitante por período de incubação). Estudou-se como ambos os modelos comportam se quando da introdução de um modelo de regulação para a população do hospedeiro intermediário. Verificou-se que o modelo de regulação por imunidade concomitante é muito mais robusto, pois além de ajustar melhor a curva de prevalência fornece uma região de estabilidade para os parâmetros epidemiológicos muito maior. / In this work two mechanisms for the regulation of the schistosomiasis were studied. In one model the regulation takes place at the intermediate host (May Model) and in the other model the regulation takes place at the definitive host (concomitant Immunity) . In both models the regulation of the intermediate host population was also included. It was found that regulation in the definitive host is much more robust than the regulation on the intermediate host allowing for a much greater range of the epidemiological parameters. Also the model of regulation on the definitive host allows for a very good fit of the prevalence curve.
56

Cenários sintéticos de radiação solar para estudos energéticos. / Solar radiation synthetic sequences for energy studies.

Gemignani, Matheus Mingatos Fernandes 27 June 2018 (has links)
Esta tese apresenta os resultados de pesquisa sobre geração de séries sintéticas de radiação solar para estudos energéticos, realizada através do uso de modelos estocásticos e com o propósito de desenvolver método para aplicações práticas no setor elétrico. Para tanto, inicialmente foi levantado o estado da arte do tema, com revisão da literatura de séries temporais e de processos estocásticos, suas particularidades e potencialidades, complementado pela contextualização do uso de cenários no setor elétrico nacional, especialmente na operação e planejamento do sistema hidrotérmico, e por experiências internacionais na modelagem do recurso solar. A modelagem das séries utilizou dados reais de localidades do nordeste brasileiro e foi desenvolvida através do método de Box-Jenkins, realizando-se estudos de alternativas para cada uma de suas etapas. O pré-tratamento dos dados foi avaliado por três estratégias de remoção da tendência das séries e na estimativa dos coeficientes dos modelos foram comparados os métodos de Yule-Walker e dos mínimos quadrados. As análises consideraram quatro opções de modelos autorregressivos e os períodos horário, diário e mensal. O modelo autorregressivo convencional com intervalo mensal, identificado como o mais adequado para aplicação em estudos energéticos, e sua variação periódica foram implementados e avaliados com maior profundidade. Este estudo complementar considerou diferentes ordens de atraso e realizou comparações dos resultados por três métodos de cálculo do erro. O modelo desenvolvido com estrutura autorregressiva periódica de primeira ordem apresentou resultados satisfatórios e significativamente superiores aos dos demais modelos. Por fim, este modelo foi empregado na geração de séries sintéticas, criando 1.000 cenários de radiação solar mensal, posteriormente aplicados em modelo de contrato de venda de energia para avaliação de estratégias de participação em leilões, em análise de riscos de suprimento e em estimativa probabilística da receita esperada por parques geradores. / This thesis presents the results of a research on the generation of solar radiation synthetic sequences for energy studies, carried out through the use of stochastic models and with the purpose of developing a method for practical applications in the electric sector. In order to do so, the state of the art was devised through a review of the literature of time series and stochastic processes, their particularities and potentialities, complemented by the contextualization of the use of scenarios in the national electricity sector, especially in the hydrothermal system operation and planning, and international experiences in modeling the solar resource. The series modeling used real data from localities in the Brazilian Northeast and was developed through the Box-Jenkins method, carrying out alternative studies for each of its stages. The data pretreatment has been evaluated by three strategies for the series trend removal and by the methods of least squares and of Yule-Walker for the estimation of the model coefficients. The analysis considered four options of autoregressive models and hourly, daily and monthly periods. The conventional autoregressive model with monthly interval, identified as the most applications in energy studies, and its periodic variation were implemented and evaluated in greater depth. This complementary study considered different orders of delay and made comparisons of the results for three error calculation methods. The model developed with periodic autoregressive structure of first order presented results that are satisfactory and significantly superior than the other models. Finally, this model was used in the generation of synthetic series, creating 1,000 scenarios of monthly solar radiation, to be later applied in a model of power purchase agreement to evaluate strategies for auctions bidding, analysis of supply risks and probabilistic estimation of the expected revenue of power plants.
57

Generalização e Robustez: Aprendizagem em Redes Neurais na Presença de Ruído / Generalization and robustness: learning in neural networks in the presence of noise

Simonetti, Roberta 09 May 1997 (has links)
Neste trabalho investigamos o aprendizado supervisionado on-line, com ênfase nas habilidades de generalização, de redes neurais feedforward. O estudo de algoritmos de aprendizagem ótimos, no sentido da generalização, é estendido para duas diferentes classes de arquiteturas: a máquina paridade com estrutura de árvore e K unidades escondidas, e o perceptron reversed wedge, uma máquina de uma camada com função de transferência não monotônica. O papel do ruído é de fundamental importância na teoria de aprendizagem. Neste trabalho estudamos os processos com ruído que podem ser parametrizados por uma única quantidade, o nível de ruído. No caso da máquina paridade analisamos o aprendizado na presença de ruído multiplicativo (na saída). O algoritmo ótimo é muito superior aos algoritmos de aprendizagem até então apresentados, como o algoritmo de mínima ação (LAA), como podemos ver, por exemplo, através do comportamento do erro de generalização que decai após a apresentação de p exemplos, com l/p ao invés de l/\'p POT. 1/3\' como no caso do LAA. Além deste fato, observa-se que não existe um nível de ruído crítico a partir do qual a rede não é capaz de generalizar, como ocorre no LAA. Além do ruído multiplicativo, no caso do perceptron reversed wedge consideramos também o ruído aditivo. Analisamos a função de modulação fornecida pelo algoritmo ótimo e as curvas de aprendizagem. A aprendizagem ótima requer o uso de parâmetros que usualmente não estão disponíveis. Neste caso estudamos a influência da utilização de uma estimativa do nível de ruído sobre as curvas de aprendizado. Estes resultados são apresentados na forma do que chamamos de diagrama de robustez, no espaço de nível de ruído real versus nível de ruído estimado. As linhas de transição deste diagrama definem regiões com comportamentos dinâmicos diferentes. Entre as propriedades mais interessantes encontradas, destacamos a universalidade do diagrama de robustez para ruído multiplicativo, uma vez que é exatamente o mesmo para a máquina paridade e comitê com estrutura de árvore, e para o perceptron reversed-wedge. Entretanto, esta universalidade não se estende para o caso de ruído aditivo, uma vez que, neste caso, os diagramas dependem da arquitetura em questão. / In this work online supervised learning is investigated with emphasis on the generalization abilities of feedforward neural networks. The study of optimal learning algorithms, in the sense of generalization, is extended to two different classes of architectures; the tree parity machine (PM) with K hidden units and the reverse wedge perceptron (RWP), a single layer machine with a non monotonic transfer function. The role of noise is of fundamental importance in learning theory, and we study noise processes which can be parametrized by a single quantity, the noise level. For the PM we analize learning in the presence of multiplicative or output noise. The optimal algorithm is far superior than previous learning algorithms, such as the Least Action Algorithm (LAA), since for example, the generalization error\'s decay is proportional to l /p instead of l/\'p POT. 1/3\' for the LAA, after p examples have been used for training. Furthermore there is no critical noise level, beyond which no generalization ability is attainable, as is the case for the LAA. For the RW perceptron in addition to multiplicative noise we also consider additive noise. The optimal algorithm modulation function and the learning curves are analized. Optimal learning requires using certain usually unavailable parameters. In this case, we study the influence that misevaluation of the noise levels has on the learning curves. The results are presented in terms of what we have called Robustness Phase Diagrams (RPD), in a space of real noise level against assumed noise level. The RPD boundary lines separate between different dynamical behaviours. Among the most interesting properties, we have found the universality of the RPD for multiplicative noise, since it is exactly the same for the PM, RWP and the tree committee machine. However this universality does not hold for the additive noise case, since RPD\'s are shown to be architecture dependent.
58

Análise de um sistema de navegação para veículo submarino autônomo. / Navigation system analysis for autonomous underwater vehicles.

Diana, Rodrigo Eiji Yamagata 07 May 2018 (has links)
O ambiente aquático tem notória importância para a pesquisa, pela biodiversidade e vastidão, e também do ponto de vista comercial, para a indústria militar e de óleo&gás por exemplo. Entretanto, a sua exploração é prejudicada por diversos fatores, entre eles devido à dificuldade de navegação. Infelizmente, carece-se de sinal GPS (Global Positioning System) embaixo d\'água, o que exige outras técnicas de localização. Assim, este trabalho analisa um sistema de navegação para um veículo submarino autônomo. Graças a sensores de velocidade, girômetros, bússola, entre outros, aplica-se o princípio de dead reckoning para calcular a posição atual do veículo a partir da última posição conhecida. Para tal, é feito inicialmente um estudo dos sensores a serem utilizados e um algoritmo de navegação é proposto, cujos resultados são expressos em coordenadas geodésicas (latitude e longitude), permitindo a visualização da trajetória do veículo em mapas geo-referenciados. Além disso, problemas práticos de medição são tratados. Em seguida, é feito um estudo sobre o ruído dos sensores, utilizando a curva de variância de Allan para caracterização dos sinais dos girômetros e do DVL (Doppler Velocity Logger). Por meio de equações de propagação de erro, os ruídos são recuperados em simulação, permitindo a estimação do erro de posição e de atitude (posição angular) acumulados para uma dada manobra. Finalmente, discute-se um critério de emersão a partir das estimativas de erro de posição. / The main part of our planet is filled with water, so the aquatic environment has notorious research and commercial importance. However, its exploration faces many difficulties. In navigation, the lack of GPS signal (Global Positioning System) during underwater missions requires different techniques, so this document focus on analyzing a navigation system for autonomous underwater vehicles. Thanks to different embedded sensors, like DVL (Doppler Velocity Logger), compass, gyrometers and others, the processes of dead reckoning is applied, witch calculates vehicle\'s current position by using the previously determined position. To do so, a navigation algorithm is implemented, providing geodesic coordinates to plot vehicle\'s trajectories on geo-referenced maps. Also, practical difficulties are discussed and treated. To improve the quality of the results, girometer\'s and DVL\'s errors are analyzed using Allan\'s variance and the navigation errors are estimated using first order time derivative equations in an augmented state space. Lastly, it is discussed a criterion to emerge and correct the vehicle\'s position using GPS signal.
59

Uma generalização do modelo de spins e bóson para a transcrição de genes sob múltiplo controle / A generalization of the spin-boson model for gene transcription under multiple control

Innocentini, Guilherme da Costa Pereira 04 June 2012 (has links)
Nesta tese propomos um modelo estocástico multimodal para regulação da expressão gênica em nível de transcrição. A definição de um espaço de parâmetros que contém o conteúdo biológico do sistema aliada à escolha apropriada de uma base para construir a matriz de acoplamento entre os estados do sistema levaram à obtenção de soluções exatas do modelo. Tais soluções são obtidas transformando as equações mestras em equações diferenciais parciais usando a técnica das funções geradoras e escrevendo os coeficientes das equações parciais em termos dos parâmetros biológicos do modelo. No regime estacionário obtivemos uma relação de recorrência para os coeficientes das séries de potências que definem as funções geradoras e a especificação das configurações de equilíbrio do sistema permite que estas séries sejam calculadas exatamente. Com as soluções exatas calculadas não só as distribuições de probabilidade foram obtidas como os momentos das distribuições. As distribuições de probabilidade de equilíbrio apresentam estruturas multimodais com vários picos e a análise do ruído (flutuação) mostra que a existência de um estado intermediário de eficiência transcricional leva a redução do ruído global do sistema. A inspeção dos autovalores da matriz de acoplamento mostrou que existem regiões onde a dinâmica dos momentos é de caráter oscilatória com amortecimento. Diferentes esquemas de acoplamento levam à diferentes regimes transientes, tal característica revela que o sistema multimodal apresentam maior flexibilidade adaptativa quando comparado com sistemas de um ou dois estados. / In this thesis we propose a stochastic model for multimodal regulation of gene expression at the transcriptional level. The definition of a parameter space that contains the contents of the biological system coupled with the appropriate choice of a base to build the coupling matrix between the states of the system led to the exact solutions of the model. Such solutions are obtained by transforming master equations in partial differential equations using the technique of generating functions and writing the coefficients of partial equations in terms of biological parameters of the model. In the steady a recurrence relation for the coefficients of power series defining the generating functions was obtained and specification of the equilibrium configurations of the system allows the exact calculation of these series. With the exact solutions calculated not only the probability distributions were obtained but also the moments of the distributions. The equilibrium distributions probability is multimodal and presents several peaks. Analysis of the noise (fluctuation) shows that the existence of an state with intermediate transcriptional efficiency leads to a reduction of the overall system noise. Inspection of the eigenvalues of the coupling matrix showed that there are regions where the dynamics of the moments is damped oscillating. Different coupling schemes lead to different transient regimes, this feature reveals that the multimodal system have greater adaptive flexibility when compared to systems of one or two states.
60

Learning probabilistic relational models: a novel approach. / Aprendendo modelos probabilísticos relacionais: uma nova abordagem.

Mormille, Luiz Henrique Barbosa 17 August 2018 (has links)
While most statistical learning methods are designed to work with data stored in a single table, many large datasets are stored in relational database systems. Probabilistic Relational Models (PRM) extend Bayesian networks by introducing relations and individuals, thus making it possible to represent information in a relational database. However, learning a PRM from relational data is a more complex task than learning a Bayesian Network from \"flat\" data. The main difficulties that arise while learning a PRM are establishing what are the legal dependency structures, searching for possible structures, and scoring them. This thesis focuses on the development of a novel approach to learn the structure of a PRM, describes a package in the R language to support the learning framework, and applies it to a real, large scale scenario of a city named Atibaia, in the state of São Paulo, Brazil. The research is based on a database combining three different tables, each representing one class in the domain of study. The first table contains 27 attributes from 110,816 citizens of Atibaia. The second table contains 9 attributes from 20,162 companies located in the city. And finally, the third table has 8 attributes from 327 census sectors (small territorial units that comprise the city of Atibaia). The proposed framework is applied to learn a PRM structure and parameters from the database. The model is used to verify if the Social Class of a person can be explained by the location where they live, their neighbors, and the companies nearby. Preliminary experiments have been conducted and a paper published in the 2017 Symposium on Knowledge Discovery, Mining and Learning (KDMiLe). The algorithm performance was further evaluated by extensive experimentation, and a broader study using Serasa Experian data was conducted. Finally, the package in the R language that supports our method was refined along with proper documentation and a tutorial. / Embora a maioria dos métodos de aprendizado estatístico tenha sido desenvolvida para se trabalhar com dados armazenados em uma única tabela, muitas bases de dados estão armazenadas em bancos de dados relacionais. Modelos Probabilísticos Relacionai (PRM) estendem Redes Bayesianas introduzindo relações e indivíduos, tornando possível a representação de informação em uma base de dados relacional. Entretanto, aprender um PRM através de dados relacionais é uma tarefa mais complexa que aprender uma Rede Bayesiana de uma única tabela. As maiores dificuldades que se impõe enquanto se aprende um PRM são estabelecer quais são as estruturas de dependência legais, procurar por possíveis estruturas, e avalia-las. Esta tese foca em desenvolver um novo método de aprendizado de estruturas de PRM, descrever um pacote na linguagem R que suporte este método e aplica-lo a um cenário real e de grande escala, a cidade de Atibaia, no estado de São Paulo, Brasil. Esta pesquisa está baseada em uma base de dados combinando três tabelas distintas, cada uma representando uma classe no domínio de estudo. A primeira tabela contém 27 atributos de 110.816 habitantes de Atibaia, e a segunda tabela contém 9 atributos de 20.162 empresas da cidade. Por fim, a terceira tabela possui 8 atributos para 327 setores censitários (pequenas unidades territoriais que formam a cidade de Atibaia). A proposta é aplicada para aprender-se a estrutura de um PRM e seus parâmetros através desta base de dados. O modelo foi utilizado para verificar se a classe social de uma pessoa pode ser explicada pelo local onde ela vive, seus vizinhos e as companhias próximas. Experimentos preliminares foram conduzidos e um artigo foi publicado no Symposium on Knowledge Discovery, Mining and Learning (KDMiLe). O desempenho do algoritmo foi reavaliada através de extensiva experimentação, e um estudo mais amplo foi conduzido com os dados da Serasa Experian. Por fim, o pacote em R que suporta o método proposto foi refinado, e documentação e tutorial apropriado foram descritos.

Page generated in 0.0966 seconds