Spelling suggestions: "subject:"misturas gaussianas"" "subject:"misturas maussianas""
1 |
Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems / Análise preditiva via processos gaussianos e auditoria estatística via Misturas Gaussianas em sistemas de inteligência de negóciosPilon, Bruno Hernandes Azenha 15 April 2015 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2015. / Um sistema de Inteligência de Negócios, do inglês \emph{Business Intelligence} (BI), é um sistema de informação que emprega ferramentas de diversas áreas do conhecimento na coleta, integração e análise de dados para aprimorar e embasar o processo decisório em empresas e instituições governamentais. O Ministério do Planejamento, Orçamento e Gestão (MP), órgão do governo federal brasileiro, possui uma série de sistemas de inteligência de negócios e, neste trabalho, dois destes sistemas foram considerados. O primeiro sistema de BI, mantido pela Secretaria de Patrimônio da União (SPU), contém dados de arrecadação mensal de impostos daquela Secretaria, enquanto o segundo sistema de BI, mantido pela Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamento (CGAUD), contém dados da folha de pagamento dos servidores públicos federais brasileiros. Ambos os sistemas foram construídos objetivando-se a detecção de fraudes e irregularidades como evasão fiscal e pagamentos não autorizados. Ao longo deste trabalho, pretende-se incorporar estágios que adicionem análise preditiva e melhorias de performance aos sistemas de BI existentes. No sistema de BI da SPU, Regressão por Processos Gaussianos (RPG) é utilizada para modelar as características intrínsecas da principal série temporal financeira. RPG retorna uma descrição estatística completa da variável estimada, que pode ser tratada como uma medida de confiança e pode ser utilizada como gatilho para classificar dados em confiáveis ou não confiáveis. Ademais, um estágio de pré-processamento reconfigura a série temporal original em uma estrutura bidimensional. O algoritmo resultante, com RPG em seu núcleo, superou métodos preditivos clássicos como indicadores financeiros e redes neurais artificiais. No sistema de BI da CGAUD, um Modelo de Misturas Gaussianas (MMG) é utilizado para descrever o processo estocástico que governa a distribuição de probabilidades dos contracheques. Rotular uma probabilidade relativa em cada contracheque habilita o sistema de BI a listá-los e filtrá-los com base em suas probabilidades. A inserção de um filtro estatístico em um sistema de BI determinístico resultou em efetiva redução na quantidade de dados a serem analisados pelas trilhas de auditoria. / A Business Intelligence (BI) system is an information system that employs tools from several areas of knowledge for the collection, integration and analysis of data to improve and support the decision making process in companies and governmental institutions. The Ministry of Planning, Budget and Management, in portuguese Ministério do Planejamento, Orçamento e Gestão (MP), an agency of the Brazilian federal government, possesses a wide number of BI systems and, in this work, two of those systems were considered. The first BI system, maintained by the Federal Patrimony Department, in portuguese Secretaria de Patrimônio da União (SPU), contains data regarding the monthly tax collection of that department, whereas the second BI system, maintained by the Human Resources Auditing Department, in portuguese Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamentos (CGAUD), contains data regarding the payroll of Brazilian federal employees. Both systems were designed aimed at fraud and irregularities detection such as tax evasion and unauthorized payments. Throughout the present work, we aim to incorporate stages into the existing BI systems in order to add predictive analytics and performance enhancements. In the BI system of SPU, Gaussian Process for Regression (GPR) is used to model the intrinsic characteristics of the core financial time series. GPR natively returns a full statistical description of the estimated variable, which can be treated as a measure of confidence and can be used as a trigger to classify trusted and untrusted data. In order to take into account the multidimensional structure of the original data, we also propose a pre-processing stage for reshaping the original time series into a bidimensional structure. The resulting algorithm, with GPR at its core, outperforms classical predictive schemes such as financial indicators and artificial neural networks. In the BI system of CGAUD, a Gaussian Mixture Model (GMM) is used to describe the stochastic process that governs the probability distribution of payrolls. Attaching a relative probability into each payroll enables the BI system to sort and filter payrolls based on their probabilities. Inserting a statistical filter in a deterministic BI system showed to be effective in reducing the amount of data to be analyzed by rule-based audit trails.
|
2 |
Segmentação de imagens utilizando combinação de modelos de misturas GaussianasSilva, Styve Stallone da 28 February 2014 (has links)
Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-10T19:06:02Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Styve Stallone da Silva.pdf: 3737470 bytes, checksum: 8b378e7a672e171ffc58dd1435b637ec (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-10T19:43:01Z (GMT) No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Styve Stallone da Silva.pdf: 3737470 bytes, checksum: 8b378e7a672e171ffc58dd1435b637ec (MD5) / Made available in DSpace on 2015-03-10T19:43:01Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
DISSERTAÇÃO Styve Stallone da Silva.pdf: 3737470 bytes, checksum: 8b378e7a672e171ffc58dd1435b637ec (MD5)
Previous issue date: 2014-02-28 / A segmentação de imagens tem por objetivo separar os objetos de interesse de
determinado estudo em uma imagem. A segmentação da imagem deve parar quando os
objetos procurados tiverem sido isolados. Por exemplo, na segmentação de uma imagem
de transito, onde se deseja identificar as placas dos carros, é necessário segmentar a
imagem separando todos os carros do restante da imagem, e ainda separar as placas dos
carros para realizar o processo de identificação de cada placa. O processo de
segmentação de imagens tem grande importância na análise e descrição de imagens,
pois essa divisão, realizada na imagem, é responsável pelo sucesso de outras técnicas
como detecção de pessoas e reconhecimento de faces.
Atualmente, métodos de segmentação do campo de jogo em vídeos de futebol têm
sido bastante explorados. O interesse em analisar e classificar eventos em vídeos, além
das dificuldades atreladas às variações de clima e iluminação que se refletem na
segmentação de campo, tem gerado grande interesse em desenvolver métodos que
consigam realizar a segmentação mesmo com os problemas anteriormente citados.
A segmentação do campo é o passo fundamental para a análise de diversos tipos de
eventos em um vídeo de jogo de futebol, que podem ser detectados e classificados
automaticamente, como gols, faltas e escanteios. Muitos métodos de segmentação de
campo têm utilizado apenas as características das cores do gramado, porém as
tonalidades dessas cores variam, evidenciando fraquezes desses métodos.
O trabalho apresentado propõe um método de segmentação baseado em combinação
de misturas gaussianas e rede neural, utilizando características de cores e também
características de texturas da imagem. O referido método é composto pelas etapas de
extração de características, agrupamento dos dados, segmentação, classificação e pósprocessamento.
Como métricas de comparação de resultados são utilizadas curvas receiver operating
characteristic (ROC) e taxas de verdadeiros e falsos positivos. Os resultados do modelo
proposto são comparados a modelos gaussianos únicos, algoritmo k-Nearest Neighbor
(k-NN) e ao algoritmo Fuzzy C-means (FCM), apresentando resultado de 94,25% de
acerto para testes com diversas variações climáticas e de iluminação. O resultado foi
superior aos outros algoritmos analisados.
|
3 |
Classificação de fluxos de dados não estacionários com algoritmos incrementais baseados no modelo de misturas gaussianas / Non-stationary data streams classification with incremental algorithms based on Gaussian mixture modelsOliveira, Luan Soares 18 August 2015 (has links)
Aprender conceitos provenientes de fluxos de dados é uma tarefa significamente diferente do aprendizado tradicional em lote. No aprendizado em lote, existe uma premissa implicita que os conceitos a serem aprendidos são estáticos e não evoluem significamente com o tempo. Por outro lado, em fluxos de dados os conceitos a serem aprendidos podem evoluir ao longo do tempo. Esta evolução é chamada de mudança de conceito, e torna a criação de um conjunto fixo de treinamento inaplicável neste cenário. O aprendizado incremental é uma abordagem promissora para trabalhar com fluxos de dados. Contudo, na presença de mudanças de conceito, conceitos desatualizados podem causar erros na classificação de eventos. Apesar de alguns métodos incrementais baseados no modelo de misturas gaussianas terem sido propostos na literatura, nota-se que tais algoritmos não possuem uma política explicita de descarte de conceitos obsoletos. Nesse trabalho um novo algoritmo incremental para fluxos de dados com mudanças de conceito baseado no modelo de misturas gaussianas é proposto. O método proposto é comparado com vários algoritmos amplamente utilizados na literatura, e os resultados mostram que o algoritmo proposto é competitivo com os demais em vários cenários, superando-os em alguns casos. / Learning concepts from data streams differs significantly from traditional batch learning. In batch learning there is an implicit assumption that the concept to be learned is static and does not evolve significantly over time. On the other hand, in data stream learning the concepts to be learned may evolve over time. This evolution is called concept drift, and makes the creation of a fixed training set be no longer applicable. Incremental learning paradigm is a promising approach for learning in a data stream setting. However, in the presence of concept drifts, out dated concepts can cause misclassifications. Several incremental Gaussian mixture models methods have been proposed in the literature, but these algorithms lack an explicit policy to discard outdated concepts. In this work, a new incremental algorithm for data stream with concept drifts based on Gaussian Mixture Models is proposed. The proposed methodis compared to various algorithms widely used in the literature, and the results show that it is competitive with them invarious scenarios, overcoming them in some cases.
|
4 |
Classificação de fluxos de dados não estacionários com algoritmos incrementais baseados no modelo de misturas gaussianas / Non-stationary data streams classification with incremental algorithms based on Gaussian mixture modelsLuan Soares Oliveira 18 August 2015 (has links)
Aprender conceitos provenientes de fluxos de dados é uma tarefa significamente diferente do aprendizado tradicional em lote. No aprendizado em lote, existe uma premissa implicita que os conceitos a serem aprendidos são estáticos e não evoluem significamente com o tempo. Por outro lado, em fluxos de dados os conceitos a serem aprendidos podem evoluir ao longo do tempo. Esta evolução é chamada de mudança de conceito, e torna a criação de um conjunto fixo de treinamento inaplicável neste cenário. O aprendizado incremental é uma abordagem promissora para trabalhar com fluxos de dados. Contudo, na presença de mudanças de conceito, conceitos desatualizados podem causar erros na classificação de eventos. Apesar de alguns métodos incrementais baseados no modelo de misturas gaussianas terem sido propostos na literatura, nota-se que tais algoritmos não possuem uma política explicita de descarte de conceitos obsoletos. Nesse trabalho um novo algoritmo incremental para fluxos de dados com mudanças de conceito baseado no modelo de misturas gaussianas é proposto. O método proposto é comparado com vários algoritmos amplamente utilizados na literatura, e os resultados mostram que o algoritmo proposto é competitivo com os demais em vários cenários, superando-os em alguns casos. / Learning concepts from data streams differs significantly from traditional batch learning. In batch learning there is an implicit assumption that the concept to be learned is static and does not evolve significantly over time. On the other hand, in data stream learning the concepts to be learned may evolve over time. This evolution is called concept drift, and makes the creation of a fixed training set be no longer applicable. Incremental learning paradigm is a promising approach for learning in a data stream setting. However, in the presence of concept drifts, out dated concepts can cause misclassifications. Several incremental Gaussian mixture models methods have been proposed in the literature, but these algorithms lack an explicit policy to discard outdated concepts. In this work, a new incremental algorithm for data stream with concept drifts based on Gaussian Mixture Models is proposed. The proposed methodis compared to various algorithms widely used in the literature, and the results show that it is competitive with them invarious scenarios, overcoming them in some cases.
|
5 |
Alocação dinâmica de recursos em redes OFDM multiusuários baseada em banda efetivaGonçalves, Bruno Henrique Pereira 19 December 2013 (has links)
Submitted by Erika Demachki (erikademachki@gmail.com) on 2014-11-06T17:22:37Z
No. of bitstreams: 2
Dissertacao - Bruno Henrique Pereira Gonçalves - 2013.pdf: 2765842 bytes, checksum: 73031d592b28fd2dc03d6bbdfa04cc34 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Approved for entry into archive by Erika Demachki (erikademachki@gmail.com) on 2014-11-06T17:22:46Z (GMT) No. of bitstreams: 2
Dissertacao - Bruno Henrique Pereira Gonçalves - 2013.pdf: 2765842 bytes, checksum: 73031d592b28fd2dc03d6bbdfa04cc34 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) / Made available in DSpace on 2014-11-06T17:22:46Z (GMT). No. of bitstreams: 2
Dissertacao - Bruno Henrique Pereira Gonçalves - 2013.pdf: 2765842 bytes, checksum: 73031d592b28fd2dc03d6bbdfa04cc34 (MD5)
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Previous issue date: 2013-12-19 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This paper proposes adaptive resource allocation in multiuser wireless networks based on
OFDM. Two allocation schemes are proposed: for TDMA networks and LTE networks.
The resource allocation schemes that provide QoS are developed from the union of OFDM
wireless networks, the proposal of adaptive modeling of traffic flows and the proposal of
adaptive estimation of effective bandwidth. The performances of the proposed schemes
are verified through simulation. Concepts and studies on traffic modeling, multifractal
traffic modeling, theory of effective bandwidth, OFDM, are addressed in order to support
the understanding and development of the proposed schemes. An algorithm for adaptive
parameter estimation of the multifractal model bMWM is proposed, and studies to
estimate the effective bandwidth are presented. Some methods of estimating effective
bandwidth are proposed using traffic flow models. / Este trabalho propõe esquemas de alocação adaptativa de recursos em redes sem fio
multiusuário OFDM. Dois esquemas de alocação são propostos: para redes TDMA e
para redes LTE. Os esquemas de alocação de recursos foram elaborados a partir da
união de tecnologia de redes sem fio OFDM, proposta de modelagem adaptativa de
fluxos de tráfego e proposta de estimação adaptativa de banda efetiva, de maneira a
garantir requisitos de QoS em redesmultiusuário. Simulações são realizadas para validar o
desempenho dos esquemas de alocação propostos. Conceitos e estudos sobre modelagem
de tráfego, modelagem de tráfego multifractal, teoria de banda efetiva e OFDM são
tratados de maneira a subsidiar o entendimento e a elaboração dos esquemas propostos. É
proposto um algoritmo para estimação adaptativa de parâmetros do modelo multifractal
bMWM, e são apresentados estudos realizados para estimação de banda efetiva. Alguns
métodos de estimação de banda efetiva são propostos utilizando modelos de fluxo de
tráfego.
|
Page generated in 0.0667 seconds