1 |
[en] MONITORING THE SPREAD OF MULTIVARIATE PROCESSES USING PROJECTIONS OF THE OBSERVABLE VARIABLES VECTOR / [pt] MONITORAMENTO DA DISPERSÃO DE PROCESSOS MULTIVARIADOS POR PROJEÇÕES DO VETOR DE VARIÁVEIS OBSERVADASSERGIO FERREIRA BASTOS 01 December 2016 (has links)
[pt] Em processos multivariados, existem diversas variáveis observáveis para serem controladas. Pressupõe-se neste trabalho que os descontroles do processo se devem a causas especiais que atuam em fontes de variação independentes, cada uma destas podendo ser representada por uma variável aleatória não observável, ou latente. Alguma alteração na média de uma dessas variáveis ou um aumento na sua dispersão resultam, respectivamente, em deslocamento da média do vetor x de variáveis observáveis ao longo de uma direção atribuível específica, ou aumento da variabilidade do vetor x nessa direção. Propõe-se então controlar a dispersão de tais processos multivariados por gráficos de controle do desvio-padrão dos valores das projeções do vetor de variáveis observadas em direções específicas, associadas a variações nas variáveis latentes não observáveis do processo. Essas direções são denominadas de direções atribuíveis. Foram desenvolvidos, também, gráficos para média da norma quadrática de um vetor resíduo, a fim de permitir a sinalização da ocorrência de novas fontes de variação ainda desconhecidas ao processo, que levem a um aumento da variabilidade do vetor x em direções não contidas no subespaço das direções atribuíveis. O esquema proposto mostrou-se eficaz para o controle estatístico de causas especiais, atuando sobre as fontes de variação do processo, com a vantagem adicional de identificar automaticamente a variável latente afetada. / [en] In multivariate processes, there are several observable variables to be controlled. It is assumed in this work that loss of control is due to special causes acting in independent sources of variation, each of these being represented by an unobservable random variable, or latent. A change in average of these variables or an increase in dispersion results, respectively, in a displacement of the average of the vector x of the observable variables along a specific assignable direction or in an increase of vector x variability in that direction. It is proposed to control the dispersion of such multivariate processes by means of control charts of the vector projections values of observed variables in specific directions, associated with process changes in latent variables, not observable. We call these directions assignable directions. Graphs of average squared norm of a residual vector were developed to enable the signaling of the occurrence of new sources of variation, yet unknown to the process, that lead to increased vector x variability in directions not contained in the assignable directions subspace. The proposed scheme was shown to be an effective tool for statistical control of special causes acting on the process variation sources, with the added benefit of automatically identification of the affected latent variable.
|
2 |
[en] POROSITY ESTIMATION FROM SEISMIC ATTRIBUTES WITH SIMULTANEOUS CLASSIFICATION OF SPATIALLY STRUCTURED LATENT FACIES / [pt] PREDIÇÃO DE POROSIDADE A PARTIR DE ATRIBUTOS SÍSMICOS COM CLASSIFICAÇÃO SIMULTÂNEA DE FACIES GEOLÓGICAS LATENTES EM ESTRUTURAS ESPACIAISLUIZ ALBERTO BARBOSA DE LIMA 26 April 2018 (has links)
[pt] Predição de porosidade em reservatórios de óleo e gás representa em uma tarefa crucial e desafiadora na indústria de petróleo. Neste trabalho é proposto um novo modelo não-linear para predição de porosidade que trata fácies sedimentares como variáveis ocultas ou latentes. Esse modelo, denominado Transductive Conditional Random Field Regression (TCRFR), combina com sucesso os conceitos de Markov random fields, ridge regression e aprendizado transdutivo. O modelo utiliza volumes de impedância sísmica como informação de entrada condicionada aos valores de porosidade disponíveis nos poços existentes no reservatório e realiza de forma simultânea e automática a classificação das fácies e a estimativa de porosidade em todo o volume. O método é capaz de inferir as fácies latentes através da combinação de amostras precisas de porosidade local presentes nos poços com dados de impedância sísmica ruidosos, porém disponíveis em todo o volume do reservatório. A informação precisa de porosidade é propagada no volume através de modelos probabilísticos baseados em grafos, utilizando conditional random fields. Adicionalmente, duas novas técnicas são introduzidas como etapas de pré-processamento para aplicação do método TCRFR nos casos extremos em que somente um número bastante reduzido de amostras rotuladas de porosidade encontra-se disponível em um pequeno conjunto de poços exploratórios, uma situação típica para geólogos durante a fase exploratória de uma nova área. São realizados experimentos utilizando dados de um reservatório sintético e de um reservatório real. Os resultados comprovam que o método apresenta um desempenho consideravelmente superior a outros métodos automáticos de predição em relação aos dados sintéticos e, em relação aos dados reais, um desempenho comparável ao gerado por técnicas tradicionais de geo estatística que demandam grande esforço manual por parte de especialistas. / [en] Estimating porosity in oil and gas reservoirs is a crucial and challenging task in the oil industry. A novel nonlinear model for porosity estimation is proposed, which handles sedimentary facies as latent variables. It successfully combines the concepts of conditional random fields (CRFs), transductive learning and ridge regression. The proposed Transductive Conditional Random Field Regression (TCRFR) uses seismic impedance volumes as input information, conditioned on the porosity values from the available wells in the reservoir, and simultaneously and automatically provides as output the porosity estimation and facies classification in the whole volume. The method is able to infer the latent facies states by combining the local, labeled and accurate porosity information available at well locations with the plentiful but imprecise impedance information available everywhere in the reservoir volume. That accurate information is propagated in the reservoir based on conditional random field probabilistic graphical models, greatly reducing uncertainty. In addition, two new techniques are introduced as preprocessing steps for the application of TCRFR in the extreme but realistic cases where just a scarce amount of porosity labeled samples are available in a few exploratory wells, a typical situation for geologists during the evaluation of a reservoir in the exploration phase. Both synthetic and real-world data experiments are presented to prove the usefulness of the proposed methodology, which show that it outperforms previous automatic estimation methods on synthetic data and provides a comparable result to the traditional manual labored geostatistics approach on real-world data.
|
3 |
[en] NONLINEAR MODELS IN ASSESSMENT IN THE SOCIAL SCIENCES: ESTIMATION BY STOCHASTIC APPROXIMATION, A FREQUENTIST MCMC / [pt] MODELOS NÃO LINEARES EM AVALIAÇÃO NAS CIÊNCIAS SOCIAIS: ESTIMAÇÃO POR APROXIMAÇÃO ESTOCÁSTICA UMA MCMC FREQÜENTISTACARLOS ALBERTO QUADROS COIMBRA 19 July 2005 (has links)
[pt] Neste trabalho apresentamos algumas contrubuições ao
estudo dos modelos
de avaliação estatística usados nas ciências sociais. As
contribuições
originais são: i ) uma descrição unificada sobre como a
teoria da medição
evoluiu nas diversas disciplinas científicas; ii ) uma
resenha abrangente sobre
os métodos de estimação por máxima verossimilhança
empregados na
medição estatística; iii ) uma formulação geral do métodos
da máxima verossimilhan
ça tendo em vista a aplicação em modelos não-lineares; e
principalmente,
iv ) a apresentação do método da aproximação estocástica na
estimação dos modelos estatísticos de avaliação e medição.
Os modelos não-lineares ocorrem freqüentemente nas
ciências sociais onde
é importante a modelagem de variáveis de resposta
dicotômicas ou ordinais.
Em particular, este trabalho trata dos modelos da teoria
da resposta
ao item, dos modelos de regressão logística e dos modelos
de componentes
aleatórias em geral. A estimação destes modelos ainda é
objeto de intensa
pesquisa. Não se pode afirmar que exista um método de
estimação
inteiramente confiável. Os métodos aproximados produzem
estimativas com
viés acentuado nas componentes de variância, enquanto os
métodos de integração numérica e os métodos bayesianos
podem apresentar problemas de
convergência em muitos casos. O método da aproximação
estocástica se baseia
na maximização da verossimilhança e emprega o algoritmo de
Robbins-
Monro para resolver a equação do escore. Como um método
estocástico ele
gera um processo de Markov que se aproxima das estimativas
desejadas e
portanto pode ser considerado um MCMC (Monte Carlo Markov
chain)
freqüentista. Nas simulações realizadas o método
apresentou um bom desempenho,
produzindo estimativas com viés pequeno, precisão razoável
e
raros problemas de convergência. / [en] This work presents a study of statistical models used for
assessment and
measurement in the social sciences. The main contributions
are: i ) a unified
description of how evaluation, assessment, and the theory
of measurement
evolved within several branches of science; ii ) a review
of estimation
methods currently employed in nonlinear models; iii ) a
general formulation
of the maximum likelihood estimation method; and
particularly, iv the
presentation of the stochastic approximation method for
estimation of non
linear statistical models in measurement and assessment.
Non linear models occurs frequently in the social sciences
where it is
important to model binary or ordinal response variables.
This work deals
with item response theory models, logistic regression
models and general
models with random components. The estimation of these
models has been
the subject of several recent simulation studies. One
cannot say there is a
best estimation method. The approximate methods are known
to produce
biased estimates, numerical integration methods and
bayesian methods can
present convergence problems in many cases. Stochastic
approximation
method is a maximum likelihood method that uses the
Robbins-Monro
algorithm to solve the score equation. As a stochastic
approximation method
it generates a Markov chain that converges to the desired
estimates and can
be considered a frequentist MCMC. A simulation study and a
comparative
estimation study show a good performance, the method
producing small
bias for the estimates, good precision, and very rare
convergence problems.
|
Page generated in 0.0307 seconds