• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 264
  • 147
  • 41
  • 30
  • 23
  • 14
  • 13
  • 6
  • 4
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • Tagged with
  • 626
  • 626
  • 210
  • 124
  • 114
  • 87
  • 86
  • 86
  • 75
  • 67
  • 61
  • 58
  • 58
  • 56
  • 55
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
361

MODELOS DE PREVISÃO DE RECURSOS PARA ANTIMICROBIANOS NO HOSPITAL UNIVERSITÁRIO DE SANTA MARIA / RESOURCE COLLECTION FOR ANTI-MICROBIAL AT THE UNIVERSITY HOSPITAL OF SANTA MARIA BY MEANS OF FORECASTS

Bastos, Claudio 04 September 2009 (has links)
The scarce resources of public health makes the administrator manage the destination of resources, aiming to rationalize and optimize its collection, in order to improve the assistance to patients because the hospital is a public institution and does not get profits but promotes the community well-being. Thus, the hospital infection is acquired after the patient comes to the hospital of after he goes home and might be associated with his staying in hospital or with hospital procedures. This cost must be avoided. Once the complete eradication is not impossible, it is necessary to analyze and to control the monthly cost of the main antibiotics used for its treatment so that there is enough knowledge to foresee the resource collection to buy them. In this context, the main reason of this research is to carry out a forecast of the monthly cost and of the resource collection needed to purchase those medicine used in the treatment of hospital infections at the University Hospital of Santa Maria. To do so, a methodology for forecast by dynamic and multiple linear regressions was used. They were combined with to a multivariate technique by principal components. The technique of principal components was used to eliminate the multiple linearity existing among the original variants so, the resulting principal components were used as variables in the construction of the model of multiple linear regression and of dynamic regression. Therefore, these methodologies are applied to a case study of public health, in order to foresee and to conclude about which model is more suitable to forecast the monthly cost of antibiotics in hospital infections. The results obtained from the two models were considered satisfactory but the model of dynamic regression was chosen to be more suitable because it presented a mean absolute percentage error (MAPE). Finally, the findings might be a managerial tool for hospital administration when they offer subsides for the budget of planning and of the resource finances, especially in a time when resources are globally scarce, making health even more expensive. / Os escassos recursos da saúde pública impõem ao administrador gerenciar a destinação dos recursos buscando racionalizar e otimizar sua alocação, permitindo, desta forma, melhorar o atendimento aos pacientes, pois o hospital, sendo uma entidade pública, não tem por objetivo o lucro, mas sim promover o bem estar da comunidade. Com isso, a infecção hospitalar que é adquirida após a internação do paciente e se manifesta durante a internação ou mesmo após a alta, podendo ser relacionada com a internação ou procedimentos hospitalares, deve ser evitada. Uma vez que sua total erradicação não é possível, se faz necessário analisar e controlar o custo mensal dos principais antibióticos utilizados no seu tratamento a fim de se ter embasamento suficiente para prever a alocação de recursos para sua aquisição. Nesse contexto, o principal objetivo desta pesquisa é realizar a previsão do custo mensal e de alocação de recursos necessários para aquisição de medicamentos utilizados no tratamento de infecções hospitalares no Hospital Universitário de Santa Maria. Para isso, utilizou-se a metodologia de previsão por regressão linear múltipla e de regressão dinâmica combinada com a técnica multivariada de componentes principais que foi utilizada para eliminar a multicolinearidade existente entre as variáveis originais. Com isso, as componentes principais resultantes foram utilizadas como variáveis independentes na construção do modelo de regressão linear múltipla e de regressão dinâmica. Portanto, essas metodologias são aplicadas a um estudo de caso na saúde pública, a fim de fazer previsões e tirar conclusões a respeito de qual modelo é mais adequado para realizar a previsão do custo mensal dos antibióticos em infecções hospitalares. Os resultados obtidos nos dois modelos foram considerados satisfatórios, mas foi escolhido, como modelo mais adequado para realizar as previsões, o modelo de regressão dinâmica, porque apresentou o menor erro percentual absoluto médio (MAPE). Por fim, as previsões encontradas, podem se constituir em uma ferramenta gerencial para a administração hospitalar ao fornecer subsídios para o planejamento orçamentário e financeiro dos recursos, especialmente em uma época em que há escassez de recursos em escala global, com reflexos muito intensos nos custos da saúde.
362

Estimação não-paramétrica e semi-paramétrica de fronteiras de produção

Torrent, Hudson da Silva January 2010 (has links)
Existe uma grande e crescente literatura sobre especificação e estimação de fronteiras de produção e, portanto, de eficiência de unidades produtivas. Nesta tese, o foco esta sobre modelos de fronteiras determinísticas, os quais são baseados na hipótese de que os dados observados pertencem ao conjunto tecnológico. Dentre os modelos estatísticos e estimadores para fronteiras determinísticas existentes, uma abordagem promissora e a adotada por Martins-Filho e Yao (2007). Esses autores propõem um procedimento de estimação composto por três estágios. Esse estimador e de fácil implementação, visto que envolve procedimentos não-paramétricos bem conhecidos. Além disso, o estimador possui características desejáveis vis-à-vis estimadores para fronteiras determinísticas tradicionais como DEA e FDH. Nesta tese, três artigos, que melhoram o modelo proposto por Martins-Filho e Yao (2007), sao propostos. No primeiro artigo, o procedimento de estimação desses autores e melhorado a partir de uma variação do estimador exponencial local, proposto por Ziegelmann (2002). Demonstra-se que estimador proposto a consistente e assintoticamente normal. Além disso, devido ao estimador exponencial local, estimativas potencialmente negativas para a função de variância condicional, que poderiam prejudicar a aplicabilidade do estimador proposto por Martins-Filho e Yao, são evitadas. No segundo artigo, e proposto um método original para estimação de fronteiras de produção em apenas dois estágios. E mostrado que se pode eliminar o segundo estágio proposto por Martins-Filho e Yao, assim como, eliminar o segundo estagio proposto no primeiro artigo desta tese. Em ambos os casos, a estimação do mesmo modelo de fronteira de produção requer três estágios, sendo versões diferentes para o segundo estagio. As propriedades assintóticas do estimador proposto são analisadas, mostrando-se consistência e normalidade assintótica sob hipóteses razoáveis. No terceiro artigo, a proposta uma variação semi-paramétrica do modelo estudado no segundo artigo. Reescreve-se aquele modelo de modo que se possa estimar a fronteira de produção e a eficiência de unidades produtivas no contexto de múltiplos insumos, sem incorrer no curse of dimensionality. A abordagem adotada coloca o modelo na estrutura de modelos aditivos, a partir de hipóteses sobre como os insumos se combinam no processo produtivo. Em particular, considera-se aqui os casos de insumos aditivos e insumos multiplicativos, os quais são amplamente considerados em teoria econômica e aplicações. Estudos de Monte Carlo são apresentados em todos os artigos, afim de elucidar as propriedades dos estimadores propostos em amostras finitas. Além disso, estudos com dados reais são apresentados em todos os artigos, nos quais são estimador rankings de eficiência para uma amostra de departamentos policiais dos EUA, a partir de dados sobre criminalidade daquele país. / There exists a large and growing literature on the specification and estimation of production frontiers and therefore efficiency of production units. In this thesis we focus on deterministic production frontier models, which are based on the assumption that all observed data lie in the technological set. Among the existing statistical models and estimators for deterministic frontiers, a promising approach is that of Martins-Filho and Yao (2007). They propose an estimation procedure that consists of three stages. Their estimator is fairly easy to implement as it involves standard nonparametric procedures. In addition, it has a number of desirable characteristics vis-a-vis traditional deterministic frontier estimators as DEA and FDH. In this thesis we propose three papers that improve the model proposed in Martins-Filho and Yao (2007). In the first paper we improve their estimation procedure by adopting a variant of the local exponential smoothing proposed in Ziegelmann (2002). Our estimator is shown to be consistent and asymptotically normal. In addition, due to local exponential smoothing, potential negativity of conditional variance functions that may hinder the use of Martins-Filho and Yao's estimator is avoided. In the second paper we propose a novel method for estimating production frontiers in only two stages. (Continue). There we show that we can eliminate the second stage of Martins-Filho and Yao as well as of our first paper, where estimation of the same frontier model requires three stages under different versions for the second stage. We study asymptotic properties showing consistency andNirtnin, asymptotic normality of our proposed estimator under standard assumptions. In the third paper we propose a semiparametric variation of the frontier model studied in the second paper. We rewrite that model allowing for estimating the production frontier and efficiency of production units in a multiple input context without suffering the curse of dimensionality. Our approach places that model within the framework of additive models based on assumptions regarding the way inputs combine in production. In particular, we consider the cases of additive and multiplicative inputs, which are widely considered in economic theory and applications. Monte Carlo studies are performed in all papers to shed light on the finite sample properties of the proposed estimators. Furthermore a real data study is carried out in all papers, from which we rank efficiency within a sample of USA Law Enforcement agencies using USA crime data.
363

Statistické metody pro regresní modely s chybějícími daty / Statistical Methods for Regression Models With Missing Data

Nekvinda, Matěj January 2018 (has links)
The aim of this thesis is to describe and further develop estimation strategies for data obtained by stratified sampling. Estimation of the mean and linear regression model are discussed. The possible inclusion of auxiliary variables in the estimation is exam- ined. The auxiliary variables can be transformed rather than used in their original form. A transformation minimizing the asymptotic variance of the resulting estimator is pro- vided. The estimator using an approach from this thesis is compared to the doubly robust estimator and shown to be asymptotically equivalent.
364

Modelos de regressão linear heteroscedásticos com erros t-Student: uma abordagem bayesiana objetiva / Heteroscedastics linear regression models with Student t erros: an objective bayesian analysis.

Aline Campos Reis de Souza 18 February 2016 (has links)
Neste trabalho, apresentamos uma extensão da análise bayesiana objetiva feita em Fonseca et al. (2008), baseada nas distribuições a priori de Jeffreys para o modelo de regressão linear com erros t-Student, para os quais consideramos a suposição de heteoscedasticidade. Mostramos que a distribuição a posteriori dos parâmetros do modelo regressão gerada pela distribuição a priori é própria. Através de um estudo de simulação, avaliamos as propriedades frequentistas dos estimadores bayesianos e comparamos os resultados com outras distribuições a priori encontradas na literatura. Além disso, uma análise de diagnóstico baseada na medida de divergência Kullback-Leiber é desenvolvida com a finalidade de estudar a robustez das estimativas na presença de observações atípicas. Finalmente, um conjunto de dados reais é utilizado para o ajuste do modelo proposto. / In this work , we present an extension of the objective bayesian analysis made in Fonseca et al. (2008), based on Jeffreys priors for linear regression models with Student t errors, for which we consider the heteroscedasticity assumption. We show that the posterior distribution generated by the proposed Jeffreys prior, is proper. Through simulation study , we analyzed the frequentist properties of the bayesian estimators obtained. Then we tested the robustness of the model through disturbances in the response variable by comparing its performance with those obtained under another prior distributions proposed in the literature. Finally, a real data set is used to analyze the performance of the proposed model . We detected possible in uential points through the Kullback -Leibler divergence measure, and used the selection model criterias EAIC, EBIC, DIC and LPML in order to compare the models.
365

Paramètres spectraux à LPC Paramètres Mapping : approches multi-linéaires et GMM (appliqué aux voyelles françaises) / Spectral Parameters to Cued Speech Parameters Mapping : Multi-linear and GMM approaches (applied to French vowels)

Ming, Zuheng 24 June 2013 (has links)
Le langage parlé complété (LPC) est un système de communication visuel qui utilise des formes de main placés dans différentes positions près du visage, en combinaison avec le discours de la lecture labiale naturel, pour améliorer la perception de la parole à partir de l'entrée visuelle pour les personnes sourdes. Cependant l'un des défis importants est la question de la communication de la parole entre les personnes normo-entendant qui ne pratiquent pas LPC mais produisent discours acoustique et les personnes sourdes qui utilisent la lecture labiale complété par code LPC pour la perception de la parole sans audition résiduelle. Dans notre travail, nous appliquons la méthode de régression linéaire multiple (MLR) et modèle gaussien de mélange (GMM) approche pour mapper des paramètres spectraux acoustiques à la position de la main dans LPC et la forme de la lèvre d’accompagnement. Nous donc contribué à la mise au point d'un système de traduction automatique dans le cadre de la synthèse de la parole visuelle.Cela prouve que l'approche MLR est bonne pour l'estimation des paramètres pour les lèvres à partir des paramètres spectraux car il y a forte corrélation linéaire entre les paramètres des lèvres et des paramètres spectraux. Cependant, la performance de l'approche MLR pour estimer la position de la main est faible car il n'y a pas de relation entre les positions de la main et des paramètres spectraux. En introduisant un espace intermédiaire, il s'avère que la structure de topologie similaire est la clé de la MLR. Afin de libérer de la contrainte linéaire de l'approche MLR, nous appliquons la méthode de cartographie basée sur GMM qui possède à la fois les propriétés de classification et de régression. Les paramètres de GMM sont estimés par les méthodes de formation supervisées, non supervisées et semi- supervisés séparément dans la vue de la théorie de l'apprentissage de la machine. La méthode de formation supervisée montre une grande efficacité et une bonne robustesse. Le Minimum Mean Square Error (MMSE) et Maximum A Posteriori Probabilité (MAP) sont utilisés comme critères de régression séparément dans l'approche de la cartographie basée sur GMM. Cela prouve que l'approche MLR est un cas particulier de l'approche de GMM lorsque le nombre de gaussiennes est égal à un. Ainsi, l'approche de la cartographie sur GMM peut améliorer la performance significative en comparaison avec le MLR en augmentant le nombre de gaussiennes. Enfin, les différentes approches de cartographie utilisées dans ce travail sont comparées dans une transition continue. Il montre que l'approche sur GMM peut effectuer bien grâce à la propriété de classification lorsque les données source et cible n'a pas de " relation" comme dans le cas de l'estimation de la position de la main, et il peut également améliorer les performances par la propriété de régression local lorsque la source et les données cible a forte corrélation comme dans le cas du paramètre de lèvre estimation. En outre, une prédiction directe de la géométrie des lèvres comporte de l'image naturelle de la bouche région d'intérêt (ROI) sur la base de la 2D transformée en cosinus discrète (DCT) combinée à une analyse en composante principale (ACP) est proposé. Les résultats montrent la possibilité d'estimer les caractéristiques géométriques de la lèvre avec une bonne précision en utilisant un ensemble réduit de prédicteurs dérivés des coefficients DCT. / Cued Speech (CS) is a visual communication system that uses hand shapes placed in different positions near the face, in combination with the natural speech lip-reading, to enhance speech perception from visual input for deaf people. However one of the important challenges is the question of speech communication between normal hearing people who do not practice CS but produce acoustic speech and deaf people who use lip-reading complemented by CS code for speech perception with no residual audition. In our work, we apply the multi-linear regression approach (MLR) and Gaussian Mixture Model (GMM)-based mapping approach to map acoustic spectral parameters to the hand position in CS and the accompanying lip shape. We hence contributed to the development of automatic translation system in the framework of visual speech synthesis. It proves that the MLR approach is good for estimating the lip parameters from the spectral parameters since there is strong linear correlation between the lip parameters and spectral parameters. However, the performance of MLR approach for estimating the hand position is poor since there is no relationship between the hand positions and spectral parameters. By introducing an intermediate space, it proves that the similar topology structure is the key of the MLR. In order to release the linear constraint of the MLR approach, we apply the GMM-based mapping approach which has both the classification-partition and regression properties. The parameters of GMM are estimated by the supervised, unsupervised and semi-supervised training methods separately in the view of the machine learning theory. The supervised training method shows high efficiency and good robustness. The Minimum Mean Square Error (MMSE) and Maximum A Posteriori Probability (MAP) are used as regression criteria separately in GMM-based mapping approach. It proves that the MLR approach is a special case of GMM-based mapping approach when the number of the Gaussians equals to one. Thus the GMM-based mapping approach can improve the performance significantly in comparison with the MLR by increasing the number of the Gaussians. Finally, a continuous transition achieved by the linear interpolation in the acoustic space is introduced to compare the different mapping approaches used in this work. It shows that the GMM-based mapping approach can perform well thanks to the classification-partitioning property when the source and target data has “no relationship” such as the case of the hand position estimation; and it can also improve the performance by the local regression property when the source and target data has strong correlation such as the case of the lip parameter estimation. Besides, a direct prediction of lip geometry features from the natural image of mouth region-of-interest (ROI) based on the 2D Discrete Cosine Transform (DCT) combined with a Principal Component Analysis (PCA) is proposed. The results show the possibility to estimate the geometric lip features with good accuracy using a reduced set of predictors derived from the DCT coefficients.
366

Building a decision support system to predict the number of visitors to an amusement park : Using an Artificial Neural Network and Statistical Analysis

Johansson, Benjamin, Almqvist, Elias January 2018 (has links)
In this thesis, we develop a decision support system for the amusement park Skara Sommarland. The aim is to predict how many visitors will come to the park in order to help the management allocate the correct amount of personnel on any given day. In order to achieve this, the widely used CRoss-Industry Standard for Data Mining framework was applied to finally build a multiple linear regression (MLR) function and an artificial neural network (ANN) model. The data used to develop the models were Skara Sommarland’s historical business data and historical weather data for the surrounding area. Additionally, a fully functional web application was built which allowed the management at Skara Sommarland to use the predictions in their daily operations. The ANN outperformed the MLR and managed to achieve about 80% accuracy in predicting the number of visitors, reaching the initial data mining goal set by the project group. The conclusion formed by this thesis is that an ANN can be used to predict the number of visitors to an amusement park similar to Skara Sommarland. The final IT artifact produced can realistically help improve an amusement park’s operations by avoiding over- and under-staffing.
367

Modelos de regressão linear heteroscedásticos com erros t-Student : uma abordagem bayesiana objetiva / Heteroscedastics linear regression models with Student-t errors: an objective bayesian analysis

Souza, Aline Campos Reis de 18 February 2016 (has links)
Submitted by Luciana Sebin (lusebin@ufscar.br) on 2016-09-26T18:57:40Z No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-27T19:59:56Z (GMT) No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-09-27T20:00:01Z (GMT) No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) / Made available in DSpace on 2016-09-27T20:00:08Z (GMT). No. of bitstreams: 1 DissACRS.pdf: 1390452 bytes, checksum: a5365fdbf745228c0174f2643b3f7267 (MD5) Previous issue date: 2016-02-18 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / In this work , we present an extension of the objective bayesian analysis made in Fonseca et al. (2008), based on Je reys priors for linear regression models with Student t errors, for which we consider the heteroscedasticity assumption. We show that the posterior distribution generated by the proposed Je reys prior, is proper. Through simulation study , we analyzed the frequentist properties of the bayesian estimators obtained. Then we tested the robustness of the model through disturbances in the response variable by comparing its performance with those obtained under another prior distributions proposed in the literature. Finally, a real data set is used to analyze the performance of the proposed model . We detected possible in uential points through the Kullback -Leibler divergence measure, and used the selection model criterias EAIC, EBIC, DIC and LPML in order to compare the models. / Neste trabalho, apresentamos uma extensão da análise bayesiana objetiva feita em Fonseca et al. (2008), baseada nas distribuicões a priori de Je reys para o modelo de regressão linear com erros t-Student, para os quais consideramos a suposicão de heteoscedasticidade. Mostramos que a distribuiçãoo a posteriori dos parâmetros do modelo regressão gerada pela distribuição a priori e própria. Através de um estudo de simulação, avaliamos as propriedades frequentistas dos estimadores bayesianos e comparamos os resultados com outras distribuições a priori encontradas na literatura. Além disso, uma análise de diagnóstico baseada na medida de divergência Kullback-Leiber e desenvolvida com analidade de estudar a robustez das estimativas na presença de observações atípicas. Finalmente, um conjunto de dados reais e utilizado para o ajuste do modelo proposto.
368

Um sistema para a infer?ncia de vari?veis usando redes neurais artificiais

Brito, Paulo Eduardo Camboim de 01 April 2013 (has links)
Made available in DSpace on 2014-12-17T14:08:55Z (GMT). No. of bitstreams: 1 PauloECB_DISSERT.pdf: 998748 bytes, checksum: ca9ede6adc0bf3c38d53d423e9580270 (MD5) Previous issue date: 2013-04-01 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / This work aims to obtain a low-cost virtual sensor to estimate the quality of LPG. For the acquisition of data from a distillation tower, software HYSYS ? was used to simulate chemical processes. These data will be used for training and validation of an Artificial Neural Network (ANN). This network will aim to estimate from available simulated variables such as temperature, pressure and discharge flow of a distillation tower, the mole fraction of pentane present in LPG. Thus, allowing a better control of product quality / Este trabalho tem como objetivo a obten??o de um sensor virtual de baixo custo para estimar a qualidade do GLP. Para a simula??o dos dados gerados por uma torre de destila??o foi utilizado um software que simula processos qu?micos, chamado HYSYS?. Esses dados ser?o utilizados para treinamento e valida??o de uma Rede Neural Artificial (RNA). Essa rede ter? como objetivo estimar a partir de vari?veis dispon?veis em uma simula??o, como a temperatura, press?o e vaz?o de refluxo de uma torre de destila??o, a fra??o molar de pentano presente no GLP. Possibilitando, desta forma, um melhor controle de qualidade do produto final
369

Decomposição de potenciais evocados auditivos do tronco encefálico por meio de classificador probabilístico adaptativo

Naves, Kheline Fernandes Peres 18 January 2013 (has links)
The Auditory Brainstem Respose signals are characteristic of the combination of neural activity responses in presence of sound stimuli, detected by the cortex and characterized by peaks and valleys. They are named by roman numerals (I, II, III, IV, V, VI and VII). The identification of these peaks is made by the classic manual process of analysis, which is based on the visualization of the signal generated by the sum of each sample. In the sum the morphological characteristics of the signal and the temporal aspects relevant waves made by Jewett are identified. However, in this visual process some difficulties may occur, regarding the recognition of patterns present, which may vary according to local, individual equipment and settings in the selected protocol. Making the analysis of ABR subject to the influence of many variables and a constant source of doubt about the reliability and agreement between examiners. In order to create a system to automatic detection of these peaks and self-learning, that takes into account the profile for evaluate from examiners this work was developed. The continuous wavelet transforms an innovative technique for the detection of peaks was used associate with a probabilistic model for classification based on the histograms with information provide by examiners. In evaluating of the system, based on the swat rate between the system and a manual technique an accuracy ranging for 74.3% to 99.7%, according to each waves. Thus the proposed technique is proved to be accurate especially in ABR that is a sign of low amplitude. / Os PEATE são sinais resultantes da combinação de respostas de atividades neurais a estímulos sonoros, detectados sobre o córtex, que se caracterizam por vales e picos, sendo nomeados por algarismos romanos (I, II, III, IV, V, VI e VII). O processo clássico de identificação desses picos é baseado na visualização do sinal gerado pela somatória de cada uma de suas componentes. Nele são identificadas as características morfológicas do sinal e os aspectos temporais relevantes constituídos pelas ondas de Jewett. No entanto, neste processo de identificação visual surgem dificuldades que tornam a análise visual dos PEATE uma fonte constante de dúvidas em relação à fidedignidade e concordância entre os examinadores. Com o objetivo de melhorar o processo de avaliação dos PEATE, foi desenvolvido um sistema de detecção automática para os picos, com capacidade de aprendizado que leva em consideração o perfil de marcação realizado por examinadores. Para a detecção de picos foi utilizada a Transformada Wavelet Contínua associado a mesma foi desenvolvido um classificador probabilístico baseado nos histogramas gerados a partir de marcações realizadas pelos profissionais. Na avaliação do sistema proposto, com base na taxa de acerto entre o sistema e a marcação manual, o mesmo apresentou uma acurácia variando de 74,3% a 99,7%, dependendo do tipo de onda analisada. Assim a técnica proposta se revela precisa, principalmente na presença de ruído característico de sinais biológicos, especialmente no PEATE, que é um sinal de amplitude baixa. / Doutor em Ciências
370

Um novo critério para seleção de variáveis usando o Algoritmo das Projeções Sucessivas

Soares, Sófacles Figueiredo Carreiro 22 September 2010 (has links)
Made available in DSpace on 2015-05-14T13:21:51Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 2432134 bytes, checksum: aeda44e0d999a92b980354a5ea66ce01 (MD5) Previous issue date: 2010-09-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This study proposes a modification in the Successive Projections Algorithm (SPA), that makes models of Multiple Linear Regression (MLR) more robust in terms of interference. In SPA, subsets of variables are compared based on their root mean square errors for the validation set. By taking into account the statistical prediction error obtained for the calibration set, and dividing by the statistical prediction error obtained for the prediction set, SPA can be improved. Also taken into account is the leverage associated with each sample. Three case studies involving; simulated analytic determinations, food colorants (UV-VIS spectrometry), and ethanol in gasoline (NIR spectrometry) are discussed. The results were evaluated using the root mean square error for an independent prediction set (Root Mean Square Error of Prediction - RMSEP), graphs of the variables, and the statistical tests t and F. The MLR models obtained by the selection using the new function were called SPE-SPA-MLR. When an interferent was present in the prediction spectra, almost all of the models performed better than both SPA-MLR and PLS. The models when compared to SPA-MLR showed that the change promoted better models in all cases giving smaller RMSEPs and variable numbers. The SPE-SPA-MLR was not better in some cases, than PLS models. The variables selected by SPA-SPE-MLR when observed in the spectra were detected in regions where interference was the at its smallest, revealing great potential. The modifications presented here make a useful tool for the basic formulation of the SPA. / Este trabalho propõe uma modificação no Algoritmo das Projeções Sucessivas (Sucessive Projection Algorithm - SPA), com objetivo de aumentar a robustez a interferentes nos modelos de Regressão Linear Múltipla (Multiple Linear Regression - MLR) construídos. Na formulação original do SPA, subconjuntos de variáveis são comparados entre si com base na raiz do erro quadrático médio obtido em um conjunto de validação. De acordo com o critério aqui proposto, a comparação é feita também levando em conta o erro estatístico de previsão (Statistical Prediction Error SPE) obtido para o conjunto de calibração dividido pelo erro estatístico de previsão obtido para o conjunto de previsão. Tal métrica leva em conta a leverage associada a cada amostra. Três estudos de caso envolvendo a determinação de analitos simulados, corantes alimentícios por espectrometria UV-VIS e álcool em gasolinas por espectrometria NIR são discutidos. Os resultados são avaliados em termos da raiz do erro quadrático médio em um conjunto de previsão independente (Root Mean Square Error of Prediction - RMSEP), dos gráficos das variáveis selecionadas e através do testes estatísticos t e F. Os modelos MLR obtidos a partir da seleção usando a nova função custo foram chamados aqui de SPA-SPE-MLR. Estes modelos foram comparados com o SPA-MLR e PLS. Os desempenhos de previsão do SPA-SPEMLR apresentados foram melhores em quase todos os modelos construídos quando algum interferente estava presente nos espectros de previsão. Estes modelos quando comparados ao SPA-MLR, revelou que a mudança promoveu melhorias em todos os casos fornecendo RMSEPs e números de variáveis menores. O SPA-SPE-MLR só não foi melhor que alguns modelos PLS. As variáveis selecionadas pelo SPA-SPE-MLR quando observadas nos espectros se mostraram em regiões onde a ação do interferente foi à menor possível revelando o grande potencial que tal mudança provocou. Desta forma a modificação aqui apresentada pode ser considerada como uma ferramenta útil para a formulação básica do SPA.

Page generated in 0.0733 seconds