Global ETD Search

151	Extração automática de termos simples baseada em aprendizado de máquina / Automatic simple term extraction based on machine learning Merley da Silva Conrado Laguna 06 May 2014 (has links) A Mineração de Textos (MT) visa descobrir conhecimento inovador nos textos não estruturados. A extração dos termos que representam os textos de um domínio é um dos passos mais importantes da MT, uma vez que os resultados de todo o processo da MT dependerão, em grande parte, da qualidade dos termos obtidos. Nesta tese, considera-se como termos as unidades lexicais realizadas para designar conceitos em um cenário tematicamente restrito. Para a extração dos termos, pode-se fazer uso de abordagens como: estatística, linguística ou híbrida. Normalmente, para a Mineração de Textos, são utilizados métodos estatísticos. A aplicação desses métodos é computacionalmente menos custosa que a dos métodos linguísticos, entretanto seus resultados são geralmente menos interpretáveis. Ambos métodos, muitas vezes, não são capazes de identificar diferenças entre termos e não-termos, por exemplo, os estatísticos podem não identificar termos raros ou que têm a mesma frequência de não-termos e os linguísticos podem não distinguir entre termos que seguem os mesmo padrões linguísticos dos não-termos. Uma solução para esse problema é utilizar métodos híbridos, de forma a combinar as estratégias dos métodos linguísticos e estatísticos, visando atenuar os problemas inerentes a cada um deles. Considerando as características dos métodos de extração de termos, nesta tese, foram investigados métodos estatísticos, formas de obtenção de conhecimento linguístico e métodos híbridos para a extração de termos simples - aqueles constituídos de somente um radical, com ou sem afixos - na língua portuguesa do Brasil. Quatro medidas estatísticas (tvq, tv, tc e comGram), originalmente utilizadas em outras tarefas, foram avaliadas na extração de termos simples, sendo que duas delas (tvq e tv) foram consideradas relevantes para essa tarefa. Quatro novas medidas híbridas (n_subst., n_adj., n_po e n_verbo) foram propostas, sendo que três delas (n_subst,. n_adj., e n_po) auxiliaram na extração de termos. Normalmente os métodos de extração de termos selecionam candidatos a termos com base em algum conhecimento linguístico. Depois disso, eles aplicam a esses candidatos medidas ou combinação de medidas (e/ou heurísticas) para gerar um ranking com tais candidatos. Quanto mais ao topo desse ranking os candidatos estão, maior a chance de que eles sejam termos. A escolha do liminar a ser considerado nesse ranking é feita, em geral de forma manual ou semiautomática por especialistas do domínio e/ou terminólogos. Automatizar a forma de escolha dos candidatos a termos é a primeira motivação da extração de termos realizada nesta pesquisa. A segunda motivação desta pesquisa é minimizar o elevado número de candidatos a termos presente na extração de termos. Esse alto número, causado pela grande quantidade de palavras contidas em um corpus, pode aumentar a complexidade de tempo e os recursos computacionais utilizados para se extrair os termos. A terceira motivação considerada nesta pesquisa é melhorar o estado da arte da extração automática de termos simples da língua portuguesa do Brasil, uma vez que os resultados dessa extração (medida F = 16%) ainda são inferiores se comparados com a extração de termos em línguas como a inglesa (medida F = 92%) e a espanhola (medida F = 68%). Considerando essas motivações, nesta tese, foi proposto o método MATE-ML (Automatic Term Extraction based on Machine Learning) que visa extrair automaticamente termos utilizando técnicas da área de aprendizado de máquina. No método MATE-ML, é sugerido o uso de filtros para reduzir o elevado número de candidatos a termos durante a extração de termos sem prejudicar a representação do domínio em questão. Com isso, acredita-se que os extratores de termos podem gerar listas menores de candidatos extraídos, demandando, assim , menos tempo dos especialistas para avaliar esses candidatos. Ainda, o método MATE-ML foi instanciado em duas abordagens: (i) ILATE (Inductive Learning for Automatic Term Extraction), que utiliza a classificação supervisionada indutiva para rotular os candidatos a termos em termos e não termos, e (ii) TLATE (Transductive Learning for Automatic Term Extraction), que faz uso da classificação semissupervisionada transdutiva para propagar os rótulos dos candidatos rotulados para os não rotulados. A aplicação do aprendizado transdutivo na extração de termos e a aplicação ao mesmo tempo de um conjunto rico de características de candidatos pertencentes a diferentes níveis de conhecimento - linguístico, estatístico e híbrido também são consideradas contribuições desta tese. Nesta tese, são discutidas as vantagens e limitações dessas duas abordagens propostas, ILATE e TLATE. Ressalta-se que o uso dessas abordagens alcança geralmente resultados mais altos de precisão (os melhores casos alcançam mais de 81%), altos resultados de cobertura (os melhores casos atingem mai de 87%) e bons valores de medida F (máximo de 41%) em relação aos métodos e medidas comparados nas avaliações experimentais realizadas considerando três corpora de diferentes domínios na língua portuguesa do Brasil / Text Mining (TM) aims at discovering innovating knowledge in unstructured texts. The extraction of terms that represent that texts of a specific domain is one of the most important steps of TM, since the results of the overall TM process will mostly depend on the quality of these terms. In this thesis, we consider terms as lexical units used to assign concepts in thematically restricted scenarios. The term extraction task may use approaches such as: statistical, linguistic, or hybrid. Typically, statistical methods are the most common for Text Mining. These methods are computationally less expensive than the linguistic ones, however their results tend to be less human-interpretable. Both methods are not often capable of identifying differences between terms and non-terms. For example, statistical methods may not identify terms that have the same frequency of non-terms and linguistic methods may not distinguish between terms that follow the same patterns of non-terms. One solution to this problem is to use hybrid methods, combining the strategies of linguistic and ststistical methods, in order to attenuate their inherent problems. Considering the features of the term extraction methods, in this thesis, we investigated statistical melhods, ways of obtaining linguistic knowledge, and hybrid methods for extracting simple terms (only one radical, with or without the affixes) for the Braziian Portuguese language. We evaluated, in term extraction, four new hybrid measures (tvq, tv, and comGram) originally proposed for other tasks; and two of them (tvq and tv) were considered relevant for this task. e proposed four new hybrid measures(n_subs., n_adj., n_po, and n_verb); and there of them (n_subst., n_adj., and n_po) were helpful in the term extraction task. Typically, the extraction methods select term candidates based on some linguistic knowledge. After this process, they apply measures or combination of measures (and/or heuristics) to these candidates in order to generate a ranking. The higher the candidates are in the ranking, the better the chances of being terms. To decide up to which position must be considered in this ranking normally, a domain expert and/or terminologist manually or semiautomatically analyse the ranking. The first motivation of this thesis is to automate how to choose the candidates during the term extraction process. The second motivation of this research is to minimize the high number of candidates present in the term extraction. The high number of candidate, caused by the large amount of words in a corpus, could increase the time complexity and computational resources for extracting terms. The third motivation considered in this research is to improve the state of the art of the automatic simple term extraction for Brazilian Portuguese since the results of this extraction (F-measure = 16%) are still low when compared to other languages like English (F-measure = 92%) and Spanish (F-measure =68%). Given these motivations, we proposed the MATE-ML method (Automatic Term Extraction Based on Machine Learning), which aims to automatically extract simple terms using the machine learning techniques. MATE-ML method suggests the use of filters to reduce the high number of term candidates during the term extraction task without harming the domain representation. Thus, we believe the extractors may generate smaller candidate lists, requiring less time to evaluate these candidates. The MATE-ML method was instantiated in two approaches.: (i) ILATE (Inductive Learning for Automatic Term Extraction),. which uses the supervised inductive classification to label term candidates, and (ii) TLATE (Trnasductive Learning for Automatic Term Extraction), which uses transductive semi-supervised classification to propagate the classes from labeled candidates to unlabeled candidates. Using transductive learning in term extraction and using, at the same time, a rich set of candidate features belonging to different levels of knowledge (linguistic,statistical, and hybrid) are also considered as contributions. In this thesis, we discuss the advantages and limitations of these two proposed approaches. We emphasize taht the use of these approaches usually with higher precision (the best case is above of 81%), high coverage results (the best case is above of 87%), and good F-measure value (maximum of 41%) considering three corpora of different domains in the Brazilian Portuguese language Aprendizado de máquina Conhecimento linguístico estatístico e híbrido Extração automática de termos Automatic term extraction Linguistic Machine learning statistical statistical and hybrid
152	Ajuste de modelos de degradabilidade ruminal por meio da técnica de produção de gases utilizando as metodologias clássica e bayesiana / Adjustment of ruminal degradability models applying the technique of gas production by using classical and Bayesian methodologies Gabriel Batalini de Souza 15 March 2013 (has links) Dado o poder agropecuário nacional e sabendo que a pastagem tem papel fundamental na nutrição animal, torna-se primordial o estudo dos mecanismos da digestão ruminal das forragens, para um aproveitamento mais racional das pastagens pelos animais, propiciando uma fermentação ruminal ótima e possibilitando o balanceamento de rações de forma mais adequada. Esta abordagem é possível por meio dos modelos de degradação ruminal, que são classificados como modelos de regressão não lineares. Neste trabalho são abordadas as metodologias clássica e bayesiana para ajustar os modelos que descrevem a cinética de degradação ruminal por meio da técnica de produção de gases. Na abordagem clássica foram considerados os modelos não sigmoidal proposto por Orskov&McDonald (1979), o Logístico proposto por Schofield (1994) e o Gompertz proposto por Lavrencic (1997), considerando a necessidade de fatores autorregressivos de primeira e segunda ordem mediante o teste de razão de verossimilhança (TRV); os modelos foram avaliados por meio dos critérios de Akaike (AIC), coeficiente de determinação ajustado (R2 aj) e quadrado médio residual (QMR). Em uma segunda etapa realizou-se o ajuste do modelo não sigmoidal sem fator autorregressivo utilizando a abordagem bayesiana, em que a condição de convergência das cadeias foi analisada por meio dos critérios de Geweke (1992), Heidelberger&Welch (1993), Raftery& Lewis (1992) e o Erro de Monte Carlo (EMC). Dentre os modelos utilizados, o que melhor se ajustou aos dados analisados foi o modelo não sigmoidal proposto por Orskov e McDonald (1979), sem o fator autorregressivo, obtendo estimativas condizentes com a realidade do fenômeno. Os resultados obtidos por meio da abordagem bayesiana também foram satisfatórios, mostrando que a técnica, apesar de pouco difundida em estudos de degradação ruminal é uma metodologia bastante viável e tem muito a agregar em estudos da área. / Given the national agricultural power and knowing that grazing plays an important role in animal nutrition, it becomes primordial to study the mechanisms of ruminal digestion of forages, for a more rational use of pastures by the animals, providing an optimal rumen fermentation and allowing a more adequate and balanced feed. This approach is possible by using the rumen degradation models, which are classified as non-linear regression models. This essay discusses the classical and Bayesian methods to adjust the models that describe the kinetics of degradation by rumen gas production technique. In the classical approach, the \"Non Sigmoidal models\", proposed by Orskov& McDonald (1979), the \"Logistic\", proposed by Schofield (1994), and \"Gompertz\", proposed by Lavrencic (1997), were considered, taking into account the need for autoregressive factors of first and second order, by the \"likelihood ratio test \" (TRV). These models were evaluated using the Akaike criteria (AIC), the coefficient of determination adjusted (R2aj) and \"the residual average square\" (QMR). In the following stage, the adjustment of the non sigmoidal model without the autoregressive factor were performed, using the Bayesian approach. For these matters, the condition of the convergence of chains was analyzed using Geweke (1992), Heidelberger & Welch (1993), Raftery& Lewis (1992) and Monte Carlo error(EMC) criteria.Among the models used, the one that best settle to the data analyzed was the non sigmoidal model without the autoregressive factor, proposed by Orskov and McDonald (1979), obtaining consistent estimates with the reality of the phenomenon. The results obtained through the Bayesian approach were also satisfactory, showing that the technique, although less diffused in studies of rumen methodology, is very viable and has a lot to add in these area studies. Degradação ruminal Inferência bayesiana Modelos não lineares R (Software estatístico) Bayesian inference Non-linear models R Software Ruminal degradation
153	Índices de capacidade para gráficos de controle baseados em modelos de regressão / Capability indices to control charts based on regression models Souza, Fernanda Siqueira January 2010 (has links) Índices de capacidade mal empregados geram conclusões errôneas, comprometendo o estudo e análise do processo, prejudicando o atendimento de exigências gerenciais ou de clientes externos. Assim, o objetivo do presente trabalho é propor índices de capacidade para processos monitorados com gráficos de controle baseado em modelos de regressão conteplando limites simétricos e assimétricos. Realizou-se um mapeamento dos artigos publicados em nove periódicos no período de 2000 a 2009, visando identificar as abordagens pesquisadas sobre capacidade de processos. Um fluxograma orientativo é apresentado, com a finalidade de direcionar a escolha do tipo de gráfico de controle e índices de capacidade para processos com variáveis de resposta: (i) não correlacionadas, (ii) correlacionadas dependentes da variável de controle e (iii) autocorrelacionadas. O uso do fluxograma foi ilustrado através da aplicação do mesmo em um processo de torneamento de uma empresa de máquinas agrícolas. / Capability indices wrongly appointed generate erroneous conclusions, compromising the study and analysis of the process, jeopardizing the fulfillment of the requirements management or external customers. Therefore, the objective of this study is to propose capability indices for processes monitored with control charts based on regression models considering symmetric and asymmetric limits. A mapping of the articles published in nine journals, during the period of 2000 to 2009, was conducted to identify the different approaches surveyed on process capability. A flowchart is presented to direct the choice of control chart and capability indices for processes with response variables: (i) noncorrelated, (ii) correlated dependent control variables and (iii) autocorrelated. The use of the flowchart was illustrated by applying it to the hard turning process of an agricultural machinery company. Controle estatístico de processo Modelos de regressão Statistical process control Tradicional capability indices
154	A utilização de métodos de regressão para respostas ordinais no estudo de coorte das crianças nascidas em 1993 em Pelotas, RS, Brasil Nunes, Luciana Neves January 1999 (has links) Em estudos epidemiológicos. Os desfechos são freqüentemente medidos em escalas ordinais, entretanto são analisados por técnicas tradicionais. como a reg ressão logística que requer desfecho binário. Consequentemente. informações importantes podem ser perdidas devido a arbitrariedade na escolha do ponto de corte. Modelos de regressão para respostas ordinais têm sido desenvolvidos e têm vantagens de reter a ordinalidade dos dados e fornecer estimativas interpretáveis para os epidemiologistas. Esse artigo descreve o modelo de odds proporcionais proposto por McGullagh e o aplica aos dados da coorte de cnanças nascidas em Pelotas em 1993. usando o pacote estatístico SAS. O objetivo desse artigo foi comparar os resultados do modelo de odds proporcionais e da regressão logística tradicional usando diferentes pontos de corte. O desfecho foi déficit de estatura para idade expressa em escore-z. com três níveis ordinais. Concluiu-se que o modelo de odds proporcionais produz uma estimativa interpretável. similar a uma razão de odds. que sumariza o efeito sobre todos pontos de corte. Na presente análise. as estimativas pontuais resultantes da regressão ordinal foram similares ás obtidas através da regressão logística tradicional usando o ponto de corte do escore-z em -1. Entretanto, a regressão ordinal produziu intervalos de confiança menores (e, portanto, aumento do poder estatístico), evitando a arbitrariedade de ter um único ponto de corte. Uma limitação para uso mais amplo do modelo ordinal é a falta de pacotes estatísticos que o incluam. / Outcomes in epidemiological studies are often measured using ordinal scales, but are nevertheless analyzed through traditional techniques such as logistic regression that require a single dychotomous outcome. Therefore, important information may be lost due to arbitrariness in the choice of a cut-off point. Regression models for ordinal responses have been developed and have the advantages of nr.aking full use of the ordinality of the data, while still providing interpretable estimates for epidemiologists. This paper describes the proportional odds model proposed by McGulla~h and applies it to data from a birth cohort in Southern Brazil. using the statistical package SAS. The objective of this paper was to compare the results of the proportional odds model and of traditional logistic regression using different cut-offs. The outcome was heighUage deficit. expressed in z-scores, with three ordinal leveis. We conclude that the proportional odds model produces an interpretable estimate. similar to an odds ratio, that summarizes the effect over ali leveis of the outcome In the present analysis, the point estimates resulting from ordinal regression were similar to those obtained through traditional logistic regression using a cut-off of -1 z-score. However, ordinal regression lead to smaller confidence intervals (and therefore increased study power), avoiding the arbitrariness of having a single cut-off point. A restriction to the wider use of the ordinal model is the lack of statistical packages that include it. Métodos de regressão Pacote estatístico SAS Epidemiologia Desnutrição proteico-calórica Models Statistical Logistic models Epidemiology Protein-energy malnutrition
155	Premissas e suposições para construção de gráficos de controle : um framework para verificação Korzenowski, Andre Luis January 2009 (has links) O presente trabalho propõe um framework que inclui a organização de procedimentos e técnicas estatísticas para a verificação da premissa e suposições dos gráficos de controle. Ao final do framework o usuário tem a indicação de qual gráfico é mais propício a condição dos dados em relação as suposições verificadas. O método é dividido em 4 fases que engloba a verificação da premissa de estacionariedade e das suposições de normalidade, independência e homocedasticidade. Procedimentos com o objetivo de adequar os dados as suposições são apresentados. Esta dissertação apresenta sugestões para solução dos problemas relacionados a violação da suposição de homocedasticidade. Descreve os principais modelos de obtenção de resíduos independentes e normal e identicamente distribuídos como solução para a violação de independência. São efetuados dois estudos de simulação Monte Carlo onde, como principais resultados, obteve-se: (i) um procedimento eficiente para verificação da premissa de que o processo encontra-se sob controle antes da implantação dos gráficos de controle e; (ii) o efeito da não normalidade na probabilidade de erros do tipo I nos gráficos X e S de Shewhart. Além disso, apresenta a relação entre tamanho de amostra e não normalidade como aspecto importante na construção de gráficos de controle do tipo X e S de Shewhart em relação ao erro do tipo I. / This paper proposes a framework that includes the organization of procedures and statistical techniques for the verification of the control chart's premise and assumptions. At the end of the framework is an indication of which chart has more favorable data condition on assumptions noted. The method is divided into 4 phases which includes verification of the stationarity premise and assumptions of normality, independence and homoscedasticity. Procedures with the goal of matching the data were been presented. This Master's work presents suggestions for solving problems related to violation of the homoscedasticity assumption. Describes the main types of models to intend get normal independent and identically distributed residuals as a solution to the violation of assumptions in the original data. Two studies are performed in Monte Carlo simulation and the main results obtained is: (i) an efficient procedure for verifying the premise that the process is under control before the implantation of control charts, (ii) the effect of non-normality in the probability of Type I error in and S Shewhart's control charts. In addition, shows the relationship between sample size and non-normality as important factor in building and S Shewhart's control charts on the error of Type I. Controle estatístico de processo Gráficos de controle Statistical process control Type I error
156	Proposta de um método para aplicação de gráficos de controle de regressão no monitoramento de processos Pedrini, Danilo Cuzzuol January 2009 (has links) O presente trabalho propõe um método para a aplicação do gráfico de controle de regressão para o monitoramento de processos industriais. O método proposto inclui uma modificação do gráfico de controle de regressão múltipla, permitindo o monitoramento direto da característica de qualidade do processo ao invés do monitoramento dos resíduos padronizados do modelo de regressão, facilitando a interpretação dos operadores do processo. O método é dividido em duas fases principais: (i) Fase I - análise retrospectiva e (ii) Fase II - monitoramento do processo. A Fase I é composta pela coleta das amostras iniciais, estimação do modelo de regressão e análise de estabilidade dos dados coletados e, a partir desta fase, define-se alguns parâmetros a serem utilizados na fase seguinte. A Fase II do método consiste na coleta periódica de amostras, verificação da extrapolação dos valores das variáveis de controle e monitoramento do processo propriamente dito. O método proposto foi validado através da aplicação em um processo produtivo e de uma comparação do número médio de amostras (NMA) do gráfico de controle de regressão proposto, gerado através de simulação de Monte Carlo, com outros procedimentos similares encontrados na literatura. Como principais resultados esta dissertação apresenta: (i) proposta de um método sistematizado para nortear a aplicação de gráficos de controle de regressão; (ii) adaptação do gráfico de controle de regressão, de forma a permitir o monitoramento direto da característica de qualidade; (iii) proposta de um procedimento gráfico para a verificação da extrapolação das variáveis de controle e (iv) obtenção do NMA do gráfico de controle de regressão proposto e de outros procedimentos encontrados na literatura. O método proposto foi aplicado em um processo produtivo de uma indústria de borrachas. / This work proposes a method for the application of regression control charts in the monitoring of industrial processes. In order to facilitate the interpretation by the process operators, a modification in the multiple regression control chart is proposed allowing the direct monitoring of the values of quality characteristic of the process, instead of monitoring the regression standardized residuals. The proposed method is divided into two Phases: (i) Phase I, called retrospective analysis, and Phase II, called process monitoring. Phase I is composed by sampling, estimation of linear regression model and verification of stability of these samples. This phase defines some parameters to be used in the following phase. Phase II consists in periodic sampling of the process, altogether with verification of the extrapolation of process control variables and the process monitoring itself. The proposed method was validated through practical application in an industrial process and compared with other procedures found in literature. This work has also achieved the average run length (ARL) of the proposed regression control chart, which was compared with the other procedures consulted. The main contributions of this work may be pointed: (i) the proposal of a method to guide the application of regression control chart; (ii) the adaptation of the multiple regression control chart, allowing the direct monitoring of the quality characteristic; (iii) the proposal of a control chart to monitor the extrapolation of the process control variable and (iv) the obtaining of the ARL of the proposed regression control chart and other similar procedures. The proposed method was applied in a process of a rubber manufactory. Modelos de regressão Controle de qualidade Gráficos de controle Controle estatístico de processo Regression control chart Average run length Regression models
157	Controle estatístico do processo aplicado a ambientes customizados Korzenowski, Andre Luis January 2012 (has links) Durante os anos 70, os sistemas de produção evoluíram de planos de produção em massa para planos flexíveis, capazes de prover para cada consumidor produtos ou serviços diferenciados através de um processo ágil, flexível e integrado com baixo custo. O aumento de opções do menu de escolha por parte dos clientes resulta na produção de pequenos lotes de produtos e, consequentemente, dados em volume insuficiente para estimar os parâmetros do processo necessários para o monitoramento da característica de qualidade. A literatura reconhece que não existem métodos capazes de tratar o pro- blema do monitoramento de ferramentas de qualidade em sistemas de produção flexíveis e customizados. O objetivo deste trabalho é propor ferramentas de controle estatístico do processo para este tipo de ambiente. Verifica-se que cenários de produção customi- zados sujeitos à produção em pequenos lotes são suscetíveis a violações de suposições e estimativas imprecisas dos parâmetros do processo. Além disso, as ações adotadas pelos engenheiros de qualidade na fase I da implantação de cartas de controle nas empresas visitadas é conflitante com o que é sugerido na literatura. Verificação dos pressupostos de normalidade e independência não são executados, mesmo quando cartas de controle são implantadas. Os principais procedimentos de controle de qualidade do atual estado da arte são apresentados para verificar alternativas para a implantação de ferramentas de controle estatístico do processo em ambientes onde as estratégias atuais de produção causaram o aumento da necessidade de flexibilidade. Nestes casos, a característica da qualidade costuma ser a mesma, mas para diferentes produtos, o que significa que se tem uma única observação para cada produto em cada momento, no mesmo processo. Discussões sobre a viabilidade em implantar as principais metodologias neste contexto são apresentadas. Entre os métodos levantados no estado da arte, uma única abordagem ca- paz é a carta que utiliza o desvio do alvo no instante t, apresentada por Del Castillo et. al. (1996), porém não é aplicável ao problema de pesquisa apresentado nesta tese, pois exige uma fase retrospectiva de análise. Além disso, a inclusão de um novo produto ou uma mudança significativa no processo antigo em um ambiente flexível não pode ser tratada pelos métodos apresentados. Uma carta de controle multivariada de auto-inicialização baseada no filtro de Kalman para o sistema de múltiplos setups é proposta além de adap- tações da carta de auto-inicialização de Shewhart e da carta de controle de Quesenberry (1991) com média e variância desconhecidos. O modelo baseado no filtro de Kalman foi escolhido depois de um estudo de simulação que comparou o desempenho preditivo dos modelos ARIMA, Regressão PLS e Estrutural Básico. O desempenho das abordagens de controle estatístico do processo propostas foi comparado através de medidas de ARL e a análise considerou a implantação das ferramentas em uma série de dados real e em séries simuladas de ambientes sujeitos à violação das suposições básicas das cartas tradicionais. Como benchmark, foi utilizada a análise retrospectiva da carta de resíduos apresentada por Del Castillo et. al. (1996). Os resultados mostram que a hipótese de violação da nor- malidade é a que mais deteriora o desempenho das cartas de controle. Efeitos de violação da independência e da suposição de homocedasticidade não são significativos ao nível de 5%, de acordo com a análise de variância realizada. Conclui-se que, dos cinco procedimentos propostos, os adaptados obtiveram resultados similares ao benchmark, podendo ser tratados como alternativas para lidar com o problema de monitoramento da qualidade em ambientes organizados com sistemas de produção customizados. / During the 70s, production systems have evolved from mass production plans to flexible plans, able to provide for each constumer diﬀerentiated products or services with low cost through an agile, flexible and integrated process. The number increase of choi- ces results in production of small batches of products, and therefore insuﬃcient volume data to estimate the required process parameters for the monitoring of quality characte- ristics. The literature shows that there are no methods to treat the problem of quality monitoring in flexible and customized production systems. The objective of this thesis is to propose tools for this type of environment. It is verified that customized scenarios are subject to small-batch production and are also susceptible to violation of assumpti- ons and inaccurate estimate of process parameters. In addition, actions taken by quality engineers in Phase I implementation of control charts in visited companies is conflicting with what is suggested in the literature. Verification of assumptions such as normality or independence are not performed, even when control charts are implemented. The state of art quality control procedures are presented in order to verify how to implement quality control tools in environments where the current strategies of production has increasing flexibility. In these cases, the quality characteristic is usually the same, but for diﬀerent products, which means that it has an observation for each product in each time frame for the same process. Discussion on the feasibility of implementing the main methodologies are presented in this context. Among the methods considered the state of the art, the chart which uses the deviation from the target at time t, presented by Del Castillo et al. (1996) is the only that could be able to work in this problem, but shall be not applied to the research problem presented in this thesis, since it requires a Phase I of retrospective analysis. Moreover, the inclusion of a new product or significant change in old process in a flexible environment can not be treated by the methods presented. A self-start multivariate control chart based on Kalman filter for multiple setups is proposed, as well as the adaptations of the self-start Shewhart control chart and the self-start Quesenberry’s control chart (1991). The model based on the Kalman filter was chosen after a simulation study that compared the predictive performance of ARIMA, PLS Regression and Struc- tural Basic models. The performance of the proposed quality control approaches was compared with measures of ARL and the analysis considered the implementation of tools in series of real data and simulated data subject to violation of the traditional charts’ basic assumptions. As a benchmark, we used a retrospective analysis of the chart presented by Del Castillo et al. (1996). The results show that the assumption of normality violation is the one that most deteriorates the performance of control charts. Eﬀects of independence and homoscedasticity violation of assumptions are not significant at 5%, according to the analysis of variance performed. We conclude that, among the five proposed procedures, the adapted ones obtained similar results to the benchmark and can be treated as alter- natives to deal with the problem of quality monitoring in environments with customized production systems. Controle estatístico de processo Customização em massa Gráficos de controle Controle de qualidade Customized systems Statistical process control Control charts performance Violation of assumptions
158	Controle estatístico das análises microbiológicas das águas potáveis e minerais comercializadas na região metropolitana do Recife–Pe FERNANDES, Amanda Cristiane Gonçalves 18 December 2015 (has links) Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-19T14:38:46Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO PÓS DEFESA 2 CORRIGIDO.pdf certa amanda.pdf: 2750762 bytes, checksum: a5f1b1ed9aff9a99f178fd6bf82aae1f (MD5) / Made available in DSpace on 2016-07-19T14:38:46Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO PÓS DEFESA 2 CORRIGIDO.pdf certa amanda.pdf: 2750762 bytes, checksum: a5f1b1ed9aff9a99f178fd6bf82aae1f (MD5) Previous issue date: 2015-12-18 / CAPEs / A falta de confiabilidade da qualidade da água do abastecimento público fez com que a maioria da população passasse a consumir com maior intensidade a água mineral. Para atender uma grande demanda das águas minerais envasadas aumentou–se ao longo dos anos o número de empresas e escavações de poços, até mesmo de forma irregular. Nessa perspectiva, é imprescindível conhecer a qualidade da água que está sendo comercializada pela população com forma de evitar danos à saúde e exigir dos órgãos competentes maiores fiscalizações. O objetivo desta pesquisa é avaliar a qualidade das águas potáveis comercializadas na região metropolitana do Recife–PE, seja através da análise microbiológica de acordo com a portaria nº 2.914/2011 e Resolução 275/2005, seja através dos dados qualitativos obtidos, buscando utilizar técnicas estatísticas adequadas como forma de obtenção de conclusões significativas para esta análise. As amostras foram garrafinhas envasadas de água mineral, pois tratam-se de um dos tipos de água mais comercializadas na região, as quais foram adquiridas de forma aleatória, no comércio local da Região Metropolitana de Recife–PE, no período de Janeiro a Abril de 2015 e no período de Junho a Agosto de 2015. Foram adquiridas um total de 35 garrafinhas que variam entre 300 ml a 500 ml e com 7 variedades de marcas, divididas em 5 unidades com mesmo lote para os dois períodos respectivamente. Para análise de coliformes totais, coliformes fecais/E. Coli, Enterococos e Pseudomonas Aeruginosas utilizou-se a técnica de Tubos Múltiplos adaptada; para contagem de bactérias heterotróficas, foi utilizada a técnica de cultivo em profundidade; para a contagem do pH de cada amostra foi verificado, em triplicata com auxílio de pHmetro. No período de Janeiro a Abril (40%) do total de amostras detectaram presença de Coliformes Totais; Para coliformes fecais/E.coli (8,57%) e Pseudomonas Aeruginosas (37,14%). De acordo com Resolução 275/2005 as amostras A, B e C tiveram suas partidas rejeitadas. Para a contagem de bactérias heterotróficas a Marca A obteve (100%) acima do limite padrão de 500 (UFC/ml) e a marca B obteve (20%). De acordo com a portaria nº 2.914/2011, conclui- se que a partida da marca A está rejeitada e uma amostra da marca B está comprometida. No período de Junho a Agosto (28,57%) do total de amostras detectaram presença de Coliformes Totais. Para coliformes fecais/E.coli obteve-se (0%) e Pseudomonas Aeruginosas (34,28). De acordo com Resolução 275/2005 as amostras A, B, C, D e E tiveram suas partidas rejeitadas. Para a contagem de bactérias heterotróficas as Marca A, B, C e D obtiveram (100%) acima do limite padrão de 500 (UFC/ml). De acordo com a portaria nº 2.914, conclui-se que as partidas das marcas A, B, C e D estão rejeitadas. Para as variáveis quantitativas (pH e Contagem de bactérias heterotróficas) foi utilizado o teste de Shapiro Wilk onde verificou que as mesmas não seguem uma distribuição normal. Através do teste estatístico qui-quadrado pode–se verificar que não houve diferença significativa na associação entre as variáveis estudadas para com os períodos analisados. Não houve variação entre as medições de pH das amostras e nem diferença significativa da medição de pH entre os períodos de Janeiro a Março/2015 e Junho a Agosto/2015. Para comparar os dados em relação aos períodos utilizaram–se estatísticas descritivas, tabelas de frequências e gráficos de Colunas. / The unreliability of public drinking water quality has meant that most people spend consuming more intensely mineral water. To meet a large demand for bottled mineral waters was increased over the years the number of companies and excavation pits, even irregularly. From this perspective, it is essential to know the quality of water being sold by people with a way to avoid damage to health and require the competent bodies larger checks. The objective of this research is to evaluate the quality of drinking water sold in the metropolitan area of Recife-PE, either through microbiological analysis according to the decree No. 2,914 / 2011 and Resolution 275/2005, either through the obtained qualitative data, seeking to use techniques appropriate statistics in order to obtain significant findings for this analysis. Samples were potted bottles of mineral water, as these are one of the types of water most commercialized in the region, which were acquired at random, in the local market in the metropolitan region of Recife-PE in the period from January to April 2015 and from June to August 2015. There were obtained a total of 35 bottles ranging from 300 ml to 500 ml and 7 varieties marks divided into five units of the same batch for two periods respectively. For analysis of total coliforms, fecal coliforms / E. Coli, Enterococci and Pseudomonas Aeruginosa used the multiple tube technique adapted; for counting heterotrophic bacteria, it was used culture technique in depth; to pH count of each sample was checked in triplicate with the aid of pH meter. In the period from January to April (40%) of the total samples detected the presence of Total Coliforms; For fecal coliform / E. coli (8.57%) and Pseudomonas Aeruginosa (37.14%). According to Resolution 275/2005 samples A, B and C had rejected their matches. For heterotrophic bacterial count of the mark A, B, C and D obtained (100%) above the standard limit of 500 (CFU / ml). According to Ordinance No. 2914, it is concluded that the matches of the brands A, B, C and D are rejected. For the quantitative variables (pH and Counting of heterotrophic bacteria) we used the Shapiro-Wilk test which found that they do not follow a normal distribution. Using the chi-square test statistic it can be seen that there was no significant difference in the association between variables towards the periods. There was no variation in pH measurements of samples and no significant difference in pH measurement in the period from January to March / 2015 and June to August / 2015. To compare the data for the periods we used descriptive statistics, frequency tables and columns of graphics. Água Potável Coliformes Controle Estatístico análise microbiológica dados qualitativos Drinking Water coliforms Statistical control microbiological analysis qualitative data
159	Simulação de condutividade alternada em sistemas poliméricos e aplicações em poliméricos condutivos / Simulation of alternated conductivity, in polymeric systems and applications in conductive polymers Haroldo Naoyuki Nagashima 20 March 2000 (has links) Os processos envolvidos em condução eletrônica de polímeros condutores são muito complicados devido à intricada morfologia estrutural de tais materiais. Realizamos medidas de condutividade alternada em filmes de polianilina em uma grande faixa de freqüência, variando o grau de dopagem dos filmes e temperatura. Ao mesmo tempo, desenvolvemos um modelo estatístico de rede de resistores para descrever a estrutura polimérica e para simular as componentes real e imaginária de sua resistividade alternada. Leva-se em conta a polidispersividade do material, assim como os mecanismos de transportes de carga intracadeia e intercadeia. Pela aplicação de uma técnica de matriz de transferência, o modelo reproduz medidas de resistividade alternada realizadas em filmes de polianilina em diferentes graus de dopagem e em diferentes temperaturas. Nossos resultados indicam que os mecanismos intercadeias governam o comportamento da resistividade em regiões de baixa freqüência enquanto que, para altas freqüências, mecanismos intracadeia são dominantes. Essa simulação foi desenvolvida para redes bi e tridimensional. Aplicamos, também, esse método para estudar sistemas isoenergéticos de estrutura desordenada (poliacetileno estirado), sistemas isoenergéticos de estrutura desordenada (poliacetileno não-estirado) e sistemas não-isoenergéticos de estrutura desordenada (polianilina). Finalmente, uma comparação entre esses três materiais, permitiu-se discutir, em detalhes, a distribuição de barreiras de energia potencial e a diferença dos níveis de energia que controlam o mecanismo de salto dos portadores eletrônicos. / The processes involved in electronic conduction of conducting polymers are very complicated due to the intricate morphological structure of such materials. We carried out alternating conductivity measurements in polyaniline films in a large frequency range, varying the doping degree of the films and temperature. At the same time, we developed a statistical model of resistor networks to describe a polymer structure and to simulate the real and imaginary components of their ac resistivities. This model takes into account the polydispersiveness of the material as well as intrachain and interchain charge transport mechanisms. By the application of a transfer-matrix technique, it reproduces ac resistivity measurements carried out with polyaniline films in different doping degrees and temperatures. Our results indicate the interchain mechanisms govern the resistivity behavior in the low frequency region while, for higher frequencies, intrachain mechanisms are dominated. These simulations were developed in bi and tridimensional lattice. We also applied this method to study ordered structure in isoenergetic systems (stretched polyacetylene), disordered structure in isoenergetic systems (normal polyacetylene), and disordered structure in non-isoenergetic systems (polyaniline). Finally, a comparison between these three materials, allowed us to discuss in detail the energy barriers distribution and the difference in energy levels, which control the hopping mechanisms of the electronic carriers. Matriz de transferência Mecanismo de condução Modelo estatístico Polialinina Rede de resistores Conduction mechanism Polyaniline Resistor network Statistical model Transfer matrix
160	Aspectos biométricos da detecção de QTL'S ("Quantitative Trait Loci") em espécies cultivadas. / Biometrical aspects of QTL detection in cultivated species. Heyder Diniz Silva 05 December 2001 (has links) O mapeamento de QTL's difere dos demais tipos de pesquisas conduzida em genética. Por se tratar basicamente de um procedimento de testes múltiplos, surge, neste contexto, um problema que se refere ao nível de significância conjunto da análise, e consequentemente, seu poder. Deste modo, avaliou-se, via simulação computacional de dados, o poder de detecção de QTL's da análise de marcas simples, realizada por meio de regressão linear múltipla, utilizando o procedimento stepwise" para seleção das marcas e procedimentos baseados em testes individuais, utilizando os critérios FDR e de Bonferroni para determinação nível de significância conjunto. Os resultados mostraram que o procedimento baseado em regressão múltipla, utilizando o procedimento stepwise" foi mais poderoso em identificar as marcas associadas a QTL's e, mesmo nos casos em que este procedimento apresentou poder ligeiramente inferior aos demais, verificou-se que o mesmo tem como grande vantagem selecionar apenas as marcas mais fortemente ligadas aos QTL's. Dentre os critérios FDR e de Bonferroni, o primeiro mostrou-se, em geral, mais poderoso, devendo ser adotado nos procedimentos de mapeamento por intervalo. Outro problema encontrado na análise de QTL's refere-se µa abordagem da interação QTL's x ambientes. Neste contexto, apresentou-se uma partição da variância da interação genótipos x ambientes em efeitos explicados pelos marcadores e desvios, a partir da qual obtiveram-se os estimadores da proporção da variância genética (pm), e da variância da interação genótipos x ambientes (pms), explicadas pelos marcadores moleculares. Estes estimadores independem de desvios das frequências alélicas dos marcadores em relação µ as esperadas (1:2:1 em uma geração F2, 1:1 em um retrocruzamento, etc.), porém, apresentam uma alta probabilidade de obtenção de estimativas fora do intervalo paramétrico, principalmente para valores elevados destas proporções. Contudo, estas probabilidades podem ser reduzidas com o aumento do número de repetições e/ou de ambientes nos quais as progênies são avaliadas. A partir de um conjunto de dados de produtividade de grãos, referentes µ a avaliação de 68 progênies de milho, genotipadas para 77 marcadores moleculares codominantes e avaliadas em quatro ambientes, verificou-se que as metodologias apresentadas permitiram estimar as proporções pm e pms, bem como classificar as marcas associadas a QTL's, conforme seu nível de interação. O procedimento permitiu ainda a identificação de regiões cromossômicas envolvidas no controle genético do caractere sob estudo conforme sua maior ou menor estabilidade ao longo dos ambientes. / In general terms, QTL mapping di®ers from other research ac-tivities in genetics. Being basically a multiple test procedure, problems arise which are related to the joint level of signi¯cance of the analysis, and consequently, to its power. Using computational simulation of data, the power of simple marker analysis, carried out through multiple linear regression, using stepwise procedures to select the markers was obtained. Procedures based on single tests, using both the FDR and the Bonferroni criteria to determinate the joint level of signi¯cance were also used. Results showed that the procedure based on multiple regression, using the stepwise technique, was the most powerful in identifying markers associated to QTL's. However, in cases where its power was smaller, its advantage was the ability to detect only markers strongly associates with QTL's. In comparision with the Bonferroni method, the FDR criterion was in general more powerful, and should be adopted in the interval mapping procedures. Additional problems found in the QTL analysis refer to the QTL x environment interaction. We consider this aspect by par-titioning the genotype x environment interaction variance in components explained by the molecular markers and deviations. This alowed estimating the proportion of the genetic variance (pm), and genotype x environment variance (pms), explained by the markers. These estimators are not a®ected by deviations of allelic frequencies of the markers in relation to the expected values (1:2:1 in a F2 generation, 1:1 in a backcross , etc). However, there is a high probability of obtaining estimates out of the parametric range, specially for high values of this proportion. Nevertheless, these probabilities can be reduced by increasing the number of replications and/or environments where the progenies are evaluated. Based on a set of grain yield data, obtained from the evaluation of 68 maize progenies genotyped for 77 codominant molecular markers, and evaluated as top crosses in four environments, the presented methodologies allowed estimating proportions pm and pms as well the classification of markers associated to QTL's, with respect to its level of genotype x environment interaction. The procedure also allowed the identification of chromosomic regions, involved in the genetical control of the considered trait, according to its stability, in relation to the observed environmental variation. biometria genética estatística genética quantitativa marcador genético método estatístico milho biometry genetic marker maize quantitative genetics statistical genetics statistical method

Search results