Spelling suggestions: "subject:"discriminantes"" "subject:"discriminante""
1 |
Abordagem Kernelizada Para Análise Discriminante GeneralizadaQueiroz, Diego Cesar Florencio de 30 July 2013 (has links)
Submitted by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-10T13:56:06Z
No. of bitstreams: 2
Dissertacao Diego de Queiroz.pdf: 4124952 bytes, checksum: 8b1119beb27827489557809772a98050 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-10T13:56:06Z (GMT). No. of bitstreams: 2
Dissertacao Diego de Queiroz.pdf: 4124952 bytes, checksum: 8b1119beb27827489557809772a98050 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-07-30 / Diferentes modelos clássicos já foram estendidos para a classificação de dados simbólicos
de natureza intervalar, como regressão logística e discriminante linear, entre vários
outros, contudo a maior parte desses classificadores foi desenvolvida para a resolução de
problemas linearmente separáveis, não possuindo um bom desempenho face à problemas
não-linearmente separáveis. Esse trabalho introduz duas abordagens baseadas no modelo
de discriminante linear generalizado para classificar dados simbólicos intervalares.
Nessas abordagens duas famílias de funções de kernel foram utilizadas separadamente
para transpor os dados para um espaço de alta dimensão, permitindo a classificação de
problemas não linearmente separáveis. Tal transposição é realizada através do kernel
trick utilizando o produto escalar convencional e o produto escalar kernelizado para
dados intervalares. Experimentos com conjuntos de dados sintéticos, híbrido entre sintético
e real e uma aplicação com um conjunto de dados intervalares real demonstram a
funcionalidade e eficiência dessa abordagem.
|
2 |
Teorema de Sturm : uma demonstração detalhada do teorema de Sturm com propriedades e aplicaçõesNADER, Fabiano Neves 19 August 2014 (has links)
Submitted by (lucia.rodrigues@ufrpe.br) on 2017-03-29T13:33:25Z
No. of bitstreams: 1
Fabiano Neves Nader.pdf: 355299 bytes, checksum: 1b2a2621a49984f5afa2c5660f9b322a (MD5) / Made available in DSpace on 2017-03-29T13:33:25Z (GMT). No. of bitstreams: 1
Fabiano Neves Nader.pdf: 355299 bytes, checksum: 1b2a2621a49984f5afa2c5660f9b322a (MD5)
Previous issue date: 2014-08-19 / This study aims to build the entire theoretical basis for the understanding and use of the Sturm theorem, which is a tool very well grounded to find the number of real roots of a polynomial with real coefficients. During the development of this study sought to illustrate with examples and applications in great detail so that students and teachers are able to understand and use this beautiful algorithm. / Este trabalho tem por finalidade construir toda a base teórica para a compreensão e utilização do Teorema de Sturm, que é uma ferramenta muito bem fundamentada para encontrar a quantidade de raízes reais de um polinômio com coeficientes reais. Durante o desenvolvimento desse estudo procurei ilustrar com exemplos e aplicações de forma bem detalhada para que alunos e professores tenham condições de entender e utilizar este belíssimo algoritmo.
|
3 |
L'analyse multidimensionnelle des données de dissimilaritéDrouet D'Aubigny, Gérard 27 January 1989 (has links) (PDF)
Trois objectifs sont poursuivis. Nous définissons d'abord un cadre algébrique suffisamment général pour unifier les deux classes de méthodes d'analyse des données de dissimilarite connues. Le langage de la géométrie affine nous permet de montrer les correspondances entre les présentations française et anglo-américaine des méthodes tautologiques et d'enrichir la méthodologie par l'apport de méthodes issues de la tradition factorialiste et la proposition d'outils d'aide à l'interprétation des résultats. Les relations de dualité mises en évidence permettent de rendre compte des liens et différences entre ces méthodes et les techniques d'ajustement de modelés de description euclidienne des données de dissimilarite, dites de codage multidimensionnel. De plus une interprétation en terme de régression ridge du problème ainsi qu'une analogie aux méthodes d'étude des réseaux électriques sont exploites. En deuxième lieu, nous étudions en détail l'introduction de contraintes. Tout d'abord les contraintes de configuration est replace dans le cadre du formalisme statistique d'analyse multivariée des courbes de croissance, et les méthodes sont affinées en conséquence. Le recourt au formalisme tensoriel permet de plus des solutions plus simples, des interprétations plus classiques des méthodes et la proposition d'évaluation de la qualité des solutions. Enfin nous proposons une méthodologie d'analyse des données de dissimilarite structurées, issue de plans d'expérience
|
4 |
Fatores discriminantes de mortalidade e sobrevivência de micro e empresas de pequeno porte de Francisco Beltrão - Paraná / Discriminant factors mortality and survival of micro and small enterprises Francisco Beltran - ParanáGodarth, Kellerman Augusto Lemes 27 February 2015 (has links)
Made available in DSpace on 2017-07-10T16:32:28Z (GMT). No. of bitstreams: 1
Kellerman_Augusto_Godarth.pdf: 1957241 bytes, checksum: e9767ae042de98dce0290f91ea51880b (MD5)
Previous issue date: 2015-02-27 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / The Micro and Small Enterprises (MSEs) are known to be important pieces on the board of the Regional Development. Plays an important role in generating employment and income, strongly contributing to such development. It is exclusive of the city of Francisco Beltrão / PR, locus of this research, as it actually happens in any region of the country. However, the high rate of mortality of Micro and Small Enterprises (MSEs) in Brazil has been featured in the press over the years. It's no different in the state of Paraná, and it appears that is also not in the municipality of Francisco Beltrão. This has been studied in several areas of human knowledge, especially by the Entrepreneurship scholars, but also the Government, Economics, Public Management, Regional Development, among others. This study has as its theme the Company Mortality related to competitiveness effect, leadership profile, tools used for decision making and training manager and its consequences for regional development. The presented objective is to identify discriminating factors for survival and mortality of Micro and Small Enterprises Francisco Porte Beltrão - Paraná. This research can be classified in various ways. First as to the method of approach, characterized by the hypothetical-deductive method because it uses the rationalization of the deductive method and experimentation of the inductive method. The method of procedure was the statistician, related to quantitative research approach, the research is still applied nature. As for the goal, distinguishes itself as exploratory. Have the technical procedures were used to descriptive statistics, by checking the frequency and data crossing (crosstabs), generating inferences for the use of Binary Logistic Regression, Data Multivariate Analysis tool, using the computational tool SPSS 18.0. We investigated a sample of 315 companies of Francisco Beltrao, with 266 active and 49 discontinued. The results answer the question problem of this dissertation, were statistically proven that 7 variables were identified and characterized a set of discriminating factors, which were 3 for mortality: permission for the team to solve problems without management intervention; conducting customer satisfaction surveys; and goal setting; and 4 for survival: inventory control; the calculation of profitability; the use of cash flow as a source of information for decision making; and the number of courses taken by the manager. / As Micro e Empresas de Pequeno Porte (MPE) são reconhecidamente peças importantes no tabuleiro do Desenvolvimento Regional. Tem papel importante na geração de emprego e renda, contribuindo fortemente para o tal desenvolvimento. Não é exclusividade do município de Francisco Beltrão/PR, lócus desta pesquisa, pois este fato acontece em qualquer região do país. Contudo, o alto índice de mortalidade das Micro e Empresas de Pequeno Porte (MPE) no Brasil tem sido destaque na imprensa ao longo dos anos. Não é diferente no estado do Paraná, e infere-se que também não o seja no município de Francisco Beltrão. Tal fato tem sido estudado em diversas áreas do conhecimento humano, principalmente pelos estudiosos do Empreendedorismo, mas também da Administração, das Ciências Econômicas, da Gestão Pública, do Desenvolvimento Regional, entre outros. Este estudo tem como tema a Mortalidade de Empresas, relacionado como efeito de competitividade, perfil de liderança, ferramentas utilizadas para a tomada de decisão e formação do gestor e sua consequência para o desenvolvimento regional. O objetivo apresentado é identificar fatores discriminantes para a sobrevivência e mortalidade das Micro e Empresas de Pequeno Porte de Francisco Beltrão - Paraná. Esta pesquisa pode ser classificada de diversas formas. Primeiramente quanto ao método de abordagem, caracteriza-se pelo método hipotético-dedutivo, pois utiliza-se da racionalização do método dedutivo e da experimentação do método indutivo. O método de procedimento foi o estatístico, relacionado à abordagem de pesquisa quantitativa, A pesquisa é ainda de natureza aplicada. Quanto ao objetivo, distingue-se como exploratória. Já nos procedimentos técnicos foram utilizadas a Estatística Descritiva, através da verificação da frequência e do cruzamento de dados (CrossTabs), que geraram inferências para o uso da Regressão Logística Binária, ferramenta da Análise Multivariada de Dados, com uso da ferramenta computacional SPSS 18.0. Foram pesquisadas uma amostra de 315 empresas de Francisco Beltrão, sendo 266 ativas e 49 descontinuadas. Os resultados encontrados respondem à questão problema desta dissertação, estatisticamente ficaram comprovados que 7 variáveis foram identificadas e caracterizam um conjunto de fatores discriminantes, sendo elas 3 para mortalidade: a permissão para que a equipe resolva problemas sem intervenção do gestor; a realização de pesquisas de satisfação dos clientes; e o estabelecimento de metas; e 4 para a sobrevivência: o controle de estoque; o cálculo da rentabilidade; o uso do fluxo de caixa como fonte de informação para tomada de decisão; e a quantidade de cursos realizados pelo gestor.
|
5 |
Two-dimensional extensions of semi-supervised dimensionality reduction methodsMoraes, Lailson Bandeira de 19 August 2013 (has links)
Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-11T18:17:21Z
No. of bitstreams: 2
Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T13:02:06Z (GMT) No. of bitstreams: 2
Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T13:02:06Z (GMT). No. of bitstreams: 2
Dissertaçao Lailson de Moraes.pdf: 4634910 bytes, checksum: cbec580f8cbc24cb3feb2379a1d2dfbd (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2013-08-19 / An important pre-processing step in machine learning systems is dimensionality reduction,
which aims to produce compact representations of high-dimensional patterns.
In computer vision applications, these patterns are typically images, that are
represented by two-dimensional matrices. However, traditional dimensionality reduction
techniques were designed to work only with vectors, what makes them a
suboptimal choice for processing two-dimensional data. Another problem with traditional
approaches for dimensionality reduction is that they operate either on a fully
unsupervised or fully supervised way, what limits their efficiency in scenarios where
supervised information is available only for a subset of the data. These situations are
increasingly common because in many modern applications it is easy to produce raw
data, but it is usually difficult to label it. In this study, we propose three dimensionality
reduction methods that can overcome these limitations: Two-dimensional Semi-supervised
Dimensionality Reduction (2D-SSDR), Two-dimensional Discriminant Principal
Component Analysis (2D-DPCA), and Two-dimensional Semi-supervised Local Fisher
Discriminant Analysis (2D-SELF). They work directly with two-dimensional data and
can also take advantage of supervised information even if it is available only for a
small part of the dataset. In addition, a fully supervised method, the Two-dimensional
Local Fisher Discriminant Analysis (2D-LFDA), is proposed too. The methods are defined
in terms of a two-dimensional framework, which was created in this study as
well. The framework is capable of generally describing scatter-based methods for dimensionality
reduction and can be used for deriving other two-dimensional methods
in the future. Experimental results showed that, as expected, the novel methods are
faster and more stable than the existing ones. Furthermore, 2D-SSDR, 2D-SELF, and
2D-LFDA achieved competitive classification accuracies most of the time when compared
to the traditional methods. Therefore, these three techniques can be seen as
viable alternatives to existing dimensionality reduction methods. / Um estágio importante de pré-processamento em sistemas de aprendizagem de máquina
é a redução de dimensionalidade, que tem como objetivo produzir representações
compactas de padrões de alta dimensionalidade. Em aplicações de visão computacional,
estes padrões são tipicamente imagens, que são representadas por matrizes
bi-dimensionais. Entretanto, técnicas tradicionais para redução de dimensionalidade
foram projetadas para lidar apenas com vetores, o que as torna opções inadequadas
para processar dados bi-dimensionais. Outro problema com as abordagens tradicionais
para redução de dimensionalidade é que elas operam apenas de forma totalmente
não-supervisionada ou totalmente supervisionada, o que limita sua eficiência em cenários
onde dados supervisionados estão disponíveis apenas para um subconjunto
das amostras. Estas situações são cada vez mais comuns por que em várias aplicações
modernas é fácil produzir dados brutos, mas é geralmente difícil rotulá-los. Neste
estudo, propomos três métodos para redução de dimensionalidade capazes de contornar
estas limitações: Two-dimensional Semi-supervised Dimensionality Reduction (2DSSDR),
Two-dimensional Discriminant Principal Component Analysis (2D-DPCA), e Twodimensional
Semi-supervised Local Fisher Discriminant Analysis (2D-SELF). Eles operam
diretamente com dados bi-dimensionais e também podem explorar informação supervisionada,
mesmo que ela esteja disponível apenas para uma pequena parte das amostras.
Adicionalmente, um método completamente supervisionado, o Two-dimensional
Local Fisher Discriminant Analysis (2D-LFDA) é proposto também. Os métodos são definidos
nos termos de um framework bi-dimensional, que foi igualmente criado neste
estudo. O framework é capaz de descrever métodos para redução de dimensionalidade
baseados em dispersão de forma geral e pode ser usado para derivar outras técnicas
bi-dimensionais no futuro. Resultados experimentais mostraram que, como esperado,
os novos métodos são mais rápidos e estáveis que as técnicas existentes. Além disto,
2D-SSDR, 2D-SELF, e 2D-LFDA obtiveram taxas de erro competitivas na maior parte
das vezes quando comparadas aos métodos tradicionais. Desta forma, estas três técnicas
podem ser vistas como alternativas viáveis aos métodos existentes para redução
de dimensionalidade.
|
6 |
Identificação rápida de contaminantes microbianos em produtos farmacêuticos / Rapid identification of microbial contaminants in pharmaceutical productsBrito, Natalia Monte Rubio de 12 June 2019 (has links)
A qualidade microbiológica de medicamentos é fundamental para garantir sua eficácia e segurança. Os métodos convencionais para identificação microbiana em produtos não estéreis são amplamente utilizados, entretanto são demorados e trabalhosos. O objetivo deste trabalho é desenvolver método microbiológico rápido (MMR) para a identificação de contaminantes em produtos farmacêuticos utilizando a espectrofotometria de infravermelho com transformada de Fourier com reflectância total atenuada (FTIR-ATR). Análise de componentes principais (PCA) e análise de discriminantes (LDA) foram utilizadas para obter um modelo de predição com a capacidade de diferenciar o crescimento de oriundo de contaminação por Bacillus subtilis (ATCC 6633), Candida albicans (ATCC 10231), Enterococcus faecium (ATCC 8459), Escherichia coli (ATCC 8739), Micrococcus luteus (ATCC 10240), Pseudomonas aeruginosa (ATCC 9027), Salmonella Typhimurium (ATCC 14028), Staphylococcus aureus (ATCC 6538) e Staphylococcus epidermidis (ATCC 12228). Os espectros de FTIR-ATR forneceram informações quanto à composição de proteínas, DNA/RNA, lipídeos e carboidratos provenientes do crescimento microbiano. As identificações microbianas fornecidas pelo modelo PCA/LDA baseado no método FTIR-ATR foram compatíveis com aquelas obtidas pelos métodos microbiológicos convencionais. O método de identificação microbiana rápida por FTIR-ATR foi validado quanto à sensibilidade (93,5%), especificidade (83,3%) e limite de detecção (17-23 UFC/mL de amostra). Portanto, o MMR proposto neste trabalho pode ser usado para fornecer uma identificação rápida de contaminantes microbianos em produtos farmacêuticos. / Microbiological quality of pharmaceuticals is fundamental in ensuring efficacy and safety of medicines. Conventional methods for microbial identification in non-sterile drugs are widely used, however are time-consuming and laborious. The aim of this paper was to develop a rapid microbiological method (RMM) for identification of contaminants in pharmaceutical products using Fourier transform infrared with attenuated total reflectance spectrometry (FTIR-ATR). Principal components analysis (PCA) and linear discriminant analysis (LDA) were used to obtain a predictive model with capable to distinguish Bacillus subtilis (ATCC 6633), Candida albicans (ATCC 10231), Enterococcus faecium (ATCC 8459), Escherichia coli (ATCC 8739), Micrococcus luteus (ATCC 10240), Pseudomonas aeruginosa (ATCC 9027), Salmonella Typhimurium (ATCC 14028), Staphylococcus aureus (ATCC 6538), and Staphylococcus epidermidis (ATCC 12228) microbial growth. FTIR-ATR spectra provide information of protein, DNA/RNA, lipids, and carbohydrates constitution of microbial growth. Microbial identification provided by PCA/LDA based on FTIR-ATR method were compatible to those obtained using conventional microbiological methods. FTIR-ATR method for rapid identification of microbial contaminants in pharmaceutical products was validated by assessing the sensitivity (93.5%), specificity (83.3%), and limit of detection (17-23 CFU/mL of sample). Therefore, the RMM proposed in this work may be used to provide a rapid identification of microbial contaminants in pharmaceutical products.
|
7 |
Mapeamento digital de solos da Forma??o Solim?es sob Floresta Tropical Amaz?nica / Digital mapping of soil form the Solim?es Formation in the Amazon rainforestVILLELA, Andr? Luis Oliveira 29 August 2013 (has links)
Submitted by Jorge Silva (jorgelmsilva@ufrrj.br) on 2017-08-22T18:59:33Z
No. of bitstreams: 1
2013 - Andr? Luis Oliveira Villela.pdf: 14328753 bytes, checksum: ce4f856fddd576111ae58d83bad8de61 (MD5) / Made available in DSpace on 2017-08-22T18:59:34Z (GMT). No. of bitstreams: 1
2013 - Andr? Luis Oliveira Villela.pdf: 14328753 bytes, checksum: ce4f856fddd576111ae58d83bad8de61 (MD5)
Previous issue date: 2013-08-29 / CAPES / PETROBRAS / The Brazilian territory region covered by the Amazon rainforest, due to its continental dimensions and difficulty of access and various interests in extractive activities, has great demand for information to provide support for the occupation, exploitation, and systematic recuperation thus keeping environmental safeguards. The regional soil information available is scarce and in scales inconsistent with the current demands, and the investments in new areas of research in the region is still insufficient. With technological developments, especially in the area of informatics that enables the storage and analysis of large banks of pedological data, the soil mapping techniques improved considerably. Pedometric techniques have been used to store and to explore large databases, thus enabling the improvement of existing soil databases and allowing manufacture of new products in larger scale and mapped areas, with low investment required. The hypothesis of this study is that the technique of reference area may allow the systematic digital mapping of soils from the Solim?es Formation, in the Amazon State. The general objective was to develop and compare methods for mapping soils in the Oil Province Uruc? (AM), using relief covariates. A conventional pedological survey of an area of 8.000 hectares, at the detail level, was executed to be used as a reference area (RA), in the augmentation of the map using digital soil mapping (MDS) techniques for an area of 73.000 hectares after downscaling and grouping of the legend. The numerical modeling of the terrain (MDT) was used (11 covariates derived from MDT) for further application of this soil formation factor as a predictor of the map units, in discriminant functions (DF), and in an expert system based on a tree model classification (AC). Four MDS models were developed, where two were trained using the studied region conceptual model of the pedologist, and the other two were trained with models based on a statistical analysis of the reference area information. The techniques were effective for predicting the mapping units (MU) in the study region, with overall accuracy (EG) ranging from 74.62 % to 88.81 %, and the kappa index was between 0.68 and 0.85. The MDS based in the expert system and AC showed significantly better results in terms of the kappa index, general EG, and the EG for 3 of the 4 mapping units in the area. Although the FD had not the highest accuracy levels, they showed a great potential for use in MDS, especially for preliminary mapping for the pedological survey of new regions, using knowledge of AR neighboring areas. The limitations were observed in the use of FD for mapping unities with small territorial expression, and it is recommended to increase the number of training observations in a way inversely proportional to the frequency of observation of these MUs. The major contribution of this work to scientific community was the establishment of bases and techniques of MDS, using AR and the soil relief relationship, for systematic mapping of new soils form Solim?es Formation. / A regi?o do territ?rio brasileiro coberta por floresta tropical amaz?nica, por suas dimens?es continentais e dificuldade de acesso e interesses diversos em atividades extrativistas, apresenta forte demanda por informa??es gerais que possam servir como subs?dio para a ocupa??o, explora??o e recupera??o ordenada e ambientalmente equilibrada. As informa??es pedol?gicas dispon?veis sobre a ?rea s?o escassas e em escalas incompat?veis com as demandas atuais, e os investimentos em novas frentes de pesquisa na regi?o ainda s?o insuficientes. Com a evolu??o tecnol?gica, sobretudo na ?rea da inform?tica que possibilita o armazenamento e an?lises de extensos bancos de dados pedol?gicos, as t?cnicas de mapeamento pedol?gico v?m se aperfei?oando consideravelmente. T?cnicas de pedometria t?m sido utilizadas para armazenar e explorar grandes bancos de dados e t?m possibilitado o aperfei?oamento das bases pedol?gicas existentes e permitido a confec??o de novos produtos em escala e ?reas mapeadas maiores, com menores investimentos exigidos. A hip?tese deste trabalho ? de que a t?cnica de ?rea de refer?ncia permite o mapeamento digital sistem?tico dos solos da regi?o da forma??o Solim?es, e o objetivo geral foi desenvolver e comparar m?todos de mapeamento de solos da Forma??o Solim?es, na Prov?ncia Petrol?fera de Urucu, AM, utilizando covari?veis do relevo. Foi executado um levantamento pedol?gico convencional de uma regi?o com 8.000 ha, em n?vel de detalhe para ser utilizado como ?rea de refer?ncia (AR) para a amplia??o do mapa, com t?cnicas de mapeamento digital de solos (MDS) para uma ?rea de 73.000 ha com redu??o de escala e agrupamento de legenda. Foi ent?o elaborada modelagem num?rica do terreno (MDT) (11 covari?veis derivadas do MDT) para posterior utiliza??o deste fator de forma??o do solo, como preditor das unidades de mapeamento, em fun??es discriminantes (FD) e um sistema especialista baseado em modelo de ?rvores de classifica??o (AC). Foram desenvolvidas 4 cartas MDS, sendo duas treinadas por modelos baseados no modelo conceitual do ped?logo sobre a regi?o em estudo, e duas treinadas por modelos baseados em an?lise estat?stica de informa??es sobre a ?rea de referencia. As t?cnicas mostraram-se eficientes para predi??o de unidades de mapeamento (UM) na regi?o de estudo, com exatid?o global (EG) variando entre 74,62% a 88,81% e ?ndice kappa entre 0,68 e 0,85. O MDS baseado em sistema especialista e AC apresentou resultados sensivelmente melhores em termos de ?ndice kappa, EG geral e EG para 3 das 4 UM da ?rea. Embora as FD n?o tenham apresentado os maiores ?ndices de acur?cia, estas tem grande potencial de uso em MDS, sobretudo para a confec??o de mapas preliminares para o levantamento pedol?gico de novas regi?es, utilizando-se do conhecimento de AR de ?reas vizinhas. Foram observadas limita??es no emprego de FD para o mapeamento de UM?s com pequena express?o territorial, sendo recomend?vel o aumento do n?mero de observa??es de treinamento inversamente proporcional ? frequ?ncia de observa??o destas UM?s. A maior contribui??o deste trabalho para a comunidade cient?fica foi o estabelecimento de bases e t?cnicas de MDS, utilizando AR e rela??o solo-relevo para o mapeamento sistem?tico de novas ?reas da forma??o Solim?es.
|
8 |
Novas estratégias para seleção de variáveis por intervalos em problemas de classificaçãoFernandes, David Douglas de Sousa 26 August 2016 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2017-06-20T13:50:43Z
No. of bitstreams: 1
arquivototal.pdf: 7102668 bytes, checksum: abe19d798ad952073affbf4950f62d29 (MD5) / Made available in DSpace on 2017-06-20T13:50:43Z (GMT). No. of bitstreams: 1
arquivototal.pdf: 7102668 bytes, checksum: abe19d798ad952073affbf4950f62d29 (MD5)
Previous issue date: 2016-08-26 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / In Analytical Chemistry it has been recurring in the literature the use of analytical signals recorded on multiple sensors combined with subsequent chemometric modeling for developing new analytical methodologies. For this purpose, it uses generally multivariate instrumental techniques as spectrometry ultraviolet-visible or near infrared, voltammetry, etc. In this scenario, the analyst is faced with the option of selecting individual variables or variable intervals so to avoid or reduce multicollinearity problems. A well-known strategy for selection of variable intervals is to divide the set of instrumental responses into equal width intervals and select the best interval based on the performance of the prediction of a unique range in the regression by Partial Least Squares (iPLS). On the other hand, the use of interval selection for classification purposes has received relatively little attention. A common practice is to use the iPLS regression method with the coded class indices as response variables to be predicted; that is the basic idea behind the release of the Discriminant Analysis by Partial Least Squares (PLS-DA) for classification. In other words, interval selection for classification purposes has no development of native functions (algorithms). Thus, in this work it is proposed two new strategies in classification problems using interval selection by the Successive Projections Algorithm. The first strategy is named Successive Projections Algorithm for selecting intervals in Discriminant Analysis Partial Least Squares (iSPA-PLS-DA), while the second strategy is called Successive Projections Algorithm for selecting intervals in Soft and Independent Modeling by Class Analogy (iSPA-SIMCA). The performance of the proposed algorithms was evaluated in three case studies: classification of vegetable oils according to the type of raw material and the expiration date using data obtained by square wave voltammetry; classification of unadulterated biodiesel/diesel blends (B5) and adulterated with soybean oil (OB5) using spectral data obtained in the ultraviolet-visible region; and classification of vegetable oils with respect to the expiration date using spectral data obtained in the near infrared region. The proposed iSPA-PLS-DA and iSPA-SIMCA algorithms provided good results in the three case studies, with correct classification rates always greater than or equal to those obtained by PLS-DA and SIMCA models using all variables, iPLS-DA and iSIMCA with a single selected interval, as well as SPA-LDA and GA-LDA with selection of individual variables. Therefore, the proposed iSPA-PLS-DA and iSPA-SIMCA algorithms can be considered as promising approaches for use in classification problems employing interval selection. In a more general point of view, the possibility of using interval selection without loss of the classification accuracy can be considered a very useful tool for the construction of dedicated instruments (e.g. LED-based photometers) for use in routine and in situ analysis. / Em Química Analítica tem sido recorrente na literatura o uso de sinais analíticos registrados em múltiplos sensores combinados com posterior modelagem quimiométrica para desenvolvimento de novas metodologias analíticas. Para esta finalidade, geralmente se faz uso de técnicas instrumentais multivariadas como a espectrometrias no ultravioleta-visível ou no infravermelho próximo, voltametria, etc. Neste cenário, o analista se depara com a opção de selecionar variáveis individuais ou intervalos de variáveis de modo de evitar ou diminuir problemas de multicolinearidade. Uma estratégia bem conhecida para seleção de intervalos de variáveis consiste em dividir o conjunto de respostas instrumentais em intervalos de igual largura e selecionar o melhor intervalo com base no critério de desempenho de predição de um único intervalo em regressão por Mínimos Quadrados Parciais (iPLS). Por outro lado, o uso da seleção de intervalo para fins de classificação tem recebido relativamente pouca atenção. Uma prática comum consiste em utilizar o método de regressão iPLS com os índices de classe codificados como variáveis de resposta a serem preditos, que é a idéia básica por trás da versão da Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA) para a classificação. Em outras palavras, a seleção de intervalos para fins de classificação não possui o desenvolvimento de funções nativas (algoritmos). Assim, neste trabalho são propostas duas novas estratégias em problemas de classificação que usam seleção de intervalos de variáveis empregando o Algoritmo das Projeções Sucessivas. A primeira estratégia é denominada de Algoritmo das Projeções Sucessivas para seleção intervalos em Análise Discriminante por Mínimos Quadrados Parciais (iSPA-PLS-DA), enquanto a segunda estratégia é denominada de Algoritmo das Projeções Sucessivas para a seleção de intervalos em Modelagem Independente e Flexível por Analogia de Classe (iSPA-SIMCA). O desempenho dos algoritmos propostos foi avaliado em três estudos de casos: classificação de óleos vegetais com relação ao tipo de matéria-prima e ao prazo de validade utilizando dados obtidos por voltametria de onda quadrada; classificação de misturas biodiesel/diesel não adulteradas (B5) e adulteradas com óleo de soja (OB5) empregando dados espectrais obtidos na região do ultravioleta-visível; e classificação de óleos vegetais com relação ao prazo de validade usando dados espectrais obtidos na região do infravermelho próximo. Os algoritmos iSPA-PLS-DA e iSPA-SIMCA propostos forneceram bons resultados nos três estudos de caso, com taxas de classificação corretas sempre iguais ou superiores àquelas obtidas pelos modelos PLS-DA e SIMCA utilizando todas as variáveis, iPLS-DA e iSIMCA com um único intervalo selecionado, bem como SPA-LDA e GA-LDA com seleção de variáveis individuais. Portanto, os algoritmos iSPA-PLS-DA e iSPA-SIMCA propostos podem ser consideradas abordagens promissoras para uso em problemas de classificação empregando seleção de intervalos de variáveis. Num contexto mais geral, a possibilidade de utilização de seleção de intervalos de variáveis sem perda da precisão da classificação pode ser considerada uma ferramenta bastante útil para a construção de instrumentos dedicados (por exemplo, fotômetros a base de LED) para uso em análise de rotina e de campo.
|
9 |
Mathématiques appliquées et traitement du signal pour l’évaluation de la dégradation de la biomasse lignocellulosique / Applied Mathematics and signal processing for the study of the evolution of plant litter during the biodegradation processRammal, Abbas 25 January 2016 (has links)
Dans cette thèse nous proposons de mettre en œuvre des méthodes des mathématiques appliquées et du traitement du signal pour l’étude à partir de spectres infrarouges (IR) de l’évolution des litières végétales au cours du processus de biodégradation. Nous présentons tout d’abord une nouvelle méthode de classification floue fondée sur une optimisation de type non supervisée, basée sur le facteur de covariance qui permet de classer des données IR de forme sphérique ou non sphérique afin d’identifier les méthodes de prétraitement et de choix de gammes spectrales les mieux adaptées. Nous développons des outils mathématiques et des algorithmes innovants permettant de combiner des informations spectrales moyen IR (MIR) et proche IR (MIR) afin d’identifier des marqueurs spectroscopiques discriminants de résidus lignocellulosiques en fonction de leur niveau de dégradation. Pour cela, nous proposons une méthode d'optimisation stochastique basée sur un algorithme génétique avec paramètres adaptés. Nous montrons que l’analyse conjoints des spectres MIR et NIR fusionnés par le produit extérieur permet de mieux discriminer la biomasse lignocellulosique au cours du processus de dégradation qu’un traitement séparé. Nous proposons ensuite une nouvelle approche d’optimisation non linéaire basée sur la sélection d’un vecteur qui met en évidence les poids des bandes spectrales. Enfin, nous développons une méthode de modélisation mathématique basée sur l’extension de l’algorithme AG-PLS en combinant les informations spectrales MIR et NIR par le produit extérieur (OP-AG-PLS). Cette méthode permet d’améliorer les performances de prédiction de l’état de dégradation de la biomasse. / In this thesis we propose to implement methods of applied mathematics and signal processing for the study of the evolution of plant biomass during the biodegradation process. The degradation of plant biomass is identified by FTIR spectroscopy, particularly in the MIR and NIR ranges. We proposed a new unsupervised classification method of Fuzzy C-Means based on the covariance factor to classify the IR data with spherical and not spherical form to identify the pre-treatment methods and the choice of spectral ranges that are the best adapted for our study. We have developed mathematical tools and innovative algorithms to combine these spectral information and identifying infrared spectroscopic markers that are discriminative in the lignocellulosic residues according to their level of degradation. For this, we have proposed a stochastic optimization method based on a genetic algorithm by choosing the appropriate parameters. We have shown that the joint analysis of the MIR and NIR spectra by the outer product (OP) provides better results than the separate analysis for the discrimination of the lignocellulosic biomass during the degradation process. Then, we proposed a new nonlinear optimization approach based on the built of vector which highlights the weight of spectral bands. Finally, we have developed a mathematical modelisation based on the extension of the GA-PLS algorithm combining the MIR and NIR spectral information by outer product (OP-GA-PLS) which significantly improves the prediction performance of the state of degradation of biomass.
|
Page generated in 0.0798 seconds