Spelling suggestions: "subject:"aprincipal component 2analysis"" "subject:"aprincipal component 3analysis""
521 |
Transformações em dados composicionais para a aplicação da análise de componentes principais / Transformations in compositional data for application of principal components analysisMessias, Ricardo Matioli 29 April 2016 (has links)
A análise de dados composicionais está sendo amplamente utilizada nas diversas áreas do conhecimento como por exemplo na análise de sedimentos rochosos, na comparação de diferentes células e até na análise criminalística na comparação de evidências de crimes. Durante a história da análise deste tipo de dados existiram muitos tipos de ajustes utilizados para contornar o problema da soma constante das variáveis e ainda hoje não temos um consenso de qual a melhor solução a ser utilizada. Neste trabalho, temos como objetivo a enunciação das 7 transformações que mais foram utilizadas ao longo do tempo e suas vantagens e desvantagens. A análise de componentes principais foi escolhida para o comparativo destas transformações. Fizemos a aplicação destas transformações em três bancos de dados reais com características diferentes entre si, comparamos os resultados e analisamos qual das transformações apresentou o melhor desempenho em cada base de dados. Os critérios de comparação foram o percentual da variância explicada, as variáveis que foram mais importantes para a primeira componente principal, cargas das variáveis nas componentes principais mais importantes assim como suas correlações com as variáveis. Também, simulamos quatro estruturas de bases de dados composicionais para avaliar o desempenho das transformações. Para essas comparações e simulações, foram desenvolvidas algumas funções, utilizando o \\textit estatístico R, que visam facilitar a comparação entre as sete transformações, assim auxiliando na escolha de qual das transformações melhor se adapta aos dados. Pelos resultados obtidos notamos que: nas bases de dados reais, os resultados das explicações da variância das transformações são similares e as transformações Ref e Alr mostram melhores desempenhos que as demais; nas quatro estruturas simuladas as transformações Ref e Alr também possuem os melhores resultados na explicação da variância e a interpretação de suas componentes principais são parecidas, assim como as transformações Trad, Log e Clr. Com isso notamos que independentemente da aplicação do logaritmo nas transformações Alr e Log elas apresentaram resultados muitos similares às transformações Ref e Trad, respectivamente, tanto na explicação da variância como na interpretação das componentes principais. / The compositional data analysis is being widely used in several areas of knowledge such as the analysis of rocky sediments, to compare different biological cells and even in forensic analysis to compare crimes evidences. During the history of the analysis of such data, to circumvent the problem of variable\'s constant sum were used many types of adjustments. Until now, we do not have a consensus in which is the best solution to be used in this cases. In this paper, we aim to enunciate seven transformations that most were used over time and their advantages and disadvantages. The principal component analysis was chosen for the comparison of these transformations. We applied this transformations in three real databases with different characteristics, we hope to compare the results and analyze which transformation have the best performance in each database. The comparison criteria were the percentage of explained variance, the variables that were most important to the first principal component,variable\'s loads in the most important principal components as well their correlation with the variables. We also simulated four compositional data bases structures to evaluate the performance of the transformations. For these comparisons and simulations were developed some functions, using the statistical software R, to facilitate comparison between the seven transformations, thus assisting in choosing which of the best transformation fits to the data. From the results we note that: for the real databases, the results of the variance explanation of all transformations are similar, thus Ref and Alr transformations show better performances than the others; in the four simulated structures the Ref and Alr transformations also have the best results in the variance explanation and interpretation of its main components are similar, as well as the transformations Trad, Log and Clr. Thus we note that independently of applying logarithm in and Log and Alr transformations they present very similar results as Ref and Trad transformations, respectively, both in variance explanation and in the interpretation of the principal components.
|
522 |
O impacto das fontes de poluição na distribuição de tamanho em número e massa do material particulado atmosférico em São Paulo / The Impact of Pollution Sources on Number and Mass Size Distribution of Atmospheric Particulate Matter in São PauloLuís Henrique Mendes dos Santos 06 August 2018 (has links)
Diversos estudos tiveram como objetivo determinar e caracterizar o aerossol atmosférico na cidade de São Paulo, quanto a seu tamanho e composição química, bem como encontrar as suas fontes emissoras e contribuições em massa para a região estudada. A coleta dos constituintes atmosféricos foi realizada na estação de amostragem do Laboratório de Análises dos Processos Atmosféricos (LAPAt) do Instituto de Astronomia, Geofísica e Ciências Atmosféricas (IAG) da Universidade de São Paulo (USP), localizada na zona oeste da cidade de São Paulo, geograficamente em 23°3334 S e 46°4400 O. O experimento foi realizado de 15 de agosto a 16 de setembro de 2016. Foram realizadas coletas de material particulado para análise da concentração em massa de sua fração fina inalável e composição química. A distribuição de tamanho para massa de material particulado foi determinada através da coleta com um impactador em cascata. A distribuição de tamanho para número foi obtida a partir de medidas com um Scanning Mobility Particle Sampler (SMPS) com o cálculo da concentração número de partículas (PNC) para o intervalo de 9 a 450 nm de diâmetro. Para estudar as relações entre os gases presentes na região amostrada com a radiação ultravioleta e com o PNC utilizamos os valores horários de concentrações dos gases (O3, NO, NO2 e NOX) e UV medidos na Rede Telemétrica da CETESB (Companhia de Tecnologia Ambiental do Estado de São Paulo). Os filtros coletados foram analisados pela técnica de Fluorescência de Raios-X dispersivo em energia (EDX). As concentrações de Black Carbon (BC) foram obtidas por refletância. Para a determinação das fontes de material particulado fino (MP2,5) foram utilizados os seguintes modelos receptores: Análise de Componentes Principais (ACP) e Fatoração de Matriz Positiva (FMP). Para análise de dispersão do poluente, utilizamos dados meteorológicos da estação climatológica do IAG situada no Parque do Estado. A concentração média de MP2,5 foi de 18,6 (±12,5) g/m³ e a concentração média de BC foi de 1,9 (±1,5) g/m³. As principais fontes encontradas, por ambos modelos receptores ACP e FMP, foram: veículos pesados (a diesel), veículos leves, queima de biomassa, ressuspensão de poeira de solo, pavimentos e construção, processos secundários e misturas de fontes. Os elementos-traço foram definidos em diferentes modas de tamanho: Al, Ca, Si e Ti com picos nas modas de acumulação, traçadores de ressuspensão de pavimento; Fe, Mn, P, K e Cr com picos na fração mais grossa da moda de acumulação, traçadores de emissões veiculares e queima de biomassa. Cu, Zn, Br, Pb, S e BC apresentam picos na fração mais fina da moda de acumulação, traçadores de emissões veiculares e queima de biomassa. / Several studies aimed to determine and characterize the atmospheric aerosol in the city of São Paulo, not only to its size and chemical composition, but as well as to find its emitting sources and mass contributions in the studied area. The atmospheric constituents were collected at the Laboratório de Análise dos Processos Atmosféricos (LAPAt) of the Institute of Astronomy, Geophysics and Atmospheric Sciences (IAG) of the University of São Paulo (USP), located in the western zone of the city of São Paulo Paulo, geographically at 23°33\'34\"S and 46°44\'00\" W. The experiment was conducted from August 15 to September 16 of 2016. Samples of particulate matter were collected to analyze the mass concentration and chemical composition of its inhalable fine fraction. The particulate mass size distribution was determined through the collection with a cascade impactor. The number size distribution was obtained from measurements with a Scanning Mobility Particle Sampler (SMPS) with the calculated number of particle concentration (PNC) for the range of 9 to 450 nm of the diameter. In order to study the relationships among the compounds present in the region and the PNC, we used the hourly values of the gaseous concentrations (O3, NO, NO2 and NOx) and UV measured in CETESB\'s Air Quality Telemetric Network in the State of São Paulo. The sampled filters were analyzed by the energy dispersive X-ray Fluorescence (EDX) technique to determine the elemental composition. The concentrations of Black Carbon (BC) were obtained by reflectance analysis. In order to determine the sources of fine particulate matter (PM2.5), the following Receptors Models were used: Principal Component Analysis (PCA) and Positive Matrix Factorization (PMF). For air pollution dispersion analysis, we used meteorological data from the IAG climatological station located in the Southeast of the city. The mean MP2.5 concentration was 18.6 (± 12.5) g/m³ and the mean concentration of BC was 1.9 (± 1.5) g/m³ for the sampling period. The main sources found by both ACP and PMF models were heavy-duty vehicles (diesel), light-duty vehicles, biomass burning, resuspension of soil dust, pavements and construction, secondary processes and mixed sources. The trace elements were defined at different size distributions: Al, Ca, Si and Ti with peaks in accumulation fraction (related to pavement resuspension tracers); Fe, Mn, P, K and Cr with peaks in the largest fraction of accumulation mode, characteristic of vehicular emissions tracer and biomass burning. Cu, Zn, Br, Pb, S and BC presented peaks in the finer fraction of the accumulation mode, related to vehicle emissions tracer and biomass burning.
|
523 |
Ordenação evolutiva de anúncios em publicidade computacional / Evolutionary ad ranking for computational advertisingBroinizi, Marcos Eduardo Bolelli 15 June 2015 (has links)
Otimizar simultaneamente os interesses dos usuários, anunciantes e publicadores é um grande desafio na área de publicidade computacional. Mais precisamente, a ordenação de anúncios, ou ad ranking, desempenha um papel central nesse desafio. Por outro lado, nem mesmo as melhores fórmulas ou algoritmos de ordenação são capazes de manter seu status por um longo tempo em um ambiente que está em constante mudança. Neste trabalho, apresentamos uma análise orientada a dados que mostra a importância de combinar diferentes dimensões de publicidade computacional por meio de uma abordagem evolutiva para ordenação de anúncios afim de responder a mudanças de forma mais eficaz. Nós avaliamos as dimensões de valor comercial, desempenho histórico de cliques, interesses dos usuários e a similaridade textual entre o anúncio e a página. Nessa avaliação, nós averiguamos o desempenho e a correlação das diferentes dimensões. Como consequência, nós desenvolvemos uma abordagem evolucionária para combinar essas dimensões. Essa abordagem é composta por três partes: um repositório de configurações para facilitar a implantação e avaliação de experimentos de ordenação; um componente evolucionário de avaliação orientado a dados; e um motor de programação genética para evoluir fórmulas de ordenação de anúncios. Nossa abordagem foi implementada com sucesso em um sistema real de publicidade computacional responsável por processar mais de quatorze bilhões de requisições de anúncio por mês. De acordo com nossos resultados, essas dimensões se complementam e nenhuma delas deve ser neglicenciada. Além disso, nós mostramos que a combinação evolucionária dessas dimensões não só é capaz de superar cada uma individualmente, como também conseguiu alcançar melhores resultados do que métodos estáticos de ordenação de anúncios. / Simultaneous optimization of users, advertisers and publishers\' interests has been a formidable challenge in online advertising. More concretely, ranking of advertising, or more simply ad ranking, has a central role in this challenge. However, even the best ranking formula or algorithm cannot withstand the ever-changing environment of online advertising for a long time. In this work, we present a data-driven analysis that shows the importance of combining different aspects of online advertising through an evolutionary approach for ad ranking in order to effectively respond to changes. We evaluated aspects ranging from bid values and previous click performance to user behavior and interests, including the textual similarity between ad and page. In this evaluation, we assessed commercial performance along with the correlation between different aspects. Therefore, we proposed an evolutionary approach for combining these aspects. This approach was composed of three parts: a configuration repository to facilitate deployment and evaluation of ranking experiments; an evolutionary data-based evaluation component; and a genetic programming engine to evolve ad ranking formulae. Our approach was successfully implemented in a real online advertising system that processes more than fourteen billion ad requests per month. According to our results, these aspects complement each other and none of them should be neglected. Moreover, we showed that the evolutionary combination of these aspects not only outperformed each of them individually, but was also able to achieve better overall results than static ad ranking methods.
|
524 |
Um método para análise e visualização de dados georreferenciados relacionados ao trânsito de veículosMachado, Jonathan 30 March 2017 (has links)
Submitted by JOSIANE SANTOS DE OLIVEIRA (josianeso) on 2017-06-13T15:57:01Z
No. of bitstreams: 1
Jonathan Machado_.pdf: 1018280 bytes, checksum: ac428b5c72c1ef24649cb96a3a778512 (MD5) / Made available in DSpace on 2017-06-13T15:57:01Z (GMT). No. of bitstreams: 1
Jonathan Machado_.pdf: 1018280 bytes, checksum: ac428b5c72c1ef24649cb96a3a778512 (MD5)
Previous issue date: 2017-03-30 / Nenhuma / Os acidentes de trânsito de veículos são uma das maiores causas de mortes na população jovem mundial, e existe uma tendência ao crescimento no número de casos dos mesmos nos próximos anos. A ocorrência dos acidentes é influenciada por diversos fatores, tais como condições das vias, condições climáticas, fiscalização de leis por órgãos governamentais, dentre outros. Seria interessante conhecer de maneira mais detalhada quais destes fatores detém maior influência. Na internet, existe uma quantidade imensa de dados gerados pelos mais diversos órgãos e empresas, porém grande parte desta informação não é analisada por ninguém, seja por falta de acesso, ou porque os dados não estão estruturados de uma maneira que permita seu entendimento. A disponibilização de dados vem aumentando, seja por conta de políticas de dados abertos implantadas pelo governo ou através de ferramentas colaborativas da web, que possibilitam o registro de informações por parte da população, e que posteriormente disponibilizam seus dados. Este trabalho propõe um método de agrupamento de dados georreferenciados oriundos de diversas fontes, para realização de uma análise estatística utilizando a técnica de Análise de Componentes Principais, que poderá identificar de forma georreferenciada quais características influenciam mais na ocorrência de acidentes de trânsito de veículos. Após a análise, é explorada uma nova metodologia de visualização dos resultados, plotados sobre mapas, que podem servir de auxílio para órgãos do governo e tomadores de decisão que realizam ações para diminuir os acidentes de trânsito. / Traffic accidents of vehicles are one of the biggest causes of deaths in the world's young population, and there is a tendency to increase this number in the next years. The occurrence of accidents is influenced by several factors, such as road conditions, climatic conditions, law enforcement by government agencies, among others. It would be interesting to know in more detail which of these factors has the greatest influence. On the internet, there is an immense amount of data generated by diverse agencies and companies, but much of this information is not analyzed, either because of lack of access, or because the data is not structured in a way that allows its understanding. The availability of data is increasing, either through open data policies implemented by the government, or through collaborative web tools, which make it possible record information by population, and subsequently make their data available. This work proposes a method of grouping georeferenced data from several sources, to perform a statistical analysis using the technique of Principal Components Analysis, which can identify in a georeferenced way which characteristics influence more in the occurrence of traffic acidentes of vehicles. After the analysis, a new methodology for visualizing results, plotted on maps, is explored, which can serve as an aid to government agencies and decision makers who take actions to reduce traffic accidents.
|
525 |
Vis-Scholar: uma metodologia de visualização e análise de dados na educaçãoCosta, Jean Carlos Araújo 01 March 2016 (has links)
Submitted by Silvana Teresinha Dornelles Studzinski (sstudzinski) on 2016-05-25T12:28:08Z
No. of bitstreams: 1
Jean Carlos Araújo Costa_.pdf: 1155126 bytes, checksum: 15210c31e7d20bb22cb98f8732173d6d (MD5) / Made available in DSpace on 2016-05-25T12:28:09Z (GMT). No. of bitstreams: 1
Jean Carlos Araújo Costa_.pdf: 1155126 bytes, checksum: 15210c31e7d20bb22cb98f8732173d6d (MD5)
Previous issue date: 2016-03-01 / Nenhuma / Técnicas de visualização de dados podem auxiliar nas mais diversas áreas de atuação humana, em especial na compreensão de dados e informações de diferentes fenômenos que se quer estudar. Quanto mais variáveis estão relacionadas com esse fenômeno, mais desafiador se torna seu tratamento e representação visual. Pensando em educação no Brasil e suas bases de dados abertas, bem como em bases de dados acadêmicas existentes nas instituições, o uso de técnicas matemáticas para correlacionar conjuntos de dados e métodos de visualização para apresentar essas correlações, disponíveis em uma ferramenta de fácil acesso e operação, podem tornar públicas informações sobre a qualidade da educação de determinada região, estado, município e instituição de ensino. Outro benefício pode ser a indicação de fatores que antes eram ignorados, como alvos de investimento e ainda ajudar na elaboração de políticas públicas, nacionais ou regionais, que tornem a educação mais eficiente, abrangente e inclusiva. Iniciativas de organizações não governamentais e algumas vinculadas ao governo brasileiro tem elaborado ferramentas de filtragem de informações e divulgação de dados sobre qualidade e investimento de recursos na educação. O governo brasileiro usa índices de desempenho para avaliar suas Instituições de Ensino Superior. O Conceito Preliminar de Curso é um desses. Este trabalho apresenta uma solução, visando elaborar uma metodologia de visualização de dados através de uma aplicação web, com tecnologias open source, utilizando o método de análise de componentes principais (ACP) como técnica matemática de correlação de variáveis, e distribuindo resultados sobre um mapa com a utilização da API do Google Maps, porém, tendo como foco, a busca do nível de influência de diferentes fatores, inclusive de alguns não ligados diretamente à educação, na performance de instituições de ensino e no rendimento acadêmico de alunos, tendo como estudo de caso, a análise de um índice de desempenho na educação superior. / Data visualization techniques can help in several areas of human activity, especially in understanding data and information from different phenomena to be studied. The more variables are related to this phenomenon, the more challenging it becomes their treatment and visual representation. Thinking about education in Brazil and its open databases, as well as in existing academic databases in institutions, using mathematical techniques to correlate data sets and visualization methods to present these correlations available in an easy tool access and operation may disclose information on the quality of education in a region, state, county and educational institution. Another benefit coud be the indication of factors that were ignored, as investment targets and also help in the development of public policies, national or regional, that make more efficient, comprehensive and inclusive education. Initiatives of non-governmental organizations and some linked to the Brazilian government has prepared information filtering tools and dissemination of data on quality and investment of resources in education. Brazilian government uses performance indicators to assess their undergraduation institutions. Course Preliminar Concept (CPC) is one of those. This paper presents a solution to this profile, aiming to develop a data visualization methodology through a web application with open source technologies, using principal component analysis method (PCA) as mathematical technique of variable correlation, and distributing results on a map using the Google Maps API, however, focusing on the search for the level of influence of different factors, including some not directly related to education, performance of educational institutions and the academic performance of students, taking as a case study, the analysis of a performance index in undergraduation.
|
526 |
Caracterização hidrogeoquímica da Bacia do Rio São João, Silva Jardim- Rio de JaneiroSouza, Giovana Vignoli Campos de. 05 October 2017 (has links)
Submitted by Biblioteca de Pós-Graduação em Geoquímica BGQ (bgq@ndc.uff.br) on 2017-10-05T18:24:14Z
No. of bitstreams: 1
Giovana Vignoli.pdf: 5851191 bytes, checksum: 42b1c55a5895de392a8243bfa74f8643 (MD5) / Made available in DSpace on 2017-10-05T18:24:14Z (GMT). No. of bitstreams: 1
Giovana Vignoli.pdf: 5851191 bytes, checksum: 42b1c55a5895de392a8243bfa74f8643 (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Universidade Federal Fluminense. Instituto de Química. Programa de Pós-Graduação em Geoquímica, Niterói, RJ / Estudos hidrogeoquímicos baseado nas variações sazonais da composição química dos rios
podem investigar a origem e os processos que controlam a química das águas numa bacia de
drenagem. A bacia hidrográfica do rio São João possui grande importância para a região dos Lagos,
a mais importante região turística do Rio de Janeiro, abastecendo cerca de 700 mil habitantes. A fim
de estudar sobre a qualidade da água e o comportamento das espécies dissolvidas nas águas desta
bacia, foi realizado um estudo ao longo de 14 meses utilizando-se da estatística (descritiva,
bivariada e multivariada) para discernir mudanças hidrogeoquímicas entre o período de estiagem e
de chuvas. O índice de qualidade das águas mostrou que a água é boa no geral, porém, coliformes
fecais e turbidez apresentaram valores de “q” muito abaixo da média, tornando preocupante o
destino da sua utilização. O pH não mostrou grandes variações, excetuando-se dentro da represa de
Juturnaíba, que atingiu 8,9 no período de estiagem. Os resultados mostraram que no período de
estiagem, a concentração média de Al, Fe e Ba foram mais representativos. Já no período chuvoso,
há uma diluição natural dos íons, enquanto que os alguns traços estão sendo liberados
mecanicamente na destruição de matrizes geológicas devido e a força das enxurradas, aumentando
suas concentrações. Os metais traços se mostram ligados à geologia regional, apresentando
associações geoquímicas calcófilas (In, Tl, Cd e Bi) e associações representativas de rochas máficas
(Fe, Cr e V). / Hydrogeochemical studies based on seasonal fluctuations in the chemical composition of rivers can
investigate the origin and processes that control the chemistry of water in a drainage basin. The
watershed of the São João river has great importance for the Região dos Lagos, the most important
tourist region of Rio de Janeiro, supplying about 700 thousand inhabitants. In order to study on the
water quality and behavior of the dissolved species in the waters of the basin, a study was
conducted over 14 months using statistics (Descriptive, bivariate and multivariate) to discern
hydrogeochemical changes between the drought and rainfall. The water quality index showed that
water is good overall, but showed fecal coliform and turbidity values of "q" well below average,
making the troubling fate of its use. The pH did not show significant variations, except for within
the Juturnaíba dam, which reached 8,9 in the dry season. The results showed that in the dry season,
the average concentration of Al, Fe and Ba were more representative. Already in the rainy season,
there is a natural dilution of the ions, while some features are being released mechanically in the
destruction of geological matrices and strength because of runoff, increasing their concentrations.
The trace metals are shown connected to the regional geology, presenting calcophiles geochemical
associations (In, Tl, Cd and Bi) and associations representing mafic rocks (Fe, Cr, and V).
|
527 |
Estudo da efic?cia do tensoativo sorbitano tween 80 veiculado em nanoemuls?o contendo ?leo de soja, como inibidor de corros?oRodrigues, Ciro Jos? Ferreira 30 August 2012 (has links)
Made available in DSpace on 2014-12-17T15:42:05Z (GMT). No. of bitstreams: 1
CiroJFR_DISSERT.pdf: 5688343 bytes, checksum: f082f764a617b016bd522ef00e0f6125 (MD5)
Previous issue date: 2012-08-30 / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico / Nowadays, the use of chemicals that satisfactorily meet the needs of
different sectors of the chemical industry is linked to the consumption of
biodegradable materials. In this context, this work contemplated
biotechnological aspects with the objective of developing a more
environmentally-friendly corrosion inhibitor. In order to achieve this goal,
nanoemulsion-type systems (NE) were obtained by varying the amount of
Tween 80 (9 to 85 ppm) a sortitan surfactant named polyoxyethylene (20)
monooleate. This NE-system was analyzed using phase diagrams in which the
percentage of the oil phase (commercial soybean oil, codenamed as OS) was
kept constant. By changing the amount of Tween 80, several polar NE-OS
derived systems (O/W-type nanoemulsion) were obtained and characterized
through light scattering, conductivity and pH, and further subjected to
electrochemical studies. The interfacial behavior of these NE-OS derived
systems (codenamed NE-OS1, S2, S3, S4 and S5) as corrosion inhibitors on
carbon steel AISI 1020 in saline media (NaCl 3.5%) were evaluated by
measurement of Open Circuit Potential (OCP), Polarization Curves (Tafel
extrapolation method) and Electrochemical Impedance Spectroscopy (EIS). The
analyzed NE-OS1 and NE-OS2 systems were found to be mixed inhibitors with
quantitative efficacy (98.6% - 99.7%) for concentrations of Tween 80 ranging
between 9 and 85 ppm. According to the EIS technique, maximum corrosion
efficiency was observed for some tested NE-OS samples. Additionaly to the
electrochemical studies, Analysis of Variance (ANOVA) and Principal
Component Analysis (PCA) were used, characterization of the nanoemulsion
tested systems and adsorption studies, respectively, which confirmed the
results observed in the experimental analyses using diluted NE-OS samples in
lower concentrations of Tween 80 (0.5 1.75 ppm) / Atualmente, a utiliza??o de produtos qu?micos que atendam satisfatoriamente
as necessidades de diferentes setores da ind?stria qu?mica encontra-se
vinculada ao consumo de materiais biodegrad?veis. Neste contexto, o presente
trabalho foi desenvolvido contemplando aspectos biotecnol?gicos com o
objetivo de se desenvolver um inibidor de corros?o menos agressivo ao meio
ambiente. Para tanto, uma nanoemuls?o (denominada de NE-OS) foi obtida
com Tween 80 (polioxietileno (20) monooleato), ?leo de soja (OS) e ?gua
bidestilada. A modifica??o dos percentuais deste tensoativo sorbitano (entre 9
e 85 ppm) foi avaliada em diagramas de fases em que se manteve constante o
percentual da fase ?leo, possibilitando a forma??o do sistema NE-OS em
diferentes concentra??es. Desta forma, nanoemuls?es (NE-OS1, S2, S3, S4 e
S5) polares (do tipo O/A) foram caracterizadas (an?lise de dispers?o de luz,
condutividade e pH) e submetidas a estudos eletroqu?micos. O comportamento
interfacial destes sistemas nanoemulsionados como inibidores de corros?o na
presen?a de a?o-carbono AISI 1020, em meio salino (NaCl 3,5%) foi avaliado
pela determina??o do Potencial de Circuito Aberto (OCP), Curvas de
Polariza??o (obtidas pela extrapola??o das curvas de Tafel) e Espectroscopia
de Imped?ncia Eletroqu?mica (EIE). De acordo com os resultados obtidos pelas
an?lises das Curvas de Polariza??o, foi poss?vel caracterizar o sistema NE-OS
(e suas varia??es) como inibidores mistos com efici?ncias m?ximas de
inibi??es quantitativas (98,6% - 99,7%) para NE-OS1 e NE-OS2 (9 - 85 ppm do
tensoativo). No entanto, de acordo com a t?cnica EIE, as efici?ncias m?ximas
de inibi??es quantitativas foram observadas para v?rias amostras deste
sistema NE-OS. Como ferramentas adicionais aos estudos eletroqu?micos
foram realizados quimiom?tricos de An?lise de Vari?ncia (ANOVA) e An?lise de
Componentes Principais (PCA), utilizadas, respectivamente, para
caracteriza??o das nanoemuls?es e estudo de isotermas de adsor??o, que
confirmaram os resultados observados nas investiga??es experimentais em
que se utilizaram as nanoemuls?es dilu?das com o tensoativo em
concentra??es reduzidas (0,5 1,75 ppm)
|
528 |
Financial time series analysis with competitive neural networksRoussakov, Maxime 08 1900 (has links)
No description available.
|
529 |
Analyse factorielle de données structurées en groupes d'individus : application en biologie / Multivariate data analysis of multi-group datasets : application to biologyEslami, Aida 21 October 2013 (has links)
Ce travail concerne les analyses visant à étudier les données où les individus sont structurés en différents groupes (données multi-groupes). La thèse aborde la question des données multi-groupes ayant une structure en un seul tableau, plusieurs tableaux, trois voies et deux blocs (régression). Cette thèse présente plusieurs méthodes d'analyse de données multi-groupes dans le cadre de l'analyse factorielle. Notre travail comporte trois parties. La première partie traite de l'analyse de données multi-groupes (un bloc de variables divisé en sous-groupes d'individus). Le but est soit descriptif (analyse intra-groupes) ou prédictif (analyse discriminante ou analyse inter-groupe). Nous commençons par une description exhaustive des méthodes multi-groupes. En outre, nous proposons deux méthodes : l'Analyse Procrustéenne duale et l'Analyse en Composantes Communes et Poids Spécifiques duale. Nous exposons également de nouvelles propriétés et algorithmes pour l'Analyse en Composantes Principales multi-groupes. La deuxième partie concerne l'analyse multi-blocs et multi-groupes et l'analyse trois voies et multi-groupes. Nous présentons les méthodes existantes. Par ailleurs, nous proposons deux méthodes, l'ACP multi-blocs et multi-groupes et l'ACP multi-blocs et multi-groupes pondérée, vues comme des extensions d'Analyse en Composantes Principales multi-groupes. L'analyse en deux blocs et multi-groupes est prise en compte dans la troisième partie. Tout d'abord, nous présentons des méthodes appropriées pour trouver la relation entre un ensemble de données explicatives et un ensemble de données à expliquer, les deux tableaux présentant une structure de groupe entre les individus. Par la suite, nous proposons quatre méthodes pouvant être vues comme des extensions de la régression PLS au cas multi-groupes, et parmi eux, nous en sélectionnons une et la développons dans une stratégie de régression. Les méthodes proposées sont illustrées sur la base de plusieurs jeux de données réels dans le domaine de la biologie. Toutes les stratégies d'analyse sont programmées sur le logiciel libre R. / This work deals with multi-group analysis, to study multi-group data where individuals are a priori structured into different groups. The thesis tackles the issue of multi-group data in a multivariate, multi-block, three-way and two-block (regression) setting. It presents several methods of multi-group data analysis in the framework of factorial analysis. It includes three sections. The first section concerns the case of multivariate multi-group data. The aim is either descriptive (within-group analysis) or predictive (discriminant analysis, between-group analysis). We start with a comprehensive review of multi-group methods. Furthermore, we propose two methods namely Dual Generalized Procrustes Analysis and Dual Common Component and Specific Weights Analysis. We also exhibit new properties and algorithms for multi-group Principal Component Analysis. The second section deals with multiblock multi-group and three-way multi-group data analysis. We give a general review of multiblock multi-group methods. In addition, we propose two methods, namely multiblock and multi-group PCA and Weighted-multiblock and multi-group PCA, as extensions of multi-group Principal Component Analysis. The two-block multi-group analysis is taken into account in the third section. Firstly, we give a presentation of appropriate methods to investigate the relationship between an explanatory dataset and a dependent dataset where there is a group structure among individuals. Thereafter, we propose four methods, namely multi-group PLS, in the PLS approach, and among them we select one and develop it into a regression strategy. The proposed methods are illustrated on the basis of several real datasets in the field of biology. All the strategies of analysis are implemented within the framework of R.
|
530 |
Transformações em dados composicionais para a aplicação da análise de componentes principais / Transformations in compositional data for application of principal components analysisRicardo Matioli Messias 29 April 2016 (has links)
A análise de dados composicionais está sendo amplamente utilizada nas diversas áreas do conhecimento como por exemplo na análise de sedimentos rochosos, na comparação de diferentes células e até na análise criminalística na comparação de evidências de crimes. Durante a história da análise deste tipo de dados existiram muitos tipos de ajustes utilizados para contornar o problema da soma constante das variáveis e ainda hoje não temos um consenso de qual a melhor solução a ser utilizada. Neste trabalho, temos como objetivo a enunciação das 7 transformações que mais foram utilizadas ao longo do tempo e suas vantagens e desvantagens. A análise de componentes principais foi escolhida para o comparativo destas transformações. Fizemos a aplicação destas transformações em três bancos de dados reais com características diferentes entre si, comparamos os resultados e analisamos qual das transformações apresentou o melhor desempenho em cada base de dados. Os critérios de comparação foram o percentual da variância explicada, as variáveis que foram mais importantes para a primeira componente principal, cargas das variáveis nas componentes principais mais importantes assim como suas correlações com as variáveis. Também, simulamos quatro estruturas de bases de dados composicionais para avaliar o desempenho das transformações. Para essas comparações e simulações, foram desenvolvidas algumas funções, utilizando o \\textit estatístico R, que visam facilitar a comparação entre as sete transformações, assim auxiliando na escolha de qual das transformações melhor se adapta aos dados. Pelos resultados obtidos notamos que: nas bases de dados reais, os resultados das explicações da variância das transformações são similares e as transformações Ref e Alr mostram melhores desempenhos que as demais; nas quatro estruturas simuladas as transformações Ref e Alr também possuem os melhores resultados na explicação da variância e a interpretação de suas componentes principais são parecidas, assim como as transformações Trad, Log e Clr. Com isso notamos que independentemente da aplicação do logaritmo nas transformações Alr e Log elas apresentaram resultados muitos similares às transformações Ref e Trad, respectivamente, tanto na explicação da variância como na interpretação das componentes principais. / The compositional data analysis is being widely used in several areas of knowledge such as the analysis of rocky sediments, to compare different biological cells and even in forensic analysis to compare crimes evidences. During the history of the analysis of such data, to circumvent the problem of variable\'s constant sum were used many types of adjustments. Until now, we do not have a consensus in which is the best solution to be used in this cases. In this paper, we aim to enunciate seven transformations that most were used over time and their advantages and disadvantages. The principal component analysis was chosen for the comparison of these transformations. We applied this transformations in three real databases with different characteristics, we hope to compare the results and analyze which transformation have the best performance in each database. The comparison criteria were the percentage of explained variance, the variables that were most important to the first principal component,variable\'s loads in the most important principal components as well their correlation with the variables. We also simulated four compositional data bases structures to evaluate the performance of the transformations. For these comparisons and simulations were developed some functions, using the statistical software R, to facilitate comparison between the seven transformations, thus assisting in choosing which of the best transformation fits to the data. From the results we note that: for the real databases, the results of the variance explanation of all transformations are similar, thus Ref and Alr transformations show better performances than the others; in the four simulated structures the Ref and Alr transformations also have the best results in the variance explanation and interpretation of its main components are similar, as well as the transformations Trad, Log and Clr. Thus we note that independently of applying logarithm in and Log and Alr transformations they present very similar results as Ref and Trad transformations, respectively, both in variance explanation and in the interpretation of the principal components.
|
Page generated in 0.1177 seconds