Spelling suggestions: "subject:"multivariate data"" "subject:"multivariate mata""
31 |
Generalized Bilinear Mixed-Effects Models for Multi-Indexed Multivariate DataJia, Yanan, Jia 29 December 2016 (has links)
No description available.
|
32 |
Data Triage and Visual Analytics for Scientific VisualizationLee, Teng-Yok 15 December 2011 (has links)
No description available.
|
33 |
Exploring Methods for Comparing Similarity of Dimensionally Inconsistent Multivariate Numerical DataMicic, Natasha, Neagu, Daniel, Torgunov, Denis, Campean, Felician 28 June 2018 (has links)
no / When developing multivariate data classification and clustering methodologies for data mining, it is clear that most literature
contributions only really consider data that contain consistently the same attributes. There are however many cases in current big data analytics applications where for same topic and even same source data sets there are differing attributes being measured, for a multitude of reasons (whether the specific design of an experiment or poor data quality and consistency). We define this class of data a dimensionally inconsistent multivariate data, a topic that can be considered a subclass of the Big Data Variety research. This paper explores some classification methodologies commonly used in multivariate classification and clustering tasks and considers how these traditional methodologies could be adapted to compare dimensionally inconsistent data sets. The study focuses on adapting two similarity measures: Robinson-Foulds tree distance metrics and Variation of Information; for comparing clustering of hierarchical cluster algorithms (such clusters are derived from the raw multivariate data). The results from experiments on engineering data highlight that adapting pairwise measures to exclude non-common attributes from the traditional distance metrics may not be the best method of classification. We suggest that more specialised metrics of similarity are required to address challenges presented by dimensionally inconsistent multivariate data, with specific applications for big engineering data analytics. / Jaguar Land-Rover
|
34 |
Estudo sobre segmentação de mercado consumidor por atitude e atributos ecológicos de produtos / Study about market segmentation by attitude and consumer good´s ecologically characteristics.Motta, Sergio Luis Stirbolov 29 May 2009 (has links)
Este estudo pretendeu verificar se a combinação das variáveis atitude e atributos ecologicamente corretos de bens de consumo pode ser utilizada como base para a segmentação de mercado. Para satisfazer a essa proposição, buscou-se, primeiramente, o domínio da teoria disponível sobre os temas a ela relacionados, que serviu de base à pesquisa de campo. Esta teve um caráter quantitativo e foi do tipo descritivo, com método do estudo de campo; utilizou uma amostra não-probabilística por conveniência de estudantes e professores de uma universidade da cidade de São Paulo-SP, que expressaram suas opiniões por autopreenchimento de um instrumento de coleta de dados estruturado e disfarçado. A análise dos dados deu-se através da aplicação de três técnicas multivariadas: Análise Fatorial, Análise de Conglomerados e Análise de Correspondência. A primeira foi bem sucedida em seu propósito principal, já que foi possível reduzir o conjunto de variáveis a dois fatores; os escores fatoriais funcionaram como entradas à Análise de Conglomerados. Esta também foi bem sucedida, pois a grande maioria das simulações realizadas combinando as medidas de similaridade com os métodos de aglomeração gerou conglomerados, o que permitiu responder favoravelmente ao problema de pesquisa; uma das combinações - Quadrado da Distância Euclideana com within groups foi considerada a mais satisfatória e utilizada como base para a próxima técnica, Análise de Correspondência. Esta foi utilizada para perfilar os conglomerados gerados e dar relevância gerencial ao presente projeto; foi parcialmente bem sucedida, pois não pôde ser utilizada para algumas variáveis, dando vez à tabulação cruzada. As considerações finais confirmaram a expectativa do pesquisador quanto à possibilidade de obtenção de conglomerados utilizando concomitantemente as variáveis atitude e atributos ecologicamente corretos de produtos. / This study intended to verify if the variable attitude in conjunction with the consumer good´s ecologically characteristics may be used as market segmentation´s basis. To satisfy this proposition, we tried, at first, to know all the available theory about the topics that are related to and also the basis to the field research. It was a quantitative and descriptive one, with a field study method. A non-probabilistic sample of students and teachers was used to explain their opinions by self-administration of a strucured and disguised questionnaire. The data analysis ocurred by the application of three multivariate techniques: Factor Analysis, Cluster Analysis and Correspondence Analysis. The first of them was successfull, whereas it was possible to reduce the set of variables to two factors; the fatorial scores performed as inputs to the Cluster Analysis. This technique was successful too, because the majority of simulations combining similarity measures and aglomeration methods engendered clusters, which permitted an answer favorable to the research problem; one of the combinations Euclidean Square Distance and Withinn Groups was considered the most satisfactory and used as basis to the next technique, the Correspondence Analysis. It was applied to profile the clusters and give a relevance to this paper; it was partly successful, as we couldnt use some variables and it was replaced by Cross Tabulation. The final considerations confirmed the researchers expectation as regard to the possibility of obtain clusters using at the same time the variable attitude and good´s ecologically characteristics.
|
35 |
Análise do uso de medidas de desempenho de empresas presentes na pesquisa em contabilidade no Brasil / Analysis of usage of measurements for companies performance present in accounting research in BrazilGirioli, Lumila Souza 20 April 2010 (has links)
A função da contabilidade tem sido avaliar a riqueza do homem, avaliar os acréscimos ou decréscimos dessa riqueza. Avaliar a riqueza das organizações requer alguma medida, é necessário uma forma de mensurar desempenho de empresas. Portanto, é necessário sabermos qual é o reflexo, no âmbito acadêmico, destas medidas de desempenho, quantas e quais são as medidas de desempenho preferencialmente utilizadas pelos artigos científicos na área de contabilidade. E, ainda, é necessário observarmos como essas medidas se agrupam. Para isso o presente trabalho analisou pesquisas na área contábil que estudaram medidas de desempenho de empresas e identificou como as medidas de desempenho utilizadas nas pesquisas podem ser agrupadas pela técnica de análise fatorial. Como principal descoberta pode-se citar as inúmeras variáveis diferentes (237) encontradas na literatura contábil como proxy da mensuração de desempenho. A maioria (62,44%) das variáveis aparece apenas uma vez no universo de todos os trabalhos pesquisados. Isso evidencia a frequente criação de medidas de desempenho pelos autores. Tal fato se deve possivelmente a aplicações específicas de análise de desempenho, com certeza essas variáveis criadas são importantes para o contexto individual de cada pesquisa, porém a análise fatorial empregada por este trabalho demonstrou que de uma maneira geral, as variáveis sempre vão se agrupar conforme os indicadores da análise de balanço e as variáveis contábeis e pode-se perceber que não é necessário usarmos diversas variáveis, as mais frequentes conseguem retratar quase a totalidade (mais de 98% no ano de 2003) das variáveis originais de um modelo. E mais, as medidas com maior peso de explicação da variância dos dados originais são aquelas variáveis extraídas dos demonstrativos contábeis, ou seja, um apoio à afirmativa de que a Contabilidade é fundamental para uma melhor tomada de decisão na área empresarial. / In this work, measurements for companies performance present in the accounting literature are analyzed. Performance measurements are important in order to inform the accounting users about the company status. On the other hand, we have performance measurements been used in the researches and, an interesting topic is to investigate, in the academic literature their frequency of occurrence, or how these measurements can be arranged in groups. To do this, articles from journals and conferences, as well as academic thesis in Brazil, were analyzed. In addition, a factorial analysis was done in order to group of measurements into factors. As a result it was found many different variables (237 performance measurements) present in the accounting researches. The 62.44% of variables appears only once in the selected sample. This fact should possibly come from specific applications of performance analysis, where such measurements are important. However, the factorial analysis performed to a specific sector, has confirmed that, the measurements form factors, according to the knowing groups. As inferred by the factorial analysis, there is no need to use multiple variables; they can be grouped in traditional groups. The most relevant measurements, explaining the variance of the original data, are those extracted directly from accounting statements, reinforcing that accounting is essential for better decision making.
|
36 |
Metabolômica como ferramenta em taxonomia: O modelo em Arnica. Metabolomics in plant taxonomy: The Arnica model / Metabolomics in plant taxonomy: The Arnica modelErnst, Madeleine 23 August 2013 (has links)
Taxonomia vegetal é a ciência que trata da descrição, identificação, nomenclatura e classificação de plantas. O desenvolvimento de novas técnicas que podem ser aplicadas nesta área de conhecimento é essencial para dar suporte às decisões relacionadas a conservação de hotspots de biodiversidade. Nesta dissertação de mestrado foi desenvolvido um protocolo de metabolic fingerprinting utilizando MALDI-MS (matrix-assisted laser desorption/ionisation mass spectrometry) e subsequente análise multivariada utilizando scripts desenvolvidos para o pacote estatístico R. Foram classificadas, com base nos seus metabólitos detectados, 24 plantas de diferentes famílias vegetais, sendo todas elas coletadas em áreas da Savana Brasileira (Cerrado), que foi considerada um hotspot de biodiversidade. Metabolic fingerprinting compreende uma parte da Metabolômica, i.e., a ciência que objetiva analisar todos os metabólitos de um dado sistema (celula, tecído ou organismo) em uma dada condição. Comparada com outros métodos de estudo do metaboloma MALDI-MS apresenta a vantagem do rápido tempo de análise. A complexidade e importância da correta classificação taxonômica é ilustrada no exemplo do gênero Lychnophora, o qual teve diversas espécies incluídas neste estudo. No Brasil espécies deste gênero são popularmente conhecidas como \"arnica da serra\" ou \"falsa arnica\". Os resultados obtidos apontam similaridades entre a classificação proposta e a classificação taxonômica atual. No entanto ainda existe um longo caminho para que a técnica de metabolic fingerprinting possa ser utilizada como um procedimento padrão em taxonomia. Foram estudados e discutidos diversos fatores que afetaram os resultados como o preparo da amostra, as condições de análise por MALDI-MS e a análise de dados, os quais podem guiar futuros estudos nesta área de pesquisa. / Plant taxonomy is the science of description, identification, nomenclature and classification of plants. The development of new techniques that can be applied in this field of research are essential in order to assist informed and efficient decision-making about conservation of biodiversity hotspots. In this master\'s thesis a protocol for metabolic fingerprinting by matrix-assisted laser desorption/ionisation mass spectrometry (MALDI-MS) with subsequent multivariate data analysis by in-house algorithms in the R environment for the classification of 24 plant species from closely as well as from distantly related families and tribes was developed. Metabolic fingerprinting forms part of metabolomics, a research field, which aims to analyse all metabolites, i.e., the metabolome in a given system (cell, tissue, or organism) under a given set of conditions. Compared to other metabolomics techniques MALDI-MS shows potential advantages, mainly due to its rapid data acquisition. All analysed species were collected in areas of the Brazilian Savanna (Cerrado), which was classified as \"hotspot for conservation priority\". The complexity and importance of correct taxonomic classification is illustrated on the example of the genus Lychnophora, of which several species also have been included into analysis. In Brazil species of this genus are popularly known as \"arnica da serra\" or \"falsa arnica\". Similarities to taxonomic classification could be obtained by the proposed protocol and data analysis. However there is still a long way to go in making metabolic fingerprinting by MALDI-MS a standard procedure in taxonomic research. Several difficulties that are inherent to sample preparation, analysis of plant\'s metabolomes by MALDI-MS as well as data analysis are highlighted in this study and might serve as a basis for further research.
|
37 |
Seleção de variáveis no desenvolvimento, classificação e predição de produtos / Selection of variables for the development, classification, and prediction of productsRossini, Karina January 2011 (has links)
O presente trabalho apresenta proposições para seleção de variáveis em avaliações sensoriais descritivas e de espectro infravermelho que contribuam com a indústria de alimentos e química através da utilização de métodos de análise multivariada. Desta forma, os objetivos desta tese são: (i) Estudar as principais técnicas de análise multivariada de dados, como são comumente organizadas e como podem contribuir no processo de seleção de variáveis; (ii) Identificar e estruturar técnicas de análise multivariada de dados de forma a construir um método que reduza o número de variáveis necessárias para fins de caracterização, classificação e predição dos produtos; (iii) Reduzir a lista de variáveis/atributos, selecionando aqueles relevantes e não redundantes, reduzindo o tempo de execução e a fadiga imposta aos membros de um painel em avaliações sensoriais; (iv) Validar o método proposto utilizando dados reais; e (v) Comparar diferentes abordagens de análise sensorial voltadas ao desenvolvimento de novos produtos. Os métodos desenvolvidos foram avaliados através da aplicação de estudos de caso, em exemplos com dados reais. Os métodos sugeridos variam com as características dos dados analisados, dados altamente multicolineares ou não e, com e sem variável dependente (variável de resposta). Os métodos apresentam bom desempenho, conduzindo a uma redução significativa no número de variáveis e apresentando índices de adequação de ajuste dos modelos ou acurácia satisfatórios quando comparados aos obtidos mediante retenção da totalidade das variáveis ou comparados a outros métodos dispostos na literatura. Conclui-se que os métodos propostos são adequados para a seleção de variáveis sensoriais e de espectro infravermelho. / This dissertation presents propositions for variable selection in data from descriptive sensory evaluations and near-infrared (NIR) spectrum analyses, based on multivariate analysis methods. There are five objectives here: (i) review the main multivariate analysis techniques, their relationships and potential use in variable selection procedures; (ii) propose a variable selection method based on the techniques in (i) that allows product prediction, classification, and description; (iii) reduce the list of variables/attributes to be analyzed in sensory panels identifying those relevant and non-redundant, such that the time to collect panel data and the fatigue imposed on panelists is minimized; (iv) validate methodological propositions using real life data; and (v) compare different sensory analysis approaches used in new product development. Proposed methods were evaluated through case studies, and vary according to characteristics in the datasets analyzed (data with different degrees of multicollinearity, presenting or not dependent variables). All methods presented good performance leading to significant reduction in the number of variables in the datasets, and leading to models with better adequacy of fit. We conclude that the methods are suitable for datasets from descriptive sensory evaluations and NIR analyses.
|
38 |
Efficient Information Visualization of Multivariate and Time-Varying DataJohansson, Jimmy January 2008 (has links)
Data can be found everywhere, for example in the form of price, size, weight and colour of all products sold by a company, or as time series of daily observations of temperature, precipitation, wind and visibility from thousands of stations. Due to their size and complexity it is intrinsically hard to form a global overview and understanding of them. Information visualization aims at overcoming these difficulties by transforming data into representations that can be more easily interpreted. This thesis presents work on the development of methods to enable efficient information visualization of multivariate and time-varying data sets by conveying information in a clear and interpretable way, and in a reasonable time. The work presented is primarily based on a popular multivariate visualization technique called parallel coordinates but many of the methods can be generalized to apply to other information visualization techniques. A three-dimensional, multi-relational version of parallel coordinates is presented that enables a simultaneous analysis of all pairwise relationships between a single focus variable and all other variables included in the display. This approach permits a more rapid analysis of highly multivariate data sets. Through a number of user studies the multi-relational parallel coordinates technique has been evaluated against standard, two-dimensional parallel coordinates and been found to better support a number of different types of task. High precision density maps and transfer functions are presented as a means to reveal structure in large data displayed in parallel coordinates. These two approaches make it possible to interactively analyse arbitrary regions in a parallel coordinates display without risking the loss of significant structure. Another focus of this thesis relates to the visualization of time-varying, multivariate data. This has been studied both in the specific application area of system identification using volumetric representations, as well as in the general case by the introduction of temporal parallel coordinates. The methods described in this thesis have all been implemented using modern computer graphics hardware which enables the display and manipulation of very large data sets in real time. A wide range of data sets, both synthetically generated and taken from real applications, have been used to test these methods. It is expected that, as long as the data have multivariate properties, they could be employed efficiently.
|
39 |
CRITICAL DESCRIPTORS FOR HYDRATE PROPERTIES OF OILS: COMPOSITIONAL FEATURESBorgund, Anna E., Høiland, Sylvi, Barth, Tanja, Fotland, Per, Kini, Ramesh A., Larsen, Roar 07 1900 (has links)
In petroleum production systems, hydrate morphology is observed to be influenced by the crude
oil composition. This work is aimed at identifying which crude oil compositional parameters that
need to be determined in order to evaluate natural anti-agglomerating properties of crude oils, i.e. the
critical compositional descriptors. The compositional features of 22 crude oils have been studied,
and multivariate data analysis has been used to investigate the possibility for correlations between
several crude oil properties. The results show that biodegradation together with a relatively large
amount of acids are characteristic for non-plugging crude oils, while excess of basic compounds is
characteristic for plugging crude oils. The multivariate data analysis shows a division of the nonbiodegraded
oils, which are all plugging, and the biodegraded oils. In addition, the biodegraded
oils seem to be divided into two groups, one with plugging oils and one with mostly non-plugging
oils. The results show that the wettability can be predicted from the variables biodegradation level,
density, asphaltene content and TAN.
|
40 |
Seleção de variáveis no desenvolvimento, classificação e predição de produtos / Selection of variables for the development, classification, and prediction of productsRossini, Karina January 2011 (has links)
O presente trabalho apresenta proposições para seleção de variáveis em avaliações sensoriais descritivas e de espectro infravermelho que contribuam com a indústria de alimentos e química através da utilização de métodos de análise multivariada. Desta forma, os objetivos desta tese são: (i) Estudar as principais técnicas de análise multivariada de dados, como são comumente organizadas e como podem contribuir no processo de seleção de variáveis; (ii) Identificar e estruturar técnicas de análise multivariada de dados de forma a construir um método que reduza o número de variáveis necessárias para fins de caracterização, classificação e predição dos produtos; (iii) Reduzir a lista de variáveis/atributos, selecionando aqueles relevantes e não redundantes, reduzindo o tempo de execução e a fadiga imposta aos membros de um painel em avaliações sensoriais; (iv) Validar o método proposto utilizando dados reais; e (v) Comparar diferentes abordagens de análise sensorial voltadas ao desenvolvimento de novos produtos. Os métodos desenvolvidos foram avaliados através da aplicação de estudos de caso, em exemplos com dados reais. Os métodos sugeridos variam com as características dos dados analisados, dados altamente multicolineares ou não e, com e sem variável dependente (variável de resposta). Os métodos apresentam bom desempenho, conduzindo a uma redução significativa no número de variáveis e apresentando índices de adequação de ajuste dos modelos ou acurácia satisfatórios quando comparados aos obtidos mediante retenção da totalidade das variáveis ou comparados a outros métodos dispostos na literatura. Conclui-se que os métodos propostos são adequados para a seleção de variáveis sensoriais e de espectro infravermelho. / This dissertation presents propositions for variable selection in data from descriptive sensory evaluations and near-infrared (NIR) spectrum analyses, based on multivariate analysis methods. There are five objectives here: (i) review the main multivariate analysis techniques, their relationships and potential use in variable selection procedures; (ii) propose a variable selection method based on the techniques in (i) that allows product prediction, classification, and description; (iii) reduce the list of variables/attributes to be analyzed in sensory panels identifying those relevant and non-redundant, such that the time to collect panel data and the fatigue imposed on panelists is minimized; (iv) validate methodological propositions using real life data; and (v) compare different sensory analysis approaches used in new product development. Proposed methods were evaluated through case studies, and vary according to characteristics in the datasets analyzed (data with different degrees of multicollinearity, presenting or not dependent variables). All methods presented good performance leading to significant reduction in the number of variables in the datasets, and leading to models with better adequacy of fit. We conclude that the methods are suitable for datasets from descriptive sensory evaluations and NIR analyses.
|
Page generated in 0.0945 seconds