Global ETD Search

401	Advanced techniques for graph analysis: a multimodal approach over planetary-scale data / Técnicas avançadas de análise de grafos: uma abordagem multimodal sobre dados em escala planetária Gimenes, Gabriel Perri 12 February 2015 (has links) Applications such as electronic commerce, computer networks, social networks, and biology (protein interaction), to name a few, have led to the production of graph-like data in planetary scale { possibly with millions of nodes and billions of edges. These applications pose challenging problems when the task is to use their data to support decision making processes by means of non-obvious and potentially useful patterns. In order to process such data for pattern discover, researchers and practitioners have used distributed processing resources organized in computational clusters. However, building and managing such clusters can be complex, bringing technical and financial issues that can be prohibitive in a variety of scenarios. Alternatively, it is desirable to process large scale graphs using only one computational node. To do so, we developed processes and algorithms according to three different approaches, building up towards an analytical set capable of revealing patterns, comprehension, and to help with the decision making process over planetary-scale graphs. / Aplicações como comércio eletrônico, redes de computadores, redes sociais e biologia (interação proteica), entre outras, levaram a produção de dados que podem ser representados como grafos à escala planetária { podendo possuir milhões de nós e bilhões de arestas. Tais aplicações apresentam problemas desafiadores quando a tarefa consiste em usar as informações contidas nos grafos para auxiliar processos de tomada de decisão através da descoberta de padrões não triviais e potencialmente utéis. Para processar esses grafos em busca de padrões, tanto pesquisadores como a indústria tem usado recursos de processamento distribuído organizado em clusters computacionais. Entretanto, a construção e manutenção desses clusters pode ser complexa, trazendo tanto problemas técnicos como financeiros que podem ser proibitivos em diversos casos. Por isso, torna-se desejável a capacidade de se processar grafos em larga escala usando somente um nó computacional. Para isso, foram desenvolvidos processos e algoritmos seguindo três abordagens diferentes, visando a definição de um arcabouço de análise capaz de revelar padrões, compreensão e auxiliar na tomada de decisão sobre grafos em escala planetária. Análise de dados Asynchronous parallel processing Banco de dados Data analysis Databases Grafos Graphs Processamento paralelo assincrono
402	Mineração de regras de associação em dados georreferenciados / Mining of association rules in geographic data Pivato, Marina Abichabki 21 March 2006 (has links) Sistemas de informações geográficas permitem armazenar, manipular e armazenar, manipular e analisar dados espaciais e aspectos descritivos desses dados. A análise de dados espaciais pode ser realizada por meio de técnicas de extração de regras de associação, ou seja, regras que descrevem relacionamentos entre os dados. Porém, a mineração de regras de associação não considera as relações topológicas existentes entre dados georreferenciados. Para solucionar esse problema, Koperski and Han (1995) e Malerba et al. (2001) propuseram um processo de extração de regras integrado ao algoritmo de mineração e utilizavam predicados lógicos para representar as regras. Como alternativa a essa solução, este trabalho propõe pré-processar os dados referenciados para encontrar relações topológicas em separado e aplicar um algoritmo de mineração de regras de associação disponí?vel pela comunidade acadêmica. As regras geradas devem apresentar características descritivas dos dados e relações topológicas. Para atingir esse objetivo foi especificado um processo de extração de regras em dados georreferenciados e implementado um módulo de pré-processamento que extrai relações topológicas. O módulo foi avaliado por meio de um estudo de caso utilizando o sistema de informação geográfica da cidade de Jaboticabal, no contexto de planejamento urbano. As regras encontradas foram analisadas por um especialista utilizando as medidas de suporte e confiança. Além disso, uma análise sobre o tempo de processamento e consumo de memória para encontrar as relações topológicas foi realizada, mostrando que é possível extrair padrões utilizando o processo e o módulo proposto neste trabalho. / Geographic information systems are used to store, manipulate, and analyze spatial data and its descriptive aspects. Spatial data analysis can be done by searching association rules that describe relationships between the data. However, georeferenced data present topological relations unknown to traditional mining association rule algorithms. To solve this problem, Koperski and Han (1995) and Malerba et al. (2001) proposed a topological relation extraction process integrated to a mining association rule algorithm. This process requires all data to be translated as logical predicates. As an alternative to this solution, this work proposes to break down this process by pre-processing the georeferenced data to find topological relations, then executing traditional mining association rule algorithms. The resulting rules must present descriptive characteristics of the data and topological relations. To reach this objective, a process of rule extraction in georeferenced data was specified, in addition to a pre-processing module implementation. This module was evaluated by using a case study that uses a geographic information system of the city of Jaboticabal, in the context of urban planning. The generated rules were analyzed by a specialist using the measures of support and confidence. In addition, an analysis regarding the processing time and memory consumption was provided to find the topological relations, which shows that it is possible to extract the patterns with the proposed process and module. Association rules Banco de dados espaciais Data mining Geographic data Mineração de dados Regras de associação
403	Tetrápodes triássicos brasileiros: uma investigação envolvendo banco de dados e análise de cluster / Brazilian Triassic tetrapods: an investigation involving database and clustering analysis. Dassie, Elisabete Caroline Gimenes 15 October 2014 (has links) O Triássico é um período de grande importância na história da vida na terra, durante o qual grandes eventos evolutivos são registrados dentre os vertebrados. Para melhor compreender a transição entre a fauna dominada por terápsidos no início do período para uma fauna dominada por dinossauros no final, tem se intensificado os estudos correlacionando sedimentos triássicos de forma global. Essencial para subsidiar tais correlações, é uma bioestratigrafia regional detalhada. No Brasil, tetrápodes triássicos são conhecidos apenas nos depósitos do Grupo Rosário do Sul, no Rio Grande do Sul. Com base nesses fósseis, muitas propostas bioestratigráficas foram elaboradas, ainda que de forma preliminar. Visto que a busca por novos sítios fossilíferos e descoberta de novos fósseis têm gerado grande acúmulo de dados sobre o Triássico brasileiro, mas poucos trabalhos de catalogação dessa informação foram desenvolvidos, acreditamos que parte das dificuldades no estabelecimento de um zoneamento bioestratigráfico de maior detalhe, neste caso, é decorrente de uma disponibilização ainda inadequada dos dados referentes ao conteúdo fossilífero de cada uma das localidades prospectadas na região. Visando sanar tal obstáculo, o presente trabalho teve como objetivo inicial a elaboração de um banco de dados acerca de tais tetrápodes triássicos, com o resgate das informações já publicadas sobre o tema, além de levantamento in loco de espécimes catalogados em determinadas coleções do Estado. Este banco de dados foi utilizado para testar as propostas bioestratigráficas vigentes através do estudo das similaridades faunísticas, com detalhamento em nível de localidades, através da aplicação de estatística multivariada (análises de cluster) em diferentes graus de abrangência taxonômica. Foram utilizados os índices de similaridade de Jaccard (qualitativo) e de Morisita-Horn (quantitativo) para a construção da matriz de distância, e o método de agrupamento de Ward para geração dos dendogramas. Os agrupamentos resultantes de análises qualitativas foram os que mais coincidiram com as propostas bioestratigráficas prévias. As demais análises, quantitativas, não resultaram em agrupamentos verossímeis, o que não se deve a problemas na utilização do método, mas da utilização de táxons que não são adequados a estudos bioestratigráficos. / The Triassic is a period of great importance in the history of life on Earth, where important evolutionary events occurred among the vertebrate lineages. To better understand the transition between a terapsid dominated fauna of the beginning of the period to one dominated by dinosaurs at its end, studies of the correlation of Triassic sediments at a global scale have been intensifying in recent years. Essential to subsidize such correlations is a detailed regional biostratigraphy. In Brazil, Triassic tetrapods are known only in the deposits of the Rosario do Sul Group, Rio Grande do Sul State. Based on these fossils, many biostratigraphical proposals have been elaborated, but are still considered as preliminary ones. As the search for new fossil sites and new discoveries generate an accumulation of data about the Brazilian Triassic, few works on the allocation of this information have been developed, however, and we believe that part of the difficulty in establishing a more detailed biostratigraphical zonings for this is due to the inadequate availability of data on the fossils of every prospected locality in the region. As a means to resolve this obstacle, the main objective of the present work was the construction of a Database of Triassic tetrapods, along with the information already published on the subject, added to an overview in loco of catalogued specimens of certain scientific collections of the State. This Database was used to test the established biostratigraphical proposals by means of a study on faunistic similarities, with detainment at location level, by use of multivariated statistics (cluster analysis) in different levels of taxonomic amplitude. We used Jaccard (qualitative) and Moristia-Hom (quantitative) similarity indexes to construct the distance matrix, and the Wards method of clustering to generate the dendograms. The resulting qualitive analysis produced clusteres that matched more closely with previous biostratigraphical proposals. The other quantative analysis did not result in stable clusters, but this is not due to methodological problems, however, but due to the use of taxa that are not sucitable for biostratigraphical studies. Análise de cluster Banco de dados Bioestratigrafia. Bioestratigraphy. Clustering analyses Database Tetrápodes Tetrapods Triassic Triássico
404	Contribuição ao estudo da implementação de Data Warehousing: um caso no setor de telecomunicações. / Contribution to study of Data Warehouse implementation: a case in telecommunication industry. Come, Gilberto de 21 November 2001 (has links) O desenvolvimento da tecnologia de informação, aliado à globalização e ao aumento da competitividade nos mais variados setores, está facilitando a integração entre o mercado produtor e consumidor. A cada negócio realizado, ou seja, a todo momento, uma grande quantidade de dados é gerada e armazenada, passando a ser um recurso importante da empresa. O grande problema está em como tratar esse grande volume de dados, geralmente espalhados por diversos sistemas de informação, de forma a obter alguma vantagem competitiva através da informação certa no momento certo. O Data Warehouse surgiu nos anos 90 como uma maneira flexível e eficiente de tratar esses grandes volumes de dados e obter informações que auxiliem no processo para tomada de decisão, mas sua implementação não é tão simples. Projetos dessa natureza demandam uma grande quantidade de tempo e dinheiro e portanto precisam de uma atenção especial. O setor de telecomunicações tem passado por uma grandes transformações nos últimos tempos. Além das novas tecnologias, o aumento da competição entre as empresas está cada vez maior. No Brasil a grande virada ocorreu em 1998 quando as empresas do setor foram privatizadas e o mercado foi aberto para a concorrência. Nesse novo cenário as empresas precisam entender o mercado em que atuam e mais que isso, conhecer muito bem o cliente. Nesse sentido o Data Warehouse surge como uma interessante alternativa. Este trabalho procura entender como foi, ou como está sendo feita a implementação do Data Warehouse em uma empresa do setor de telecomunicações que atua no Brasil, através da análise dos aspectos gerenciais, aspectos tecnológicos e aspectos humanos envolvidos no projeto. O levantamento bibliográfico, começa pela apresentação do ambiente de estudo, ou seja, o setor de telecomunicações no Brasil, o Data Warehouse e como eles se relacionam. Em seguida são apresentados vários conceitos gerenciais, tecnológicos e humanos que serviram de base para o desenvolvimento e conclusão do trabalho. A pesquisa em campo foi realizada através do método de Estudo de Caso por ser entendido como uma forma eficiente de responder aos objetivos propostos, pois possibilita a consideração dos mais variados aspectos relativos ao fato estudado, no caso, a implementação do Data Warehouse em uma empresa de telecomunicações. / The information technology evolution, allied to globalization and the increasing in competitiveness in different segments, is facilitating the integration between producer and consumer market. In each accomplished business, in other words, at every moment, a great amount of data is generated and stored, becoming an important resource of the company. The big problem is how to handle this great data volume, usually spread in several information systems, in order to get some competitive advantage through the right information in the right moment. The Data Warehouse appeared in the nineties, as a flexible and efficient way to handle these data and to get information, which aids in the process of decision-making, but its implementation is not that simple. This kind of project demands a great amount of time and money and therefore they need a special attention. The telecommunications (telecom) segment is going through great changes in the last times. Besides the new technologies, the increasing in competition among the companies is becoming larger. In Brazil an important milestone happened in 1998 when the telecom companies were privatized and the market was opened for the competition. In this new situation the companies need to understand the market and more than that, know the customer very well. To address this need, the Data Warehouse appears as an interesting alternative. This dissertation tries to understand how it was, or how the Data Warehouse implementation is being made in a company of the Brazilian telecom segment, through the analysis of the managerial, technological and human aspects involved in the project. The literature review begins presenting the study environment, in other words, the Brazilian telecom segment, the Data Warehouse and the relation between them. Then several concepts managerial, technological and humans are presented and used as foundation for the development and conclusion of this work. The empirical research was conducted by the Study of Case method, which was considered as an efficient way to reach the proposed objectives, as it makes possible the analyses of various aspects of the studied fact, in this case, Data Warehouse implementation in a telecom company. banco de dados data base information systems information technology sistemas de informação tecnologia da informação telecommunication telecomunicações
405	Integrando banco de dados relacional e orientado a grafos para otimizar consultas com alto grau de indireção / Integrating relational and graph-oriented database to optimize queries with high degree of indirection Catarino, Marino Hilario 10 November 2017 (has links) Um indicador importante na área acadêmica está relacionado ao grau de impacto de uma publicação, o que pode auxiliar na avaliação da qualidade e do grau de internacionalização de uma instituição. Para melhor delimitar esse indicador torna-se necessária a realização de uma análise das redes de colaboração dos autores envolvidos. Considerando que o modelo de dados relacional é o modelo predominante dos bancos de dados atuais, observa-se que a análise das redes de colaboração é prejudicada pelo fato desse modelo não atender, com o mesmo desempenho, a todos os tipos de consultas realizadas. Uma alternativa para executar as consultas que perdem desempenho no modelo de banco de dados relacional é a utilização do modelo de banco de dados orientado a grafos. Porém, não é claro quais parâmetros podem ser utilizados para definir quando utilizar cada um dos modelos de bancos de dados. Assim, este trabalho tem como objetivo fazer uma análise de consultas que, a partir da sintaxe da consulta e do ambiente de execução, possa apontar o modelo de dados mais adequado para execução da referida consulta. Com essa análise, é possível delimitar em que cenários uma integração entre o modelo relacional e o orientado a grafos é mais adequada. / An important indicator in the academic area is related to the degree of impact of a publication that can help in evaluating the quality and degree of internationalization in academic institutions. One approach to better understand the aforementioned indicator is analyzing the collaboration network formed by each researcher. In order to analyze this network, several alternatives use the well known relational data model which is predominant in most databases used today. Even though this model is widely used, it has a performance drawback when some types of queries are performed. For overcoming this drawback, certain alternatives are using a graph-oriented database model which is similar to a collaboration network model. However, it is unclear what parameters can be used to define when to use a relational or graph-oriented model. In this work, we propose an analysis of queries that, from the syntax of a query and the execution environment, can point to the most suitable data model for the execution given a specific query. With this query analysis, it is possible to delimit in which scenarios an integration between the relational and the graph-oriented models is more appropriate. Banco de dados orientado a grafos Collaboration networks Graph database Integração Integration Internacionalização Internationalization NoSQL NoSQL Redes de colaboração
406	Método de filtragem fuzzy para avaliação de bases de dados relacionais / Fuzzy filtering method for evaluation of relational databases Penteado, Fernanda Bessani Leite 02 October 2009 (has links) As informações imprecisas e vagas, comumente encontradas na modelagem de problemas do mundo real, muitas vezes não são manipuladas de forma adequada por meio das consultas convencionais aos bancos de dados. Alternativamente, a teoria de conjuntos fuzzy tem sido considerada uma ferramenta bem promissora para tratamento destas informações consideradas imprecisas e, em determinados casos, até mesmo ambíguas. Esse trabalho utiliza a linguagem SQL padrão para apresentar uma abordagem fuzzy de consultas a bancos de dados relacionais. Estudos de casos referentes à aplicabilidade do método desenvolvido são apresentados a fim de mostrar as suas potencialidades em relação aos métodos tradicionais de consultas. / Often, the imprecise and vague information, commonly found in the modeling of real world problems, are not dealt in an appropriate way through conventional queries used in databases. Alternatively, the fuzzy set theory has been considered a very promising tool to treat imprecise and ambiguous information. This work uses the standard SQL language and fuzzy set theory to develop a fuzzy query method for relational databases. Simulation examples are presented to illustrate its potentialities in relation to the traditional query methods. Banco de dados relacional Fuzzy logic Linguagem SQL Lógica fuzzy Relational database SQL language
407	Os conflitos em ambientes escolares : um olhar além da superfície / Pereira, Lilian Rodrigues Martins. January 2019 (has links) Orientador: Antonio Francisco Marques / Banca: Maria José da Silva Fernandes / Banca: Marcia Cristina Argenti Perez / Resumo: No Brasil, percebe-se um aumento de ações violentas e agressivas, na resolução de conflitos, fenômeno que tem sido objeto de estudo não só da Educação, como também da Psicologia, da Sociologia e da Saúde. No âmbito escolar, além de gerar tensões nas relações sociais, interferem no processo de ensino-aprendizagem. Diante desse cenário, a pesquisa teve como objetivo estudar os conflitos entre alunos e as formas de resolução, através da percepção dos sujeitos escolares, assim como por intermédio da revisão de literatura e dos documentos escolares, tendo em vista propor possibilidades à aprendizagem e ao desenvolvimento das relações sociais, no sentido de melhorar as relações no ambiente escolar. O trabalho é composto por uma revisão de literatura, seguida de reflexões teóricas e uma investigação qualitativa, a qual teve como objeto de estudo os conflitos entre os alunos. A partir da definição do objetivo e da apresentação das concepções de educação escolar e prática educativa que norteiam este trabalho, levantaram-se conhecimentos acerca da temática, em quatro bases de dados: SciELO, ERIC, CAPES e BDTD. Em seguida, apresentam-se reflexões a respeito de conflito, violência e relações sociais na escola. Na pesquisa empírica de cunho qualitativo, utilizaram-se, para a coleta de dados: observação, questionário e entrevista. Os participantes da pesquisa foram os alunos dos quartos e quintos anos do Ensino Fundamental, os professores das classes, professores e monitores culturais e os... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: In Brazil, there is an increase in violent and aggressive actions in the resolution of conflicts, a phenomenon that has been the object of study not only of Education, but also of Psychology, Sociology and Health. In the school context, besides generating tensions in social relations, interfere in the teaching-learning process. In view of this scenario, the research had as objective to study the conflicts between students and the forms of resolution, through the perception of the school subjects, as well as through the review of literature and school documents, aiming to propose possibilities for learning and development of social relations, in order to improve relations in the school environment. The work is composed of a review of the literature, followed by theoretical reflections and a qualitative investigation, which had as object of study the conflicts between the students. Based on the definition of the objective and the presentation of the conceptions of school education and educational practice that guide this work, knowledge about the subject was raised in four databases: SciELO, ERIC, CAPES and BDTD. Then, reflections on conflict, violence and social relations in the school are presented. In qualitative empirical research, data collection, observation, questionnaire and interview were used. The research participants were fourth and fifth year primary school students, teachers of classes, teachers and cultural monitors and the coordinators of a full-time municipal p... (Complete abstract click electronic access below) / Mestre Banco de dados bibliográficos. Violencia escolar. Prática de ensino. Educação. Aprendizagem. Ambiente escolar. Data libraries
408	Análise Crítica do Banco de Dados de Mortalidade do Ministério da Saúde, Utilizando os Dados Sobre Homicídios Ocorridos no Município de São Paulo, de 1979 a 1994. / Not available Costa Junior, Moacyr Lobo da 03 July 1997 (has links) Este trabalho faz uma análise crítica do banco de dados de mortalidade do Ministério da Saúde, utilizando para tanto os dados sobre homicídios ocorridos no município de São Paulo de 1979 a 1994. Levanta uma série de problemas detectados durante a análise, alguns conceituais e outros operacionais, apresentando sugestões de solução. Apresenta também possibilidades de análise permitidas pelas informações contidas no banco, sem a utilização de dados primários, muito pouco exploradas em estudos de mortalidade. / The aim of this study was to critically analyse the mortality data bank of the Brazilian Ministry of Health (The National Mortality System of Information), using the information on Homicides that occurred in the City of São Paulo, during the time period 1979/1994. Many problems were detected by conceptual and by the operational points of view, and suggestions, as resolutions, are given. Important possibilities to explore the death certificate information, not yet used in mortality studies, are shown and conclusions led to the fact that this information can substitute the primary one obtained in household interview or other source. Banco de Dados (análise) Estatística Homicídio (1979-1994) (São Paulo) Mortalidade Not available
409	Otimizando a execu??o de aplica??es de banco de dados atrav?s de uma melhor aloca??o de recursos de disco em ambientes virtualizados Fonseca, F?bio Miguel Blasak da 11 August 2017 (has links) Submitted by PPG Ci?ncia da Computa??o (ppgcc@pucrs.br) on 2018-04-10T19:11:33Z No. of bitstreams: 1 FABIO_MIGUEL_BLASAK_DA_FONSECA_DIS.pdf: 2321276 bytes, checksum: 333d6e8a8d369d82fe548927b2edaad3 (MD5) / Approved for entry into archive by Tatiana Lopes (tatiana.lopes@pucrs.br) on 2018-04-13T16:22:42Z (GMT) No. of bitstreams: 1 FABIO_MIGUEL_BLASAK_DA_FONSECA_DIS.pdf: 2321276 bytes, checksum: 333d6e8a8d369d82fe548927b2edaad3 (MD5) / Made available in DSpace on 2018-04-13T16:28:48Z (GMT). No. of bitstreams: 1 FABIO_MIGUEL_BLASAK_DA_FONSECA_DIS.pdf: 2321276 bytes, checksum: 333d6e8a8d369d82fe548927b2edaad3 (MD5) Previous issue date: 2017-08-11 / The growing need to extend IT (Information Technology) resources to meet business needs has raised concerns about how to increase capacity with lower cost and greater use of data center. Therefore, in order to avoid underutilization of infrastructure resources virtualization is a trend towards cost reduction and consolidation of the server infrastructure, thus taking advantage of existing assets. However, with virtualization growth, there is a problem related to resources concurrence in consolidated environments, where diskintensive applications such as databases can be impacted in this type of environment, if they do not have their resources managed properly, can generate performance degradation and increasing execution time respectively. In order to optimize performance and reduce I/O contention, Kassiano J.M. [19] presented a study on the acceleration of Hadoop applications through manual adjustment of disk resource allocation, showing that it is possible to get performance gains. Therefore, proposed work follows this line of study, however, with objective of optimizing the execution of database applications in virtualized environments with shared resources, applying a dynamic adjustment policy of disk resources allocation. It aims to distribute disk resources optimally through an algorithm, avoiding that one or more processes consume all disk resources, while others wait to be executed or are being executed without minimum of appropriate disk resources, thus, taking more time to complete their execution. In order to demonstrate this scenario, workloads of OLTP (Online Transaction Processing) and DW (Data Warehouse) databases have been evaluated using the Orion data load simulator [24] and real captured data from a loading test provided by a large IT company in partnership with PUCRS University (Pontifical Catholic University of Rio Grande do Sul), through the Oracle RAT (Real Application Testing) [25]. Laboratory tests have been performed using the following test scenarios: without adjustment of disk resources, with static adjustment of disk resources and through a dynamic adjustment policy of disk resources based on performance metrics. In this case, it can be observed that dynamic policy obtained the best result among the other test groups, generating a gain of 23% for OLTP database workloads, 21% for DW database workloads and 18% for environments with different types of workloads in concurrency like DW and OLTP. / A crescente necessidade de extens?o dos recursos de TI (Tecnologia da Informa??o) para atender as demandas do neg?cio, geraram uma preocupa??o de como aumentar a capacidade com menor custo e maior aproveitamento do data center. Portanto, a fim de evitar a subutiliza??o de recursos de infraestrutura a virtualiza??o ? uma tend?ncia para redu??o de custos e consolidar a infraestrutura de servidores, aproveitando assim os ativos existentes. Entretanto, com o crescimento da virtualiza??o, surge um problema relacionado a concorr?ncia por recursos em ambientes consolidados, onde aplica??es com uso intensivo de disco, como bancos de dados, podem ser impactados neste tipo de ambiente, caso n?o tenham os seus recursos gerenciados apropriadamente, podendo gerar degrada??o no desempenho e consequentemente aumentando o tempo de execu??o. A fim de otimizar performance e reduzir a conten??o de E/S (Entrada/Sa?da), Kassiano J. M. [19] apresentou um estudo sobre a acelera??o de aplica??es Hadoop atrav?s de ajuste manual na aloca??o de recursos de disco, mostrando que ? poss?vel obter ganhos de performance. Logo, o trabalho proposto, segue esta linha de estudo, entretanto, com o objetivo de otimizar a execu??o de aplica??es de banco de dados em ambientes virtualizados com recursos compartilhados, aplicando uma pol?tica de ajuste din?mico de aloca??o de recursos de disco, a qual visa acelerar ainda mais os ganhos de performance. Essa pol?tica tem por objetivo distribuir os recursos de disco de forma otimizada, conforme algoritmo aplicado, evitando que um ou mais processos consumam todos os recursos de disco, enquanto outros aguardam para serem executados ou executam com o m?nimo de recursos de disco apropriados, por isso, levando maior tempo para concluir o processamento. Para evidenciar esta situa??o, foram avaliados workloads de banco de dados do tipo OLTP (Online Transaction Processing) e DW (Data Warehouse), utilizando o simulador de cargas de dados Orion [24] e com dados reais capturados de um teste de carga cedidos por uma empresa de TI de grande porte, em parceria com a universidade PUCRS (Pontif?cia Universidade Cat?lica do Rio Grande do Sul), atrav?s do recurso Oracle RAT (Real Application Testing) [25]. Foram realizados testes em laborat?rio utilizando os seguintes cen?rios de teste: sem ajuste de recursos de disco, com ajuste est?tico de recursos de disco e atrav?s de uma pol?tica de ajuste din?mico de recursos de disco com base em m?tricas deperformance. A partir disso, pode-se observar que a pol?tica din?mica obteve o melhor resultado entre os demais grupos de teste, gerando um ganho de 23% para a execu??o de workloads de banco de dados OLTP, 21% para workloads de banco de dados DW e 18% durante a execu??o de ambientes com workloads de tipos diferentes em concorr?ncia, exemplo: DW e OLTP. Aloca??o de Recursos Virtualiza??o Conten??o de Disco Banco de Dados
410	Emprego de ferramentas de quimioinformática no estudo do perfil metabólico de plantas e na desreplicação de matrizes vegetais / Application of chemoinformatic tools in the study of plant metabolic profiles and dereplication Tiago Branquinho Oliveira 10 September 2015 (has links) Com o surgimento da era computacional com especial aplicação em química, as substâncias de origem naturais puderam ter suas informações armazenadas em bancos de dados. Desta forma, surge a oportunidade de se empregar bancos de dados de produtos naturais e de algumas ferramentas de quimioinformática como os estudos de Quantitative Structure-Retention Relationship (QSRR) para acelerar a identificação de substâncias em estudos metabolômicos. Este trabalho propôs o desenvolvimento de três estudos de QSRR, bem como a construção de um banco de dados (AsterDB) com estruturas químicas da família Asteraceae e informações a elas associadas (ex.: ocorrências botânicas e taxonômicas, atividade biológica, informações analíticas etc.) para auxiliar a desreplicação de substâncias em extratos vegetais. O primeiro estudo foi elaborado com 39 lactonas sesquiterpênicas (LST) analisadas em dois diferentes sistemas de solventes (MeOH-H2O 55:45 e MeCN-H2O 35:65), três grupos de descritores estruturais (2D-descr, 3D-1conf e 3D-weigh), dois diferentes conjuntos para treino e teste (26:13 e 29:10), quatro algoritmos para seleção de descritores (best first, linear forward - LFS, greedy stepwise e algoritmo genético - GA), três diferentes tamanhos de modelos (quatro, cinco e seis descritores) e dois métodos de modelagem (mínimos quadrados parciais - PLS e redes neurais artificiais - ANN). O segundo foi desenvolvido com 50 substâncias de diferentes classes químicas com intuito de avaliar as diferenças entre substâncias analisadas individualmente e em mistura em três diferentes equipamentos e dois métodos cromatográficos. O terceiro foi elaborado com 2.635 estruturas químicas com um teste externo comum a todos os modelos (25%, n = 656), três métodos de separação para teste e treino (partição baseada na resposta e baseada nos preditores 2D e 3D), três diferentes tamanhos de modelos selecionados por GA e dois métodos de modelagem (MLR e redes neurais feed-forward com regularização bayesiana - BRNN). O banco de dados AsterDB foi desenvolvido para ser preenchido de forma gradual e atualmente possui cerca de 2.000 estruturas químicas. O primeiro estudo de QSRR gerou bons modelos capazes de estimar o logaritmo do fator de retenção (logk) das LST com P2>0,81 para o sistema MeCN-H2O. O segundo estudo mostrou que não houve diferença estatística entre as substâncias analisadas individualmente e em mistura (p-valor>0,95) e que a correlação entre os dois métodos cromatográficos e equipamentos utilizados foi reprodutível (R>0,95). Estas análises mostraram que foi possível desenvolver modelos de QSRR para um método cromatográfico e equipamento e transpô-los para outro equipamento seguindo o uso de substâncias em comum. O terceiro estudo produziu modelos com boa capacidade de predição (P2>0,81) utilizando alta amplitude de espaço químico e rigor estatístico. Conclui-se que, estas informações podem ser utilizadas como uma plataforma piloto para análises de dados com objetivo de auxiliar na desreplicação de extratos de plantas em estudos metabolômicos / After the emergence of the computing era with special application in chemistry, all substances from natural sources might have their information stored in databases. Therefore, the opportunity arises to employ natural product databases and some chemoinformatic tools such as QSRR studies to speed up the identification of substances from metabolomic studies. This paper proposes the development of three QSRR studies as well as the building of a database (AsterDB) with chemical structures from the Asteraceae family and related information (i.e.: botanical and taxonomic occurrences, biological activity, analytical information, etc.) aiming to assist the dereplication of substances in plant extracts. The first study was carried out with 39 sesquiterpene lactones (STLs) analysed using two different solvent systems (MeOH-H2O 55:45 and MeCN-H2O 35:65), three groups of structural descriptors (2D-descr, 3D-1conf, and 3D-weigh), two different sets for training and testing (26:13 and 29:10), four algorithms for selection of descriptors (best first, LFS, greedy stepwise, and GA), three different model sizes (four, five, and six descriptors) and two modelling methods (PLS and ANN). The second study was developed with 50 compounds of different chemical classification in order to assess the differences between individual and mixed compounds analysed in three different equipments and two chromatographic methods. The third was elaborated with 2,635 chemical structures with a common external test to all models (25%, n = 656), three separation methods for testing- and training-set (based on response and on 2D and 3D predictors partitions), three different sizes of models selected by GA and two modelling methods (MLR and BrNN). The AsterDB database was developed to be populated gradually and currently, it has about 2,000 chemical structures. The first QSRR study generated good models, able to estimate the logarithm of the retention factor (logk) of STLs with P2>0.81 for the MeCN-H2O system. The second study showed that there was no statistical difference between the substances analysed individually and mixed (p-value>0.95) and the correlation between the two chromatographic methods and equipments used was reproducible (R>0.95). These analyses showed that it was possible to develop QSRR models for a chromatographic method and equipment and translate them into other equipment following the use of substances in common. The third study produced models with good predictive capacity (P2>0.81) using a high range of chemical space and statistical accuracy. In conclusion, this information can be used as a pilot platform for data analysis in order to assist in plant dereplication in metabolomics studies Banco de dados Estimar tempo de retenção Produtos naturais Quimioinformática Cheminformatics Chemoinformatics Database Natural products QSRR

Search results