Spelling suggestions: "subject:"armazenamento dde dados"" "subject:"armazenamento dee dados""
1 |
Engenharia da informação aplicada no desenvolvimento de Data WarehouseSouza, Ivanise Volpato de January 2002 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós -Graduação em Computação. / Made available in DSpace on 2012-10-19T21:38:30Z (GMT). No. of bitstreams: 0Bitstream added on 2014-09-26T02:33:36Z : No. of bitstreams: 1
182122.pdf: 3085126 bytes, checksum: a57ea9e1597cec6c6217dac74340d7e1 (MD5) / O presente trabalho propõe a utilização da Engenharia da Informação para a análise, incorporação de técnicas e procedimentos formais nas atividades de planejamento e de desenvolvimento de sistemas cuja informação estratégica é processada por intermédio dos procedimentos desenvolvidos pela tecnologia Data Warehouse cujo o conjunto de dados está baseado em informações integradas, não voláteis, variáveis no tempo, consistentes e de apoio às decisões estratégicas das empresas de e-commerce.Apresentam-se duas abordagens que estabelecem as atividades necessárias para o desenvolvimento do Data Warehouse no planejamento estratégico das informações e análise da área de negócios. Para a implementação do Data Warehouse se utilizará a modelagem dimensional em formato de esquema estrela e o conceito de ClickStream, isso permite a construção de um protótipo, o qual valida os conceitos e os resultados esperados no uso da Engenharia da Informação e Data Warehouse.
|
2 |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process / Contribuições para um sistema de BI baseadas em big data e análise preditiva integrada em processo de ETLSerrano, Antonio Manuel Rubio 30 June 2014 (has links)
Dissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014. / Submitted by Ana Cristina Barbosa da Silva (annabds@hotmail.com) on 2015-03-27T18:26:58Z
No. of bitstreams: 1
2014_AntonioManuelRubioSerrano.pdf: 2936232 bytes, checksum: 2f60301c6aa9536e02021ad389644ed6 (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2015-05-19T13:52:40Z (GMT) No. of bitstreams: 1
2014_AntonioManuelRubioSerrano.pdf: 2936232 bytes, checksum: 2f60301c6aa9536e02021ad389644ed6 (MD5) / Made available in DSpace on 2015-05-19T13:52:40Z (GMT). No. of bitstreams: 1
2014_AntonioManuelRubioSerrano.pdf: 2936232 bytes, checksum: 2f60301c6aa9536e02021ad389644ed6 (MD5) / Esta dissertação apresenta o estudo, aplicação e análise dos conceitos envolvidos num processo de Business Intelligence (BI) em três áreas principais: extração e carga de dados, análise preditiva, e armazenamento de dados usando Big Data. Primeiro, no processo de extração e carga de dados, as diferentes soluções adotadas no sistema de BI do Ministério de Planejamento, Orçamento e Gestão têm sido analisadas, e uma nova solução tem sido proposta para resolver as limitações detectadas nas soluções anteriores a cumprir com os novos requerimentos do sistema. Esses requerimentos incluem a capacidade de trabalhar com um maior volume de dados e a necessidade de um melhor monitoramento do processo de restituição ao erário nos casos em que um servidor público deve devolver o salário recebido indevidamente. Na parte de análise preditiva, diversos algoritmos de predição foram estudados e comparados usando os dados do MP. As conclusões deste estudo tem sido úteis para propor um sistema automático de detecção de fraudes e uma metodologia chamada de Extração, Transformação, Predição Adaptativa e Carga (ETAPL) que inclui predição adaptativa com seleção e configuração automática do algoritmo dentro de um processo tradicional de Extração, Transformação e Carga (ETL). Por último, as novas tecnologias de Big Data têm sido estudadas e comparadas com as atuais, de forma a avaliar a viabilidade destas tecnologias como alternativa futura no contexto do MP. _________________________________________________________________________ ABSTRACT / This dissertation presents the study, application and analysis of the concepts involved on the process of a Business Intelligence (BI) solution in three main areas: data extraction and loading, predictive analytics and storage systems using Big Data. First, in the BI data loading, the different previous solutions into the BI system of the Brazilian Ministry of Planning, Budget and Management (MP) has been analysed, and a new solution has been proposed for solving the limitations of the previous ones and for fulfilling the new requirements appeared on the project. Those requirements include the necessity of managing a bigger volume of data or the need for a better monitoring of the reimbursement process that is executed when a public servant has to refund the erroneously received money.In predictive analytics, several prediction algorithms have been analysed and compared using the data of the MP. The results has been useful for proposing an automatic fraud detection system and a new methodology called Extract, Transform, Adaptive Prediction and Load (ETAPL) that includes predictive analytics into a traditional Extract, Transform and Load (ETL) process. Finally, the new Big Data technologies have been studied and tested as future alternative for the current storage systems at the MP.
|
3 |
TM-tree : um método de acesso para consultas por similaridadeNadvorny, César Feijó January 2005 (has links)
O armazenamento de grandes quantidades de informações em bases de dados cria a necessidade de se usar Métodos de Acesso a esses dados de uma forma mais eficiente do que uma busca linear. Dessa forma, diversos Métodos de Acesso vêm sendo propostos há décadas. Desde os mais simples Métodos de Acesso como árvores B até os mais sofisticados Métodos de Acesso Métrico tem-se o mesmo objetivo: a eficiência na consulta. Para cada tipo de dados, para cada tipo de consulta, existe uma diferente forma de acesso mais adequada. Se os dados puderem ser ordenados, pode-se usar uma àrvore B. Na busca por pequenas cadeias de caracteres, pode-se utilizar uma árvore de sufixos. Com a evoluçãocomputacional, não se quer armazenar apenas números ou pequenas seqüências de texto. Já existem diversas bases de dados muito mais complexas, como seqüências de sons, imagens ou até mesmo vídeos armazenados. A complexidade desse tipo de dados e do tipo de consulta feita em cima deles gerou a necessidade de novos Métodos de Acesso. Os chamados Métodos de Acesso Métrico são estruturas capazes de acessar dados bastante complexos, como arquivos multimídia, com uma boa eficiência. Esse tipo de estrutura vem sendo estudada há muitos anos, mas a primeira delas realmente eficaz foi a árvore M. Depois dela, vários outros Métodos de Acesso Métricos surgiram, como a árvore Slim, M2, M+, DF, DBM aprimorando sua estrutura básica Esse trabalho propõe a árvore TM, que inova a forma como os dados são indexados, aprimorando a árvore M. Essa nova estrutura, usa o espaço métrico para a busca dos dados, o que é feito por todos Métodos de Acesso Métricos. Mas sua inovação está na forma como os dados são indexados, usando-se um espaço novo também proposto nesse trabalho, o espaço distorcido. Experimentos mostram uma melhora significativa na eficiência da consulta tanto em quantidade de acesso a disco quando em custo de processamento.
|
4 |
TM-tree : um método de acesso para consultas por similaridadeNadvorny, César Feijó January 2005 (has links)
O armazenamento de grandes quantidades de informações em bases de dados cria a necessidade de se usar Métodos de Acesso a esses dados de uma forma mais eficiente do que uma busca linear. Dessa forma, diversos Métodos de Acesso vêm sendo propostos há décadas. Desde os mais simples Métodos de Acesso como árvores B até os mais sofisticados Métodos de Acesso Métrico tem-se o mesmo objetivo: a eficiência na consulta. Para cada tipo de dados, para cada tipo de consulta, existe uma diferente forma de acesso mais adequada. Se os dados puderem ser ordenados, pode-se usar uma àrvore B. Na busca por pequenas cadeias de caracteres, pode-se utilizar uma árvore de sufixos. Com a evoluçãocomputacional, não se quer armazenar apenas números ou pequenas seqüências de texto. Já existem diversas bases de dados muito mais complexas, como seqüências de sons, imagens ou até mesmo vídeos armazenados. A complexidade desse tipo de dados e do tipo de consulta feita em cima deles gerou a necessidade de novos Métodos de Acesso. Os chamados Métodos de Acesso Métrico são estruturas capazes de acessar dados bastante complexos, como arquivos multimídia, com uma boa eficiência. Esse tipo de estrutura vem sendo estudada há muitos anos, mas a primeira delas realmente eficaz foi a árvore M. Depois dela, vários outros Métodos de Acesso Métricos surgiram, como a árvore Slim, M2, M+, DF, DBM aprimorando sua estrutura básica Esse trabalho propõe a árvore TM, que inova a forma como os dados são indexados, aprimorando a árvore M. Essa nova estrutura, usa o espaço métrico para a busca dos dados, o que é feito por todos Métodos de Acesso Métricos. Mas sua inovação está na forma como os dados são indexados, usando-se um espaço novo também proposto nesse trabalho, o espaço distorcido. Experimentos mostram uma melhora significativa na eficiência da consulta tanto em quantidade de acesso a disco quando em custo de processamento.
|
5 |
Replicação de dados em workflows de bioinformática usando os bancos de dados NoSQLLima, Iasmini Virgínia Oliveira 02 December 2016 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2017-02-14T20:06:16Z
No. of bitstreams: 1
2016_IasminiVirgíniaOliveiraLima.pdf: 9288284 bytes, checksum: 60f129cce5f057223b8532bc67380557 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2017-03-13T18:57:10Z (GMT) No. of bitstreams: 1
2016_IasminiVirgíniaOliveiraLima.pdf: 9288284 bytes, checksum: 60f129cce5f057223b8532bc67380557 (MD5) / Made available in DSpace on 2017-03-13T18:57:10Z (GMT). No. of bitstreams: 1
2016_IasminiVirgíniaOliveiraLima.pdf: 9288284 bytes, checksum: 60f129cce5f057223b8532bc67380557 (MD5) / Projetos em Bioinformática são geralmente executados como workflows científicos. Os biólogos frequentemente podem executar o mesmo workflow diversas vezes com diferentes parâmetros. Estas execuções podem gerar um grande volume de arquivos com diferentes formatos, que precisam ser armazenados para futuras execuções. Dentre diversos sistemas de armazenamento de dados apresentados na literatura, novos modelos de bancos de dados têm sido definidos para armazenar grandes volumes de dados, os bancos de dados NoSQL (Not Only SQL), que surgiram da necessidade de uma alta escalabilidade e de um desempenho superior quando o volume de dados é muito grande. Nesse contexto, é proposta a análise do impacto da replicação de dados quando se utiliza bancos de dados NoSQL para o armazenamento dos diferentes formatos de arquivos resultantes da execução de workflows de Bioinformática. Foram executados três workflows de Bioinformática envolvendo diferentes formatos de dados, os quais foram utilizados para os testes nos bancos de dados NoSQL Cassandra e MongoDB, e em seguida é apresentada uma análise dessas execuções e testes. Os resultados obtidos mostraram que os tempos de inserção e extração dos dados são mínimos comparados aos tempos de execução dos workflows e portanto, os bancos de dados NoSQL mostraram ser uma boa opção para armazenamento e gerenciamento de dados biológicos. / Projects in bioinformatics are generally executed as scientific workflows. The biologists often perform the same workflow several times with different parameters. These executions can generate a large volume of files with different formats, which need to be stored for future executions. Among several data storage systems presented in the literature, new database models have been defined to store large volumes of data, the NoSQL databases (Not Only SQL), which arose from the need for high scalability and superior performance when the data volume is too large. In this context, it is proposed to analyze the impact of data replication when using NoSQL databases for the storage of the different file formats resulting from the execution of bioinformatics workflows. Three bioinformatics workflows involving different data formats were executed, which were used for testing the NoSQL Cassandra and MongoDB databases, and then an analysis of those executions and tests is presented. The results show that the data insertion and extraction times are minimal compared to the execution times of the workflows, and therefore, the NoSQL databases have proved to be a good option for the storage and management of biological data.
|
6 |
TM-tree : um método de acesso para consultas por similaridadeNadvorny, César Feijó January 2005 (has links)
O armazenamento de grandes quantidades de informações em bases de dados cria a necessidade de se usar Métodos de Acesso a esses dados de uma forma mais eficiente do que uma busca linear. Dessa forma, diversos Métodos de Acesso vêm sendo propostos há décadas. Desde os mais simples Métodos de Acesso como árvores B até os mais sofisticados Métodos de Acesso Métrico tem-se o mesmo objetivo: a eficiência na consulta. Para cada tipo de dados, para cada tipo de consulta, existe uma diferente forma de acesso mais adequada. Se os dados puderem ser ordenados, pode-se usar uma àrvore B. Na busca por pequenas cadeias de caracteres, pode-se utilizar uma árvore de sufixos. Com a evoluçãocomputacional, não se quer armazenar apenas números ou pequenas seqüências de texto. Já existem diversas bases de dados muito mais complexas, como seqüências de sons, imagens ou até mesmo vídeos armazenados. A complexidade desse tipo de dados e do tipo de consulta feita em cima deles gerou a necessidade de novos Métodos de Acesso. Os chamados Métodos de Acesso Métrico são estruturas capazes de acessar dados bastante complexos, como arquivos multimídia, com uma boa eficiência. Esse tipo de estrutura vem sendo estudada há muitos anos, mas a primeira delas realmente eficaz foi a árvore M. Depois dela, vários outros Métodos de Acesso Métricos surgiram, como a árvore Slim, M2, M+, DF, DBM aprimorando sua estrutura básica Esse trabalho propõe a árvore TM, que inova a forma como os dados são indexados, aprimorando a árvore M. Essa nova estrutura, usa o espaço métrico para a busca dos dados, o que é feito por todos Métodos de Acesso Métricos. Mas sua inovação está na forma como os dados são indexados, usando-se um espaço novo também proposto nesse trabalho, o espaço distorcido. Experimentos mostram uma melhora significativa na eficiência da consulta tanto em quantidade de acesso a disco quando em custo de processamento.
|
7 |
Artefatos da semiotica organizacional na elicitação de requisitos para soluções de data warehouseFaria, João Marcos Bonadio de 22 February 2006 (has links)
Orientador: Maria Cecilia Calani Baranauskas / Dissertação (mestrado profissional) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-07T10:10:53Z (GMT). No. of bitstreams: 1
Faria_JoaoMarcosBonadiode_M.pdf: 1155230 bytes, checksum: 40eeffe5de2707ee5fabf23023b26646 (MD5)
Previous issue date: 2006 / Resumo: Este trabalho tem como objetivo propor o uso das ferramentas e métodos da Semiótica Organizacional para a elicitação de requisitos de uma solução de Data Warehouse. As principais motivações para o trabalho advêm da falta de uma metodologia de elicitação de requisitos que apóiem de maneira efetiva todas as necessidades particulares para a elicitação de requisitos de Data Warehouse. Os problemas apontados pela literatura são explorados, bem como algumas propostas de metodologia apresentadas recentemente. Em particular, discutimos alguns dos aspectos que demonstram a necessidade de uma técnica de elicitação de requisitos desenvolvida especialmente para esse tipo de aplicação. Explicamos nesse trabalho o que é um Data Warehouse e suas diferentes tecnologias, introduzimos o conceito de Semiótica Organizacional e apresentamos as ferramentas que são utilizadas durante o estudo de caso. Esse estudo de caso é descrito e os resultados apresentados, fornecendo a base para a proposta de uma maneira de uso das ferramentas da Semiótica Organizacional para a elicitação de requisitos. Ao final do trabalho pudemos ver que as ferramentas foram eficazes em seu propósito, inclusive com resultados além dos esperados, e propostas de trabalhos futuros são feitas / Abstract: This work has the main goal of proposing the use of the tools and methods of Organizational Semiotics to elicit user requirements to a Data Warehouse solution. The main motivations for this work come from the lack of a proper methodology to elicit requirements that fully addres the particular needs for a Data Warehouse solution. The issues discussed by previous works are analyzed; as well as some newly presented methodologies are discussed. Particularly we present some aspects that show the need of a new technique to elicit requirements tailored for Data Warehouse solutions. We explain what is a Data Warehouse and its technologies, introduce the concept of Organizational Semiotics and present the tools used during the case study. The Case Study is described and the results shown giving the base to propose a method to use the Semiotic techniques to elicit the requirements for a Data Warehouse solution. With the results of the work we are able to understand that the Semiotic tools are quite efficient and the resultswere above expectation and finally some considerations for future works are made / Mestrado / Engenharia de Computação / Mestre em Computação
|
8 |
Um modelo distribuído de armazenamento hierárquico de conhecimento médicoMacedo, Douglas Dyllon Jeronimo de January 2014 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2013. / Made available in DSpace on 2014-08-06T18:02:36Z (GMT). No. of bitstreams: 1
326446.pdf: 7557486 bytes, checksum: 7e6ecc641fbbbe3baf02a113c016d479 (MD5)
Previous issue date: 2014 / O advento da disseminação e consolidação dos sistemas computacionais, como ferramentas de apoio aos mais variados tipos de negócios, criou uma dependência dos usuários em geral, em armazenar mais e mais seus dados. Atualmente é inquestionável a necessidade de registros anteriores de transações dos usuários em sistemas operacionais. Esta necessidade vai, por exemplo, desde a recuperação de um e-mail de anos anteriores, passando por registros de transações bancárias legadas, indo até prontuários eletrônicos. Com esta crescente demanda de armazenamento de dados, informações e conhecimento, para os mais variados nichos da Indústria e da Ciência em geral, criou um interessante espaço para pesquisa e desenvolvimento de formas alternativas para a persistência de longo prazo em sistemas computacionais. Na área médica, esta premissa é ainda mais verdadeira, pois todos os dias, centenas de milhares de pacientes ao redor do mundo, realizam exames médicos baseados em imagens, buscando auxílio para o diagnóstico dos mais variados tipos de doenças. As formas de persistência de dados que atualmente são utilizadas na área médica, em sua grande maioria, se apoiam no paradigma relacional, que geralmente suportam os sistemas de informação ou conhecimento que estão nos hospitais e clínicas médicas. Neste sentido, esta tese propôs um novo modelo de armazenamento para sistemas médicos baseados em imagens. Este modelo foi concebido a partir de um paradigma hierárquico, seguindo o padrão para imagens médicas internacionalmente reconhecido (DICOM), o que além de representar os dados de uma forma mais natural, simplifica o processo de busca e recuperação. Ao final dos experimentos e das etapas de análises dos resultados, o modelo proposto mostrou ter um desempenho mais eficiente no geral, se comparado ao modelo atual, utilizando bancos de dados relacionais.<br> / Abstract : The advent of the spread and consolidation of computer systems as tools supporting various kinds of business, created a dependence on general users to store more and more data. Currently there is an unquestionable need for previous records of user transactions in computer systems. This will need, for example, from the restore of an e-mail in previous years, going through records of bank transactions legacy, going to electronic records. With this increasing demand for data storage, information and knowledge for various niches of Science and Industry in general has created an interesting space for research and development of alternative forms for the persistence of long-term computer systems. In the medical field, this premise is even more true because every day, hundreds of thousands of patients around the world, conduct medical examinations based on images, seeking aid for the diagnosis of various types of diseases. Forms of data persistence that are currently used in the medical field, mostly, rely on the relational paradigm, which generally support information systems and knowledge that are in hospitals and medical clinics. In this sense, this thesis proposes a new storage model for systems -based medical images. This model was designed from a hierarchical paradigm, following the standard for internationally recognized medical images (DICOM), which also represents the data in a more natural, simplifies the process of search and retrieval. At the end of experiments and after the stages of analysis of the results, the proposed model has shown a better performance when compared to the current model, using relational databases.
|
9 |
Criação auxiliada por tecnologia CASE de ambiente de Data WarehouseBroleze, Alexandre January 2002 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Computação. / Made available in DSpace on 2012-10-19T15:40:53Z (GMT). No. of bitstreams: 0 / Atualmente, na maioria das organizações, são encontrados sistemas computacionais destinados a auxiliar e controlar as mais diversas atividades, gerando uma quantidade assustadora de dados.
|
10 |
Uma metodologia para desenvolvimento da data warehouse e estudo de casoDill, Sérgio Luis January 2002 (has links)
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação. / Made available in DSpace on 2012-10-19T19:17:32Z (GMT). No. of bitstreams: 1
188747.pdf: 1112253 bytes, checksum: 66d48c19b849b0a055ef208bd222deed (MD5) / O ambiente de data warehouse (DW) surgiu como uma evolução dos ambientes de suporte a decisão, integrando fontes de dados dos sistemas transacionais. Sua crescente popularidade reflete a necessidade das empresas em obter informações analíticas derivadas dos seus sistemas transacionais. O ambiente de data warehouse tem características diferentes do ambiente tradicional e é construído tendo-se em mente as necessidades de processamento analítico das organizações. Os projetos de data warehouse têm mais chances de sucesso quando desenvolvidos através de uma metodologia consistente que identifique e guie o projetista durante as várias fases do projeto. Neste trabalho, apresentamos três metodologias de desenvolvimento de data warehouse identificadas a partir de pesquisa bibliográfica. Estas metodologias foram avaliadas com o objetivo de verificar a sua efetiva aplicabilidade em projetos de desenvolvimento de data warehouses. A partir desta avaliação concluiu-se que as metodologias apresentadas não podem ser utilizadas integralmente como base para a construção de sistemas de data warehouse. Conseqüentemente, elaborou-se uma proposta de metodologia com o objetivo de suprir as deficiências e limitações das metodologias pesquisadas. Posteriormente, essa metodologia proposta, foi utilizada para desenvolver o estudo de caso desta dissertação. O estudo de caso tem a finalidade de verificar e avaliar a aplicabilidade da metodologia proposta. Para o estudo de caso foi utilizado o sistema de Concurso Vestibular da UNIJUÍ sediada na cidade de Ijuí (RS).
|
Page generated in 0.1143 seconds