• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1519
  • 38
  • 27
  • 20
  • 20
  • 19
  • 15
  • 14
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 1596
  • 825
  • 659
  • 403
  • 259
  • 220
  • 182
  • 162
  • 141
  • 138
  • 137
  • 135
  • 126
  • 124
  • 121
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
461

Caracterização de uma jazida visando a garantia da qualidade de matérias-primas para indústria cerâmica de revestimentos

Masson, Marcos Roberto [UNESP] 31 July 2002 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:22Z (GMT). No. of bitstreams: 0 Previous issue date: 2002-07-31Bitstream added on 2014-06-13T18:43:40Z : No. of bitstreams: 1 masson_mr_dr_rcla.pdf: 5456827 bytes, checksum: f6e8589e56caa770c89d35c9718cd568 (MD5) / O projeto consiste na aplicação de métodos de caracterização de jazidas em um depósito mineral de matérias-primas para indústria cerâmica de pisos e revestimento. Este estudo demonstra que, ao contrário do que muitos pregavam anteriormente, este tipo de jazida possui variações significativas e que existe uma forte necessidade de utilização dos métodos quantitativos e qualitativos para o controle de qualidade das matérias-primas da massa cerâmica e dessa forma alavancar a competitividade dos produtos no mercado nacional e para exportação. Os principais resultados apresentados são a avaliação bidimensional das variações existentes em uma frente de lavra em operação, tanto do ponto de vista químico quanto físico e as variações das propriedades da matéria-prima ao longo do tempo, em diferentes pontos do processo produtivo até a sua influência relativa nas características dos produtos finais obtidos. Para tanto, foram utilizadas ferramentas da estatística uni e multivariada e também a análise variográfica temporal, neste caso uma ferramenta da geoestatística. / The project consists in the application of mine characterization methods in a mineral deposit of raw material for the ceramic tile industry. This study shows that in opposition of general opinion so far, this type of mine has significant variations and that is strongly recommended the use of quantitative and qualitative methods in order to improve the quality control of ceramic raw material, thus to enhance product competitivity in national and international markets. The most important results presented are the two dimensional variation existing in a open pit mine in operation, both by the chemistry and physics standpoint, and the variations of raw material properties along time, in different points of the productive process, until its relative influence in the end products characteristics obtained. For this study, tools of uni and multivarieted statistics were utilized and also temporal variografic analyses, the last one, a geostatistical tool.
462

Modelo exploratorio para depositos de chumbo e zinco na faixa Itaiacoca - PR/SP

Stevanato, Rodoilton January 1998 (has links)
Orientador: Francisco Jose Fonseca Ferreira / Co-orientadores: Paulo Cesar Soares, Augustinho Rigoti / Dissertação (mestrado) - Universidade Federal do Paraná / Resumo: Neste estudo procurou-se aplicar e interrelacionar três grandes áreas do conhecimento: a geologia, a geoquímica e a geofísica voltadas para a elaboração de um modelo exploratório para depósitos de chumbo e zinco do tipo Mississippi Valley ou Irlandês, em ambiente modificado por processos tectono-metamórficos de idade meso/neoproterozóica, na Faixa Itaiacoca, inserida no escudo leste paranaense. Inicialmente discorre-se um breve histórico do estado da arte na exploração mineral, cujo desenvolvimento é apoiado pela prospecção e na sua condução à elaboração de programas exploratórios. Tais programas devem estar direcionados ao objeto, ou seja, o depósito mineral. Geologicamente, os estudos foram centrados na área de Palmeirinha, município de Sengés-PR, junto à divisa dos estados do Paraná e São Paulo, dentro da Faixa Itaiacoca, situada a NNE do Complexo Batolítico de Cunhaporanga e na borda leste da Bacia do Paraná. As várias unidades mapeadas foram agrupadas de acordo com seu conteúdo litológico, características primárias, metamorfismo e deformações associadas. Individualizaram-se três complexos tectono- metamórficos e uma unidade granítica denominada Granito São Domingos. A unidade portadora e potencialmente favorável ao depósito de chumbo e zinco aqui estudado é representada por espessa seção de metapelitos e metacalcários intensamente deformados ao longo da direção NS, incorporando feições dúcteis e rúpteis, em sistemas de cavalgamentos, empurrões, falhamentos e dobramentos, com metamorfismo na fácies xisto verde inferior. A mineralização descoberta ocorre na porção basal da unidade metapelito-carbonática, em zona de falha transcorrente com direção N10E, subvertical e com rejeito lateral, causando cataclase e brechação nas encaixantes e nos metais-base. A mineralização hospeda-se em metadolarenitos intercalados por cálcio filonitos carbonosos e xistos quartzo-feldspáticos adjacentes. O minério compreende disseminações de galena e esfalerita com pirita e raros cristais de calcopirita, marcassita e covelita, os quais distribuem-se em fraturas e na matriz de brechas com remobilização e recristalização. As técnicas empregadas para a descoberta do depósito, incluem perfis de solos perpendiculares à direção das camadas e foram locados em função do conhecimento geológico prévio, ocorrências minerais, presença de gossans, estruturas e interface metapelitos/metacalcários; os alvos definidos foram escavados por trincheiras e perfurados, os quais resultaram na descoberta do depósito com teor de 7,0% de Pb e 3,0% de Zn com espessura de 1,30 metros. A geofísica, particularmente os métodos magnético e gamaespectrométrico (aéreos e terrestres), auxiliaram o mapeamento geológico-estrutural, enquanto os métodos IP/resistividade detectaram as continuidades vertical e lateral da mineralização, as quais foram confirmadas por novos furos exploratórios. A principal contribuição do presente estudo é a proposta de um modelo exploratório para depósitos de chumbo e zinco em metadolarenitos, enfocando desde a escala do contexto geotectônico até à microscopia da mineralização, além da prospecção e pesquisa na busca de novos depósitos de metais-base na Faixa Itaiacoca. / Abstract: Integrated geologic, geochemical and geophysical information are used to develop an exploration model for Mississippi Valley-type or Irish type lead-zinc deposits in the itaiacoca belt (Middle-Upper Proterozoic, Parana Shield), which has undergone tectonic and metamorphic deformation processes. The study area is located in the region of Palmeirinha, near the border of Parana and Sao Paulo States, NNE of the Cunhaporanga Batholit Complex, and East of the Parana Basin border. The defined units were mapped and grouped according to their lithologies, primary characteristics, metamorphism and associate deformation. Three tectonic and metamorphic complexes and a granitic unit named Sao Domingos Granite were defined. The most favorable unit, hosting the deposit been studied, consists of a thick sequence of metapelites and metadolomites, which were intensively deformed along a NS trend, exhibiting ductile to ruptile features including thrusts, faults and folds, and low greenschist facies metamorphism. The mineralization occurs in a N10E subvertical lateral-slip transcurrent fault zone at the basal part of the metapelites and metacarbonates unit. This transcurrent fault generated breccia and cataclasis in the metadolomites host rock and in the base metais. The deposit occurs in metadolostone covered by graphitic phyllonites and underlaid by quartz-feldspathic schists, placed side by side as a consequence of an allochtonous process along an unconformity between the Middle and Upper Proterozoic units. The ore consists of disseminated galena, sphalerite, pyrite, chalcopyrite, marcasite and covellite, concentrated along the fractures and veinlets with remobilization and recristalization. The exploration strategy employed to discover the deposit includes soil sample analysis, mapping of mineral occurences, gossans, structures and metapelites to metadolomites transition. Selected targets were then drilled and the result was the discovery of a 1.30 m thick ore deposit with 7.0 % Pb and 3.0 % Zn. Geophysics, particularly magnetic and radiometric methods (ground and airborne), helped the geological and structural mapping whereas IP-resistivity mapped the continuity of the ore body, which was confirmed by new drill holes. The main new contribution of the present study is the proposal of an exploration strategy for the deposits in the Itaiacoca belt.
463

Identificação e propagação de temas em redes sociais

Klinczak, Marjori Naiele Mocelin 24 August 2016 (has links)
Os últimos anos foram marcados pelo surgimento de diversas mídias sociais, desde o Orkut até o Facebook, assim como Twitter, Youtube, Google+ e tantos outros: cada um oferece novas funcionalidades como forma de atrair um maior número de usuários. Essas mídias sociais geram uma grande quantidade de dados, que se devidamente processados podem ser utilizados para se identificar tendências, padrões e mudanças. O objetivo deste trabalho é a descoberta dos principais temas abordados em uma rede social, caracterizados como agrupamentos de termos relevantes, restritos a determinado contexto e o estudo de sua evolução ao longo do tempo. Para tanto serão utilizados procedimentos fundamentados em Mineração de Dados e no Processamento de Textos. Em um primeiro momento são utilizadas técnicas de pré-processamento de textos com o objetivo de identificar os termos mais relevantes que aparecem nas mensagens textuais da rede social. Em seguida utilizam-se algoritmos clássicos de agrupamento - k-means, k-medoids, DBSCAN - e o recente NMF (Non-negative Matrix Factorization), para a identificação dos temas principais destas mensagens, caracterizados como agrupamentos de termos relevantes. A proposta foi avaliada sobre a rede Twitter, utilizando-se bases de tweets considerando diversos contextos. Os resultados obtidos evidenciam a viabilidade da proposta e sua aplicação na identificação de temas relevantes desta rede social. / Recent years have been marked by the emergence of various social media, from Orkut to Facebook, and Twitter, Youtube, Google+ and many others: each offers new features as a way to attract more users. These social media generate a large amount of data which is processed properly can be used to identify trends, patterns and changes. The objective of this work is the discovery of the key topics in a social network, characterized as relevant terms groupings, restricted to a particular context and the study of its evolution over time. For that will be used procedures based on Data Mining and Text Processing. At first techniques are used preprocessing of texts in order to identify the most relevant terms that appear in the text messages from the social network. Next are used grouping of classical algorithms - k-means, k-medoids, DBSCAN - and the recent NMF (Non-negative Matrix Factorization), to identify the main themes of these messages, characterized as relevant terms groupings. The proposal was evaluated on the Twitter network, using bases tweets considering different contexts. The results show the feasibility of the proposal and its application in the identification of relevant topics of this social network
464

Identificação e propagação de temas em redes sociais

Klinczak, Marjori Naiele Mocelin 24 August 2016 (has links)
Os últimos anos foram marcados pelo surgimento de diversas mídias sociais, desde o Orkut até o Facebook, assim como Twitter, Youtube, Google+ e tantos outros: cada um oferece novas funcionalidades como forma de atrair um maior número de usuários. Essas mídias sociais geram uma grande quantidade de dados, que se devidamente processados podem ser utilizados para se identificar tendências, padrões e mudanças. O objetivo deste trabalho é a descoberta dos principais temas abordados em uma rede social, caracterizados como agrupamentos de termos relevantes, restritos a determinado contexto e o estudo de sua evolução ao longo do tempo. Para tanto serão utilizados procedimentos fundamentados em Mineração de Dados e no Processamento de Textos. Em um primeiro momento são utilizadas técnicas de pré-processamento de textos com o objetivo de identificar os termos mais relevantes que aparecem nas mensagens textuais da rede social. Em seguida utilizam-se algoritmos clássicos de agrupamento - k-means, k-medoids, DBSCAN - e o recente NMF (Non-negative Matrix Factorization), para a identificação dos temas principais destas mensagens, caracterizados como agrupamentos de termos relevantes. A proposta foi avaliada sobre a rede Twitter, utilizando-se bases de tweets considerando diversos contextos. Os resultados obtidos evidenciam a viabilidade da proposta e sua aplicação na identificação de temas relevantes desta rede social. / Recent years have been marked by the emergence of various social media, from Orkut to Facebook, and Twitter, Youtube, Google+ and many others: each offers new features as a way to attract more users. These social media generate a large amount of data which is processed properly can be used to identify trends, patterns and changes. The objective of this work is the discovery of the key topics in a social network, characterized as relevant terms groupings, restricted to a particular context and the study of its evolution over time. For that will be used procedures based on Data Mining and Text Processing. At first techniques are used preprocessing of texts in order to identify the most relevant terms that appear in the text messages from the social network. Next are used grouping of classical algorithms - k-means, k-medoids, DBSCAN - and the recent NMF (Non-negative Matrix Factorization), to identify the main themes of these messages, characterized as relevant terms groupings. The proposal was evaluated on the Twitter network, using bases tweets considering different contexts. The results show the feasibility of the proposal and its application in the identification of relevant topics of this social network
465

Aplicação de tecnologias de informação e automação em minas subterrâneas: desafios e perspectivas. / Information and automation technologies application in a underground mines: challenges and perspectives.

Guilherme Paiva 21 October 2015 (has links)
Este trabalho tem o objetivo de discutir conceitos, desafios e perspectivas relacionados à aplicação de tecnologias de automação e informação em minas subterrâneas. Exemplos de aplicação contextualizam técnicas e tecnologias atuais de lavra, suas tendências de evolução para o futuro e a interação com aspectos humanos, operacionais e gerenciais. Dados coletados, referentes a indicadores de produtividade e confiabilidade, são utilizados para um estudo sobre a utilização de um jumbo de perfuração computadorizado nas operações de desenvolvimento e produção de uma mina subterrânea no Brasil. Uma série de desafios devem ser considerados para que sistemas computadorizados embarcados em conjunto com infraestrutura de tecnologia da informação se tornem parte da estratégia operacional. Gestores devem efetivamente adaptar as organizações a novos padrões de segurança, eficiência operacional e gestão integrada da informação. A padronização de interfaces deve ser aceita como premissa básica para a integração de processos. / This study aims to discuss the concepts, challenges and perspectives related to automation and information technologies application in underground mines. Application examples contextualize current mining techniques and technology, future evolution and the interaction with human, operational and management aspects. Productivity and reliability data collected are used to study the utilization of a computerized drilling jumbo for development and production operations in an underground mine in Brazil. A series of challenges must be considered for onboard electronic systems combined with information technology infrastructure become part of the operational strategy. Leaders must effectively manage to adapt organizations to new standards. It is evident the value-added operation with all the benefits related to safety, operational efficiency and integrated information management. Interface standardization must be accepted as a basic premise for process integration.
466

Um data warehouse de publicações científicas: indexação automática da dimensão tópicos de pesquisa dos data marts / A Data warehouse for scientific publications: automatic indexing of the research topic dimension for using in data marts

Augusto Kanashiro 04 May 2007 (has links)
Este trabalho de mestrado insere-se no contexto do projeto de uma Ferramenta Inteligente de Apoio à Pesquisa (FIP), sendo desenvolvida no Laboratório de Inteligência Computacional do ICMC-USP. A ferramenta foi proposta para recuperar, organizar e minerar grandes conjuntos de documentos científicos (na área de computação). Nesse contexto, faz-se necessário um repositório de artigos para a FIP. Ou seja, um Data Warehouse que armazene e integre todas as informações extraídas dos documentos recuperados de diferentes páginas pessoais, institucionais e de repositórios de artigos da Web. Para suportar o processamento analítico on-line (OLAP) das informações e facilitar a ?mineração? desses dados é importante que os dados estejam armazenados apropriadamente. Dessa forma, o trabalho de mestrado teve como objetivo principal projetar um Data Warehouse (DW) para a ferramenta FIP e, adicionalmente, realizar experimentos com técnicas de mineração e Aprendizado de Máquina para automatizar o processo de indexação das informações e documentos armazenados no data warehouse (descoberta de tópicos). Para as consultas multidimensionais foram construídos data marts de forma a permitir aos pesquisadores avaliar tendências e a evolução de tópicos de pesquisa / This dissertation is related to the project of an Intelligent Tool for Research Supporting (FIP), being developed at the Laboratory of Computational Intelligence at ICMC-USP. The tool was proposed to retrieve, organize, and mining large sets of scientific documents in the field of computer science. In this context, a repository of articles becomes necessary, i.e., a Data Warehouse that integrates and stores all extracted information from retrieved documents from different personal and institutional web pages, and from article repositories. Data appropriatelly stored is decisive for supporting online analytical processing (OLAP), and ?data mining? processes. Thus, the main goal of this MSc research was design the FIP Data Warehouse (DW). Additionally, we carried out experiments with Data Mining and Machine Learning techniques in order to automatize the process of indexing of information and documents stored in the data warehouse (Topic Detection). Data marts for multidimensional queries were designed in order to facilitate researchers evaluation of research topics trend and evolution
467

COMOVI: um framework para transformação de dados em aplicações de credit behavior scoring baseado no desenvolvimento dirigido por modelos

OlLIVEIRA NETO, Rosalvo Ferreira de 11 December 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-12T12:11:15Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Tese_Rosalvo_Neto_CIN_2015.pdf: 7674683 bytes, checksum: 99037c704450a9a878bcbe93ab8b392d (MD5) / Made available in DSpace on 2016-07-12T12:11:15Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Tese_Rosalvo_Neto_CIN_2015.pdf: 7674683 bytes, checksum: 99037c704450a9a878bcbe93ab8b392d (MD5) Previous issue date: 2015-12-11 / CAPEs / A etapa de pré-processamento em um projeto de descoberta do conhecimento é custosa, em geral, consome cerca de 50 a 80% do tempo total de um projeto. É nesta etapa que um banco de dados relacional é transformado para aplicação de um algoritmo de mineração de dados. A transformação dos dados nesta etapa é uma tarefa complexa, uma vez que exige uma forte integração entre projetistas de banco de dados e especialistas do domínio da aplicação. Os frameworks que buscam sistematizar a etapa de transformação dos dados encontrados na literatura apresentam limitações significativas quando aplicados a soluções comportamentais, como Credit Behavior Scoring. Estas soluções visam a auxiliar as instituições financeiras a decidirem sobre a concessão de crédito aos consumidores com base no risco das solicitações. Este trabalho propõe um framework baseado no Desenvolvimento Dirigido por Modelos para sistematizar esta etapa em soluções de Credit Behavior Scoring. Ele é composto por um meta-modelo que mapeia os conceitos do domínio e um conjunto de regras de transformações. As três principais contribuições do framework proposto são: 1) aumentar o poder discriminatório da solução, através da construção de novas variáveis que maximizam o conteúdo estatístico da informação do domínio; 2) reduzir o tempo da transformação dos dados através da geração automática de código e 3) permitir que profissionais e pesquisadores de Inteligência Artificial e Estatística realizem a transformação dos dados sem o auxílio de especialistas de Banco de Dados. Para validar o framework proposto, dois estudos comparativos foram realizados. Primeiro, um estudo comparando o desempenho entre os principais frameworks existentes na literatura e o framework proposto foi realizado em duas bases de dados. Uma base de dados de um conhecido benchmark de uma competição internacional organizada pela PKDD, e outra obtida de uma das maiores empresas de varejo do Brasil, que possui seu próprio cartão de crédito. Os frameworks RelAggs e Validação de Múltiplas Visões Baseado em Correção foram escolhidos como representantes das abordagens proposicional e mineração de dados relacional, respectivamente. A comparação foi realizada através do processo de validação cruzada estratificada, para definir os intervalos de confiança para a avaliação de desempenho. Os resultados mostram que o framework proposto proporciona um desempenho equivalente ou superior aos principais framework existentes, medido pela área sob a curva ROC, utilizando uma rede neural MultiLayer Perceptron, K vizinho mais próximos e Random Forest como classificadores, com um nível de confiança de 95%. O segundo estudo verificou a redução de tempo proporcionada pelo framework durante a transformação dos dados. Para isso, sete times compostos por estudantes de uma universidade brasileira mensuraram o tempo desta atividade com e sem o framework proposto. O teste pareado Wilcoxon Signed-Rank mostrou que o framework proposto reduz o tempo de transformação com um nível de confiança de 95%. / The pre-processing stage in knowledge discovery projects is costly, generally taking between 50 and 80% of total project time. It is in this stage that data in a relational database are transformed for applying a data mining technique. This stage is a complex task that demands from database designers a strong interaction with experts who have a broad knowledge about the application domain. The frameworks that aim to systemize the data transformation stage have significant limitations when applied to behavior solutions such as the Credit Behavior Scoring solutions. Their goal is help financial institutions to decide whether to grant credit to consumers based on the credit risk of their requests. This work proposes a framework based on the Model Driven Development to systemize this stage in Credit Behavioral Scoring solutions. It is composed by a meta-model which maps the domain concepts and a set of transformation rules. This work has three main contributions: 1) improving the discriminant power of data mining techniques by means of the construction of new input variables, which embed new knowledge for the technique; 2) reducing the time of data transformation using automatic code generation and 3) allowing artificial intelligence and statistics modelers to perform the data transformation without the help of database experts. In order to validate the proposed framework, two comparative studies were conducted. First, a comparative study of performance between the main existing frameworks found in literature and the proposed framework applied to two databases was performed. One database from a known benchmark of an international competition organized by PKDD, and another one obtained from one of the biggest retail companies from Brazil, that has its own private label credit card. The RelAggs and Correlation-based Multiple View Validation frameworks were chosen as representatives of the propositional and relational data mining approaches, respectively. The comparison was carried out through by a 10-fold stratified cross-validation process with ten stratified parts in order to define the confidence intervals. The results show that the proposed framework delivers a performance equivalent or superior to those of existing frameworks, for the evaluation of performance measured by the area under the ROC curve, using a Multilayer Perceptron neural network, k-nearest neighbors and Random Forest as classifiers, with a confidence level of 95%. The second comparative study verified the reduction of time required for data transformation using the proposed framework. For this, seven teams composed by students from a Brazilian university measured the runtime of this stage with and without the proposed framework. The paired Wilcoxon Signed-Rank’s Test showed that the proposed framework reduces the time of data transformation with a confidence level of 95%.
468

Smart info: sistema inteligente para extração de informação de comentários em lojas de aplicativos móveis

MOREIRA, Átila Valgueiro Malta 23 February 2016 (has links)
Submitted by Natalia de Souza Gonçalves (natalia.goncalves@ufpe.br) on 2016-09-28T12:13:59Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação Átila Valgueiro Malta Moreira.pdf: 1329930 bytes, checksum: 6f5ad643b747ebf5a53091b1afaccd17 (MD5) / Made available in DSpace on 2016-09-28T12:13:59Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação Átila Valgueiro Malta Moreira.pdf: 1329930 bytes, checksum: 6f5ad643b747ebf5a53091b1afaccd17 (MD5) Previous issue date: 2016-02-23 / CAPES / O SMART INFO é um sistema de descoberta de conhecimento em avaliações feitas por usuários de jogos móveis em lojas virtuais, tais como Google Play e iTunes, visando a detecção automática de falhas que possam prejudicar a vida útil do jogo, assim como o levantamento de sugestões feitas pelos usuários. Este sistema tem vital importância para o novo paradigma de desenvolvimento, onde jogos deixam de ser tratados como produtos e passam a ser tratados como serviços, passando a respeitar o ciclo ARM, que consiste em três pontos: Aquisição, Retenção e Monetização. Para tanto foi utilizada Descoberta de Conhecimento em Texto (DCT) por meio de uma adaptação do CRISP-DM, juntamente com o processo de DCT. / SMART INFO is a knowledge discovery system that uses reviews made by mobile game users on virtual stores, such as Google Play and iTunes, with the goals of automatically detecting flaws, which might harm the game's lifespan, and obtaining suggestions made by users. This system is of vital importance for the new paradigm of development, where games stop being treated as products and start being treated as services, needing to respect the ARM cycle, which consists of three main aspects: Acquisition, Retention and Monetization. To achieve this, Knowledge Discovery in Text (KDT) was used through an adaptation of the CRISP-DM, together with the DCT process
469

Descoberta automatizada de associações com o uso de algoritmo Apriori como técnica de mineração de dados / Automatic discovery of associations by Apriori data mining technique

ALMEIDA, Derciley Cunha de 25 February 2011 (has links)
Made available in DSpace on 2014-07-29T15:08:17Z (GMT). No. of bitstreams: 1 Dissertacao Derciley Cunha de Almeida.pdf: 2389648 bytes, checksum: c4c207dc1855a4a0e99ee3eeed7c28b9 (MD5) Previous issue date: 2011-02-25 / Nowadays, the use of modern information systems allows the storage and management of increasingly large amounts of data. On the other hand, the full analysis and the maximum extraction of useful information from this universe of available data present considerable challenges in view of inherent human limitations. This dissertation deals with the subject of data mining, which is the use of technology resources in order to extract information from databases in an automated way. One of the possibilities offered by data mining technologies is the automated search for possible associations within data. Information about such associations can be useful for understanding cause and effect relationships between the involved variables in data analysis for decision making. There are several data mining techniques and many of them can be used for discovering associations. The main goal of this work is to study a particular method for automated search of associations called Apriori , evaluating its capabilities and outcomes. The study focuses on the problem of improving the Apriori algorithm results, taking into consideration that the results of the data mining process might be improved if the data are prepared specifically for Apriori application. The conclusions are drawn from a case study in which the Apriori algorithm was applied to a database with information on drug distribution at a health institute. The results of two experiments are considered in order to evaluate the influence of data preprocessing on the Apriori algorithm's performance. It was found that the Apriori algorithm yields satisfactory results on the discovery of association in data; however, for best results, it is advisable that the data be prepared in advance, specifically for the Apriori application, otherwise many associations in the database might be left undiscovered. / Atualmente é possível o armazenamento e o gerenciamento de grandes quantidades de dados, através de modernos sistemas informatizados. Por outro lado, a análise completa e a extração do máximo de informações desse universo de dados disponíveis passaram a ser um grande desafio, diante das limitações próprias de um ser humano. Essa dissertação aborda o tema mineração de dados, também muito conhecido pelo termo em inglês data mining. Trata-se da extração de informações de bases de dados de forma automatizada, com o uso de recursos tecnológicos. Uma das possibilidades que as tecnologias de data mining oferecem é a busca automatizada de possíveis associações existentes entre dados. As informações sobre associações entre dados podem ser muito úteis para se compreender possíveis relações de causa e efeito entre muitas variáveis envolvidas em estudos e análises de dados para tomada de decisões. Há várias técnicas de mineração de dados e muitas podem ser utilizadas para descoberta de associações. O principal objetivo deste trabalho é estudar mais especificamente o método de busca automatizada de associações conhecido como Apriori de forma a avaliar sua sistemática, capacidade e resultados. O estudo é direcionado por um problema que está relacionado à busca pelo aprimoramento dos resultados gerados pelo algoritmo Apriori sob a premissa de que uma preparação de dados específica e direcionada para o uso do algoritmo pode aprimorar os resultados do processo de mineração de dados. As conclusões são extraídas de um estudo de caso sobre a aplicação do algoritmo Apriori em uma base de dados com informações sobre fornecimento de medicamentos de uma unidade de saúde. São avaliados e comparados os resultados de três experimentos para se verificar a influência de uma preparação de dados no desempenho do algoritmo. Ficou evidenciado que o algoritmo Apriori alcança resultados satisfatórios na tarefa de busca por associações entre dados, no entanto, é recomendável uma preparação específica desses dados para que a aplicação do algoritmo alcance melhores resultados ou muitas associações existentes podem não ser encontradas.
470

Enxame de partículas aplicado ao agrupamento de textos / Enxame de partículas aplicado ao agrupamento de textos

Prior, Ana Karina Fontes 22 December 2010 (has links)
Made available in DSpace on 2016-03-15T19:37:34Z (GMT). No. of bitstreams: 1 Ana Karina Fontes Prior.pdf: 415415 bytes, checksum: a6ecb97b982ab886cc421abdc943c8ac (MD5) Previous issue date: 2010-12-22 / Fundo Mackenzie de Pesquisa / The large number of data generated by people and organizations has stimulated the research on effective and automatic methods of knowledge extraction from databases. This dissertation proposes two new bioinspired techniques, named cPSC and oPSC, based on the Particle Swarm Optimization Algorithm (PSO) to solve data clustering problems. The proposed algorithms are applied to data and text clustering problems and their performances are compared with a standard algorithm from the literature. The results allow us to conclude that the proposed algorithms are competitive with those already available in literature, but bring benefits such as automatic determination of the number of groups on the dataset and a search for the best partitioning of the dataset considering an explicit cost function. / A grande quantidade de dados gerados por pessoas e organizações tem estimulado a pesquisa sobre métodos efetivos e automáticos de extração de conhecimentos a partir de bases de dados. Essa dissertação propõe duas novas técnicas bioinspiradas, denominadas cPSC e oPSC, baseadas no algoritmo de otimização por enxame de partículas (PSO - Particle Swarm Optimization) para resolver problemas de agrupamento de dados. Os algoritmos propostos são aplicados a problemas de agrupamento de dados e textos, e seus desempenhos são comparados com outros propostos na literatura específica. Os resultados obtidos nos permitem concluir que os algoritmos propostos são competitivos com aqueles já disponíveis na literatura, porém trazem outros benefícios como a determinação automática do número de grupos nas bases e a efetuação de uma busca pelo melhor particionamento possível da base considerando uma função de custo explícita.

Page generated in 0.1066 seconds