• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 77
  • 74
  • 52
  • 10
  • 3
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 269
  • 269
  • 175
  • 165
  • 95
  • 56
  • 55
  • 51
  • 50
  • 47
  • 44
  • 43
  • 40
  • 40
  • 36
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
161

GeoMiningVisualQL: uma linguagem de consulta visual para mineração de dados geográficos

Pedrosa, Klebber de Araújo 10 August 2010 (has links)
Made available in DSpace on 2015-05-14T12:36:56Z (GMT). No. of bitstreams: 1 parte1.pdf: 1854774 bytes, checksum: 9564eb94b101d580f9879bf9c9422f98 (MD5) Previous issue date: 2010-08-10 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Several areas of knowledge domain, such as remote sensing systems, transportation, telecommunication, digital mapping, among others, make use of large amounts of geographic data. Typically, these data are stored in Management Systems Geographic Database (SGBDGeo), through which can be often manipulated by Geographic Information Systems (GIS). However, these systems are not able to extract new information, previously unknown to users, which may be embedded within the database field analysed and that, somehow, represent new and userful knowledge, for example, for decision making. In this case, it is necessary to make use of specific techniques of Knowledge Discovery in Databases (KDD). Moreover, spatial data present inherently visual characteristics that, often, can be associated with geometric and pictographic visual representations. In this context, there are few visual query languages for spatial data. However, few of this treat mining methods among the spatial data. Thus, this paper proposes the construction of an environment for data mining tasks performed under certain geographical areas, beyond the formal specification of a visual query language to be used in this environment. These queries are formulated through pictorial representations of geographic features, operators, and spatial relationships between these data. To this end, we use metaphorical abstractions on the metadata of the geographical environment, and the approach defined as "flowing stream" in which the user focuses attention on certain stages of the mining process, facilitating the construction of these consultations a number of them. Thus, the proposed environment aims to simplify the tasks of consultations on mining spatial data, making them more user friendly, providing more efficiency and speed when compared to textual queries scripts. / Diversas áreas de domínio de conhecimento, tais como os sistemas de sensoriamente remoto, transportes, telecomunicações, cartografia digital, entre outras, fazem uso de uma grande quantidade de dados geográficos. Normalmente, esses dados são armazenados em Sistemas Gerenciadores de Banco de Dados Geográficos (SGBDGeo), através dos quais, muitas vezes, podem ser manipulados por Sistemas de Informações Geográficas (SIG). Entretanto, esses sistemas não são capazes de extrair novas informações, previamente desconhecidas pelos usuários, as quais podem estar embutidas dentro da base de dados do domínio analisado e que, de certo modo, representam algum conhecimento novo e de grande utilidade, por exemplo, para tomadas de decisões. Neste caso, é necessário fazer uso de técnicas específicas de Descoberta de Conhecimento em Banco de Dados (DCBD ou KDD, Knowledge Discovery in Database). Além disso, os dados geográficos apresentam características inerentemente visuais que, muitas vezes, podem ser associados a representações visuais geométricas ou pictográficas. Nesse contexto, existem algumas linguagens de consultas visuais para dados geográficos. Todavia, poucas delas tratam métodos de mineração espacial entre os dados. Desta forma, este trabalho propõe a construção de um ambiente para as tarefas de mineração de dados realizada sob certos domínios geográficos, além da especificação formal de uma linguagem de consulta visual a ser usada neste ambiente. Estas consultas são formuladas através de representações pictóricas de feições geográficas, operadores e relacionamentos espaciais existentes entre estes dados. Para tal, utilizam-se abstrações metafóricas sobre os metadados do ambiente geográfico, além da abordagem definida como fluxo corrente na qual o usuário foca a sua atenção em determinadas etapas do processo de mineração, facilitando a construção destas consultas por parte dos mesmos. Desta forma, o ambiente proposto tem como objetivo simplificar as consultas sobre tarefas de mineração de dados geográficos, tornando-as mais amigáveis aos usuários, concedendo mais eficiência e rapidez quando se comparado aos scripts textuais de consultas.
162

Modelação e análise da vida útil (metrológica) de medidores tipo indução de energia elétrica ativa /

Silva, Marcelo Rubia da. January 2010 (has links)
Orientador: Carlos Alberto Canesin / Banca: Júlio Borges de Souza / Banca: Denizar Cruz Martins / Resumo: O estudo da confiabilidade operacional de equipamentos se tornou fundamental para as empresas possuírem o devido controle dos seus ativos, tanto pelo lado financeiro quanto em questões de segurança. O estudo da taxa de falha de equipamentos prevê quando as falhas irão ocorrer possibilitando estabelecer atitudes preventivas, porém, seu estudo deve ser realizado em condições de operação estabelecidas e fixas. Os medidores de energia elétrica, parte do ativo financeiro das concessionárias de energia, são equipamentos utilizados em diversas condições de operação, tanto nas condições do fluxo de energia, tais como presenças de harmônicos, subtensões, sobre-tensões e padrões de consumo distintos, quanto pelo local físico de instalação, tais como maresia, temperatura, umidade, etc. As falhas nos medidores eletromecânicos de energia elétrica são de difícil constatação uma vez que a maioria dos erros de medição, ocasionados principalmente por envelhecimento de componentes, não alteram a qualidade da energia fornecida e nem interrompem o seu fornecimento. Neste sentido, este trabalho propõe uma nova metodologia de determinação de falhas em medidores eletromecânicos de energia elétrica ativa. Faz-se uso de banco de dados de uma concessionária de energia elétrica e do processo de descoberta de conhecimento em bases de dados para selecionar as variáveis mais significativas na determinação de falhas em medidores eletromecânicos de energia elétrica ativa, incluindo no conjunto de falhas a operação com erros de medição acima do permitido pela legislação nacional (2010). Duas técnicas de mineração de dados foram utilizadas: regressão stepwise e árvores de decisão. As variáveis obtidas foram utilizadas na construção de um modelo de agrupamento de equipamentos associando a cada grupo uma probabilidade... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: The operational reliability study of equipments has become primal in order to enterprises have the righteous control over their assets, both by financial side as by security reasons. The study for the hazard rate of equipments allows to foresee the failures for the equipments and to act preventively, but this study must be accomplished under established and fixed operation conditions. The energy meters, for their part, are equipments utilized in several operating conditions so on the utilization manner, like presence of harmonics, undervoltages and over-voltages and distinct consumption patterns, as on the installation location, like swel, temperature, humidity, etc. Failures in electromechanical Wh-meters are difficult to detect once that the majority of metering errors occurred mainly by aging of components do not change the quality of offered energy neither disrupt its supply. In this context, this work proposes a novel methodology to obtain failure determination for electromechanical Whmeters. It utilizes Wh-databases from an electrical company and of the process of knowledge discovery in databases to specify the most significant variables in determining failures in electromechanical Wh-meters, including in the failure set the operation with metering errors above those permitted by national regulations (2010). Two techniques of data mining were used in this work: stepwise regression and decision trees. The obtained variables were utilized on the construction of a model of clustering similar equipments and the probability of failure of those clusters were determined. As final results, an application in a friendly platform were developed in order to apply the methodology, and a case study was accomplished in order to demonstrate its feasibility. / Mestre
163

Aplicação do processo de descoberta de conhecimento em dados do poder judiciário do estado do Rio Grande do Sul / Applying the Knowledge Discovery in Database (KDD) Process to Data of the Judiciary Power of Rio Grande do Sul

Schneider, Luís Felipe January 2003 (has links)
Para explorar as relações existentes entre os dados abriu-se espaço para a procura de conhecimento e informações úteis não conhecidas, a partir de grandes conjuntos de dados armazenados. A este campo deu-se o nome de Descoberta de Conhecimento em Base de Dados (DCBD), o qual foi formalizado em 1989. O DCBD é composto por um processo de etapas ou fases, de natureza iterativa e interativa. Este trabalho baseou-se na metodologia CRISP-DM . Independente da metodologia empregada, este processo tem uma fase que pode ser considerada o núcleo da DCBD, a “mineração de dados” (ou modelagem conforme CRISP-DM), a qual está associado o conceito “classe de tipo de problema”, bem como as técnicas e algoritmos que podem ser empregados em uma aplicação de DCBD. Destacaremos as classes associação e agrupamento, as técnicas associadas a estas classes, e os algoritmos Apriori e K-médias. Toda esta contextualização estará compreendida na ferramenta de mineração de dados escolhida, Weka (Waikato Environment for Knowledge Analysis). O plano de pesquisa está centrado em aplicar o processo de DCBD no Poder Judiciário no que se refere a sua atividade fim, julgamentos de processos, procurando por descobertas a partir da influência da classificação processual em relação à incidência de processos, ao tempo de tramitação, aos tipos de sentenças proferidas e a presença da audiência. Também, será explorada a procura por perfis de réus, nos processos criminais, segundo características como sexo, estado civil, grau de instrução, profissão e raça. O trabalho apresenta nos capítulos 2 e 3 o embasamento teórico de DCBC, detalhando a metodologia CRISP-DM. No capítulo 4 explora-se toda a aplicação realizada nos dados do Poder Judiciário e por fim, no capítulo 5, são apresentadas as conclusões. / With the purpose of exploring existing connections among data, a space has been created for the search of Knowledge an useful unknown information based on large sets of stored data. This field was dubbed Knowledge Discovery in Databases (KDD) and it was formalized in 1989. The KDD consists of a process made up of iterative and interactive stages or phases. This work was based on the CRISP-DM methodology. Regardless of the methodology used, this process features a phase that may be considered as the nucleus of KDD, the “data mining” (or modeling according to CRISP-DM) which is associated with the task, as well as the techniques and algorithms that may be employed in an application of KDD. What will be highlighted in this study is affinity grouping and clustering, techniques associated with these tasks and Apriori and K-means algorithms. All this contextualization will be embodied in the selected data mining tool, Weka (Waikato Environment for Knowledge Analysis). The research plan focuses on the application of the KDD process in the Judiciary Power regarding its related activity, court proceedings, seeking findings based on the influence of the procedural classification concerning the incidence of proceedings, the proceduring time, the kind of sentences pronounced and hearing attendance. Also, the search for defendants’ profiles in criminal proceedings such as sex, marital status, education background, professional and race. In chapters 2 and 3, the study presents the theoretical grounds of KDD, explaining the CRISP-DM methodology. Chapter 4 explores all the application preformed in the data of the Judiciary Power, and lastly, in Chapter conclusions are drawn
164

Análise de grandezas cinemáticas e dinâmicas inerentes à hemiparesia através da descoberta de conhecimento em bases de dados / Analysis of kinematic and dynamic data inherent to hemiparesis through knowledge discovery in databases

Caio Benatti Moretti 31 March 2016 (has links)
Em virtude de uma elevada expectativa de vida mundial, faz-se crescente a probabilidade de ocorrer acidentes naturais e traumas físicos no cotidiano, o que ocasiona um aumento na demanda por reabilitação. A terapia física, sob o paradigma da reabilitação robótica com serious games, oferece maior motivação e engajamento do paciente ao tratamento, cujo emprego foi recomendado pela American Heart Association (AHA), apontando a mais alta avaliação (Level A) para pacientes internados e ambulatoriais. No entanto, o potencial de análise dos dados coletados pelos dispositivos robóticos envolvidos é pouco explorado, deixando de extrair informações que podem ser de grande valia para os tratamentos. O foco deste trabalho consiste na aplicação de técnicas para descoberta de conhecimento, classificando o desempenho de pacientes diagnosticados com hemiparesia crônica. Os pacientes foram inseridos em um ambiente de reabilitação robótica, fazendo uso do InMotion ARM, um dispositivo robótico para reabilitação de membros superiores e coleta dos dados de desempenho. Foi aplicado sobre os dados um roteiro para descoberta de conhecimento em bases de dados, desempenhando pré-processamento, transformação (extração de características) e então a mineração de dados a partir de algoritmos de aprendizado de máquina. A estratégia do presente trabalho culminou em uma classificação de padrões com a capacidade de distinguir lados hemiparéticos sob uma precisão de 94%, havendo oito atributos alimentando a entrada do mecanismo obtido. Interpretando esta coleção de atributos, foi observado que dados de força são mais significativos, os quais abrangem metade da composição de uma amostra. / As a result of a higher life expectancy, the high probability of natural accidents and traumas occurences entails an increasing need for rehabilitation. Physical therapy, under the robotic rehabilitation paradigm with serious games, offers the patient better motivation and engagement to the treatment, being a method recommended by American Heart Association (AHA), pointing the highest assessment (Level A) for inpatients and outpatients. However, the rich potential of the data analysis provided by robotic devices is poorly exploited, discarding the opportunity to aggregate valuable information to treatments. The aim of this work consists of applying knowledge discovery techniques by classifying the performance of patients diagnosed with chronic hemiparesis. The patients, inserted into a robotic rehabilitation environment, exercised with the InMotion ARM, a robotic device for upper-limb rehabilitation which also does the collection of performance data. A Knowledge Discovery roadmap was applied over collected data in order to preprocess, transform and perform data mining through machine learning methods. The strategy of this work culminated in a pattern classification with the abilty to distinguish hemiparetic sides with an accuracy rate of 94%, having eight attributes feeding the input of the obtained mechanism. The interpretation of these attributes has shown that force-related data are more significant, comprising half of the composition of a sample.
165

Aplicação do processo de descoberta de conhecimento em dados do poder judiciário do estado do Rio Grande do Sul / Applying the Knowledge Discovery in Database (KDD) Process to Data of the Judiciary Power of Rio Grande do Sul

Schneider, Luís Felipe January 2003 (has links)
Para explorar as relações existentes entre os dados abriu-se espaço para a procura de conhecimento e informações úteis não conhecidas, a partir de grandes conjuntos de dados armazenados. A este campo deu-se o nome de Descoberta de Conhecimento em Base de Dados (DCBD), o qual foi formalizado em 1989. O DCBD é composto por um processo de etapas ou fases, de natureza iterativa e interativa. Este trabalho baseou-se na metodologia CRISP-DM . Independente da metodologia empregada, este processo tem uma fase que pode ser considerada o núcleo da DCBD, a “mineração de dados” (ou modelagem conforme CRISP-DM), a qual está associado o conceito “classe de tipo de problema”, bem como as técnicas e algoritmos que podem ser empregados em uma aplicação de DCBD. Destacaremos as classes associação e agrupamento, as técnicas associadas a estas classes, e os algoritmos Apriori e K-médias. Toda esta contextualização estará compreendida na ferramenta de mineração de dados escolhida, Weka (Waikato Environment for Knowledge Analysis). O plano de pesquisa está centrado em aplicar o processo de DCBD no Poder Judiciário no que se refere a sua atividade fim, julgamentos de processos, procurando por descobertas a partir da influência da classificação processual em relação à incidência de processos, ao tempo de tramitação, aos tipos de sentenças proferidas e a presença da audiência. Também, será explorada a procura por perfis de réus, nos processos criminais, segundo características como sexo, estado civil, grau de instrução, profissão e raça. O trabalho apresenta nos capítulos 2 e 3 o embasamento teórico de DCBC, detalhando a metodologia CRISP-DM. No capítulo 4 explora-se toda a aplicação realizada nos dados do Poder Judiciário e por fim, no capítulo 5, são apresentadas as conclusões. / With the purpose of exploring existing connections among data, a space has been created for the search of Knowledge an useful unknown information based on large sets of stored data. This field was dubbed Knowledge Discovery in Databases (KDD) and it was formalized in 1989. The KDD consists of a process made up of iterative and interactive stages or phases. This work was based on the CRISP-DM methodology. Regardless of the methodology used, this process features a phase that may be considered as the nucleus of KDD, the “data mining” (or modeling according to CRISP-DM) which is associated with the task, as well as the techniques and algorithms that may be employed in an application of KDD. What will be highlighted in this study is affinity grouping and clustering, techniques associated with these tasks and Apriori and K-means algorithms. All this contextualization will be embodied in the selected data mining tool, Weka (Waikato Environment for Knowledge Analysis). The research plan focuses on the application of the KDD process in the Judiciary Power regarding its related activity, court proceedings, seeking findings based on the influence of the procedural classification concerning the incidence of proceedings, the proceduring time, the kind of sentences pronounced and hearing attendance. Also, the search for defendants’ profiles in criminal proceedings such as sex, marital status, education background, professional and race. In chapters 2 and 3, the study presents the theoretical grounds of KDD, explaining the CRISP-DM methodology. Chapter 4 explores all the application preformed in the data of the Judiciary Power, and lastly, in Chapter conclusions are drawn
166

Ciência, mídia e governo na configuração do macroambiente para os biocombustíveis líquidos

Talamini, Edson January 2008 (has links)
O objetivo na pesquisa foi investigar as dimensões sob as quais a Ciência, a Mídia e o Governo de diferentes países configuraram o macroambiente para os biocombustíveis líquidos ao longo do tempo. Utilizando a Teoria da Análise Ambiental, da área de planejamento estratégico, e as teorias da área da comunicação (Agendamento, Enquadramento e Priming), apoiando-se numa revisão das interações entre Ciência, Mídia e Governo, foram definidas nove dimensões macroambientais, sob as quais a temática dos biocombustíveis líquidos pode ser enquadrada: Agronômica, Ambiental, Cultural, Econômica, Geopolítica, Legal, Política, Social e Tecnológica. Neste estudo, foram formulados seis conjuntos de hipóteses, na investigação das semelhanças e diferenças entre os meios de expressão de um mesmo país e entre os diferentes países. Como espaços geopolíticos de estudo, foram selecionados os três países maiores produtores de biocombustíveis líquidos no presente: Alemanha, Brasil e Estados Unidos. Para análise, foram coletados documentos textuais em formato eletrônico de cada país ao longo de dez anos (1997 a 2006). A busca dos documentos foi feita em bases de publicações científicas, em páginas dos governos na rede mundial de computadores e em arquivos eletrônicos dos jornais selecionados, a partir de palavras-chave relacionadas aos tipos de biocombustíveis líquidos mais importantes no presente. Os 9.343 documentos selecionados foram armazenados em nove bases de dados, construídas e preparadas utilizando-se o software QDA Miner. Para extrair o conhecimento das bases textuais, foi elaborada uma estrutura de análise constituída pelas dimensões macroambientais e os seus respectivos conjuntos de “palavras-d”, as quais foram definidas a partir da sua freqüência de uso em publicações científicas dos campos do conhecimento, respectivos a cada dimensão. Aplicando-se a estrutura de análise ao módulo WordStat® do software SimStat®, foi feita a Mineração em Textos nas bases de dados. As hipóteses de semelhança ou diferença entre as respectivas expressões em cada dimensão, em cada tipo de documento e em cada país foram testadas por meio de Testes de Aderência e Homogeneidade, além do uso do Coeficiente de Similaridade de Jaccard. Os resultados mostraram que as dimensões macroambientais predominantes, sob as quais a temática dos biocombustíveis líquidos tem se expressado de modo similar na Ciência dos três países, são: Ambiental, Tecnológica e Agronômica. Nos documentos do Governo da Alemanha predominaram as dimensões: Tecnológica, Geopolítica e Ambiental, enquanto que nos documentos do Governo do Brasil predominaram as dimensões: Tecnológica, Geopolítica, Econômica e Ambiental, com amplo domínio da dimensão Tecnológica. Por outro lado, nos documentos do Governo dos Estados Unidos, predominaram as dimensões: Ambiental, Tecnológica e Agronômica. Com relação aos resultados observados nos documentos da Mídia alemã predominaram as dimensões: Geopolítica, Econômica e Agronômica. Na Mídia brasileira predominaram as dimensões: Econômica, Tecnológica, Política e Geopolítica. Na Mídia norte-americana predominaram as dimensões: Econômica, Ambiental, Geopolítica e Política. Os resultados indicam a existência de diferenças entre a Ciência, a Mídia e o Governo de cada país analisado, sendo que o grau de similaridade é maior entre as expressões da Ciência e dos Governos. Assim, a produção e o uso dos biocombustíveis líquidos evoluem num macroambiente determinado por vetores de diferentes dimensões dominantes, de acordo com as particularidades de cada espaço geopolítico. O reconhecimento destas diferenças pode ter ser relevante para o desenho de estratégias para a promoção da produção e do uso de biocombustíveis líquidos nos diferentes países e mercados. / The objective of this research was to investigate the dimensions in which Science, Media and Government of different countries determined the macroenvironment in which liquid biofuel production and use evolved during time. By applying the Environmental Analysis Theory, from the field of strategic planning, and theories of the field of the communication sciences (Agenda Setting, Framing and Priming), supported by a review of the interactions between Science, Media and Government, nine macrodimensions were defined, in which the subject of liquid biofuels production and use can be framed: agronomic, environmental, cultural, economic, geopolitical, legal, political, social and technological. In this study, six group of hypothesis were presented for the test for similarities and differences between the different vehicles of expression of the same or of different countries. For the study of different geopolitical spaces, the three countries which currently present the highest production of liquid biofuels were selected namely Germany, Brazil and the United States. For analysis, electronic text documents were selected from each country, published during ten years (from 1997 to 2006). The search for documents was carried out in bases of scientific publications and in websites of governments and of selected newspapers, using keywords related to the liquid biofuels mostly used currently. The 9,343 documents selected were downloaded onto nine data-bases, formatted by the QDA Miner software. For knowledge extraction from textual data-bases, a structural analysis framework was constructed considering the nine macroenvironmental dimensions selected and the sets of corresponding “d-words”, as derived from collections of scientific publications of each of the fields of knowledge, respectively to each dimension. Text mining was carried out in the data-bases, according to the analytical framework with the help of WordStat® module of the software SimSat®. The similarity or difference hypothesis between the respective expressions in each dimension, in each kind of document, and in each country, were verified by the Adherence and Homogeneity Test and by determination of the Jaccard’s Similarity Coefficient. Results showed that the predominant macroenvironmental dimensions, in which the subject of liquid biofuels has been expressed in Science documents, similarly in the three countries studied, are: Environmental, Technological and Agronomic. In the documents of the Government of Germany predominated the dimensions: Technological, Geopolitical and Environmental, whereas in the documents of the Government of Brazil predominated the dimensions: Technological, Geopolitical, Economic and Environmental, with ample dominance of the Technological dimension. On the other hand, in the documents of the Government of the United States predominated the dimensions: Environmental, Technological and Agronomic. Regarding the documental analysis of the Media, in the German Media predominated the dimensions: Geopolitical, Economic and Agronomic. In the Brazilian Media predominated the dimensions: Economic, Technological, Political and Geopolitical. In the North-American Media predominated the dimensions: Economic, Environmental, Geopolitical, and Political. The results indicate the occurrence of differences between Science, Media and Government of each country analysed, the degree of similarity being higher in the expressions of Science and Government. Therefore, the production and the use of liquid biofuels evolve in a macroenvironment determined by different, dominant macroenvironmental vectors, according to the singularities of each particular geopolitical space. The recognition of these differences can be of relevance for designing strategies for the promotion of production and use of liquid biofuels in different countries and markets.
167

Smart info: sistema inteligente para extração de informação de comentários em lojas de aplicativos móveis

MOREIRA, Átila Valgueiro Malta 23 February 2016 (has links)
Submitted by Natalia de Souza Gonçalves (natalia.goncalves@ufpe.br) on 2016-09-28T12:13:59Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação Átila Valgueiro Malta Moreira.pdf: 1329930 bytes, checksum: 6f5ad643b747ebf5a53091b1afaccd17 (MD5) / Made available in DSpace on 2016-09-28T12:13:59Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Dissertação Átila Valgueiro Malta Moreira.pdf: 1329930 bytes, checksum: 6f5ad643b747ebf5a53091b1afaccd17 (MD5) Previous issue date: 2016-02-23 / CAPES / O SMART INFO é um sistema de descoberta de conhecimento em avaliações feitas por usuários de jogos móveis em lojas virtuais, tais como Google Play e iTunes, visando a detecção automática de falhas que possam prejudicar a vida útil do jogo, assim como o levantamento de sugestões feitas pelos usuários. Este sistema tem vital importância para o novo paradigma de desenvolvimento, onde jogos deixam de ser tratados como produtos e passam a ser tratados como serviços, passando a respeitar o ciclo ARM, que consiste em três pontos: Aquisição, Retenção e Monetização. Para tanto foi utilizada Descoberta de Conhecimento em Texto (DCT) por meio de uma adaptação do CRISP-DM, juntamente com o processo de DCT. / SMART INFO is a knowledge discovery system that uses reviews made by mobile game users on virtual stores, such as Google Play and iTunes, with the goals of automatically detecting flaws, which might harm the game's lifespan, and obtaining suggestions made by users. This system is of vital importance for the new paradigm of development, where games stop being treated as products and start being treated as services, needing to respect the ARM cycle, which consists of three main aspects: Acquisition, Retention and Monetization. To achieve this, Knowledge Discovery in Text (KDT) was used through an adaptation of the CRISP-DM, together with the DCT process
168

Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores

Rocha, Mauricio Rêgo Mota da 20 August 2008 (has links)
Made available in DSpace on 2016-03-15T19:38:11Z (GMT). No. of bitstreams: 1 Mauricio Rego Mota da Rocha.pdf: 914988 bytes, checksum: d8751dcc6d37e161867d8941bc8f7d64 (MD5) Previous issue date: 2008-08-20 / Fundo Mackenzie de Pesquisa / The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest. / O processo de descoberta de conhecimento em banco de dados tem se tornado necessário devido à grande quantidade de dados atualmente armazenados nas bases de dados das empresas. Esses dados devidamente explorados podem auxiliar os gestores na tomada de decisões nas organizações. Este processo é composto de várias etapas, dentre elas destaca-se a mineração de dados, etapa onde são aplicadas técnicas para obtenção de conhecimento que não podem ser obtidas através de métodos tradicionais de análise. Além das técnicas, na etapa demineração de dados também é escolhida a tarefa de mineração que será utilizada. A mineração de dados geralmente produz grande quantidade de regras que muitas vezes não são importantes, relevantes ou interessantes para o usuário final. Isto torna necessária a análise do conhecimento descoberto no pós-processamento dos dados. Na etapa de pós-processamento são utilizadas medidas tanto de desempenho como também de grau de interesse com a finalidade de apontar as regras mais interessante, úteis e relevantes. Neste trabalho, utilizando-se de uma ferramenta chamada WEKA (Waikato Environment for Knowledge Analysis), foram aplicadas as técnicas de mineração de Árvore de Decisão e de Regras de Classificação através dos algoritmos de classificação J48.J48 e J48.PART respectivamente. No pós-processamento de dados foi implementado um pacote com funções e procedimentos para cálculo das medidas tanto de desempenho como também de grau de interesse de regras. Nesta etapa também foram desenvolvidas consultas (querys) para selecionar as regras mais importantes de acordo com as medidas de desempenho e de grau de interesse.
169

Algorithms for knowledge discovery using relation identification methods

Tomczak, Jakub January 2009 (has links)
In this work a coherent survey of problems connected with relational knowledge representation and methods for achieving relational knowledge representation were presented. Proposed approach was shown on three applications: economic case, biomedical case and benchmark dataset. All crucial definitions were formulated and three main methods for relation identification problem were shown. Moreover, for specific relational models and observations’ types different identification methods were presented. / Double Diploma Programme, polish supervisor: prof. Jerzy Świątek, Wrocław University of Technology
170

Využití data miningových metod při zpracování dat z demografických šetření / Using data mining methods for demographic survey data processing

Fišer, David January 2015 (has links)
USING DATA MINING METHODS FOR DEMOGRAPHIC SURVEY DATA PROCESSING Abstract The goal of the thesis was to describe and demonstrate principles of the process of knowledge discovery in databases - data mining (DM). In the theoretical part of the thesis, selected methods for data mining processes are described as well as basic principles of those DM techniques. In the second part of the thesis a DM task is realized in accordance to CRISP-DM methodology. Practical part of the thesis is divided into two parts and data from the survey of American Community Survey served as the basic data for the practical part of the thesis. First part contains a classification task which goal was to determinate whether the selected DM techniques can be used to solve missing data in the surveys. The success rate of classifications and following data value prediction in selected attributes was in 55-80 % range. The second part of the practical part of the thesis was then focused of determining knowledge of interest using associating rules and the GUHA method. Keywords: data mining, knowledge discovery in databases, statistic surveys, missing values, classification, association rules, GUHA method, ACS

Page generated in 0.1329 seconds