Global ETD Search

61	Técnicas de mineração de dados para análise de imagens / Data mining techniques for image analysis Luís Augusto Consularo 26 September 2000 (has links) Imagens codificadas por matrizes de intensidade são tipicamente representadas por grande quantidade de dados. Embora existam inúmeras abordagens para análise de imagens, o conhecimento sobre problemas específicos é raramente considerado. Este trabalho trata sobre problemas de análises de imagens cujas soluções dependem do conhecimento sobre os dados envolvidos na aplicação específica. Para isso, utiliza técnicas de mineração de dados para modelar as respostas humanas obtidas de experimentos psicofísicos. Dois problemas de análise de imagens são apresentados: (1) a análise de formas e (2) a análise pictórica. No primeiro problema (1), formas de neurônios da retina (neurônios ganglionares de gato) são segmentadas e seus contornos submetidos a uma calibração dos parâmetros de curvatura considerando a segmentação manual de um especialista. Outros descritores, tais como esqueletos multi-escalas são explorados para eventual uso e avaliação da abordagem. No segundo problema (2), a análise pictórica de imagens de home-pages serve para avaliar critérios estéticos a partir de medidas de complexidade, contraste e textura. O sistema generaliza as respostas por um experimento psicofísico realizados com humanos. Os resultados objetivos com as duas abordagens revelaram-se promissores, surpreendentes e com ampla aplicabilidade. / Images coded by intensity matrices typically involve large amount of data. Although image analysis approaches are diverse, knowledge about specific problems is rarely considered. This work is about image analysis problems whose solutions depend on the knowledge about the involved data. In order to do so data mining techniques are applied to model human response to psychophysical experiments. Two image analysis problems are addressed: (1) shape analysis; and (2) pictorial analysis. In the former, neuronal images (ganglion retinal cells of cat) are segmented and curvature parameters are calibrated to identify extremities and branches on the shape considering human segmentation as a reference. Descriptors such as multiscale skeletons are also explored for potential application or evaluations. In the second problem, a pictorial analysis of home-pages images feed an artificial aesthetics criteria evaluator based on complexity, contrast and texture features. The system models and generalizes the obtained human responses to psychophysical experiment. The results for these two approaches are promising, surprising and widely applicable. Análise de formas Análise de imagens Descoberta de conhecimento em imagens Mineração de dados Visão computacional Computer vision Data mining Image analysis Image understanding Shape analysis
62	Uso de medidas de desempenho e de grau de interesse para análise de regras descobertas nos classificadores Rocha, Mauricio Rêgo Mota da 20 August 2008 (has links) Made available in DSpace on 2016-03-15T19:38:11Z (GMT). No. of bitstreams: 1 Mauricio Rego Mota da Rocha.pdf: 914988 bytes, checksum: d8751dcc6d37e161867d8941bc8f7d64 (MD5) Previous issue date: 2008-08-20 / Fundo Mackenzie de Pesquisa / The process of knowledge discovery in databases has become necessary because of the large amount of data currently stored in databases of companies. They operated properly can help the managers in decision-making in organizations. This process is composed of several steps, among them there is a data mining, stage where they are applied techniques for obtaining knowledge that can not be obtained through traditional methods of analysis. In addition to the technical, in step of data mining is also chosen the task of data mining that will be used. The data mining usually produces large amount of rules that often are not important, relevant or interesting to the end user. This makes it necessary to review the knowledge discovered in post-processing of data. In the stage of post-processing is used both measures of performance but also of degree of interest in order to sharpen the rules more interesting, useful and relevant. In this work, using a tool called WEKA (Waikato Environment for Knowledge Analysis), were applied techniques of mining, decision trees and rules of classification by the classification algorithms J48.J48 and J48.PART respectively. In the post-processing data was implemented a package with functions and procedures for calculation of both measures of performance but also of the degree of interest rules. At this stage consultations have also been developed (querys) to select the most important rules in accordance with measures of performance and degree of interest. / O processo de descoberta de conhecimento em banco de dados tem se tornado necessário devido à grande quantidade de dados atualmente armazenados nas bases de dados das empresas. Esses dados devidamente explorados podem auxiliar os gestores na tomada de decisões nas organizações. Este processo é composto de várias etapas, dentre elas destaca-se a mineração de dados, etapa onde são aplicadas técnicas para obtenção de conhecimento que não podem ser obtidas através de métodos tradicionais de análise. Além das técnicas, na etapa demineração de dados também é escolhida a tarefa de mineração que será utilizada. A mineração de dados geralmente produz grande quantidade de regras que muitas vezes não são importantes, relevantes ou interessantes para o usuário final. Isto torna necessária a análise do conhecimento descoberto no pós-processamento dos dados. Na etapa de pós-processamento são utilizadas medidas tanto de desempenho como também de grau de interesse com a finalidade de apontar as regras mais interessante, úteis e relevantes. Neste trabalho, utilizando-se de uma ferramenta chamada WEKA (Waikato Environment for Knowledge Analysis), foram aplicadas as técnicas de mineração de Árvore de Decisão e de Regras de Classificação através dos algoritmos de classificação J48.J48 e J48.PART respectivamente. No pós-processamento de dados foi implementado um pacote com funções e procedimentos para cálculo das medidas tanto de desempenho como também de grau de interesse de regras. Nesta etapa também foram desenvolvidas consultas (querys) para selecionar as regras mais importantes de acordo com as medidas de desempenho e de grau de interesse. mineração de dados pós-processamento classificação medidas de avaliação de regras knowledge discovery in databases data mining post-processing classification rule evaluation measures CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
63	"Visualizações temporais em uma plataforma de software extensível e adaptável" / "Temporal visualizations in an extensible and adaptable software platform" Milton Hirokazu Shimabukuro 05 July 2004 (has links) Repositórios com volumes de dados cada vez maiores foram viabilizados pelo desenvolvimento tecnológico, criando importantes fontes de informação em diversas áreas da atividade humana. Esses repositórios freqüentemente incluem informação sobre o comportamento temporal e o posicionamento espacial dos itens neles representados, os quais são extremamente relevantes para a análise dos dados. O processo de descoberta de conhecimento a partir de grandes volumes de dados tem sido objeto de estudo em diversas disciplinas, dentre elas a Visualização de Informação, cujas técnicas podem apoiar diversas etapas desse processo. Esta tese versa sobre o uso da Visualização Exploratória em conjuntos de dados com atributos temporais e espaciais, empregando a estratégia de múltiplas visualizações coordenadas para apoiar o tratamento de dados em estágios iniciais de processos de descoberta de conhecimento. São propostas duas novas representações visuais temporais denominadas Variação Temporal Uni-escala e Variação Temporal Multi-escala para apoiar a análise exploratória de dados temporais. Adicionalmente, é proposto um modelo de arquitetura de software AdaptaVis, que permite a integração dessas e outras representações visuais em uma plataforma de visualização de informação flexível, extensível e adaptável às necessidades de diferentes usuários, tarefas e domínios de aplicação a plataforma InfoVis. Sessões de uso realizadas com dados e usuários reais dos domínios de Climatologia e Negócios permitiram validar empiricamente as representações visuais e o modelo. O modelo AdaptaVis e a plataforma InfoVis estabelecem bases para a continuidade de diversas pesquisas em Visualização de Informação, particularmente o estudo de aspectos relacionados ao uso coordenado de múltiplas visualizações, à modelagem do processo de coordenação, e à integração entre múltiplas técnicas visuais e analíticas. / Data repositories with ever increasing volumes have been made possible by the evolution in data collection technologies, creating important sources of information in several fields of human activity. Such data repositories often include information about both the temporal behavior and the spatial positioning of data items that will be relevant in future data analysis tasks. The process of discovering knowledge embedded in great volumes of data is a topic of study in several disciplines, including Information Visualization, which offers a range of techniques to support different stages of a discovery process. This thesis addresses the application of Exploratory Visualization techniques on datasets with temporal and spatial attributes, using the strategy of coordinating multiple data views, to assist data treatment on early stages of knowledge discovery processes. Two temporal visual representations are proposed Uni-scale Temporal Behavior and Multi-scale Temporal Behavior that support the exploratory analysis of temporal data. Moreover, a software architecture model is introduced AdaptaVis, that allows the integration of these and other visualization techniques into a flexible, extensible and adaptable information visualization platform called InfoVis that may be tailored to meet the requirements of different users, tasks and application domains. Sessions conducted with real data and users from the Climatology and Business application domains allowed an empirical validation of both the visual representations and the model. The AdaptaVis model and the InfoVis platform establish the basis for further research on issues related to the coordinated use of multiple data views, the modeling of the coordination process and the integration amongst multiple visual and analytical techniques. dados temporais e espaciais descoberta de conhecimento mineração de dados visual visualização de informação visualização exploratória exploratory visualization information visualization knowledge discovery temporal and spatial data visual data mining
64	[en] INTELLIGENT ASSISTANCE FOR KDD-PROCESS ORIENTATION / [pt] ASSISTÊNCIA INTELIGENTE À ORIENTAÇÃO DO PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS RONALDO RIBEIRO GOLDSCHMIDT 15 December 2003 (has links) [pt] A notória complexidade inerente ao processo de KDD - Descoberta de Conhecimento em Bases de Dados - decorre essencialmente de aspectos relacionados ao controle e à condução deste processo (Fayyad et al., 1996b; Hellerstein et al., 1999). De uma maneira geral, estes aspectos envolvem dificuldades em perceber inúmeros fatos cuja origem e os níveis de detalhe são os mais diversos e difusos, em interpretar adequadamente estes fatos, em conjugar dinamicamente tais interpretações e em decidir que ações devem ser realizadas de forma a procurar obter bons resultados. Como identificar precisamente os objetivos do processo, como escolher dentre os inúmeros algoritmos de mineração e de pré-processamento de dados existentes e, sobretudo, como utilizar adequadamente os algoritmos escolhidos em cada situação são alguns exemplos das complexas e recorrentes questões na condução de processos de KDD. Cabe ao analista humano a árdua tarefa de orientar a execução de processos de KDD. Para tanto, diante de cada cenário, o homem utiliza sua experiência anterior, seus conhecimentos e sua intuição para interpretar e combinar os fatos de forma a decidir qual a estratégia a ser adotada (Fayyad et al., 1996a, b; Wirth et al., 1998). Embora reconhecidamente úteis e desejáveis, são poucas as alternativas computacionais existentes voltadas a auxiliar o homem na condução do processo de KDD (Engels, 1996; Amant e Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). Aliado ao exposto acima, a demanda por aplicações de KDD em diversas áreas vem crescendo de forma muito acentuada nos últimos anos (Buchanan, 2000). É muito comum não existirem profissionais com experiência em KDD disponíveis para atender a esta crescente demanda (Piatetsky-Shapiro, 1999). Neste contexto, a criação de ferramentas inteligentes que auxiliem o homem no controle do processo de KDD se mostra ainda mais oportuna (Brachman e Anand, 1996; Mitchell, 1997). Assim sendo, esta tese teve como objetivos pesquisar, propor, desenvolver e avaliar uma Máquina de Assistência Inteligente à Orientação do Processo de KDD que possa ser utilizada, fundamentalmente, como instrumento didático voltado à formação de profissionais especializados na área da Descoberta de Conhecimento em Bases de Dados. A máquina proposta foi formalizada com base na Teoria do Planejamento para Resolução de Problemas (Russell e Norvig, 1995) da Inteligência Artificial e implementada a partir da integração de funções de assistência utilizadas em diferentes níveis de controle do processo de KDD: Definição de Objetivos, Planejamento de Ações de KDD, Execução dos Planos de Ações de KDD e Aquisição e Formalização do Conhecimento. A Assistência à Definição de Objetivos tem como meta auxiliar o homem na identificação de tarefas de KDD cuja execução seja potencialmente viável em aplicações de KDD. Esta assistência foi inspirada na percepção de um certo tipo de semelhança no nível intensional apresentado entre determinados bancos de dados. Tal percepção auxilia na prospecção do tipo de conhecimento a ser procurado, uma vez que conjuntos de dados com estruturas similares tendem a despertar interesses similares mesmo em aplicações de KDD distintas. Conceitos da Teoria da Equivalência entre Atributos de Bancos de Dados (Larson et al., 1989) viabilizam a utilização de uma estrutura comum na qual qualquer base de dados pode ser representada. Desta forma, bases de dados, ao serem representadas na nova estrutura, podem ser mapeadas em tarefas de KDD, compatíveis com tal estrutura. Conceitos de Espaços Topológicos (Lipschutz, 1979) e recursos de Redes Neurais Artificiais (Haykin, 1999) são utilizados para viabilizar os mapeamentos entre padrões heterogêneos. Uma vez definidos os objetivos em uma aplicação de KDD, decisões sobre como tais objetivos podem ser alcançados se tornam necessárias. O primeiro passo envolve a escolha de qual algoritmo de mineração de dados é o mais apropriado para o problema em questão. A Assistência ao Planejamento de Ações de KDD auxilia o homem nesta escolha. Utiliza, para tanto, uma metodologia de ordenação dos algoritmos de mineração baseada no desempenho prévio destes algoritmos em problemas similares (Soares et al., 2001; Brazdil et al., 2003). Critérios de ordenação de algoritmos baseados em similaridade entre bases de dados nos níveis intensional e extensional foram propostos, descritos e avaliados. A partir da escolha de um ou mais algoritmos de mineração de dados, o passo seguinte requer a escolha de como deverá ser realizado o pré-processamento dos dados. Devido à diversidade de algoritmos de pré-processamento, são muitas as alternativas de combinação entre eles (Bernstein et al., 2002). A Assistência ao Planejamento de Ações de KDD também auxilia o homem na formulação e na escolha do plano ou dos planos de ações de KDD a serem adotados. Utiliza, para tanto, conceitos da Teoria do Planejamento para Resolução de Problemas. Uma vez escolhido um plano de ações de KDD, surge a necessidade de executá-lo. A execução de um plano de ações de KDD compreende a execução, de forma ordenada, dos algoritmos de KDD previstos no plano. A execução de um algoritmo de KDD requer conhecimento sobre ele. A Assistência à Execução dos Planos de Ações de KDD provê orientações específicas sobre algoritmos de KDD. Adicionalmente, esta assistência dispõe de mecanismos que auxiliam, de forma especializada, no processo de execução de algoritmos de KDD e na análise dos resultados obtidos. Alguns destes mecanismos foram descritos e avaliados. A execução da Assistência à Aquisição e Formalização do Conhecimento constitui-se em um requisito operacional ao funcionamento da máquina proposta. Tal assistência tem por objetivo adquirir e disponibilizar os conhecimentos sobre KDD em uma representação e uma organização que viabilizem o processamento das funções de assistência mencionadas anteriormente. Diversos recursos e técnicas de aquisição de conhecimento foram utilizados na concepção desta assistência. / [en] Generally speaking, such aspects involve difficulties in perceiving innumerable facts whose origin and levels of detail are highly diverse and diffused, in adequately interpreting these facts, in dynamically conjugating such interpretations, and in deciding which actions must be performed in order to obtain good results. How are the objectives of the process to be identified in a precise manner? How is one among the countless existing data mining and preprocessing algorithms to be selected? And most importantly, how can the selected algorithms be put to suitable use in each different situation? These are but a few examples of the complex and recurrent questions that are posed when KDD processes are performed. Human analysts must cope with the arduous task of orienting the execution of KDD processes. To this end, in face of each different scenario, humans resort to their previous experiences, their knowledge, and their intuition in order to interpret and combine the facts and therefore be able to decide on the strategy to be adopted (Fayyad et al., 1996a, b; Wirth et al., 1998). Although the existing computational alternatives have proved to be useful and desirable, few of them are designed to help humans to perform KDD processes (Engels, 1996; Amant and Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). In association with the above-mentioned fact, the demand for KDD applications in several different areas has increased dramatically in the past few years (Buchanan, 2000). Quite commonly, the number of available practitioners with experience in KDD is not sufficient to satisfy this growing demand (Piatetsky-Shapiro, 1999). Within such a context, the creation of intelligent tools that aim to assist humans in controlling KDD processes proves to be even more opportune (Brachman and Anand, 1996; Mitchell, 1997). Such being the case, the objectives of this thesis were to investigate, propose, develop, and evaluate an Intelligent Machine for KDD-Process Orientation that is basically intended to serve as a teaching tool to be used in professional specialization courses in the area of Knowledge Discovery in Databases. The basis for formalization of the proposed machine was the Planning Theory for Problem-Solving (Russell and Norvig, 1995) in Artificial Intelligence. Its implementation was based on the integration of assistance functions that are used at different KDD process control levels: Goal Definition, KDD Action-Planning, KDD Action Plan Execution, and Knowledge Acquisition and Formalization. The Goal Definition Assistant aims to assist humans in identifying KDD tasks that are potentially executable in KDD applications. This assistant was inspired by the detection of a certain type of similarity between the intensional levels presented by certain databases. The observation of this fact helps humans to mine the type of knowledge that must be discovered since data sets with similar structures tend to arouse similar interests even in distinct KDD applications. Concepts from the Theory of Attribute Equivalence in Databases (Larson et al., 1989) make it possible to use a common structure in which any database may be represented. In this manner, when databases are represented in the new structure, it is possible to map them into KDD tasks that are compatible with such a structure. Topological space concepts and ANN resources as described in Topological Spaces (Lipschutz, 1979) and Artificial Neural Nets (Haykin, 1999) have been employed so as to allow mapping between heterogeneous patterns. After the goals have been defined in a KDD application, it is necessary to decide how such goals are to be achieved. The first step involves selecting the most appropriate data mining algorithm for the problem at hand. The KDD Action-Planning Assistant helps humans to make this choice. To this end, it makes use of a methodology for ordering the mining algorithms that is based on the previous experiences, their knowledge, and their intuition in order to interpret and combine the facts and therefore be able to decide on the strategy to be adopted (Fayyad et al., 1996a, b; Wirth et al., 1998). Although the existing computational alternatives have proved to be useful and desirable, few of them are designed to help humans to perform KDD processes (Engels, 1996; Amant & Cohen, 1997; Livingston, 2001; Bernstein et al., 2002; Brazdil et al., 2003). In association with the above-mentioned fact, the demand for KDD applications in several different areas has increased dramatically in the past few years (Buchanan, 2000). Quite commonly, the number of available practitioners with experience in KDD is not sufficient to satisfy this growing demand (Piatetsky-Shapiro, 1999). Within such a context, the creation of intelligent tools that aim to assist humans in controlling KDD processes proves to be even more opportune (Brachman & Anand, 1996; Mitchell, 1997). Such being the case, the objectives of this thesis were to investigate, propose, develop, and evaluate an Intelligent Machine for KDD-Process Orientation that is basically intended to serve as a teaching tool to be used in professional specialization courses in the area of Knowledge Discovery in Databases. The basis for formalization of the proposed machine was the Planning Theory for Problem-Solving (Russell and Norvig, 1995) in Artificial Intelligence. Its implementation was based on the integration of assistance functions that are used at different KDD process control levels: Goal Definition, KDD Action- Planning, KDD Action Plan Execution, and Knowledge Acquisition and Formalization. The Goal Definition Assistant aims to assist humans in identifying KDD tasks that are potentially executable in KDD applications. This assistant was inspired by the detection of a certain type of similarity between the intensional levels presented by certain databases. The observation of this fact helps humans to mine the type of knowledge that must be discovered since data sets with similar structures tend to arouse similar interests even in distinct KDD applications. Concepts from the Theory of Attribute Equivalence in Databases (Larson et al., 1989) make it possible to use a common structure in which any database may be represented. In this manner, when databases are represented in the new structure, it is possible to map them into KDD tasks that are compatible with such a structure. Topological space concepts and ANN resources as described in Topological Spaces (Lipschutz, 1979) and Artificial Neural Nets (Haykin, 1999) have been employed so as to allow mapping between heterogeneous patterns. After the goals have been defined in a KDD application, it is necessary to decide how such goals are to be achieved. The first step involves selecting the most appropriate data mining algorithm for the problem at hand. The KDD Action-Planning Assistant helps humans to make this choice. To this end, it makes use of a methodology for ordering the mining algorithms that is based on the previous performance of these algorithms in similar problems (Soares et al., 2001; Brazdil et al., 2003). Algorithm ordering criteria based on database similarity at the intensional and extensional levels were proposed, described and evaluated. The data mining algorithm or algorithms having been selected, the next step involves selecting the way in which data preprocessing is to be performed. Since there is a large variety of preprocessing algorithms, many are the alternatives for combining them (Bernstein et al., 2002). The KDD Action-Planning Assistant also helps humans to formulate and to select the KDD action plan or plans to be adopted. To this end, it makes use of concepts contained in the Planning Theory for Problem-Solving. Once a KDD action plan has been chosen, it is necessary to execute it. Executing a KDD action plan involves the ordered execution of the KDD algorithms that have been anticipated in the plan. Executing a KDD algorithm requires knowledge about it. The KDD Action Plan Execution Assistant provides specific guidance on KDD algorithms. In addition, this assistant is equipped with mechanisms that provide specialized assistance for performing the KDD algorithm execution process and for analyzing the results obtained. Some of these mechanisms have been described and evaluated. The execution of the Knowledge Acquisition and Formalization Assistant is an operational requirement for running the proposed machine. The objective of this assistant is to acquire knowledge about KDD and to make such knowledge available by representing and organizing it a way that makes it possible to process the above-mentioned assistance functions. A variety of knowledge acquisition resources and techniques were employed in the conception of this assistant. [pt] MINERACAO DE DADOS [en] DATA MINING [en] KNOWLEDGE DISCOVERY IN DATABASES [en] KDD TASK DEFINITION ASSISTANCE [pt] PLANEJAMENTO EM KDD [en] PLANNING IN KDD
65	Uso de redes neurais artificiais para descoberta de conhecimento sobre a escolha do modo de viagem / Using artificial neural network for the discovery of mode travel choice knowledge Wermersch, Fábio Glauco 09 May 2002 (has links) Esta pesquisa objetivou uma melhor compreensão do processo de escolha do modo de viagem. Empregou-se a abordagem indutiva dirigida a dados livre de suposições a priori da mineração em banco de dados (Data Mining), utilizando redes neurais artificiais (RNA) como ferramenta mineradora, à procura de conhecimento, ou informação útil, a respeito de escolha e capaz de indicar qual das estruturas de decisão subjacentes aos modelos de escolha modal considerados mais se aproximaria ao do observado. Partindo-se da ideia de que nesse processo exista um padrão o qual pode ser captado por uma RNA, ajustou-se um modelo de RNA aos dados e extraiu-se então o conhecimento contido no modelo de RNA ajustado através de um algoritmo de extração de árvore de decisão de RNA chamado Trepan (Trees parroting network), que foi analisado e interpretado à luz dos objetivos desta pesquisa. Os dados que foram utilizados nesse processo de descoberta de conhecimento são provenientes de uma pesquisa de entrevista domiciliar realizada na cidade de Bauru - SP, para fins de estimativa da matriz de deslocamentos origem-destino dessa cidade. Obteve-se quatro árvores de decisão com estruturas simples e com a araucária preditiva de 75% aproximadamente para os três modos de viagem estudados. Embora o conhecimento extraído dos modelos neurais ajustados não tenham proporcionado a indicação de qual das estruturas de decisão subjacentes aos modelos de escolha modal mais se aproxima da obtida com o modelo neural, foi constatada nas árvores resultantes do processo de descoberta do conhecimento uma relação de compensação entre o atributo sexo e os atributos relacionados à capacidade econômica do domicílio na decisão de escolha do modo carro para a realização de uma viagem. Os resultados também sugerem a não necessidade de mais um atributo de entrada referente ao deslocamento realizado em uma viagem para modelagem por RNA do processo de escolha do modo de viagem no contexto estudado. / This research aimed at a better understanding of the mode travel choice process. The inductive data driven free from a priori assumptions of the data mining approach was employed, using artificial neural networks (ANN) as a mining tool, looking for knowledge or useful information, concerning the choice process and capable of indicating which of the underlying decision structures to the considered modal choice models would come closer to the observed one. Taking into consideration that there is a pattern in this process that can be captured by ANN, an ANN model was fitted (trained) to the data, and the knowledge contained in the trained ANN model was extracted by employing an ANN decision tree extraction algorithm called Trepan (Trees parroting network), which was analysed and interpreted in the light of the object of this research. The data which was employed in this knowledge discovery process come from a household survey carried out in Bauru - SP in order to estimate the O-D matrix in this city. Four decision trees with simple structures and predicting accuracy of approximately 75% for the three travel modes studied were obtained. Even though the knowledge extracted from the trained ANN model has not yielded the indication of which of the underlying decision structures to the modal choice models was closer to the neural model, a compensating relation between the sex attribute and the household economic-related attribute in the decision of choosing the car mode in order to travel was evidenced in the trees resulting from the process of knowledge discovery. The results also suggest the lack of necessity of more than one input travel attribute concerning the displacement performed in a trip for the ANN modelling of the mode travel choice process in the studied context. Análise de demanda por transporte Artificial intelligence Artificial neural network Árvores de decisão Choice models Data mining Decision trees Inteligência artificial Knowledge discovery in database Mineração de dados Modelos de escolha Redes neurais artificiais Transport demand analysis
66	Identificação e estimação de ruído em redes DSL: uma abordagem baseada em inteligência computacional FARIAS, Fabrício de Souza 25 January 2012 (has links) Submitted by Irvana Coutinho (irvana@ufpa.br) on 2013-01-24T12:14:20Z No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_IdentificacaoEstimulacaoRuido.pdf: 1534456 bytes, checksum: 376786e221762a1b34af76521652d2bb (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-01-25T12:21:25Z (GMT) No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_IdentificacaoEstimulacaoRuido.pdf: 1534456 bytes, checksum: 376786e221762a1b34af76521652d2bb (MD5) / Made available in DSpace on 2013-01-25T12:21:25Z (GMT). No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_IdentificacaoEstimulacaoRuido.pdf: 1534456 bytes, checksum: 376786e221762a1b34af76521652d2bb (MD5) Previous issue date: 2012 / CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico / Este trabalho propõe a utilização de técnicas de inteligência computacional objetivando identificar e estimar a potencia de ruídos em redes Digital Subscriber Line ou Linhas do Assinante Digital (DSL) em tempo real. Uma metodologia baseada no Knowledge Discovery in Databases ou Descobrimento de Conhecimento em Bases de Dados (KDD) para detecção e estimação de ruídos em tempo real, foi utilizada. KDD é aplicado para selecionar, pré-processar e transformar os dados antes da etapa de aplicação dos algoritmos na etapa de mineração de dados. Para identificação dos ruídos o algoritmo tradicional backpropagation baseado em Redes Neurais Artificiais (RNA) é aplicado objetivando identificar o tipo de ruído em predominância durante a coleta das informações do modem do usuário e da central. Enquanto, para estimação o algoritmo de regressão linear e o algoritmo híbrido composto por Fuzzy e regressão linear foram aplicados para estimar a potência em Watts de ruído crosstalk ou diafonia na rede. Os resultados alcançados demonstram que a utilização de algoritmos de inteligência computacional como a RNA são promissores para identificação de ruídos em redes DSL, e que algoritmos como de regressão linear e Fuzzy com regressão linear (FRL) são promissores para a estimação de ruídos em redes DSL. / This paper proposes the use of computational intelligence techniques aiming to identify and estimate the noise power in Digital Subscriber Line (DSL) networks on real time. A methodology based on Knowledge Discovery in Databases (KDD) for detect and estimate noise in real time, was used. KDD is applied to select, pre-process and transform data before data mining step. For noise identification the traditional backpropagation algorithm based on Artificial Neural Networks (ANN) is applied aiming to identify the predominant noise during the collection of information from the user's modem and the DSL Access Multiplexer (DSLAM). While the algorithm for noise estimation, linear regression and a hybrid algorithm consisting of Fuzzy with linear regression are applied to estimate the noise power in Watts. Results show that the use of computational intelligence algorithms such as RNA are promising for noise identification in DSL networks, and algorithms such as linear regression and fuzzy with linear regression (FRL) are promising for noise estimation in DSL networks. Rede DSL Redes neurais (Computação) Processo KDD Inteligência computacional
67	Uso de redes neurais artificiais para descoberta de conhecimento sobre a escolha do modo de viagem / Using artificial neural network for the discovery of mode travel choice knowledge Fábio Glauco Wermersch 09 May 2002 (has links) Esta pesquisa objetivou uma melhor compreensão do processo de escolha do modo de viagem. Empregou-se a abordagem indutiva dirigida a dados livre de suposições a priori da mineração em banco de dados (Data Mining), utilizando redes neurais artificiais (RNA) como ferramenta mineradora, à procura de conhecimento, ou informação útil, a respeito de escolha e capaz de indicar qual das estruturas de decisão subjacentes aos modelos de escolha modal considerados mais se aproximaria ao do observado. Partindo-se da ideia de que nesse processo exista um padrão o qual pode ser captado por uma RNA, ajustou-se um modelo de RNA aos dados e extraiu-se então o conhecimento contido no modelo de RNA ajustado através de um algoritmo de extração de árvore de decisão de RNA chamado Trepan (Trees parroting network), que foi analisado e interpretado à luz dos objetivos desta pesquisa. Os dados que foram utilizados nesse processo de descoberta de conhecimento são provenientes de uma pesquisa de entrevista domiciliar realizada na cidade de Bauru - SP, para fins de estimativa da matriz de deslocamentos origem-destino dessa cidade. Obteve-se quatro árvores de decisão com estruturas simples e com a araucária preditiva de 75% aproximadamente para os três modos de viagem estudados. Embora o conhecimento extraído dos modelos neurais ajustados não tenham proporcionado a indicação de qual das estruturas de decisão subjacentes aos modelos de escolha modal mais se aproxima da obtida com o modelo neural, foi constatada nas árvores resultantes do processo de descoberta do conhecimento uma relação de compensação entre o atributo sexo e os atributos relacionados à capacidade econômica do domicílio na decisão de escolha do modo carro para a realização de uma viagem. Os resultados também sugerem a não necessidade de mais um atributo de entrada referente ao deslocamento realizado em uma viagem para modelagem por RNA do processo de escolha do modo de viagem no contexto estudado. / This research aimed at a better understanding of the mode travel choice process. The inductive data driven free from a priori assumptions of the data mining approach was employed, using artificial neural networks (ANN) as a mining tool, looking for knowledge or useful information, concerning the choice process and capable of indicating which of the underlying decision structures to the considered modal choice models would come closer to the observed one. Taking into consideration that there is a pattern in this process that can be captured by ANN, an ANN model was fitted (trained) to the data, and the knowledge contained in the trained ANN model was extracted by employing an ANN decision tree extraction algorithm called Trepan (Trees parroting network), which was analysed and interpreted in the light of the object of this research. The data which was employed in this knowledge discovery process come from a household survey carried out in Bauru - SP in order to estimate the O-D matrix in this city. Four decision trees with simple structures and predicting accuracy of approximately 75% for the three travel modes studied were obtained. Even though the knowledge extracted from the trained ANN model has not yielded the indication of which of the underlying decision structures to the modal choice models was closer to the neural model, a compensating relation between the sex attribute and the household economic-related attribute in the decision of choosing the car mode in order to travel was evidenced in the trees resulting from the process of knowledge discovery. The results also suggest the lack of necessity of more than one input travel attribute concerning the displacement performed in a trip for the ANN modelling of the mode travel choice process in the studied context. Análise de demanda por transporte Árvores de decisão Inteligência artificial Mineração de dados Modelos de escolha Redes neurais artificiais Artificial intelligence Artificial neural network Choice models Data mining Decision trees Knowledge discovery in database Transport demand analysis
68	An?lise de desempenho de vendas em telecomunica??es utilizando t?cnicas de minera??o de dados / Analysis of business development in telecommunication using data minig techniques Mattozo, Te?filo Camara 22 November 2007 (has links) Made available in DSpace on 2014-12-17T14:52:36Z (GMT). No. of bitstreams: 1 TeofiloCM.pdf: 1145688 bytes, checksum: d9ef0be6d9fb3c2958916ee42bdb507a (MD5) Previous issue date: 2007-11-22 / Nowadays, telecommunications is one of the most dynamic and strategic areas in the world. Organizations are always seeking to find new management practices within an ever increasing competitive environment where resources are getting scarce. In this scenario, data obtained from business and corporate processes have even greater importance, although this data is not yet adequately explored. Knowledge Discovery in Databases (KDD) appears then, as an option to allow the study of complex problems in different areas of management. This work proposes both a systematization of KDD activities using concepts from different methodologies, such as CRISP-DM, SEMMA and FAYYAD approaches and a study concerning the viability of multivariate regression analysis models to explain corporative telecommunications sales using performance indicators. Thus, statistical methods were outlined to analyze the effects of such indicators on the behavior of business productivity. According to business and standard statistical analysis, equations were defined and fit to their respective determination coefficients. Tests of hypotheses were also conducted on parameters with the purpose of validating the regression models. The results show that there is a relationship between these development indicators and the amount of sales / Telecomunica??es ? uma das mais din?micas e estrat?gicas ?reas no mundo atual. H? constante necessidade das organiza??es buscarem novas formas de gerenciamento, em um ambiente cada vez mais competitivo e com recursos cada vez menores. A exist?ncia de bases de dados nas empresas passou a ter maior import?ncia. Na grande maioria dos casos, dados n?o s?o ainda explorados adequadamente. T?cnicas de Descoberta de Conhecimento em Bases de Dados (DCBD) surgem como alternativas, permitindo o estudo de problemas complexos, sendo cada vez mais utilizadas nas diferentes ?reas de gest?o. O presente trabalho apresenta uma proposta para a sistematiza??o das atividades de DCBD a qual integra as metodologias CRISP-DM, SEMMA, FAYYAD, em um ambiente interativo, bem como um estudo de viabilidade do uso de an?lise de regress?o linear m?ltipla para explica??o de vendas, no setor corporativo de telecomunica??es, utilizando indicadores de desempenho. Foi delineado um m?todo estat?stico para analisar o efeito que os indicadores de desempenho t?m sobre o comportamento da produtividade de venda. Mediante an?lises estat?sticas e comerciais criteriosas, as equa??es foram definidas, sendo ajustados os seus respectivos coeficientes de determina??o. Foram tamb?m realizados testes de hip?teses de seus par?metros, visando ? valida??o ou n?o dos modelos de regress?o e an?lise da qualidade de seus ajustamentos. Ficou evidenciada a exist?ncia de relacionamento entre as caracter?sticas desses indicadores de desempenho com o volume de vendas realizado Indicadores de Desempenho Gest?o de Neg?cios em Telecomunica??es Sistema de Apoio ? Decis?o Performance Indicators Knowledge Discovery in Database Business Management in Telecommunication Decision Support Systems
69	Explorando a localização e orientação de fotograﬁas pessoais para descoberta de pontos de interesse baseada em agrupamento. LACERDA, Yuri Almeida. 16 May 2018 (has links) Submitted by Kilvya Braga (kilvyabraga@hotmail.com) on 2018-05-16T14:43:46Z No. of bitstreams: 1 YURI ALMEIDA LACERDA - TESE (PPGCC) 2017.pdf: 28353805 bytes, checksum: 0d8453f39b64823b7308c81cc7731524 (MD5) / Made available in DSpace on 2018-05-16T14:43:46Z (GMT). No. of bitstreams: 1 YURI ALMEIDA LACERDA - TESE (PPGCC) 2017.pdf: 28353805 bytes, checksum: 0d8453f39b64823b7308c81cc7731524 (MD5) Previous issue date: 2017 / Capes / A descoberta de conhecimento a partir de grandes repositórios online de fotograﬁas tem sido uma área de pesquisa bastante ativa nos últimos anos. Isso se deve principalmente a três fatores: incorporação de câmeras digitais e sensores de geolocalização aos dispositivos móveis; avanços na conectividade com a Internet; e evolução das redes sociais. As fotograﬁas armazenadas nesses repositórios possuem metadados contextuais que podem ser utilizados em aplicações de descoberta de conhecimento, tais como: detecção de pontos de interesse (POIs); geração de roteiros de viagens; e organização automática de fotograﬁas. A maioria das abordagens para detecção de POIs parte do princípio que as áreas geográﬁcas onde uma grande quantidade de pessoas capturou fotograﬁas indica a existência de um ponto de interesse. Porém, em muitos casos, os POIs estão localizados a uma certa distância desse local na orientação em que a câmera estava direcionada, e não no ponto exato da captura da fotograﬁa. A maioria das técnicas propostas na literatura não consideram o uso da orientação no processo de detecção de pontos de interesses. Dessa forma, este trabalho propõe novos algoritmos e técnicas para detecção de pontos de interesse em cidades turísticas a partir de coleções de fotograﬁas orientadas e georreferenciadas explorando de diversas formas a orientação geográﬁca. Esta pesquisa comprovou a importância do uso da orientação nos novos algoritmos voltados para detecção de pontos de interesses. Os experimentos, utilizando uma base de dados real de grandes cidades, demonstraram que os algoritmos considerando a orientação conseguem, em alguns cenários, superar os que não a consideram. Também foram propostas novas métricas de avaliação e uma ferramenta para auxiliar as atividades de descoberta de conhecimento baseada em grandes massas de fotograﬁas. / The knowledge discovery from huge photo repositories has been a very active area of research in the last years. This is due to three facts: the incorporation of digital cameras and geolocation sensors in mobile devices; the advances in Internet connectivity; and the evolution of social networks. The photos stored on those repositories have contextual metadata. Those metadata could be used for many applications of knowledge discovering, such as: Point of Interest (POI) detection; generating of tourist guides; and automatic photo organization. Most approaches for POI detection assume that geographic areas with high density of photos indicate the existence of a point of interest in that area. However, in many cases, the POIs are located in a certain distance of that position in direction where camera was aiming, and not in the exact point of photo shooting. Most of related work do not consider the use of orientation in the process of POI detection. In this way, we propose a set of algorithms and techniques for POI discovery in touristic cities using geotagged and oriented photos collection exploring the geographic orientation in different ways. This research has proven the importance of the usage of orientation in the new algorithms for POI detection. In the experiments with collections related to big cities, the algorithms considering orientation, in several scenarios, have beaten those that do not consider. Also, new metrics of evaluation have been proposed and a new framework to assist all the tasks for knowledge discovery based on huge photo collections. Ciências Ciência da Computação Descoberta de Conhecimento Detecção de Pontos de Interesse Fotos Orientadas Metadados Ponto de Interesse Agrupamento Multimídia Agrupamento de Fotos Knowledge Discovery Point-of-Interest Detection Oriented Photos Point-of-Interest Metadata Multimedia Clustering Photo Clustering
70	Programação Genética Aplicada no Processo de Descoberta de Conhecimento em Bases de Dados de Redes de Pesquisa. / Genetic Programming Apllied in the Process of Knowledge Discovery in Databases for Research Networks. DUARTE, Kedma Batista 20 December 2010 (has links) Made available in DSpace on 2014-07-29T15:08:16Z (GMT). No. of bitstreams: 1 Tese de Kedma Batista Duarte.pdf: 2986348 bytes, checksum: b08f936c5937365d2b7493f4db0f0b88 (MD5) Previous issue date: 2010-12-20 / The Genetic Programming (GP) is a heuristic algorithm for Data Mining (DM), which can be applied to the classification task. This is a method of evolutionary computing inspired in the mechanisms of natural selection theory of Charles Darwin, declared in 1859 in his book "The Origin of Species." From an initial population, the method search over a number of generations to find solutions adapted to the environment of problem. The PG method was proposed in 1990 by John Koza, who demonstrated in one of its applications, the induction in formation of decision trees in the process of data classification. Within this context, the study developed in this work has as main objective the investigation of the concepts of PG and its application on a database of scientific collaboration networks, helping as a management tool in prospective studies of trends for the establishment of common axes in public policy of Science, Technology and Innovation (STI), focusing on regional development. The method is applied on a set of attributes, sorting them in order to identify similarity relationships between groups of researchers that comprise the network. The study involves the concepts of Knowledge Discovery in Databases (KDD) and Data Mining (DM). Networks of Scientific Collaboration, or Networks Research, are inserted in the context of small groups of social networks, the environment is dynamic due to the easy of information exchange and links between individuals, favoring the formation of new groups, which makes the growth of the network unlimited. "The combination of these groups, generated by the relationships between them, appears as a case of multi-criteria decision, granting the application of some complexity. In this sense, it is intended to apply the method of PG for generation of classification rules that lead to the discovery of groups of researchers with similar traits, which in a planned process could be induced to form groups strengthened and consolidated. The study helps to exploit the potential of genetic programming as a classifier algorithm, as well as use it as a method to build tools to support planning and decision making in STI. / A Programação Genética (PG) é um algoritmo heurístico de Mineração de Dados (MD), quepode ser aplicado na tarefa de classificação. Trata-se de um método da Computação Evolutiva inspirado nos mecanismos de seleção natural, da teoria de Charles Darwin, declarada em 1859 em seu livro A Origem das Espécies . A partir de uma população inicial, o método busca ao longo de um conjunto de gerações a descoberta de soluções bem adaptadas ao ambiente do problema. O método de PG foi proposto por John Koza em 1990, que demonstrou em uma de suas aplicações, a indução na formação de árvores de decisão em processos de classificação de dados. Dentro deste contexto, o estudo desenvolvido neste trabalho tem como objetivo principal a investigação dos conceitos de PG e sua aplicação sobre uma base de dados de Redes de Colaboração Científica, auxiliando como ferramenta de gestão em estudos prospectivos de tendências para o estabelecimento de eixos comuns em políticas públicas de Ciência, Tecnologia e Inovação (CT&I), com foco em desenvolvimento regional. O método é aplicado sobre um conjunto de atributos, classificando-os de forma a identificar relações de similaridade entre os grupos de pesquisadores que compõem a rede. O estudo envolve conceitos de Descoberta do Conhecimento em Bases de Dados (DCBD) e Mineração de Dados (MD). As Redes de Colaboração Científica, ou Redes de Pesquisa, estão inseridas no contexto dos pequenos grupos das Redes Sociais, o ambiente é dinâmico devido à facilidade para troca de informações e articulação entre os indivíduos, favorecendo a formação de novos grupos, fato que torna ilimitado o crescimento da Rede. A combinação das características desses grupos, gerada pelos relacionamentos entre eles, configura-se como um caso de decisão multi-critério, dotando a aplicação de certa complexidade. Neste sentido, pretende-se com a aplicação do método da PG a geração de regras de classificação que levem à descoberta de grupos de pesquisadores com características similares, que em um processo planejado poderiam ser induzidos à formação de grupos fortalecidos e consolidados. O estudo contribui no sentido de explorar o potencial da Programação Genética como um algoritmo classificador, bem como, usá-lo como método na construção de ferramentas de apoio ao planejamento e tomada de decisão em CT&I. Computação Evolutiva Descoberta do Conhecimento Mineração de Dados Programação Genética Redes de Pesquisa. Evolutionary Computation Discovery of Knowledge Data Mining Genetic Programming Networks Research. CNPQ::ENGENHARIAS

Search results