Global ETD Search

211	Técnicas de aprendizado de máquina aplicadas à classificação de estudantes a partir de estilos de aprendizagem / Machine Learning techniques applied to automatic detection of Learning Styles in educational systems Ferreira, Lucas Daniel 25 April 2018 (has links) Com efeito, diversos estudos nas áreas de psicologia cognitiva e pedagogia apontam que cada indivíduo possui diferentes maneiras de captar, processar, analisar e organizar informações durante o processo de aprendizado, o que fundamenta o conceito de Estilos de Aprendizagem (EA). Em vista disso, diversos sistemas educacionais adaptativos foram propostos com o intuito de proporcionar conteúdo personalizado em seus cursos. Porém, em boa parte dos casos, estes sistemas fazem uso de questionários para identificar os estilos de aprendizagem, e este método pode mostrar-se inviável em algumas situações. Isso ocorre pois o preenchimento dos questionários demanda um esforço adicional por parte do aluno, além fazer uma avaliação estática dos EA, desconsiderando possíveis variações em suas preferências ao longo do tempo. Supõe-se que uma estratégia de detecção automática e dinâmica dos EA baseada no comportamento dos estudantes pode ser mais proveitosa neste sentido, pois é isenta destas limitações. Deste modo, a proposta neste trabalho é investigar diferentes técnicas relacionadas ao aprendizado de máquina (especialmente algoritmos de classificação) aplicadas à predição automática dos estilos de aprendizagem de estudantes, a partir de suas interações em um ambiente virtual de ensino. Dentre os inúmeros modelos de EA propostos na literatura, optou-se por usar o modelo de Felder-Silverman como base para os experimentos. Como estudo de caso, foram rastreadas as interações de 105 estudantes de um curso de pós-graduação em fonoaudiologia ministrado integralmente pelo sistema Moodle. Além disso, estes alunos foram solicitados a responder ao questionário ILS, o qual indica a preferência de cada indivíduo de acordo com o modelo de Felder-Silverman. Para a construção dos conjuntos de dados, foram coletadas informações como a quantidade de visitas, tempo gasto e interação dos usuários em cada tipo de recurso (recursos de vídeo, formulários de avaliação, fórum, etc.). Estes conjuntos de dados no formato atributo-valor serviram de entrada para quatro algoritmos de classificação: Naïve Bayes, aprendizado baseado em instâncias (kNN), Redes Neurais Artificiais (MultiLayer Perceptron) e Árvores de Decisão (J48), combinados com métodos de seleção de atributos e executados em validação cruzada. Para fins de experimentação, foram avaliadas as taxas de acertos e erros dos algoritmos em relação aos resultados apontados pelo questionário ILS, em cada umas das dimensões do modelo de Felder-Silverman. Os resultados apontaram para o uso de mais de um classificador - Naïve Bayes e aprendizagem baseada em instância - dependendo da dimensão do estilo de aprendizagem. A metodologia aplicada foi comparada com sete trabalhos correlatos da literatura; Os resultados demonstraram uma performance superior aos trabalhos anteriores em quase todas as dimensões. Portanto, o presente trabalho contribui para o contexto da informática aplicada à educação, especificamente no que diz respeito à implementação de sistemas educacionais adaptativos, com base em uma análise comparativa entre diferentes técnicas aplicadas ao mesmo problema. Sendo assim, as conclusões obtidas devem colaborar para o aprimoramento do processo de modelagem de estudantes. Além disso, são levantadas discussões a respeito dos resultados, que podem auxiliar na direção de futuros trabalhos da área. / In fact, several studies in the areas of cognitive psychology and pedagogy point out that each individual has different ways of capturing, processing, analyzing and organizing information during the learning process, which supports the concept of Learning Styles (LS). Therefore, several adaptive educational systems were proposed with the aim of providing personalized content in their courses. However, in most cases, these systems use questionnaires to identify learning styles, and this method may prove unfeasible in some situations. This is because filling in the questionnaires requires an additional effort on the part of the student, besides, this approach makes a static evaluation of the LS, disregarding possible variations in their preferences over time. It is assumed that an automatic and dynamic detection of LS based on student behavior may be more useful in this sense, since it is exempt from these limitations. In this way, the proposal in this work is to investigate different techniques related to machine learning (especially classification algorithms) applied to the automatic prediction of student learning styles, based on their interactions in a virtual teaching environment. Among the many LS models proposed in the literature, we chose to use the Felder-Silverman model (FSLSM). As a case study, the interactions of 105 students from a post-graduate course in speech therapy were studied. In addition, these students were asked to respond to the ILS questionnaire, which indicates the preference of each individual according to FSLSM. In order to construct the data sets, information was collected such as the number of visits, time spent and user interaction in each type of resource (video resources, evaluation forms, forum, etc.). These data sets in the attribute-value format served as input to four classification algorithms: Naïve Bayes, instance-based learning (kNN), MultiLayer Perceptron and Decision Trees (J48), combined with attribute selection methods and executed in cross-validation. For the experimentation, the accuracy and error rates of the algorithms were evaluated in relation to the results indicated by the ILS questionnaire, in each one of FSLSM dimensions. Our results pointed out to the use of more than one classifier, Naïve Bayes and Instance-based Learning, depending on the learning style dimension. We compared our methodology to seven works of the literature; the results demonstrated a performance superior to the previous works in almost every dimension. The present work contributes to the context of informatics applied to education, specifically with regard to the implementation of adaptive educational systems, based on a comparative analysis of different methods applied to the same problem. Therefore, the conclusions obtained should contribute to the improvement of the student modeling process. In addition, discussions are held regarding the results, which may assist in the direction of future work in this area. Adaptative learning Adaptive educational systems Aprendizado de máquina Aprendizagem adaptativa Estilos de aprendizagem Felder-Silverman Felder-Silverman Learning styles Machine learning Sistemas educacionais adaptativos
212	Estudo de algoritmos de otimização estocástica aplicados em aprendizado de máquina / Study of algorithms of stochastic optimization applied in machine learning problems Fernandes, Jessica Katherine de Sousa 23 August 2017 (has links) Em diferentes aplicações de Aprendizado de Máquina podemos estar interessados na minimização do valor esperado de certa função de perda. Para a resolução desse problema, Otimização estocástica e Sample Size Selection têm um papel importante. No presente trabalho se apresentam as análises teóricas de alguns algoritmos destas duas áreas, incluindo algumas variações que consideram redução da variância. Nos exemplos práticos pode-se observar a vantagem do método Stochastic Gradient Descent em relação ao tempo de processamento e memória, mas, considerando precisão da solução obtida juntamente com o custo de minimização, as metodologias de redução da variância obtêm as melhores soluções. Os algoritmos Dynamic Sample Size Gradient e Line Search with variable sample size selection apesar de obter soluções melhores que as de Stochastic Gradient Descent, a desvantagem se encontra no alto custo computacional deles. / In different Machine Learnings applications we can be interest in the minimization of the expected value of some loss function. For the resolution of this problem, Stochastic optimization and Sample size selection has an important role. In the present work, it is shown the theoretical analysis of some algorithms of these two areas, including some variations that considers variance reduction. In the practical examples we can observe the advantage of Stochastic Gradient Descent in relation to the processing time and memory, but considering accuracy of the solution obtained and the cost of minimization, the methodologies of variance reduction has the best solutions. In the algorithms Dynamic Sample Size Gradient and Line Search with variable sample size selection, despite of obtaining better solutions than Stochastic Gradient Descent, the disadvantage lies in their high computational cost. Aprendizado de máquina Dynamic sample size selection Dynamic sample size selection Machine Learning Métodos de redução de variância Otimização estocástica Sample size approximation Sample size approximation Stochastic optimization Variance reduction methods
213	Combinação de classificadores simbólicos utilizando medidas de regras de conhecimento e algoritmos genéticos / Combinig classifiers using knowledge rule measures and genetic algortgms Bernardini, Flávia Cristina 29 August 2006 (has links) A qualidade das hipóteses induzidas pelos atuais sistemas de aprendizado de máquina supervisionado depende da quantidade dos exemplos no conjunto de treinamento. Por outro lado, muitos dos sistemas de aprendizado de máquina conhecidos não estão preparados para trabalhar com uma grande quantidade de exemplos. Grandes conjuntos de dados são típicos em mineração de dados. Uma maneira para resolver este problema consiste em construir ensembles de classificadores. Um ensemble é um conjunto de classificadores cujas decisões são combinadas de alguma maneira para classificar um novo caso. Apesar de melhorar o poder de predição dos algoritmos de aprendizado, ensembles podem ser compostos por muitos classificadores, o que pode ser indesejável. Ainda, apesar de ensembles classificarem novos exemplos melhor que cada classificador individual, eles se comportam como caixas pretas, no sentido de não oferecer ao usuário alguma explicação relacionada à classificação por eles fornecida. Assim, neste trabalho propomos uma abordagem que utiliza algoritmos de aprendizado simbólico para construir ensembles de classificadores simbólicos que explicam suas decisões de classificação e são tão ou mais precisos que o mais preciso dos seus classificadores individuais. Além disso, considerando que algoritmos de aprendizado simbólico utilizam métodos de busca local para induzir classificadores quanto que algoritmos genéticos utilizam métodos de busca global, propomos uma segunda abordagem para aprender conceitos simbólicos de grandes bases de dados utilizando algoritmos genéticos para evoluir classificadores simbólicos em um u´ nico classificador simbólico, de maneira que o classificador evoluído é mais preciso que os classificadores iniciais. Ambas propostas foram implementadas em dois sistemas computacionais. Diversos experimentos usando diferentes conjuntos de dados foram conduzidos para avaliar ambas as propostas. Ainda que os resultados experimenta das duas soluções propostas são promissores, os melhores resultados foram obtidos utilizando a abordagem relacionada a algoritmos genéticos / The quality of hypotheses induced by most of the available supervised machine learning algorithms depends on the quantity and quality of the instances in the training set. However, several well known learning algorithms are not able to manipulate many instances making it difficult to induce good classifiers from large databases, as are needed in the Data Mining process. One approach to overcome this problem is to construct ensembles of classifiers. An ensemble is a set of classifiers whose decisions are combined in some way to classify new cases (instances). However, although ensembles improve learning algorithms power prediction, ensembles may use an undesired large set of classifiers. Furthermore, despite classifying new cases better than each individual classifier, ensembles are generally a sort of ?black-box? classifier, not being able to explain their classification decisions. To this end, in this work we propose an approach that uses symbolic learning algorithms to construct ensembles of symbolic classifiers that can explain their classification decisions so that the ensemble is as accurate as or more accurate than the individual classifiers. Furthermore, considering that symbolic learning algorithms use local search methods to induce classifiers while genetic algorithms use global search methods, we propose a second approach to learn symbolic concepts from large databases using genetic algorithms to evolve symbolic classifiers into only one symbolic classifier so that the evolved classifier is more accurate than the initial ones. Both proposals were implemented in two computational systems. Several experiments using different databases were conducted in order to evaluate both proposals. Results show that although both proposals are promising, the approach using genetic algorithms produces better results. Algoritmos genéticos Aprendizado de máquina Combinação de classificadores Combining classifiers Computação evolutiva Essembles de classificadores Essembles of classifiers Evolutionary computtion Genetic algorithms Knowledge rule evaluation measures Machine learning
214	Método baseado em rotação e projeção otimizadas para a construção de ensembles de modelos / Ensemble method based on optimized rotation and projection Ferreira, Ednaldo José 31 May 2012 (has links) O desenvolvimento de novas técnicas capazes de produzir modelos de predição com erros de generalização relativamente baixos é uma constante em aprendizado de máquina e áreas correlatas. Nesse sentido, a composição de um conjunto de modelos no denominado ensemble merece destaque por seu potencial teórico e empírico de minimizar o erro de generalização. Diversos métodos para construção de ensembles de modelos são encontrados na literatura. Dentre esses, o método baseado em rotação (RB) tem apresentado desempenho superior a outros clássicos. O método RB utiliza a técnica de extração de características da análise de componentes principais (PCA) como estratégia de rotação para provocar acurácia e diversidade entre os modelos componentes. Contudo, essa estratégia não assegura que a direção resultante será apropriada para a técnica de aprendizado supervisionado (SLT) escolhida. Adicionalmente, o método RB não é adequado com SLTs invariantes à rotação e não foi amplamente validado com outras estáveis. Esses aspectos tornam-no inadequado e/ou restrito a algumas SLTs. Nesta tese, é proposta uma nova abordagem de extração baseada na concatenação de rotação e projeção otimizadas em prol da SLT (denominada roto-projeção otimizada). A abordagem utiliza uma metaheurística para otimizar os parâmetros da transformação de roto-projeção e minimizar o erro da técnica diretora da otimização. Mais enfaticamente, propõe-se a roto-projeção otimizada como parte fundamental de um novo método de ensembles, denominado ensemble baseado em roto-projeção otimizada (ORPE). Os resultados obtidos mostram que a roto-projeção otimizada pode reduzir a dimensionalidade e a complexidade dos dados e do modelo, além de aumentar o desempenho da SLT utilizada posteriormente. O método ORPE superou, com relevância estatística, o RB e outros com SLTs estáveis e instáveis em bases de classificação e regressão de domínio público e privado. O ORPE mostrou-se irrestrito e altamente eficaz assumindo a primeira posição em todos os ranqueamentos de dominância realizados / The development of new techniques capable of inducing predictive models with low generalization errors has been a constant in machine learning and other related areas. In this context, the composition of an ensemble of models should be highlighted due to its theoretical and empirical potential to minimize the generalization error. Several methods for building ensembles are found in the literature. Among them, the rotation-based (RB) has become known for outperforming other traditional methods. RB method applies the principal components analysis (PCA) for feature extraction as a rotation strategy to provide diversity and accuracy among base models. However, this strategy does not ensure that the resulting direction is appropriate for the supervised learning technique (SLT). Moreover, the RB method is not suitable for rotation-invariant SLTs and also it has not been evaluated with stable ones, which makes RB inappropriate and/or restricted to the use with only some SLTs. This thesis proposes a new approach for feature extraction based on concatenation of rotation and projection optimized for the SLT (called optimized roto-projection). The approach uses a metaheuristic to optimize the parameters from the roto-projection transformation, minimizing the error of the director technique of the optimization process. More emphatically, it is proposed the optimized roto-projection as a fundamental part of a new ensemble method, called optimized roto-projection ensemble (ORPE). The results show that the optimized roto-projection can reduce the dimensionality and the complexities of the data and model. Moreover, optimized roto-projection can increase the performance of the SLT subsequently applied. The ORPE outperformed, with statistical significance, RB and others using stable and unstable SLTs for classification and regression with databases from public and private domains. The ORPE method was unrestricted and highly effective holding the first position in every dominance rankings Aprendizado de Ensemble Aprendizado de máquina Ensemble learning Ensemble method Machine learning Método de ensemble Optimized roto-projection Optimized roto-projection ensemble Roto-projeção otimizada
215	Construção automática de redes bayesianas para extração de interações proteína-proteína a partir de textos biomédicos / Learning Bayesian networks for extraction of protein-protein interaction from biomedical articles Juárez, Pedro Nelson Shiguihara 20 June 2013 (has links) A extração de Interações Proteína-Proteína (IPPs) a partir de texto é um problema relevante na área biomédica e um desafio na área de aprendizado de máquina. Na área biomédica, as IPPs são fundamentais para compreender o funcionamento dos seres vivos. No entanto, o número de artigos relacionados com IPPs está aumentando rapidamente, sendo impraticável identicá-las e catalogá-las manualmente. Por exemplo, no caso das IPPs humanas apenas 10% foram catalogadas. Por outro lado, em aprendizado de máquina, métodos baseados em kernels são frequentemente empregados para extrair automaticamente IPPs, atingindo resultados considerados estado da arte. Esses métodos usam informações léxicas, sintáticas ou semânticas como características. Entretanto, os resultados ainda são insuficientes, atingindo uma taxa relativamente baixa, em termos da medida F, devido à complexidade do problema. Apesar dos esforços em produzir kernels, cada vez mais sofisticados, usando árvores sintáticas como árvores constituintes ou de dependência, pouco é conhecido sobre o desempenho de outras abordagens de aprendizado de máquina como, por exemplo, as redes bayesianas. As àrvores constituintes são estruturas de grafos que contêm informação importante da gramática subjacente as sentenças de textos contendo IPPs. Por outro lado, a rede bayesiana permite modelar algumas regras da gramática e atribuir para elas uma distribuição de probabilidade de acordo com as sentenças de treinamento. Neste trabalho de mestrado propõe-se um método para construção automática de redes bayesianas a partir de árvores contituintes para extração de IPPs. O método foi testado em cinco corpora padrões da extração de IPPs, atingindo resultados competitivos, em alguns casos melhores, em comparação a métodos do estado da arte / Extracting Protein-Protein Interactions (PPIs) from text is a relevant problem in the biomedical field and a challenge in the area of machine learning. In the biomedical field, the PPIs are fundamental to understand the functioning of living organisms. However, the number of articles related to PPIs is increasing rapidly, hence it is impractical to identify and catalog them manually. For example, in the case of human PPIs only 10 % have been cataloged. On the other hand, machine learning methods based on kernels are often employed to automatically extract PPIs, achieving state of the art results. These methods use lexical, syntactic and semantic information as features. However, the results are still poor, reaching a relatively low rate of F-measure due to the complexity of the problem. Despite efforts to produce sophisticate kernels, using syntactic trees as constituent or dependency trees, little is known about the performance of other Machine Learning approaches, eg, Bayesian networks. Constituent tree structures are graphs which contain important information of the underlying grammar in sentences containing PPIs. On the other hand, the Bayesian network allows modeling some rules of grammar and assign to them a probability distribution according to the training sentences. In this master thesis we propose a method for automatic construction of Bayesian networks from constituent trees for extracting PPIs. The method was tested in five corpora, considered benchmark of extraction of PPI, achieving competitive results, and in some cases better results when compared to state of the art methods Aprendizado de máquina Bayesian networks Extração de informação Extração de relação Information extraction Machine learning Protei-protein interaction extraction Redes bayesianas Relation extraction
216	Predição de séries temporais por similaridade / Similarity-based time series prediction Parmezan, Antonio Rafael Sabino 07 April 2016 (has links) Um dos maiores desafios em Mineração de Dados é a integração da informação temporal ao seu processo. Esse fato tem desafiado profissionais de diferentes domínios de aplicação e recebido investimentos consideráveis da comunidade científica e empresarial. No contexto de predição de Séries Temporais, os investimentos se concentram no subsídio de pesquisas destinadas à adaptação dos métodos convencionais de Aprendizado de Máquina para a análise de dados na qual o tempo constitui um fator importante. À vista disso, neste trabalho é proposta uma nova extensão do algoritmo de Aprendizado de Máquina k-Nearest Neighbors (kNN) para predição de Séries Temporais, intitulado de kNN - Time Series Prediction with Invariances (kNN-TSPI ). O algoritmo concebido difere da versão convencional pela incorporação de três técnicas para obtenção de invariância à amplitude e deslocamento, invariância à complexidade e tratamento de casamentos triviais. Como demonstrado ao longo desta dissertação de mestrado, o uso simultâneo dessas técnicas proporciona ao kNN-TSPI uma melhor correspondência entre as subsequências de dados e a consulta de referência. Os resultados de uma das avaliações empíricas mais extensas, imparciais e compreensíveis já conduzidas no tema de predição de Séries Temporais evidenciaram, a partir do confronto de dez métodos de projeção, que o algoritmo kNN-TSPI, além de ser conveniente para a predição automática de dados a curto prazo, é competitivo com os métodos estatísticos estado-da-arte ARIMA e SARIMA. Por mais que o modelo SARIMA tenha atingido uma precisão relativamente superior a do método baseado em similaridade, o kNN-TSPI é consideravelmente mais simples de ajustar. A comparação objetiva e subjetiva entre algoritmos estatísticos e de Aprendizado de Máquina para a projeção de dados temporais vem a suprir uma importante lacuna na literatura, a qual foi identificada por meio de uma revisão sistemática seguida de uma meta-análise das publicações selecionadas. Os 95 conjuntos de dados empregados nos experimentos computacionais juntamente com todas as projeções analisadas em termos de Erro Quadrático Médio, coeficiente U de Theil e taxa de acerto Prediction Of Change In Direction encontram-se disponíveis no portal Web ICMC-USP Time Series Prediction Repository. A presente pesquisa abrange também contribuições e resultados significativos em relação às propriedades inerentes à predição baseada em similaridade, sobretudo do ponto de vista prático. Os protocolos experimentais delineados e as diversas conclusões obtidas poderão ser usados como referência para guiar o processo de escolha de modelos, configuração de parâmetros e aplicação dos algoritmos de Inteligência Artificial para predição de Séries Temporais. / One of the major challenges in Data Mining is integrating temporal information into process. This difficulty has challenged professionals several application fields and has been object of considerable investment from scientific and business communities. In the context of Time Series prediction, these investments consist majority of grants for designed research aimed at adapting conventional Machine Learning methods for data analysis problems in which time is an important factor. We propose a novel modification of the k-Nearest Neighbors (kNN) learning algorithm for Time Series prediction, namely the kNN - Time Series Prediction with Invariances (kNN-TSPI). Our proposal differs from the literature by incorporating techniques for amplitude and offset invariance, complexity invariance, and treatment of trivial matches. These three modifications allow more meaningful matching between the reference queries and Time Series subsequences, as we discuss with more details throughout this masters thesis. We have performed one of the most comprehensible empirical evaluations of Time Series prediction, in which we faced the proposed algorithm with ten methods commonly found in literature. The results show that the kNN-TSPI is appropriate for automated short-term projection and is competitive with the state-of-the-art statistical methods ARIMA and SARIMA. Although in our experiments the SARIMA model has reached a slightly higher precision than the similarity based method, the kNN-TSPI is considerably simpler to adjust. The objective and subjective comparisons of statistical and Machine Learning algorithms for temporal data projection fills a major gap in the literature, which was identified through a systematic review followed by a meta-analysis of selected publications. The 95 data sets used in our computational experiments, as well all the projections with respect to Mean Squared Error, Theils U coefficient and hit rate Prediction Of Change In Direction are available online at the ICMC-USP Time Series Prediction Repository. This work also includes contributions and significant results with respect to the properties inherent to similarity-based prediction, especially from the practical point of view. The outlined experimental protocols and our discussion on the usage of them, can be used as a guideline for models selection, parameters setting, and employment of Artificial Intelligence algorithms for Time Series prediction. Aprendizado de máquina Data mining Machine learning Métodos baseados em similaridade Mineração de dados Predição de séries temporais Similarity-based methods Time series prediction
217	Um estudo da aplicação de técnicas de inteligência computacional e de aprendizado em máquina de mineração de processos de negócio / A study of the application of computational intelligence and machine learning techniques in business process mining Cárdenas Maita, Ana Rocío 04 December 2015 (has links) Mineração de processos é uma área de pesquisa relativamente recente que se situa entre mineração de dados e aprendizado de máquina, de um lado, e modelagem e análise de processos de negócio, de outro lado. Mineração de processos visa descobrir, monitorar e aprimorar processos de negócio reais por meio da extração de conhecimento a partir de logs de eventos disponíveis em sistemas de informação orientados a processos. O principal objetivo deste trabalho foi avaliar o contexto de aplicação de técnicas provenientes das áreas de inteligência computacional e de aprendizado de máquina, incluindo redes neurais artificiais. Para fins de simplificação, denominadas no restante deste texto apenas como ``redes neurais\'\'. e máquinas de vetores de suporte, no contexto de mineração de processos. Considerando que essas técnicas são, atualmente, as mais aplicadas em tarefas de mineração de dados, seria esperado que elas também estivessem sendo majoritariamente aplicadas em mineração de processos, o que não tinha sido demonstrado na literatura recente e foi confirmado por este trabalho. Buscou-se compreender o amplo cenário envolvido na área de mineração de processos, incluindo as principais caraterísticas que têm sido encontradas ao longo dos últimos dez anos em termos de: tipos de mineração de processos, tarefas de mineração de dados usadas, e técnicas usadas para resolver tais tarefas. O principal enfoque do trabalho foi identificar se as técnicas de inteligência computacional e de aprendizado de máquina realmente não estavam sendo amplamente usadas em mineração de processos, ao mesmo tempo que se buscou identificar os principais motivos para esse fenômeno. Isso foi realizado por meio de um estudo geral da área, que seguiu rigor científico e sistemático, seguido pela validação das lições aprendidas por meio de um exemplo de aplicação. Este estudo considera vários enfoques para delimitar a área: por um lado, as abordagens, técnicas, tarefas de mineração e ferramentas comumente mais usadas; e, por outro lado, veículos de publicação, universidades e pesquisadores interessados no desenvolvimento da área. Os resultados apresentam que 81% das publicações atuais seguem as abordagens tradicionais em mineração de dados. O tipo de mineração de processos com mais estudo é Descoberta 71% dos estudos primários. Os resultados deste trabalho são valiosos para profissionais e pesquisadores envolvidos no tema, e representam um grande aporte para a área / Mining process is a relatively new research area that lies between data mining and machine learning, on one hand, and business process modeling and analysis, on the other hand. Mining process aims at discovering, monitoring and improving business processes by extracting real knowledge from event logs available in process-oriented information systems. The main objective of this master\'s project was to assess the application of computational intelligence and machine learning techniques, including, for example, neural networks and support vector machines, in process mining. Since these techniques are currently widely applied in data mining tasks, it would be expected that they were also widely applied to the process mining context, which has been not evidenced in recent literature and confirmed by this work. We sought to understand the broad scenario involved in the process mining area, including the main features that have been found over the last ten years in terms of: types of process mining, data mining tasks used, and techniques applied to solving such tasks. The main focus of the study was to identify whether the computational intelligence and machine learning techniques were indeed not being widely used in process mining whereas we sought to identify the main reasons for this phenomenon. This was accomplished through a general study area, which followed scientific and systematic rigor, followed by validation of the lessons learned through an application example. This study considers various approaches to delimit the area: on the one hand, approaches, techniques, mining tasks and more commonly used tools; and, on the other hand, the publication vehicles, universities and researchers interested in the development area. The results show that 81% of current publications follow traditional approaches to data mining. The type of mining processes more study is Discovery 71% of the primary studies. These results are valuable for practitioners and researchers involved in the issue, and represent a major contribution to the area Aprendizado de máquina BPM BPM Business Process Management Computational Intelligence Data Mining Gestão de Processos de Negócio Inteligência computacional Machine Learning Mineração de dados Mineração de processos Mineração de workflows Process Mining Workflow Mining
218	Soluções de tomadas de decisões inteligentes para infraestruturas residenciais / Intelligent decision-making solutions for residential infrastructures Rocha Filho, Geraldo Pereira 18 May 2018 (has links) Nos últimos anos, um dos principais desafios globais está relacionado com a eficiência energética, sendo o desperdício de energia um dos fatores a ser destacado. Tal desperdício pode ser superado com o uso do Sistema de Automação Residencial (SAR). Vale frisar que os SARs são fortemente dependentes da sua infraestrutura interna, visto que esta é a base de uma casa inteligente. A Rede de Sensores e Atuadores sem Fio (RSASF) é uma solução promissora e de fácil implantação para ser utilizada como infraestrutura em um SAR. Entretanto, o uso das RSASFs como infraestrutura para monitorar e atuar (isto é, processo de tomada de decisão) no contexto de um SAR traz um novo problema. Tal problema remete não apenas a falta de um método para realizar a decisão dentro do próprio nó da RSASF, mas também a ausência em investigar um trade-off entre a precisão nas tomadas de decisões e o consumo de energia dos nós da rede. Além disso, a falta de uma infraestrutura distribuída, com baixo overhead e que reduza a latência do serviço são algumas das novas problemáticas para serem exploradas. Com isso, tem-se como desafio embarcar uma maior inteligência em dispositivos com recursos escassos, característica presente em uma RSASF. Para superar tais limitações, esta tese apresenta duas soluções de decisões inteligentes para uma infraestrutura residencial, nomeadas como ResiDI e ImPeRIum. O ResiDI é baseado em uma rede neural para atuar no processo de tomada de decisão dentro da RSASF, bem como em um mecanismo de correlação temporal para maximizar a eficiência energética da infraestrutura de comunicação. Já o ImPeRIum é baseado em um conjunto heterogêneo de dispositivos inteligentes para formar um ambiente computacional de fog, o qual gerencia as aplicações da residência por meio de uma rede neural. As soluções foram avaliadas extensivamente em diferentes cenários e comparadas com um trabalho da literatura. Os resultados reais e simulados, avaliados mediante uma análise estatística paramétrica e não-paramétrica, mostrou atingir o objetivo desta tese, sendo quatro deles notáveis: (i) aumento da precisão nas tomadas de decisões; (ii) redução no consumo de energia dos nós da rede; (iii) redução no tempo de resposta da atuação com baixa sobrecarrega; e (iv) eficiência na disseminação das informações. / In recent years, energy efficiency has become a major global challenge, and energy waste is a factor that needs to be highlighted. Such waste can be overcome with the use of Home Automation System (HAS). It should be stressed that the HASs are strongly dependent on its internal network, since this is the basis of a smart home. Wireless Sensor and Actuator Networks (WSANs) provide a modern and ubiquitous infrastructure for a smart home. However, the use of WSANs to monitor and act (i.e. decision-making process) as a control infrastructure within the context of HAS poses a new problem. Such problem refers not only to the lack of a method to execute the decision-making process within the WSAN, but also to the lack of investigating a trade-off between the decision-making accuracy and the extension of the WSAN nodes life-time. In addition, the lack of a distributed infrastructure, with low overhead in processing and that reduces service latency are some of the new problems to be addressed in the literature. With this, one has as a challenge to embark on greater intelligence in devices with scarce resources, a feature present in a WSAN. To overcome such limitations, this thesis presents two intelligent decision-making solutions for residential infrastructures, named ResiDI and ImPeRIum. ResiDI was developed based on a neural network to act in the decision-making process within the network, as well as a temporal correlation mechanism to maximize the energy consumption in the networks nodes. ImPeRIum was based on a heterogeneous set of smart objects to form a fog computational environment, which manages the applications of the residence through a neural network. The solutions were evaluated extensively in different scenarios and compared with an approach in the literature. The real and simulated results, evaluated through parametric and non-parametric tests, show that solutions make four key contributions: (i) increased decisionmaking; (ii) reduction in node energy consumption; (iii) reduction in action response time with low overload; and (iv) efficiency in the transmission of information. Aprendizado de máquina Computational Intelligence Decision-Making Home Automation System Inteligência computacional Machine Learning Rede de sensores sem fio Sistema de automação residencial Tomada de decisão Wireless Sensor Network
219	Collective dynamics in complex networks for machine learning / Dinâmica coletiva em redes complexas para aprendizado de máquina Verri, Filipe Alves Neto 19 March 2018 (has links) Machine learning enables machines to learn automatically from data. In literature, graph-based methods have received increasing attention due to their ability to learn from both local and global information. In these methods, each data instance is represented by a vertex and is linked to other vertices according to a predefined affinity rule. However, they usually have unfeasible time cost for large problems. To overcome this problem, techniques can employ a heuristic to find suboptimal solutions in a feasible time. Early heuristic optimization methods exploit nature-inspired collective processes, such as ants looking for food sources and swarms of bees. Nowadays, advances in the field of complex systems provide powerful tools to assess and to understand dynamical systems. Complex networks, which are graphs with nontrivial topology, are among these theoretical tools capable of describing the interplay of topology, structure, and dynamics of complex systems. Therefore, machine learning methods based on complex networks and collective dynamics have been proposed. They encompass three steps. First, a complex network is constructed from the input data. Then, the simulation of a distributed collective system in the network generates rich information. Finally, the collected information is used to solve the learning problem. The coordination of the individuals in the system permit to achieve dynamics that is far more complex than the behavior of single individuals. In this research, I have explored collective dynamics in machine learning tasks, both in unsupervised and semi-supervised scenarios. Specifically, I have proposed a new collective system of competing particles that shifts the traditional vertex-centric dynamics to a more informative edge-centric one. Moreover, it is the first particle competition system applied in machine learning task that has deterministic behavior. Results show several advantages of the edge-centric model, including the ability to acquire more information about overlapping areas, a better exploration behavior, and a faster convergence time. Also, I have proposed a new network formation technique that is not based on similarity and has low computational cost. Since addition and removal of samples in the network is cheap, it can be used in real-time application. Finally, I have conducted analytical investigations of a flocking-like system that was needed to guarantee the expected behavior in community detection tasks. In conclusion, the result of the research contributes to many areas of machine learning and complex systems. / Aprendizado de máquina permite que computadores aprendam automaticamente dos dados. Na literatura, métodos baseados em grafos recebem crescente atenção por serem capazes de aprender através de informações locais e globais. Nestes métodos, cada item de dado é um vértice e as conexões são dadas uma regra de afinidade. Todavia, tais técnicas possuem custo de tempo impraticável para grandes grafos. O uso de heurísticas supera este problema, encontrando soluções subótimas em tempo factível. No início, alguns métodos de otimização inspiraram suas heurísticas em processos naturais coletivos, como formigas procurando por comida e enxames de abelhas. Atualmente, os avanços na área de sistemas complexos provêm ferramentas para medir e entender estes sistemas. Redes complexas, as quais são grafos com topologia não trivial, são uma das ferramentas. Elas são capazes de descrever as relações entre topologia, estrutura e dinâmica de sistemas complexos. Deste modo, novos métodos de aprendizado baseados em redes complexas e dinâmica coletiva vêm surgindo. Eles atuam em três passos. Primeiro, uma rede complexa é construída da entrada. Então, simula-se um sistema coletivo distribuído na rede para obter informações. Enfim, a informação coletada é utilizada para resolver o problema. A interação entre indivíduos no sistema permite alcançar uma dinâmica muito mais complexa do que o comportamento individual. Nesta pesquisa, estudei o uso de dinâmica coletiva em problemas de aprendizado de máquina, tanto em casos não supervisionados como semissupervisionados. Especificamente, propus um novo sistema de competição de partículas cuja competição ocorre em arestas ao invés de vértices, aumentando a informação do sistema. Ainda, o sistema proposto é o primeiro modelo de competição de partículas aplicado em aprendizado de máquina com comportamento determinístico. Resultados comprovam várias vantagens do modelo em arestas, includindo detecção de áreas sobrepostas, melhor exploração do espaço e convergência mais rápida. Além disso, apresento uma nova técnica de formação de redes que não é baseada na similaridade dos dados e possui baixa complexidade computational. Uma vez que o custo de inserção e remoção de exemplos na rede é barato, o método pode ser aplicado em aplicações de tempo real. Finalmente, conduzi um estudo analítico em um sistema de alinhamento de partículas. O estudo foi necessário para garantir o comportamento esperado na aplicação do sistema em problemas de detecção de comunidades. Em suma, os resultados da pesquisa contribuíram para várias áreas de aprendizado de máquina e sistemas complexos. Aprendizado de máquina Aprendizado não supervisionado Aprendizado semissupervisionado Collective dynamics Complex networks Dinâmica coletiva Machine learning Redes complexas Semi-supervised learning Unsupervised learning
220	Um data warehouse de publicações científicas: indexação automática da dimensão tópicos de pesquisa dos data marts / A Data warehouse for scientific publications: automatic indexing of the research topic dimension for using in data marts Kanashiro, Augusto 04 May 2007 (has links) Este trabalho de mestrado insere-se no contexto do projeto de uma Ferramenta Inteligente de Apoio à Pesquisa (FIP), sendo desenvolvida no Laboratório de Inteligência Computacional do ICMC-USP. A ferramenta foi proposta para recuperar, organizar e minerar grandes conjuntos de documentos científicos (na área de computação). Nesse contexto, faz-se necessário um repositório de artigos para a FIP. Ou seja, um Data Warehouse que armazene e integre todas as informações extraídas dos documentos recuperados de diferentes páginas pessoais, institucionais e de repositórios de artigos da Web. Para suportar o processamento analítico on-line (OLAP) das informações e facilitar a ?mineração? desses dados é importante que os dados estejam armazenados apropriadamente. Dessa forma, o trabalho de mestrado teve como objetivo principal projetar um Data Warehouse (DW) para a ferramenta FIP e, adicionalmente, realizar experimentos com técnicas de mineração e Aprendizado de Máquina para automatizar o processo de indexação das informações e documentos armazenados no data warehouse (descoberta de tópicos). Para as consultas multidimensionais foram construídos data marts de forma a permitir aos pesquisadores avaliar tendências e a evolução de tópicos de pesquisa / This dissertation is related to the project of an Intelligent Tool for Research Supporting (FIP), being developed at the Laboratory of Computational Intelligence at ICMC-USP. The tool was proposed to retrieve, organize, and mining large sets of scientific documents in the field of computer science. In this context, a repository of articles becomes necessary, i.e., a Data Warehouse that integrates and stores all extracted information from retrieved documents from different personal and institutional web pages, and from article repositories. Data appropriatelly stored is decisive for supporting online analytical processing (OLAP), and ?data mining? processes. Thus, the main goal of this MSc research was design the FIP Data Warehouse (DW). Additionally, we carried out experiments with Data Mining and Machine Learning techniques in order to automatize the process of indexing of information and documents stored in the data warehouse (Topic Detection). Data marts for multidimensional queries were designed in order to facilitate researchers evaluation of research topics trend and evolution Aprendizado de máquina Data mart Data mart Data mining Data warehouse Data warehouse Detecção de tópicos de pesquisa Machine learning Mineração de dados Mineração de textos OLAP OLAP Research topic detection Text mining

Search results