Global ETD Search

61	Aprendizado de máquina baseado em tensores e suas aplicacções para floresta de caminhos ótimos Lopes, Ricardo Ricci [UNESP] 21 August 2015 (has links) (PDF) Made available in DSpace on 2016-04-01T17:54:36Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-08-21. Added 1 bitstream(s) on 2016-04-01T18:00:15Z : No. of bitstreams: 1 000859943.pdf: 1070364 bytes, checksum: 04d8c74205b7c2df31f68a75600abada (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / Técnicas de aprendizado de máquina, usualmente, objetivam aprender alguma superfície que separe amostras de classes diferentes por meio de sua representação vetorial. Entretanto, existem muitas aplicações que podem, eventualmente, perder informações essenciais e inerentes da estrutura dos dados em tal representação e, com o crescimento de base de dados com alta dimensionalidade, essas informações se tornam cada vez mais importantes. Os espaços de representação de dados com curvatura, baseados em trabalhos na area da Matemática e Física, têm despertado interesse por parte da comunidade de aprendizado de máquina com o intuito de resolver tal situação. Esses espaços de representação são baseados em tensores, os quais mantém a estrutura original dos dados, bem como permitem a utilização de variedades em superfícies com curvatura não nula. Esta dissertação de mestrado apresenta uma revisão bibliográfica sobre abordagens de aprendizado de máquina baseadas em tensores, bem como um referencial teórico sobre algebra multilinear. Também e apresentado um estudo da aplicabilidade do classificador Floresta de Caminhos Otimos, do inglês Optimum-Path Forest - OPF, em espaços tensoriais através da técnica Análise de Componentes Principais Multilineares, bem como a comparação dos resultados obtidos com outras técnicas conhecidas na literatura em contexto de reconhecimento em fotos e vídeos. Também foi demonstrado que o OPF pode obter maior acurácia em algumas situações quando se trabalha com características no espaço tensorial / Machine learning techniques usually learn some decision surface that separates samples from di erent classes by means of their vectorial representation. However, there exist many applications that might lose important information that are strongly related to the data itself. Additionally, such information has gained importance with the popularity of high-dimensional datasets. As such, works based on Mathematics and Physics, where curvature-based space representations have been used in several application, have gained attention by the machine learning community. Such representations are based on tensors, which keep the original structure of the data, as well as they allow us to use manifolds in curvature-based spaces. This master's dissertation presents a review of the literature with respect to tensor-based machine learning techniques, as well as a brief review about multilinear algebra. We also evaluate the performance of the Optimum-Path Forest classi er (OPF) in tensor-oriented spaces by means of the Multilinear Principal Component Analysis, as well as its comparison against with other related techniques is also performed. It is shown OPF can bene t from such feature space representation in some situations Computação - Matematica Reconhecimento de padrões Álgebra tensorial Aprendizado do computador Floresta de caminhos ótimos Computer science Mathematics
62	Seleção de características utilizando algoritmos evolucionistas e suas aplicações em reconhecimento de padrões / Rodrigues, Douglas. January 2014 (has links) Orientador: João Paulo Papa / Banca: Roberta Spolon / Banca: Alexandre Luís Magalhães Levada / Resumo: Técnicas para seleção de características tem sido amplamente estudadas pela comunidade científica de reconhecimento de padrões e areas afins, dado que o problema de encontrar o subconjunto das características que maximiza a taxa de acerto de uma técnica de classificação de padrões pode ser modelado como um problema de otimização. Metodologias baseadas em inteligência evolucionista, tais como aquelas que simulam dinâmicas sociais e de interação entre morcegos, algumas espécies de aves e outros insetos, tem sido recentemente aplicadas nesse contexto. Assim sendo, o presente trabalho visou o estudo e desenvolvimento de técnicas de seleção de características utilizando abordagens de otimização evolucionistas, sendo elas: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experimentos realizados em seis bases de dados utilizando as técnicas propostas em conjunto com outras cinco técnicas (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) mostraram a eficácia das técnicas evolucionistas propostas quando utilizadas em conjunto com o classificador OPF. O BSSO - Binary Social-Spider Optimization apresentou a melhor acurácia em 3 bases, chegando a aumentar a taxa de acerto do classificador OPF em até 19%, bem como, selecionou o menor número de características em cinco das seis bases. Em relação ao tempo de execuçãao, o BKH - Binary Krill Herd obteve o segundo melhor tempo em cinco bases, ficando atrás somente do BHS - Binary Harmony Search / Abstract: Techniques for feature selection have been widely studied by the pattern recognition scientific community and related fields, as the problem of finding the subset of features that maximizes the classifier rate can be modeled as a optimization problem. Methodologies based on evolutionary intelligence, such as those that simulate social dynamics and interaction between bats, some species of birds and other insects, have recently been applied in this context. Therefore, this work aimed to the study and development of feature selection techniques using evolutionary optimization approaches: BBA - Binary Bat Algorithm, BCSS - Binary Charged System Search, BCS - Binary Cuckoo Search, BKH - Binary Krill Herd e BSSO - Binary Social-Spider Optimization. Experiments conducted in six databases using the proposed techniques together with ve other techniques (BGA - Binary Genetic Algorithm, BPSO - Binary Particle Swarm Optimization, BFA - Binary Fire y Algorithm, BGSA - Binary Gravitational Search Algorithm, BHS - Binary Harmony Search) have shown the efiectiveness of proposed evolutionary techniques when used with the OPF classifier. The BSSO - Binary Social-Spider Optimization showed the best accuracy on 3 datasets coming to increase the OPF classification rate in up to 19%. Also, SSO has selected the smallest number features in ve of the six datasets. Regarding the runtime, BKH - Binary Krill Herd was the second fastest technique in ve datasets, being only slower then BHS - Binary Harmony Search technique / Mestre Computação - Matematica. Reconhecimento de padrões. Aprendizado do computador. Floresta de caminhos ótimos. Algoritmos evolutivos Computer science Mathematics
63	Distance estimation for mixed continuous and categorical data with missing values Azevedo, Glauco Gomes de 04 June 2018 (has links) Submitted by Glauco Gomes de Azevedo (glaucogazevedo@gmail.com) on 2018-08-28T20:54:50Z No. of bitstreams: 1 dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5) / Approved for entry into archive by Janete de Oliveira Feitosa (janete.feitosa@fgv.br) on 2018-09-10T19:38:08Z (GMT) No. of bitstreams: 1 dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5) / Made available in DSpace on 2018-09-12T17:39:51Z (GMT). No. of bitstreams: 1 dissertacao_glauco_azevedo.pdf: 1909706 bytes, checksum: 6636e75aa9da1db2615932f064fd1138 (MD5) Previous issue date: 2018-06-04 / Neste trabalho é proposta uma metodologia para estimar distâncias entre pontos de dados mistos, contínuos e categóricos, contendo dados faltantes. Estimação de distâncias é a base para muitos métodos de regressão/classificação, tais como vizinhos mais próximos e análise de discriminantes, e para técnicas de clusterização como k-means e k-medoids. Métodos clássicos para manipulação de dados faltantes se baseiam em imputação pela média, o que pode subestimar a variância, ou em métodos baseados em regressão. Infelizmente, quando a meta é a estimar a distância entre observações, a imputação de dados pode performar de modo ineficiente e enviesar os resultados na direção do modelo. Na proposta desse trabalho, estima-se a distância dos pares diretamente, tratando os dados faltantes como aleatórios. A distribuição conjunta dos dados é aproximada utilizando um modelo de mistura multivariado para dados mistos, contínuos e categóricos. Apresentamentos um algoritmo do tipo EM para estimar a mistura e uma metodologia geral para estimar a distância entre observações. Simulações mostram que um método proposto performa tanto dados simulados, como reais. / In this work we propose a methodology to estimate the pairwise distance between mixed continuous and categorical data with missing values. Distance estimation is the base for many regression/classification methods, such as nearest neighbors and discriminant analysis, and for clustering techniques such as k-means and k-medoids. Classical methods for handling missing data rely on mean imputation, that could underestimate the variance, or regression-based imputation methods. Unfortunately, when the goal is to estimate the distance between observations, data imputation may perform badly and bias the results toward the data imputation model. In this work we estimate the pairwise distances directly, treating the missing data as random. The joint distribution of the data is approximated using a multivariate mixture model for mixed continuous and categorical data. We present an EM-type algorithm for estimating the mixture and a general methodology for estimating the distance between observations. Simulation shows that the proposed method performs well in both simulated and real data. Dados faltantes Machine learning Modelos de mixtura Missing data Mixture models Tecnologia Aprendizado do computador Ausencia de dados (Estatistica) Modelagem de dados
64	Desenvolvimento de uma proposta didático-pedagógica para ambiente virtual de aprendizagem assistida por computador / Development of a pedagogical-didactic proposal for computer assisted learning virtual environments Araujo, Izabel Cristina de, 1966- 25 August 2018 (has links) Orientador: Sérgio Ferreira do Amaral / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Educação / Made available in DSpace on 2018-08-25T19:14:27Z (GMT). No. of bitstreams: 1 Araujo_IzabelCristinade_D.pdf: 4104644 bytes, checksum: b2e270b8879cdf763e6800edb77559f1 (MD5) Previous issue date: 2013 / Resumo: Essa pesquisa tem como objetivo geral desenvolver uma proposta didático-pedagógica para ambiente virtual de aprendizagem assistida por computador (AAC). Os objetivos específicos situam-se em: identificar referenciais didático-pedagógicos junto à literatura e especialistas da área, construir um quadro indicativo dos referenciais didático-pedagógicos de ambiente virtual de AAC e sistematizar os referenciais encontrados, agrupando-os em unidades de análise para composição das diretrizes norteadoras do desenvolvimento da proposta didático-pedagógica. O problema da pesquisa apresentou-se em: Como referenciais didático-pedagógicos podem nortear ações educativas em ambientes virtuais de AAC? Realizamos trabalho de campo com levantamento e revisão da literatura, anotações em diário de campo advindas da observação em campo e entrevista semi-estruturada. Tivemos a participação de 36 pesquisadores de diferentes universidades americanas, asiáticas, europeias e da Oceania. A análise dos dados de predominância qualitativa norteou as conclusões, quais sejam: que o investimento em pesquisa na área de educação com inovação tecnológica proporciona resultados práticos, impactando na formulação de políticas públicas e na formação de professores; a relevância da autoria do professor na ação educativa em ambiente virtual de AAC; o professor-autor como mediador da aprendizagem; as destrezas e os conhecimentos necessários para utilizar os materiais de ambiente de AAC se apresentam mais eficazes se autores e coautores contarem com formação básica para a utilização das ferramentas tecnológicas. Daí a importância de fazê-lo gradualmente para que sejam capazes de aumentar seu nível de autonomia frente a sua própria aprendizagem.Essa pesquisa tem como objetivo geral desenvolver uma proposta didático-pedagógica para ambiente virtual de aprendizagem assistida por computador (AAC). Os objetivos específicos situam-se em: identificar referenciais didático-pedagógicos junto à literatura e especialistas da área, construir um quadro indicativo dos referenciais didático-pedagógicos de ambiente virtual de AAC e sistematizar os referenciais encontrados, agrupando-os em unidades de análise para composição das diretrizes norteadoras do desenvolvimento da proposta didático-pedagógica. O problema da pesquisa apresentou-se em: Como referenciais didático-pedagógicos podem nortear ações educativas em ambientes virtuais de AAC? Realizamos trabalho de campo com levantamento e revisão da literatura, anotações em diário de campo advindas da observação em campo e entrevista semi-estruturada. Tivemos a participação de 36 pesquisadores de diferentes universidades americanas, asiáticas, europeias e da Oceania. A análise dos dados de predominância qualitativa norteou as conclusões, quais sejam: que o investimento em pesquisa na área de educação com inovação tecnológica proporciona resultados práticos, impactando na formulação de políticas públicas e na formação de professores; a relevância da autoria do professor na ação educativa em ambiente virtual de AAC; o professor-autor como mediador da aprendizagem; as destrezas e os conhecimentos necessários para utilizar os materiais de ambiente de AAC se apresentam mais eficazes se autores e coautores contarem com formação básica para a utilização das ferramentas tecnológicas. Daí a importância de fazê-lo gradualmente para que sejam capazes de aumentar seu nível de autonomia frente a sua própria aprendizagem / Abstract: The overall goal of this research work is to develop a didactic proposal for Computer Assisted Learning (CAL) environments. The specific goals are: to identify the didactic requirements from both the literature and the specialists in the field; to build a conceptual framework of the didactic requirements of a virtual CAL environment; and to organize the requirements found by creating categories based on units of analysis so as to build up the main requirements of the development of a teaching proposal. The main concern was: How can pedagogical criteria set the foundations for sound educational actions in computer-assisted learning environments? 36 researchers from different universities in America, Asia, Europe and Australia participated in the research. The data analysis led to the following conclusions: a) the investment in research in the field of technology-enhanced teaching and learning leads to practical results which in turn foster the emergence of public policies and the improvement of teacher training; b) the relevance of teacher authorship in education in virtual CAL environments should be pointed out, the starting point being the social and cultural environment of the school where the teaching-learning process takes place; c) the role of the teacher-author as a mediator in learning should be borne in mind; d) the skills and knowledge needed when using the materials of a CAL environment become more effective when used by authors and co-authors trained in the use of technological tools. This means that it is important to provide authors and co-authors with the opportunity to develop those competences gradually so as to increase their level of autonomy regarding their own learning process / Doutorado / Ciencias Sociais na Educação / Doutora em Educação Ambiente virtual de aprendizagem Autoria Educação e tecnologia Virtual learning environment Supervised learning (Computer learning) Authorship Education and technology
65	Melhoria da atratividade de faces em imagens = Enhancement of faces attractiveness in images / Enhancement of faces attractiveness in images Leite, Tatiane Silvia 20 August 2018 (has links) Orientador: José Mario De Martino / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-20T14:28:14Z (GMT). No. of bitstreams: 1 Leite_TatianeSilvia_M.pdf: 77678050 bytes, checksum: 402062baa2ae89224527d82c64355abd (MD5) Previous issue date: 2012 / Resumo: O rosto desempenha um papel importante na comunicação e expressão de emoções. Por ser o cartão de visitas individual e caracterizar a primeira impressão de cada um, sua aparência e seu formato tornam-se alvo de diversos estudos. Um rosto mais atraente é capaz de capturar com maior facilidade não apenas a atenção de quem o observa, como também sua empatia. Nesta linha, o presente trabalho tem como objetivo o desenvolvimento de uma metodologia para manipulação e transformação de imagens fotográficas de faces com a finalidade de aumentar a atratividade destes rostos. Para isso, foram abordados dois aspectos de modificação da face: o geométrico e o de textura da pele do rosto. No contexto deste trabalho, foi construída uma base de imagens de faces. Nas imagens desta base foram identificados pontos de interesse e calculadas distâncias entre eles para a caracterização das proporções da face. Adicionalmente, foi atribuído um grau de atratividade para cada face, a partir de avaliação realizada por um grupo de 40 voluntários. As medidas de proporção e atratividade foram utilizadas, no processo de melhoria geométrica da face, como conjunto de treinamento para os algoritmos de aprendizado de máquina. Como resultado do processamento são geradas novas medidas para o rosto que se deseja tornar mais atraente. Utilizando a técnica de warping, a imagem do rosto de entrada é modificada para as novas medidas encontradas. A imagem resultante deste processo serve como imagem de entrada para o processo de modificação da textura. Neste processamento é gerada uma nova imagem com a cor dos pixels da região de pele do rosto alterada. A principal contribuição deste trabalho consiste em unir o processo de modificação geométrica do rosto à modificação de textura da pele. Esta união resultou em um ganho de atratividade maior do que se estas técnicas fossem utilizadas separadamente. Este ganho foi comprovado com testes de pós-avaliação realizados com voluntários analisando os resultados finais nas imagens / Abstract: The face plays an important role in communication and expression of emotions. Face characterizes the first impression of each person; thus, its appearance and shape became the target of several studies. An attractive face is capable of capturing more easily not only the attention of the beholder, as well as his/her empathy. In this vein, this study aims to develop a methodology for handling and processing of images of faces in order to increase the attractiveness of these faces. It was addressed two aspects of modification of the face: the geometric and texture (considering only the skin of the face). In this work, a large database of face images was built. All these faces were marked with feature points and from them it was taken measures considered interesting to analyze the dimensions and proportions of the faces. Besides that, they were also evaluated according to their degree of attraction by a group of volunteers. This information was used in the enhancement of the face geometry, using machine learning algorithms. At this stage new measures were generated for the input face which is considered in the beautification process. Using the technique of warping, the input face image is warped to fit the new measures found by the algorithms. The resulting image from this process serves as the input image to the process of texture modification. At this stage it is generated a new image with the color of pixels in the region of skin of the face changed. The main contribution of this work is to join the process of face geometry modification with the process of face skin texture modification. The result of this union generates image faces which have greater enhancement of attractiveness than if the processes were used separately. This gain was confirmed by post-evaluation tests conducted with volunteers that analyzed the final results / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica Face Processamento de imagens Imagens Textura Face Supervised learning (Machine learning) Image processing Image Texture
66	Reconhecimento automático de expressões faciais baseado em modelagem estatística Pedroso, Felipe José Coelho 28 March 2013 (has links) Made available in DSpace on 2016-12-23T14:07:23Z (GMT). No. of bitstreams: 1 Felipe Jose Coleho Pedroso_frontispicio.pdf: 1036866 bytes, checksum: 151c0d29a07012b8556291c387c1425f (MD5) Previous issue date: 2013-03-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / As expressões faciais são alvos constante de estudos desde Charles Darwin, em 1872. Pesquisas na área de psicologia e, em destaque, os trabalhos de Paul Ekman afirmam que existem expressões faciais universais básicas e elas são manifestadas em todos os seres humanos independente de fatores como gênero, idade, cultura e ambiente social. Ainda pode-se criar novas expressões mais complexas combinando as expressões fundamentais de alegria, tristeza, medo, nojo, raiva, surpresa e desprezo, além da face neutra. O assunto ainda é atual, uma vez que há uma grande necessidade de implementar interfaces homem-máquinas (IHM) capazes de identificar a expressão de um indivíduo e atribuir uma saída condizente com a situação observada. Pode-se citar como exemplos iterações homem-robô, sistemas de vigilância e animações gráficas. Nesse trabalho é proposto um sistema automático para identificar expressões faciais. O sistema é dividido em três etapas: localização de face, extração de características e identificação da expressão facial. O banco de dados Japanese Facial Expression Database - JAFFE foi utilizado para treinamentos e testes . A localização da face é realizada de maneira automática através do framework proposto por Viola-Jones e é estimado o centro da face. Na sequência, utiliza-se o algoritmo Active Appearance Model -AAM para descrever estatisticamente um modelo de forma e textura para o banco de dados. Com esse descritor é possível gerar um vetor de aparência capaz de representar, com redução de dimensão, uma face e, consequentemente, a expressão facial contida nela através de um algoritmo iterativo de busca a partir de um modelo médio. Esse vetor é utilizado na etapa de reconhecimento das expressões faciais, onde são testados os classificadores baseados no vizinho mais próximo k-NN e a máquina de vetores de suporte - SVM com kernel RBF para tratar o problema de forma não linear. É proposto um mecanismo de busca na saída do bloco de detecção de faces para diminuir o erro do modelo, pois o sucesso do algoritmo é altamente dependente do ponto inicial de busca. Também é proposto uma mudança no algoritmo AAM para redução do erro de convergência entre a imagem real e o modelo sintético que a representa, abordando o problema de forma não linear. Testes foram realizados utilizando a validação cruzada leave one out para todas as expressões faciais e o classificador SVM-RBF. O sistema apresentou um taxa de acerto de 55,4%, com sensibilidade 60,25% e especificidade 93,95% / Facial expressions are constant targets of studies since Charles Darwin in 1872. Research in psychology and highlighted the work of Paul Ekman claim that there are universal basic facial expressions and they are expressed in all human beings regardless of factors such as gender, age, culture and social environment. Although you can create new more complex expressions combining the fundamental expressions of happiness, sadness, fear, disgust, anger, surprise and contempt, beyond the neutral face. The matter is still relevant, since there is a great need to implement human machine interfaces (HMI) able to identify the expression of an individual and assign an output consistent with the observed situation. One can cite as examples iterations man-robot surveillance and motion graphics. In this work it/ s proposed an automatic system to identify facial expressions. The system is divided into three blocks: face localization, feature extraction and identification of facial expression. The Japanese Facial Expression Database - JAFFE was used for training and testing. The location of the face is done automatically using the framework proposed by Viola and Jones estimating center of the face. Following the Active Appearance Model - AAM algorithm is used to describe statistical model of shape and texture to the database. With this descriptor is possible to generate a vector capable of representing faces with reduced dimension and hence the facial expression contained therein through an iterative search algorithm from an average model. This vector is used in recognizing facial expressions block, where the classifiers are tested based on the nearest neighbor k-NN and support vector machine - SVM with RBF kernel to address the problem of non-linear way. A mechanism to decrease the error of the model is proposed before the output of the face detection block, because the success of the algorithm is highly dependent on the starting point of the search. A change in the AAM algorithm is also proposed to reduce the convergence error between actual and synthetic model that is addressing the problem of nonlinear way. Tests were conducted using leave one out cross validation for all the facial expressions and the final classifier was SVM-RBF. The system has an accuracy rate of 55.4%, with 60,25% sensitivity and 93,95% specificity Processamento de imagens Interação homem-máquina Sistemas de reconhecimento de padrões Expressão facial Aprendizado do computador
67	Avaliação de um Sistema Escalável de Classificação CNAE Implementado em Cloud Computing Veronese, Lucas de Paula 17 March 2011 (has links) Made available in DSpace on 2016-12-23T14:33:35Z (GMT). No. of bitstreams: 1 Lucas de Paula Veronese.pdf: 2538988 bytes, checksum: c17a3042d9904bfe301764e3ca465825 (MD5) Previous issue date: 2011-03-17 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Em problemas de classificação automática de texto com um grande número de rótulos, as bases de dados de treinamento são extensas, o que pode tornar o tempo de classificação proibitivo para os sistemas on-line. Destarte, nossa motivação para a realização deste trabalho veio da necessidade de o Governo Federal implementar no país um Cadastro Sincronizado Nacional (CSN) de empresas, onde a Classificação Nacional de Atividades Econômicas (CNAE) seria parte constituinte. Nesta tarefa de classificação, são associados um ou mais códigos CNAE-Subclasses à descrição de atividades econômicas de empresas. Vale destacar que, em 2009, a tarefa de atribuir ou revisar tais códigos CNAE foi realizada no país cerca de duas milhões de vezes. Diante disto, para a realização deste trabalho, nós investigamos o uso de servidores Web baseado em Cloud Computing devido à escalabilidade e ao baixo custo de desenvolvimento e operação. Pela facilidade de utilização e fornecimento de quotas livres, o servidor de Cloud Computing escolhido para desenvolvimento da aplicação foi o Google App Engine. Desta forma, nós projetamos, implementamos e hospedamos um sistema de classificação de textos dentro de tal servidor. No entanto, o Google App Engine cobra pelo serviço que ultrapassa a quantidade de quota livre (renovável diariamente), então, quanto menor a complexidade do processamento do sistema, menor o custo financeiro da aplicação. Foi feita uma otimização no sistema de armazenamento dos classificadores, aproveitando as características das bases de dados textuais. Houve uma redução do custo computacional do sistema e, em consequência, para a demanda atual de requisições CNAE o custo financeiro anual seria de 2000 dólares americanos. Este é um valor irrisório se comparado aos custos de infra-estrutura, manutenção e energia necessários para realizar um serviço semelhante ao de um servidor Web tradicional / In problems in automatic text classification with a large number of labels, training databases are large, therefore the classification time can become prohibitive for online rating systems. Thus, our motivation for this work came from the need of the Federal Government to implement a Cadastro Sincronizado Nacional (CSN) of companies, where the Classificação Nacional de Atividades Econômicas (CNAE) would compose the system. In this classification task one or more CNAE-Subclasses codes are associated to the description of the economic activities of companies. It is worth noticing that in 2009, the task of assigning codes or revise the CNAE was done in the country about 2 million times. This way, we investigated the use ofWeb servers based on Cloud Computing on its scalability and low cost of development and operation. Due to the ease of use and free quotas, the Cloud Computing server chosen for this application development was Google App Engine. Thus, we designed, implemented and hosted a system of classification of such texts on the server. However, Google App Engine service charges for exceeding the amount of free quota (renewable every day), whereas the lower the complexity of the processing system, the lower the financial cost of implementation. Aiming this, an optimization was performed on the storage system of classifiers, taking advantage of the features of the text base. We successfully reduced the computational cost of the system and, in consequence, it was estimated that for the current demand of requests the CNAE annual financial cost would be $ 2,000. This is a small amount when it is compared to the cost of infrastructure, maintenance and power that would take to perform a similar service to a traditional Web server Recuperação da informação Aprendizado do computador Mineração de dados (computação) Computação em Nuvem
68	Avaliação da aprendizagem: uma abordagem qualitativa baseada em mapas conceituais, ontologias e algoritmos genéticos ROCHA, Francisco Edson Lopes da 18 May 2007 (has links) Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-09T14:54:57Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoAprendizagemAbordagem.pdf: 2517984 bytes, checksum: 26cdc303b304bae9cf0c1ed59a31b85e (MD5) / Rejected by Edisangela Bastos (edisangela@ufpa.br), reason: on 2016-12-15T11:50:54Z (GMT) / Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-15T13:07:36Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoAprendizagemAbordagem.pdf: 2517984 bytes, checksum: 26cdc303b304bae9cf0c1ed59a31b85e (MD5) / Rejected by Edisangela Bastos (edisangela@ufpa.br), reason: on 2016-12-15T13:59:53Z (GMT) / Submitted by camilla martins (camillasmmartins@gmail.com) on 2016-12-15T14:19:21Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoAprendizagemAbordagem.pdf: 2517984 bytes, checksum: 26cdc303b304bae9cf0c1ed59a31b85e (MD5) / Approved for entry into archive by Edisangela Bastos (edisangela@ufpa.br) on 2016-12-15T16:38:08Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoAprendizagemAbordagem.pdf: 2517984 bytes, checksum: 26cdc303b304bae9cf0c1ed59a31b85e (MD5) / Made available in DSpace on 2016-12-15T16:38:08Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Tese_AvaliacaoAprendizagemAbordagem.pdf: 2517984 bytes, checksum: 26cdc303b304bae9cf0c1ed59a31b85e (MD5) Previous issue date: 2007-05-18 / Nas últimas duas décadas, o crescimento nas áreas de Redes de Computadores e Inteligência Artificial - IA - favoreceu o avanço da pesquisa em outras áreas de conhecimento, entre elas a Educação. Nesta área, novas descobertas deslocaram as pesquisas das antigas teorias educacionais comportamentalistas para o construtivismo, levando a um melhor entendimento de como acontece a aprendizagem. Aprendizagem Significativa - AS - é uma das teorias construtivista em grande evidência atualmente e Mapa Conceitual - MC - é a sua ferramenta cognitiva principal. Adicionalmente, o amadurecimento da pesquisa da modalidade de Educação a Distância - EAD - permitiu aplicar o processo educacional em larga escala. Nesta tese investiga-se a avaliação automática inteligente da aprendizagem mediada por mapas conceituais. Trata-se de uma abordagem qualitativa, denominada de avaliação formativa, que está em conformidade com o modelo de Bloom, uma referência para os processos educacionais - ensino, aprendizagem e avaliação da aprendizagem. A proposta apresentada pretende ser uma alternativa de solução para uma importante questão na área da Educação: Como avaliar qualitativamente a aprendizagem respeitando os processos cognitivos idiossincráticos de cada estudante? A integração de mapas conceituais, ontologias de domínio e algoritmos genéticos possibilita um avanço no estado da arte de avaliação e acompanhamento automático da aprendizagem. Quebra-se o paradigma das avaliações apenas quantitativas, apresentando uma nova abordagem de acompanhamento gradual e contínuo das atividades do estudante. Nesta abordagem pode-se fazer o acompanhamento individual, respeitando a forma idiossincrática de aprender, e/ou de grupo de estudantes, sendo possível agrupá-los por características cognitivas específicas ou por grau de desenvolvimento. Esta tese inicia uma nova linha de pesquisa que pode ser sintetizada como “Avaliação automática qualitativa da aprendizagem centrada em Mapas Conceituais, fundamentada com técnicas de IA: ontologias e algoritmos genéticos”. Dentro dessa nova linha de pesquisa, a tese traz as seguintes contribuições: ² um protótipo de um ambiente para ensino, aprendizagem e avaliação da aprendizagem, fundamentado na Aprendizagem Significativa, incluindo um editor de mapas conceituais, um editor de ontologias e um módulo avaliador; ² uma proposta de uso de algoritmos genéticos e ontologias para avaliação/acompanhamento qualitativo da aprendizagem, permitindo: – acompanhamento individual passo a passo; – acompanhamento de grupos de estudantes; – comparações entre estudantes. As ontologias de domínio são geradas pelo professor usando um editor de ontologias que é disponibilizado no ambiente. Elas contêm o conhecimento estrutural que deve ser aprendido pelos estudantes antes que estes possam dominar outras formas de conhecimento. O algoritmo genético foi projetado para funcionar em dois modos distintos: i) gerando múltiplos MCs para comparar com o MC do estudante, permitindo uma avaliação da aprendizagem em qualquer estágio do andamento do curso; esta avaliação é relativa, centrada num determinado número de conceitos que representa uma estrutura parcial do domínio de conhecimento sendo estudado; e ii) gerando um MC ótimo de acordo com a ontologia gerada pelo professor para permitir uma avaliação completa da aprendizagem do domínio de conhecimento que foi estudado. O modelo proposto foi avaliado pela implementação de protótipos para a ferrramenta de avaliação. O algoritmo genético desenvolvido usa como espaço de busca as ontologias. Ele imita os processos cognitivos característicos da aprendizagem significativa e constrói MCs que possam ser comparados semanticamente com o do estudante. Sua função de adaptação representa uma forma medir distâncias no campo cognitivo, sendo a escala de medida dada por uma taxonomia que organiza dimensões semânticas e, dentro destas, frases de ligação. Esta taxonomia é usada pelo professor ao construir as ontologias e pelos estudantes ao construírem seus mapas conceituais. Os principais desafios que envolveram o desenvolvimento da pesquisa relatada nesta tese foram os seguintes: 1) determinação de um modelo adequado de ontologia de domínio que pudesse ser aplicado à avaliação da aprendizagem; 2) determinação de um método e uma escala de medida que se aplicasse ao domínio cognitivo; e 3) determinação de um mecanismo de busca na ontologia que fosse coerente com as teorias construtivistas da avaliação da aprendizagem. A pesquisa relatada neste trabalho pode avançar em função de novas funcionalidades ou de melhorias nas funcionalidades já implementadas. Algumas possibilidades foram sugeridas ao final da tese, sendo uma das principais a disponibilização do ambiente na Internet. Esta tese gerou 7 (sete) contribuições científicas, 1 (uma) em revista qualis A, 1 (uma) em revista qualis B, 2 (duas) em congressos internacionais e 3 (três) em congressos nacionais. Os resultados obtidos fazem avançar significativamente o que já foi conseguido até então no grupo de pesquisa AmAm/UFPA, em cujo contexto esta tese está inserida. / In the last two decades, the development of areas such as Computer Networks and Artificial Intelligence (AI) has favored the growth of other areas of knowledge, like Education. In this area, new discoveries have changed the focus of research from old behaviorist educational theories to constructivism, leading to a better understanding of how learning occurs. Meaningful Learning (ML) is a constructivist theory in evidence nowadays and the Concept Map (CM) is its main cognitive tool. Additionally, the recent developments on Distance Learning (DL) have made it possible to apply the educational process in a larger scale. In this thesis, automatic learning assessment mediated by concept maps is investigated. This is related to a qualitative approach, named as formative assessment, which is compliant with Bloom’s model, a reference for educational processes - teaching, learning, and learning assessment. The proposal presented in this thesis is seen as an alternative solution to an important issue in the area of Education: how to evaluate learning qualitatively, respecting each student’s cognitive processes? The integration of concept maps, domain ontologies, and genetic algorithms allows for advances in automatic learning assessment and assistance. The paradigm of mere quantitative assessment is broken, and a new approach to gradual and continuous assistance in learning is presented. Following this approach, it is possible to accompany students individually, respecting their idiosyncratic ways of learning, and also to group students based on specific cognitive characteristics or development degrees. This thesis begins a new research area, which can be synthesized as "Automatic qualitative assessment of learning centered in Concept Maps, based on AI techniques: ontologies and genetic algorithms". In this new research area, the thesis originated the following contributions: ² a prototype of an environment designed to aid teaching, learning, and learning assessment, founded upon Meaningful Learning, encompassing a concept map editor, an ontology editor, and an assessment module; ² A proposal concerning the use of genetic algorithms and ontologies in qualitative assessment/ assistance of learning, allowing for: – step-by-step individual assistance; – assistance to groups of students; – comparisons among students. Domain ontologies are generated by the teacher, who uses an ontology editor provided by the environment. They comprise the structural knowledge that must be learned by students before they can manage other forms of knowledge. The genetic algorithm was designed to run in two distinct modes: i) generating multiple CMs to compare with the student’s CM, allowing for learning assessment at any moment of the course; this assessment is relative, centered in a determined number of concepts which represent a partial structure of knowledge domain being studied.; and ii) generating an optimal CM according to the ontology created by the teacher, to permit a complete assessment of the learning of the knowledge domain which was studied. The proposed model was evaluated by the implementation of prototypes for the assessment tool. The genetic algorithm developed uses the ontologies as its search spaces. It emulates meaningful learning cognitive processes, and constructs CMs that can be semantically compared to that of the student. Its fitness function represents a way of measuring distances in the cognitive field, being the measurement unit given by a taxonomy that organizes semantic dimensions and, inside these, linking phrases. This taxonomy is used by teachers when they construct their ontologies, and by students when they construct their concept maps. The main challenges faced in the development of the research reported in this thesis were: 1) definition of a domain ontology model that could be applied to learning assessment; 2) definition of a method and a scale that could be applied to the cognitive domain; and 3) definition of a search mechanism in the ontology in accordance with constructivist theories of learning assessment. The research described in this thesis can be further developed with new functionalities or improvements in functionalities already implemented. Some possibilities are suggested in the end of the thesis, the main of which being the deployment of the environment in the Internet. This thesis has generated 7 (seven) scientific contributions, 1 (one) in a qualis A magazine, 1 (one) in a qualis B magazine, 2 (two) in international congresses, and 3(three) in national congresses. The results of this research advance what has already been attained by the AmAm/UFPA research group, in whose context this thesis is inserted. CNPQ::ENGENHARIA ELETRICA Informática na educação Aprendizagem significativa Avaliação automática da aprendizagem Mapas conceituais Ontologias de domínio Algoritmos genéticos Aprendizagem cognitiva Aprendizado do computador Ensino auxiliado por computador
69	TubeSpam: Filtragem Automática de Comentários Indesejados Postados no YouTube / TubeSpam: automatic undesired comments filtering on YouTube Alberto, Túlio Casagrande 03 February 2017 (has links) Submitted by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:06:58Z No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:07:11Z (GMT) No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Approved for entry into archive by Milena Rubi (milenarubi@ufscar.br) on 2017-10-03T19:07:27Z (GMT) No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) / Made available in DSpace on 2017-10-03T19:07:37Z (GMT). No. of bitstreams: 1 ALBERTO_Tulio_2017.pdf: 2422402 bytes, checksum: 127bff2089f3d274b1abaa58c3d32578 (MD5) Previous issue date: 2017-02-03 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / YouTube has become an important video sharing platform. Several users regularly produce video content and make this task their main livelihood. However, such success is also drawing the attention of malicious users propagating undesired comments and videos, looking for self-promotion or disseminating malicious links which may have malwares and viruses. Since YouTube offers limited tools for blocking spam, the volume of such messages is shockingly increasing and harming users and channels owners. In addition to the problem being naturally online, comment spam filtering on YouTube is different than the traditional email spam filtering, since the messages are very short and often rife with spelling errors, slangs, symbols and abbreviations. This manuscript presents a performance evaluation of traditional online classification methods, aided by lexical normalization and semantic indexing techniques when applied to automatic filter YouTube comment spam. It was also evaluated the performance of MDLText, a promising text classification method based on the minimum description length principle. The statistical analysis of the results indicates that MDLText, Passive-Aggressive, Naïve Bayes, MDL and Online Gradient Descent obtained statistically equivalent performances. The results also indicate that the lexical normalization and semantic indexing techniques are effective to be applied to the problem. Based on the results, it is proposed and designed TubeSpam, an online tool to automatic filter undesired comments posted on YouTube. / O YouTube tem se tornado uma importante plataforma de compartilhamento de vídeos. Muitos usuários produzem regularmente conteúdo em vídeo e fazem desta tarefa seu principal meio de vida. Contudo, esse sucesso também vem despertando a atenção de usuários mal-intencionados, que propagam comentários e vídeos indesejados para se autopromoverem ou para disseminar links maliciosos que podem conter vírus e malwares. Visto que o YouTube atualmente oferece recursos limitados para bloquear spam, o volume dessas mensagens está impactando muitos usuários e proprietários de canais. Além da característica inerentemente online do problema, filtrar spam nos comentários do YouTube é uma tarefa que difere-se da tradicional filtragem de spam em emails, pois as mensagens costumam ser muito mais curtas e repletas de erros de digitação, gírias, símbolos e abreviações que podem dificultar a tarefa de classificação. Assim, nesta dissertação é apresentada a avaliação de desempenho obtido por métodos tradicionais de classificação online auxiliados por técnicas de normalização léxica e indexação semântica, quando aplicados na filtragem automática de comentários indesejados postados no YouTube. Foi avaliado também o desempenho do MDLText, um promissor método de classificação de texto baseado no princípio da descrição mais simples. A análise estatística dos resultados indica que os métodos MDLText, Passivo-Agressivo, Naïve Bayes, MDL e Gradiente Descendente Online obtiveram desempenhos equivalentes. Além disso, os resultados também indicam que o uso de técnicas de normalização léxica e indexação semântica são eficazes para atenuar os problemas de representação de texto e, consequentemente, aumentar o poder de predição dos métodos de classificação. Baseado nos resultados dos experimentos, foi proposto e desenvolvido o TubeSpam, uma ferramenta online para filtrar automaticamente comentários indesejados postados no YouTube. Youtube (Recurso eletrônico) Aprendizado do computador Spam (Mensagens eletrônicas) Youtube (Recurso eletrônico) Comentários indesejados Spam (Electronic mail) Machine learning Undesired comments
70	[en] COMPUTATIONAL INTELLIGENCE APLPLIED IN THE FIELD OF MACHINE LEARNING / [pt] INTELIGÊNCIA COMPUTACIONAL APLICADA EM MACHINE LEARNING IVO LIMA BRASIL JUNIOR 18 October 2005 (has links) [pt] Esta dìssertação investiga o emprego e o desempenho da Inteligência Computacional em Machine Learning. De modo particular, pesquisou-se a aplicação dos mecanismos e estruturas na biologia e natureza, presentes nas técnica inteligentes (Redes Neurais, Algoritmos Genéticos e Lógica Nebulosa) na construção de algoritmos que codificam mecanismos indutivos em Machine Learning. O trabalho foi desenvolvido em 4 etapas principais: um estudo bibliográfico da área de Machine Learning e modelagem e desenvolvimento de três sistemas demonstrativos da aplicação de Inteligência Computacional em Machine Learning: Redes Neurais TD(gama) no aprendizado do jogo de Gamão, Algoritmos Genéticos na evolução do controle de um robô autônomo, e Lógica Nebulosa para controle de robôs. O estudo bibliográfico envolveu a busca, tendo como principal veículo inicial a Internet, de literatura referente às áreas de Machine Learning e de Inteligência Computacional. Foram pesquisados livros especializados da área, e também artigos técnicos envolvendo os temas abordados nesta dissertação. Este levantamento bibliográfico resultou no resumo dos principais projetos na área de Machine Learning, apresentado no capítulo 2. A modelagem de um sistema de aprendizado do jogo de gamão por Redes Neurais envolveu o estudo e implementação de um método de Reinforcement Learning denominado TD(gama), que opera através do princípio de tentativa e erro, recompensado ações que trazem um bom resultado. O jogo de Gamão foi escolhido pelo seu vastíssimo número de prováveis situações a serem encontradas durante o jogo, consequência do fator estocástico (dados) inerente ao jogo, tornando uma abordagem tradicional muito difícil e até mesmo ineficiente. A evolução do controle de robôs por Algoritmos Genéticos, é inspirada na evolução de um padrão de comportamento exemplificada no capítulo 2 pelo dilema dos prisioneiros. Através da codificação em um cromossoma das variáveis que descrevem o ambiente onde o robô está inserido, foi possível evoluir um padrão de atuação diante da situação presente a cada instante, de forma a atingir um objetivo especificado de forma ótima, ou sub-ótima. O controle de robôs por Lógica Nebulosa demonstra o potencial desta técnica para problemas de controle, codificando através de regras imprecisas que assemelham-se à forma humana de armazenar e transmitir conhecimento, o comportamento que o robô deve ter frente a cada situação encontrada em seu ambiente. Os resultados apresentados demonstram o potencial de utilização das técnicas da Inteligência Computacional, inspiradas na biologia e na natureza, na área de Machine Learning, mostrando através dos exemplos implementados a capacidade de aquisição de conhecimento por experiência, através de mecanismos indutivos, ao invés de codificar explicitamente soluções específicas para os problemas apresentados. / [en] This work investigates the application and performance of the Computational intelligence technics in the field of Machine Learning. In particular, was investigated the application of intelligent systems (Neural Networks, genetic Algorithms and fuzzy Logic) in the development of algorithms that codify inductive mechanisms in Machine Learning. This work was developed in two main steps: a research of Machine Learning bibliography, and the development of three intelligent systems: neural Networks applied to the game of backgammon, Genetic Algorithms in the evolution of an autonomous robot control system, and fuzzy Logic applied to robot control. The bibliography research involved looking for technical literature about Machine Learning and Computational Intelligence. Were used in this research books specialized in the area, and technical papers about the themes treated in this dissertation. The modeling of the backgammon learning algorithm, based on Neural Networks, was implemented using a reinforcement learning method known as TD(l), which operate by the principle of trial and error, giving a reward for actions that brings a good result. The game of backgammon was chosen because of its huge number of possible situations that can be faced during the game, due to estocastic factor (dice) attached to the game, making a traditional approach very difficult, if not even inefficient. The evolution of the autonomous robot control system using Genetic Algorithms is inspired in the evolution of a behavior pattern of behavior to deal with the faced at each moment, in order to achieve a goal in an optimal or sub-optimal way. The robot control system using Fuzzy Logic demonstrates the potential of this technic to control problems, codifying through fuzzy rules, which are similar to the human way to in its environment. The results presented demonstrate the potential of the Computational Intelligence technics, inspired in biology and nature, in the field of Machine Learning, showing through the examples implemented the knowledge acquisition capacity by experience, using inductive mechanisms instead of programming specific solutions for the problems presented [pt] REDES NEURAIS [en] NEURAL NETWORKS [pt] ALGORITMO GENETICO [en] GENETIC ALGORITHM [pt] LOGICA FUZZY [en] FUZZY LOGIC [pt] APRENDIZADO DE COMPUTADOR [en] LEARNING FOR COMPUTER

Search results