Global ETD Search

71	Uma avaliação do uso de máquinas de vetores de suporte na predição de sinais de rádio frequência em redes celulares Timoteo, Robson Dias Alves 14 November 2014 (has links) Submitted by Natalia de Souza Gonçalves (natalia.goncalves@ufpe.br) on 2015-05-08T14:39:08Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) MestradoRobson_versao_posbanca_v8.pdf: 2916922 bytes, checksum: 69519207e681c79847392599f7417664 (MD5) / Made available in DSpace on 2015-05-08T14:39:08Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) MestradoRobson_versao_posbanca_v8.pdf: 2916922 bytes, checksum: 69519207e681c79847392599f7417664 (MD5) Previous issue date: 2014-11-14 / Nos últimos anos, o tráfego de dados nas redes celulares tem crescido exponencialmente devido ao aumento do número de dispositivos móveis. Neste cenário, os modelos de predição de sinais de rádio frequência podem ser utilizados na otimização da rede e na criação de novos serviços. Os modelos de predição mais utilizados são os modelos do tipo empírico, tais como o Okumura-Hata, Ericsson 9999, COST-231 e ECC-33. No entanto, esses modelos não apresentam bons resultados quando aplicados a ambientes urbanos. Neste trabalho, é proposto um método de predição de sinais de rádio frequência utilizando máquinas de vetores de suporte. Na implementação da máquina de vetor de suporte, os kernels Laplaciano, Gaussiano e Polinomial foram testados. Todas as implementações tiveram desempenho superior aos modelos empíricos tradicionais. Por último, a melhor configuração, obtida com o kernel Laplaciano, foi selecionada e aplicada no contexto de geolocalização de terminais móveis em redes celulares. Os resultados obtidos indicaram um erro médio de localização em torno de uma ordem de grandeza menor do que o erro obtido por meio de técnicas de trilateração de potência. Redes sem fio Modelos de Propagação Aprendizagem de Máquina Máquina de vetor de suporte Regressão com vetor de suporte Regressão não linear
72	Detecção de módulos de software propensos a falhas através de técnicas de aprendizagem de máquina BEZERRA, Miguel Eugênio Ramalho 31 January 2008 (has links) Made available in DSpace on 2014-06-12T15:52:09Z (GMT). No. of bitstreams: 1 license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2008 / O sucesso de um software depende diretamente de sua qualidade. Tradicionalmente, métodos formais e de inspeção manual de código são usados para assegurá-la. Tais métodos, geralmente, possuem um custo elevado e demandam bastante tempo. Dessa forma, as atividades de teste devem ser planejadas cuidadosamente para evitar o desperdício de recursos. Atualmente, as organizações estão buscando maneiras rápidas e baratas de detectar defeitos em softwares. Porém, mesmo com todos os avanços dos últimos anos, o desenvolvimento de software ainda é uma atividade que depende intensivamente do esforço e do conhecimento humano. Muitos pesquisadores e organizações estão interessados em criar um mecanismo capaz de prever automaticamente defeitos em softwares. Nos últimos anos, técnicas de aprendizagem de máquina vêm sendo utilizadas em diversas pesquisas com esse objetivo. Este trabalho investiga e apresenta um estudo da viabilidade da aplicação de métodos de aprendizagem de máquina na detecção de módulos de software propensos a falhas. Classificadores como redes neurais artificiais e técnicas de aprendizagem baseada em instâncias (instance-based learning) serão usadas nessa tarefa, tendo como fonte de informação as métricas de software retiradas do repositório do Metrics Data Program (MDP) da NASA. Também será apresentado um conjunto de melhorias, propostas durante este trabalho, para alguns desses classificadores. Como a detecção de módulos defeituosos é um problema sensível a custo, este trabalho também propõe um mecanismo capaz de medir analiticamente o custo de cada decisão tomada pelos classificadores Aprendizagem de máquina Instance based learning Redes neurais Avaliação de custos de testes Métricas de software MDP NASA
73	Deteção de Spam baseada na evolução das características com presença de Concept Drift Henke, Márcia 30 March 2015 (has links) Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-11-12T20:17:58Z No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-11-16T18:36:36Z (GMT) No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-11-16T18:43:03Z (GMT) No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) / Made available in DSpace on 2015-11-16T18:43:03Z (GMT). No. of bitstreams: 1 Tese - Márcia Henke.pdf: 2984974 bytes, checksum: a103355c1a7895956d40d4fa9422347a (MD5) Previous issue date: 2015-03-30 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Electronic messages (emails) are still considered the most significant tools in business and personal applications due to their low cost and easy access. However, e-mails have become a major problem owing to the high amount of junk mail, named spam, which fill the e-mail boxes of users. Among the many problems caused by spam messages, we may highlight the fact that it is currently the main vector for the spread of malicious activities such as viruses, worms, trojans, phishing, botnets, among others. Such activities allow the attacker to have illegal access to penetrating data, trade secrets or to invade the privacy of the sufferers to get some advantage. Several approaches have been proposed to prevent sending unsolicited e-mail messages, such as filters implemented in e-mail servers, spam message classification mechanisms for users to define when particular issue or author is a source of spread of spam and even filters implemented in network electronics. In general, e-mail filter approaches are based on analysis of message content to determine whether or not a message is spam. A major problem with this approach is spam detection in the presence of concept drift. The literature defines concept drift as changes occurring in the concept of data over time, as the change in the features that describe an attack or occurrence of new features. Numerous Intrusion Detection Systems (IDS) use machine learning techniques to monitor the classification error rate in order to detect change. However, when detection occurs, some damage has been caused to the system, a fact that requires updating the classification process and the system operator intervention. To overcome the problems mentioned above, this work proposes a new changing detection method, named Method oriented to the Analysis of the Development of Attacks Characteristics (MECA). The proposed method consists of three steps: 1) classification model training; 2) concept drift detection; and 3) transfer learning. The first step generates classification models as it is commonly conducted in machine learning. The second step introduces two new strategies to avoid concept drift: HFS (Historical-based Features Selection) that analyzes the evolution of the features based on over time historical; and SFS (Similarity-based Features Selection) that analyzes the evolution of the features from the level of similarity obtained between the features vectors of the source and target domains. Finally, the third step focuses on the following questions: what, how and when to transfer acquired knowledge. The answer to the first question is provided by the concept drift detection strategies that identify the new features and store them to be transferred. To answer the second question, the feature representation transfer approach is employed. Finally, the transfer of new knowledge is executed as soon as changes that compromise the classification task performance are identified. The proposed method was developed and validated using two public databases, being one of the datasets built along this thesis. The results of the experiments shown that it is possible to infer a threshold to detect changes in order to ensure the classification model is updated through knowledge transfer. In addition, MECA architecture is able to perform the classification task, as well as the concept drift detection, as two parallel and independent tasks. Finally, MECA uses SVM machine learning algorithm (Support Vector Machines), which is less adherent to the training samples. The results obtained with MECA showed that it is possible to detect changes through feature evolution monitoring before a significant degradation in classification models is achieved. / As mensagens eletrônicas (e-mails) ainda são consideradas as ferramentas de maior prestígio no meio empresarial e pessoal, pois apresentam baixo custo e facilidade de acesso. Por outro lado, os e-mails tornaram-se um grande problema devido à elevada quantidade de mensagens não desejadas, denominadas spam, que lotam as caixas de emails dos usuários. Dentre os diversos problemas causados pelas mensagens spam, destaca-se o fato de ser atualmente o principal vetor de propagação de atividades maliciosas como vírus, worms, cavalos de Tróia, phishing, botnets, dentre outros. Tais atividades permitem ao atacante acesso indevido a dados sigilosos, segredos de negócios ou mesmo invadir a privacidade das vítimas para obter alguma vantagem. Diversas abordagens, comerciais e acadêmicas, têm sido propostas para impedir o envio de mensagens de e-mails indesejados como filtros implementados nos servidores de e-mail, mecanismos de classificação de mensagens de spam para que os usuários definam quando determinado assunto ou autor é fonte de propagação de spam e até mesmo filtros implementados em componentes eletrônicos de rede. Em geral, as abordagens de filtros de e-mail são baseadas na análise do conteúdo das mensagens para determinar se tal mensagem é ou não um spam. Um dos maiores problemas com essa abordagem é a deteção de spam na presença de concept drift. A literatura conceitua concept drift como mudanças que ocorrem no conceito dos dados ao longo do tempo como a alteração das características que descrevem um ataque ou ocorrência de novas características. Muitos Sistemas de Deteção de Intrusão (IDS) usam técnicas de aprendizagem de máquina para monitorar a taxa de erro de classificação no intuito de detetar mudança. Entretanto, quando a deteção ocorre, algum dano já foi causado ao sistema, fato que requer atualização do processo de classificação e a intervenção do operador do sistema. Com o objetivo de minimizar os problemas mencionados acima, esta tese propõe um método de deteção de mudança, denominado Método orientado à Análise da Evolução das Características de Ataques (MECA). O método proposto é composto por três etapas: 1) treino do modelo de classificação; 2) deteção de mudança; e 3) transferência do aprendizado. A primeira etapa emprega modelos de classificação comumente adotados em qualquer método que utiliza aprendizagem de máquina. A segunda etapa apresenta duas novas estratégias para contornar concept drift: HFS (Historical-based Features Selection) que analisa a evolução das características com base no histórico ao longo do tempo; e SFS (Similarity based Features Selection) que observa a evolução das características a partir do nível de similaridade obtido entre os vetores de características dos domínios fonte e alvo. Por fim, a terceira etapa concentra seu objetivo nas seguintes questões: o que, como e quando transferir conhecimento adquirido. A resposta à primeira questão é fornecida pelas estratégias de deteção de mudança, que identificam as novas características e as armazenam para que sejam transferidas. Para responder a segunda questão, a abordagem de transferência de representação de características é adotada. Finalmente, a transferência do novo conhecimento é realizada tão logo mudanças que comprometam o desempenho da tarefa de classificação sejam identificadas. O método MECA foi desenvolvido e validado usando duas bases de dados públicas, sendo que uma das bases foi construída ao longo desta tese. Os resultados dos experimentos indicaram que é possível inferir um limiar para detetar mudanças a fim de garantir o modelo de classificação sempre atualizado por meio da transferência de conhecimento. Além disso, um diferencial apresentado no método MECA é a possibilidade de executar a tarefa de classificação em paralelo com a deteção de mudança, sendo as duas tarefas independentes. Por fim, o MECA utiliza o algoritmo de aprendizagem de máquina SVM (Support Vector Machines), que é menos aderente às amostras de treinamento. Os resultados obtidos com o MECA mostraram que é possível detetar mudanças por meio da evolução das características antes de ocorrer uma degradação significativa no modelo de classificação utilizado. Aprendizagem de máquina Deteção de spam Transferência de aprendizado Concept drift Machine learning Intrusion detection Transfer learning
74	Aprendendo a segmentar páginas web Daoud, Caio Moura 28 March 2013 (has links) Made available in DSpace on 2015-04-11T14:02:58Z (GMT). No. of bitstreams: 1 Caio Moura Daoud.pdf: 3197574 bytes, checksum: 0c7b4dcb04bf82e38f2ef4c47bd0b3ea (MD5) Previous issue date: 2013-03-28 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Unlike traditional documents, Web pages are composed of different segments or blocks, each block has specific functions in each page. Recent work in the literature has shown that information on these segments may be useful to improve the results of numerous tasks in information retrieval and data mining areas. For this reason, there are many scientific works proposing different methods for Web pages segmentation. Generally speaking, the targeting methods found in the literature only use evidences of the page to be segmented. However, based on the observation that the pages of a site tend to have very similar layouts, we present a strategy based on machine learning that explores overall evidences of Web sites. Our method, which adopts Support Vector Machines for the learning process, and use the SOM structure (Site Object Model) to aggregate information from all pages of aWeb site, achieved good results when compared a manual segmentation approach, and with a recent approach in the literature. / Diferente dos documentos tradicionais, as páginasWeb são compostas por diferentes segmentos ou blocos, cada qual desempenhando uma função específica dentro de cada página. Trabalhos recentes da literatura têm demonstrado que informações sobre esses segmentos podem ser úteis para melhorar os resultados de inúmeras tarefas das áreas de recuperação de informação e mineração de dados. Por esse motivo, existem muitos trabalhos científicos propondo diferentes métodos de segmentação de páginas Web. De uma forma geral, os métodos de segmentação encontrados na literatura utilizam apenas evidências da própria página a ser segmentada. No entanto, partindo da observação de que as páginas de um mesmo site tendem a possuir layouts bastante similares, apresentamos neste trabalho uma abordagem baseada em aprendizagem de máquina que explora evidências globais dos Web sites. Nosso método, que adota Support Vector Machines para o processo de aprendizagem, e usa a estrutura SOM (Site Object Model) para agregar informações de todas as páginas de um mesmo Web site, apresentou bons resultados quando comparado com uma abordagem de segmentação manual, e quando comparado com uma recente abordagem da literatura. Segmentação de páginas Web Aprendizagem de máquina Árvore SOM Web pages segmentation Machine learning SOMtree
75	Processamento de informação em redes neurais sensoriais / Information processing in sensory neural networks Mosqueiro, Thiago Schiavo 26 August 2015 (has links) Com os avanços em eletrônica analógica e digital dos últimos 50 anos, a neurociência ganhou grande momentum e nasceu uma de suas áreas que atualmente mais recebe financiamento: neurociência computacional. Estudos nessa área, ainda considerada recente, vão desde estudos moleculares de trocas iônicas por canais iônicos (escala nanométrica), até influências de populações neurais no comportamento de grandes mamíferos (escala de até metros). O coração da neurociência computacional compreende técnicas inter- e multidisciplinares, envolvendo biologia de sistemas, bioquímica, modelagem matemática, estatística, termodinâmica, física estatística, etc. O impacto em áreas de grande interesse, como o desenvolvimento de fármacos e dispositivos militares, é a grande força motriz desta área. Especificamente para este último, a compreensão do código neural e como informação sensorial é trabalhada por populações de neurônios é essencial. E ainda estamos num estágio muito inicial de desvendar todo o funcionamento de muitos dos sistemas sensoriais mais complexos. Um exemplo é de um dos sentidos que parece existir desde as formas mais primitivas de vida: o olfato. Em mamíferos, o número de estudos parece sempre crescer com os anos. Ainda estamos, no entanto, longe de um consenso sobre o funcionamento de muitos dos mecanismos básicos do olfato. A literatura é extensa em termos bioquímicos e comportamental, mas reunir tudo em um único modelo é talvez o grande desafio atual. Nesta tese discuto, em duas partes, sistemas sensoriais seguindo uma linha bastante ligada ao sistema olfativo. Na primeira parte, um modelo formal que lembra o bulbo olfativo (de mamíferos) é considerado para investigar a relação entre a performance da codificação neural e a existência de uma dinâmica crítica. Em especial, discuto sobre últimos experimentos baseados em observações de leis de potência como evidências da existência de criticalidade e ótima performance em populações neurais. Mostro que, apesar de a performance das redes estar, sim, ligada ao ponto crítico do sistema, a existência de leis de potência não está ligada nem com tal ponto crítico, nem com a ótima performance. Experimentos recentes confirmam estas observações. Na segunda parte, discuto e proponho uma modelagem inicial para o órgão central do sentido olfativo em insetos: o Corpo Cogumelar. A novidade deste modelo está na integração temporal, além de conseguir tanto fazer reconhecimento de padrões (qual odor) e estimativa de concentrações de odores. Com este modelo, proponho uma explicação para uma recente observação de antecipação neural no Corpo Cogumelar, em que sua última camada paradoxalmente parece antecipar a primeira camada. Proponho a existência de um balanço entre agilidade do código neural contra acurácia no reconhecimento de padrões. Este balanço pode ser empiricamente testado. Também proponho a existência de um controle de ganho no Corpo Cogumelar que seria responsável pela manutenção dos ingredientes principais para reconhecimento de padrões e aprendizado. Ambas estas partes contribuem para o compreendimento de como sistemas sensoriais operam e quais os mecanismos fundamentais que os fornecem performance invejável. / With the advances in digital and analogical electronics in the last 50 years, neuroscience gained great momentum and one of its most well-financed sub-areas was born: computational neuroscience. Studies in this area, still considered recent by many, range from the ionic balance in the molecular level (scale of few nanometers), up to how neural populations influence behavior of large mammalians (scale of meters). The computational neuroscience core is highly based on inter- and multi-disciplinary techniques, involving systems biology, biochemistry, mathematical modeling, thermodynamics, statistical physics, etc. The impact in areas of current great interest, like in pharmaceutical drugs development and military devices, is its major flagship. Specifically for the later, deep understanding of neural code and how sensory information is filtered by neural populations is essential. And we are still grasping at the surface of really understanding many of the complex sensory systems we know. An example of such sensory modality that coexisted among all kinds of life forms is olfaction. In mammalians, the number of studies in this area seems to be growing steadily. However, we are still far from a complete agreement on how the basic mechanisms in olfaction work. There is a large literature of biochemical and behavioral studies, yet there is not a single model that comprises all this information and reproduces any olfactory system completely. In this thesis, I discuss in two parts sensory systems following a general line of argument based on olfaction. In the first part, a formal model that resembles the olfactory bulb (mammalians) is considered to investigate the relationship between performance in information coding and the existence of a critical dynamics. I show that, while the performance of neural networks may be intrinsically linked to a critical point, power laws are not exactly linked to neither critical points or performance optimization. Recent experiments corroborate this observation. In the second part, I discuss and propose a first dynamical model to the central organ responsible for olfactory learning in insects: the Mushroom Bodies. The novelty in this model is in the time integration, besides being able of pattern recognition (which odor) and concentration estimation at the same time. With this model, I propose an explanation for a seemingly paradoxical observation of coding anticipation in the Mushroom Bodies, where the last neural layer seems to trail the input layer. I propose the existence of a balance between accuracy and speed of pattern recognition in the Mushroom Bodies based on its fundamental morphological structure. I also propose the existence of a robust gain-control structure that sustain the key ingredients for pattern recognition and learning. This balance can be empirically tested. Both parts contribute to the understanding of the basic mechanisms behind sensory systems. Aprendizagem de máquina Computational neuroscience Critical phenomena Fenômenos críticos Leis de potência Machine learning Neurociência computacional Olfaction in insects Olfato em insetos Power laws
76	Inteligência artificial aplicada ao auxilio no diagnóstico da dor pélvica crônica / Artificial intelligence applied to aid in the diagnosis of chronic pelvic pain Oliverio, Vinícius 18 April 2018 (has links) A dor pélvica crônica (DPC) é uma condição clínica comum, inclusive no Brasil. Estudos do nosso núcleo de pesquisa evidenciam uma prevalência em torno de 11%. Ela é, dentre outros agravos, causa recorrente de procura a serviços de saúde, falta ao trabalho e baixa produtividade. Com a inserção definitiva da mulher no mercado de trabalho a doença tem impactado negativamente no desempenho econômico desse grupo, afetando diretamente a atividade econômica domiciliar. Todavia, o diagnóstico da causa desta condição clínica não é trivial e erros podem ocorrer devido à falta de conhecimento sobre o assunto, portanto, a criação de um sistema que possa auxiliar no diagnóstico e na identificação das causas desta condição clínica é de grande importância para que os erros de diagnósticos sejam minimizados e para que esta condição seja tratada da melhor maneira possível. Contudo, o presente trabalho tem como objetivo o desenvolvimento de um sistema de inteligência artificial que auxilie no diagnóstico da DPC em seu estágio inicial, minimizando erros e tempo de tratamento por meio da mineração de dados em uma base médica previamente preenchida com casos já diagnosticados como auxilio a aprendizagem do sistema. / Chronic pelvic pain (CPP) is a common clinical condition, including in Brazil. Studies held by our research group shows evidences of a prevalence around 11%. It is, among other illness, a recurrent cause of lack of productivity, work miss and utilization of healthcare services. As the women is each time more inserted in the labor force this condition is impacting negatively the economic performance of this group, affecting directly the domestic economic activity. However, the diagnostic of the cause of this condition is not trivial, and mistakes can happen due to the lack of knowledge about the matter, therefore, the creation of a system that may help in the diagnosing and identification of the causes of this clinical condition is of great importance to the decrease of mistaken diagnoses leading to a better treatment of the condition. However, the current work has as objective the development of an artificial intelligence system that help in the CPP diagnose in its initial stage, decreasing mistakes and treatment time by using data mining in a medical database previously filled with already diagnosed cases as auxiliary to the learning of the system.
77	PersonalTVware: uma infraestrutura de suporte a sistemas de recomendação sensíveis ao contexto para TV Digital Personalizada. / PersonalTVware: an infrastructure to support the context-aware recommender systems for Personalized Digital TV. Fábio Santos da Silva 18 March 2011 (has links) O processo de digitalização da TV em diversos países do mundo tem contribuído para o aumento do volume de programas de TV, o que gera uma sobrecarga de informação. Consequentemente, o usuário está enfrentando dificuldade para encontrar os programas de TV favoritos dentre as várias opções disponíveis. Diante deste cenário, os sistemas de recomendação destacam-se como uma possível solução. Tais sistemas são capazes de filtrar itens relevantes de acordo com as preferências do usuário ou de um grupo de usuários que possuem perfis similares. Entretanto, em diversas recomendações o interesse do usuário pode depender do seu contexto. Assim, torna-se importante estender as abordagens tradicionais de recomendação personalizada por meio da exploração do contexto do usuário, o que poderá melhorar a qualidade das recomendações. Para isso, este trabalho descreve uma infraestrutura de software de suporte ao desenvolvimento e execução de sistemas de recomendação sensíveis ao contexto para TV Digital Interativa - intitulada de PersonalTVware. A solução proposta fornece componentes que implementam técnicas avançadas para recomendação de conteúdo e processamento de contexto. Com isso, os desenvolvedores de sistemas de recomendação concentram esforços na lógica de apresentação de seus sistemas, deixando questões de baixo nível para o PersonalTVware gerenciar. As modelagens de usuário, e do contexto, essenciais para o desenvolvimento do PersonalTVware, são representadas por padrões de metadados flexíveis usados na TV Digital Interativa (MPEG-7 e TV-Anytime), e suas devidas extensões. A arquitetura do PersonalTVware é composta por dois subsistemas: dispositivo do usuário e provedor de serviços. A tarefa de predição de preferências contextuais é baseada em métodos de aprendizagem de máquina, e a filtragem de informação sensível ao contexto tem como base a técnica de filtragem baseada em conteúdo. O conceito de perfil contextual também é apresentado e discutido. Para demonstrar e validar as funcionalidades do PersonalTVware em um cenário de uso, foi desenvolvido um sistema de recomendação sensível ao contexto como estudo de caso. / The process of digitalization of TV in several countries around the world has, contributed to increase the volume of TV programs offered and it leads, to information overload problem. Consequently, the user facing the difficulty to find their favorite TV programs in view of various available options. Within this scenario, the recommender systems stand out as a possible solution. These systems are capable of filtering relevant items according to the user preferences or the group of users who have similar profiles. However, the most of the recommender systems for Interactive Digital TV has rarely take into consideration the users contextual information in carrying out the recommendation. However, in many recommendations the user interest may depend on the context. Thus, it becomes important to extend the traditional approaches to personalized recommendation of TV programs by exploiting the context of user, which may improve the quality of the recommendations. Therefore, this work presents a software infrastructure in an Interactive Digital TV environment to support context-aware personalized recommendation of TV programs entitled PersonalTVware. The proposed solution provides components which implement advanced techniques to recommendation of content and context management. Thus, developers of recommender systems can concentrate efforts on the presentation logic of their systems, leaving low-level questions for the PersonalTVware managing. The modeling of user and context, essential for the development of PersonalTVware, are represented by granular metadata standards used in the Interactive Digital TV field (MPEG-7 and TV-Anytime), and its extensions required. The PersonalTVware architecture is composed by two subsystems: the users device and the service provider. The task of inferring contextual preferences is based on machine learning methods, and context-aware information filtering is based on content-based filtering technique. The concept of contextual user profile is presented and discussed. To demonstrate the functionalities in a usage scenario a context-aware recommender system was developed as a case study applying the PersonalTVware. Aprendizagem de máquina Computação sensível ao contexto Metadados Sistemas de recomendação TV Digital Interativa Context-aware computing Interactive Digital TV Machine learning Metadata Recommender systems
78	Técnicas de transferência de aprendizagem aplicadas a modelos QSAR para regressão / Transfer learning techniques applied to QSAR models for regression Simões, Rodolfo da Silva 10 April 2018 (has links) Para desenvolver um novo medicamento, pesquisadores devem analisar os alvos biológicos de uma dada doença, descobrir e desenvolver candidatos a fármacos para este alvo biológico, realizando em paralelo, testes em laboratório para validar a eficiência e os efeitos colaterais da substância química. O estudo quantitativo da relação estrutura-atividade (QSAR) envolve a construção de modelos de regressão que relacionam um conjunto de descritores de um composto químico e a sua atividade biológica com relação a um ou mais alvos no organismo. Os conjuntos de dados manipulados pelos pesquisadores para análise QSAR são caracterizados geralmente por um número pequeno de instâncias e isso torna mais complexa a construção de modelos preditivos. Nesse contexto, a transferência de conhecimento utilizando informações de outros modelos QSAR\'s com mais dados disponíveis para o mesmo alvo biológico seria desejável, diminuindo o esforço e o custo do processo para gerar novos modelos de descritores de compostos químicos. Este trabalho apresenta uma abordagem de transferência de aprendizagem indutiva (por parâmetros), tal proposta baseia-se em uma variação do método de Regressão por Vetores Suporte adaptado para transferência de aprendizagem, a qual é alcançada ao aproximar os modelos gerados separadamente para cada tarefa em questão. Considera-se também um método de transferência de aprendizagem por instâncias, denominado de TrAdaBoost. Resultados experimentais mostram que as abordagens de transferência de aprendizagem apresentam bom desempenho quando aplicadas a conjuntos de dados de benchmark e a conjuntos de dados químicos / To develop a new medicament, researches must analyze the biological targets of a given disease, discover and develop drug candidates for this biological target, performing in parallel, biological tests in laboratory to validate the effectiveness and side effects of the chemical substance. The quantitative study of structure-activity relationship (QSAR) involves building regression models that relate a set of descriptors of a chemical compound and its biological activity with respect to one or more targets in the organism. Datasets manipulated by researchers to QSAR analysis are generally characterized by a small number of instances and this makes it more complex to build predictive models. In this context, the transfer of knowledge using information other\'s QSAR models with more data available to the same biological target would be desirable, nince its reduces the effort and cost to generate models of chemical descriptors. This work presents an inductive learning transfer approach (by parameters), such proposal is based on a variation of the Vector Regression method Adapted support for learning transfer, which is achieved by approaching the separately generated models for each task. It is also considered a method of learning transfer by instances, called TrAdaBoost. Experimental results show that learning transfer approaches perform well when applied to some datasets of benchmark and dataset chemical Aprendizagem de máquina Chemoinformatics Machine learning Modelos QSAR QSAR models Quimioinformática Regressão por vetores suporte Support vector regression Transfer learning Transferência de aprendizagem
79	Análise de textura em imagens de ressonância magnética na predição de recorrência tumoral em pacientes portadores de adenomas hipofisários clinicamente não funcionantes / Magnetic Resonance Imaging Texture Analysis in the Prediction of Tumor Recurrence in Patients with Non-functioning Pituitary Adenomas Machado, Leonardo Ferreira 28 November 2017 (has links) O presente trabalho propõe o uso de parâmetros de textura extraídos computacionalmente de IRM como biomarcadores de imagem na predição de recorrência tumoral em pacientes de adenomas pituitários clinicamente não funcionantes (APNF). Para isso, esse estudo analisou imagens de RM de 15 pacientes de APNF retrospectivamente separados em dois grupos: O grupo de pacientes recorrentes, definido por 7 pacientes que exibiram recorrência tumoral em um período de 4, 640 +- 0, 653 anos (média +- erro padrão) de acompanhamento clínico após a primeira abordagem cirúrgica; e o grupo de pacientes estáveis, formado por 8 pacientes com lesões consideradas estáveis em um período de 4,512 +- 0, 536 anos. Uma máscara de segmentação tridimensional da lesão tumoral foi construída manualmente por um especialista sobre a imagem 3D T1-W DCE pré-operatória para cada paciente. Em seguida, essa segmentação e a própria imagem de ressonância foram usadas para extrair 48 características numéricas de textura. Adicionalmente, 4 características clínicas foram consideradas no estudo: a imunohistoquímica, invasividade, idade na primeira cirurgia e sexo, totalizando 52 características. Cada uma destas 52 características fora testada através de testes estatísticos convencionais univariados para ver se existia evidencias do poder discriminatório dessas características para diferenciar esses dois grupos de pacientes. Mais adiante, diferentes subconjuntos dessas características foram usados para construir modelos de predição baseados na teoria de aprendizagem de máquinas (usando os algoritmos k-nearest neighbor (kNN), decision tree (DTC), e random forest (RFC)) para investigar um modelo de classificação capaz de identificar os pacientes que experimentariam recorrência tumoral após a primeira cirurgia. 9 características de textura foram consideradas individualmente significantes (p < 0, 05) na diferenciação dos grupos de paciente recorrente e estável. Afirmando esses achados, a análise com a curva ROC para cada uma das 9 características exibiu medidas de AUC de 0,803 a 0,857 significando uma boa performance de classificação. A idade, imunoistoquímica, invasividade e sexo não mostraram evidencias de associação com recorrência tumoral. As melhores performances com algoritmos de classificação foram com kNN e RFC, ambos atingiram uma especificidade de 1,000 conservando alta acurácia (0,933) e obtendo 0,991 na análise com a curva ROC, o que caracteriza uma performance de classificação quase perfeita. DTC não mostrou nenhuma melhora se comparado com os resultados das classificações univariadas. Esses resultados permitem concluir que parâmetros de textura são úteis na predição de recorrência tumoral após a primeira cirurgia em pacientes de APNF. E que os valores de predição dessas características podem ser observados por testes estatísticos univariados convencionais e por análises multivariadas através de algoritmos baseados em aprendizagem de máquinas / The present work proposes the usage of texture features computationally extracted from MRI as imaging biomarkers in the prediction of tumor recurrence in patients with non-functioning pituitary adenomas (NFPA). With this purpose, this study analyzed MR images from 15 patients of NFPA retrospectively separated in two groups: the recurrent patient group, formed by seven (7) patients who exhibited tumor recurrence in a period of 4,640 +- 0,653 years (mean +- standard error) of follow-up period after the first surgical approach; and the stable patient group formed by eight (8) patients with lesions considered stable in a period of 4,512 +- 0,536 years. A three-dimensional segmentation mask of the tumor lesion was manually performed by a specialist over preoperative 3D T1-W DCE MR image for each patient. Next, this segmentation and the preoperative MRI itself were used to extract 48 numerical textural features. Additionally, 4 clinical features were considered in the study: immunohistochemistry, invasiveness, age at first surgery, and gender, totalizing 52 features. Each one of those 52 features were tested through conventional univariate statistical tests to see if there were evidence of their discrimination power to differentiate these two patient groups. Moreover, different subsets of those features were used to build machine learning prediction models (using k-nearest neighbor (kNN), decision tree (DTC), and random forest (RFC) algorithms) to investigate a classification model capable of identifying the patients that would experience tumor recurrence after the first surgery. 9 quantitative textural features were found to be individually significant (p < 0,05) in the differentiation of recurrent and stable patient group. Affirming these findings, the ROC curve analysis for each one of those 9 features exhibited an AUC score from 0.803 to 0.857 meaning a good classification performance. Age, immunohistochemistry and invasiveness status, and gender did not show evidence of association with tumor recurrence. The best performances with classification algorithms were obtained with kNN and RFC, both reached specificity of 1.000 conserving high accuracy (0.933) and scoring 0.991 in ROC curve analysis, what characterizes an almost perfect classification performance. DTC did not show any improvement compared to the univariate classification results. These findings allow to conclude that textural features are useful in the prediction of tumor recurrence after first surgery in NFPA patients. And that the prediction value of those features can be observed with both conventional univariate statistical tests and multivariate analyses through machine learning algorithms Análise de textura APNF Aprendizagem de máquina Imagens por ressonância magnética Machine learning Magnetic resonance imaging NFPA Predição de recorrência tumoral Prediction of tumor recurrence Texture analysis
80	Uma comparação de métodos de classificação aplicados à detecção de fraude em cartões de crédito / A comparison of classification methods applied to credit card fraud detection Gadi, Manoel Fernando Alonso 22 April 2008 (has links) Em anos recentes, muitos algoritmos bio-inspirados têm surgido para resolver problemas de classificação. Em confirmação a isso, a revista Nature, em 2002, publicou um artigo que já apontava para o ano de 2003 o uso comercial de Sistemas Imunológicos Artificiais para detecção de fraude em instituições financeiras por uma empresa britânica. Apesar disso, não observamos, a luz de nosso conhecimento, nenhuma publicação científica com resultados promissores desde então. Nosso trabalho tratou de aplicar Sistemas Imunológicos Artificiais (AIS) para detecção de fraude em cartões de crédito. Comparamos AIS com os métodos de Árvore de Decisão (DT), Redes Neurais (NN), Redes Bayesianas (BN) e Naive Bayes (NB). Para uma comparação mais justa entre os métodos, busca exaustiva e algoritmo genético (GA) foram utilizados para selecionar um conjunto paramétrico otimizado, no sentido de minimizar o custo de fraude na base de dados de cartões de crédito cedida por um emissor de cartões de crédito brasileiro. Em adição à essa otimização, fizemos também uma análise e busca por parâmetros mais robustos via multi-resolução, estes parâmetros são apresentados neste trabalho. Especificidades de bases de fraude como desbalanceamento de dados e o diferente custo entre falso positivo e negativo foram levadas em conta. Todas as execuções foram realizadas no Weka, um software público e Open Source, e sempre foram utilizadas bases de teste para validação dos classificadores. Os resultados obtidos são consistentes com Maes et al. que mostra que BN são melhores que NN e, embora NN seja um dos métodos mais utilizados hoje, para nossa base de dados e nossas implementações, encontra-se entre os piores métodos. Apesar do resultado pobre usando parâmetros default, AIS obteve o melhor resultado com os parâmetros otimizados pelo GA, o que levou DT e AIS a apresentarem os melhores e mais robustos resultados entre todos os métodos testados. / In 2002, January the 31st, the famous journal Nature, with a strong impact in the scientific environment, published some news about immune based systems. Among the different considered applications, we can find detection of fraudulent financial transactions. One can find there the possibility of a commercial use of such system as close as 2003, in a British company. In spite of that, we do not know of any scientific publication that uses Artificial Immune Systems in financial fraud detection. This work reports results very satisfactory on the application of Artificial Immune Systems (AIS) to credit card fraud detection. In fact, scientific financial fraud detection publications are quite rare, as point out Phua et al. [PLSG05], in particular for credit card transactions. Phua et al. points out the fact that no public database of financial fraud transactions is available for public tests as the main cause of such a small number of publications. Two of the most important publications in this subject that report results about their implementations are the prized Maes (2000), that compares Neural Networks and Bayesian Networks in credit card fraud detection, with a favored result for Bayesian Networks and Stolfo et al. (1997), that proposed the method AdaCost. This thesis joins both these works and publishes results in credit card fraud detection. Moreover, in spite the non availability of Maes data and implementations, we reproduce the results of their and amplify the set of comparisons in such a way to compare the methods Neural Networks, Bayesian Networks, and also Artificial Immune Systems, Decision Trees, and even the simple Naïve Bayes. We reproduce in certain way the results of Stolfo et al. (1997) when we verify that the usage of a cost sensitive meta-heuristics, in fact generalized from the generalization done from the AdaBoost to the AdaCost, applied to several tested methods substantially improves it performance for all methods, but Naive Bayes. Our analysis took into account the skewed nature of the dataset, as well as the need of a parametric adjustment, sometimes through the usage of genetic algorithms, in order to obtain the best results from each compared method.

Search results