• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 44
  • 8
  • 1
  • Tagged with
  • 53
  • 53
  • 14
  • 14
  • 11
  • 11
  • 10
  • 10
  • 10
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

[en] ADDING SYSTEM INTRASTRUCTURE FRAMEWORKS IN AN COMPONENT BASED ARCHITECTURE: A CASE STUDY WITHIN THE AULANET ENVIRONMENT / [pt] AGREGANDO FRAMEWORKS DE INFRA-ESTRUTURA EM UMA ARQUITETURA BASEADA EM COMPONENTES: UM ESTUDO DE CASO NO AMBIENTE AULANET

CELSO GOMES BARRETO JUNIOR 05 July 2006 (has links)
[pt] Groupware é difícil de construir e de manter, pois envolve aspectos multidisciplinares. Além das dificuldades associadas ao desenvolvimento de aplicações colaborativas, usualmente o desenvolvedor de groupware deve se preocupar com outros aspectos de infra-estrutura. Nesta dissertação é proposta uma arquitetura multicamadas baseada em componentes para groupware, utilizando frameworks de infra-estrutura. Na camada de negócio são utilizados os frameworks Hibernate, responsável pela persistência dos dados da aplicação, e o framework Spring, que dentre outras coisas é responsável pelo controle de transações e pela exposição de serviços remotamente. Na camada de apresentação o framework JaveServer Faces provê meios para criar e reusar componentes de interface. Nesta dissertação também é apresentada uma forma de comparar frameworks de infra-estrutura, levando em consideração tanto aspectos técnicos, que definem se o framework atende aos requisitos da aplicação, quanto nãotécnicos, relacionados a aspectos como documentação disponível e aceitação no mercado. A arquitetura definida nesta dissertação é aplicada no AulaNet, groupware voltado para a aprendizagem desenvolvido no Laboratório de Engenharia de Software da PUC-Rio. / [en] Groupware is difficult to develop and maintain because it involves multidisciplinary aspects in its construction. Besides the difficulties related to the development of collaborative applications, usually the developer must handle with other infrastructure aspects. In this dissertation, it is proposed a multilayer component based architecture with system infrastructure frameworks to deal with them. In the business layer, the Hibernate framework is responsible for the persistence of application data, and the Spring framework is responsible for, amongst others, transactions control and remote exposition of services. In the presentation layer the JaveServer Faces framework provides ways to create and to reuse user-interface components. This dissertation also presents a way to compare system infrastructure frameworks, considering both technical aspects, related to the application requirements fulfillment, and non- technical, related to aspects such as documentation availability and market acceptance. The architecture defined in this dissertation is applied to the AulaNet, which is a groupware for learning developed in the Software Engineering Laboratory of PUC-Rio.
22

[en] CONCURRENCY AND SANDBOXES MODELS APPLIED TO LUA HTTP SERVERS / [pt] MODELOS DE CONCORRÊNCIA E SANDBOXES APLICADOS A SERVIDORES HTTP EM LUA

LEONARDO GODINHO DA CUNHA 09 April 2007 (has links)
[pt] Os desenvolvedores de sistemas cliente-servidor constantemente se deparam com questões de desempenho e escalabilidade, muitas vezes o número de clientes simultâneos de um servidor pode crescer de forma significativa. Além disso, se esses sistemas podem executar códigos de terceiros, passa a existir a preocupação com a questão de segurança da execução destes trechos de códigos. O objetivo desse trabalho é testar o desempenho de diversas combinações de modelos de concorrência e sandboxes. Como exemplo de sistema sujeito a solicitações concorrentes que precisa permitir a execução de programas de terceiros, temos os servidores web. O Xavante é um servidor web desenvolvido na linguagem de programação Lua que originalmente utiliza um modelo de programação concorrente baseado em co-rotinas. Esse servidor já possuía a flexibilidade de mapear tipos de requisição a tratadores diferentes. Alguns desses tratadores de requisi ção permitem a utilização de código de terceiros em tempo de execução e, por isso, já fazem uso de sandboxes a fim de oferecer um ambiente de execução protegido. Nesse trabalho testamos o uso dessas sandboxes nativas ao Xavante além de outros tipos de sandboxes. Também aumentamos as possibilidades de extensão do servidor, flexibilizando a arquitetura de modo a permitir diferentes estratégias de concorrência. Utilizando a nova arquitetura testamos o desempenho das diversas combinações de sandboxes e modelos de programação concorrente, permitindo a comparação dos modelos não só do ponto de vista qualitativo mas também medindo o impacto de desempenho do seu uso. / [en] Client-server developers constantly have to deal with questions concerning performance and scalability, since the number of simultaneous clients can grow significantly. Moreover, if these systems can execute third-party code, there is also the concern of secure execution of these pieces of code. This work goal is to benchmark several combinations of concurrency and sandboxes models. As an example of a system exposed to several concurrent requests that must be able to execute third-party code, we have the web servers. Xavante is a web server developed in the Lua programming language that originally uses an concurrency programming model based on coroutines. This server offers the flexibility to map request types to different handlers. Some of these request handlers dynamically allow the use of third-party code, therefore they make use of sandboxes in order to offer a protected running environment. In this work we test the use of Xavante´s native sandboxes and other types of sandboxes.We also improve the extensibility of the server, using a different architecture in order to allow different concurrency strategies. Using the new architecture we tested the performance of several combinations of sandboxes and concurrency programming models, allowing the model comparison not only in a qualitative point of view but also measuring the related performance impacts.
23

[en] A UNIFIED PROCESS FRAMEWORK OF ONTOLOGY ENGINEERING / [pt] UM PROCESSO UNIFICADO PARA ENGENHARIA DE ONTOLOGIAS

DANIEL ABADI ORLEAN 12 March 2004 (has links)
[pt] A Web Semântica já está deixando de ser uma visão de Tim Berners-Lee para virar uma realidade. Diversos projetos em todo mundo já exploram as potencialidades dessa segunda geração da Web para tornar seu conteúdo processável por máquinas. Infelizmente (ou felizmente!), os computadores não são capazes de desenvolver por livre e espontânea vontade uma linguagem consensual de comunicação. É nesta etapa que entram em cena as ontologias. Conhecida no ramo da filosofia como teorias sobre a natureza da existência, as ontologias têm sido encaradas de maneira consideravelmente diferente no universo computacional. Representam um entendimento comum e compartilhado sobre um domínio específico e têm como o objetivo principal permitir a comunicação entre organizações, pessoas e o uso de metodologias, processos e/ ou métodos bem definidos. Com o aumento de sua importância, o projeto e desenvolvimento de ontologias vêm deixando de ser uma arte para se transformar em um processo de engenharia. Diversas propostas já foram apresentadas para o problema de engenharia de ontologias, muitas delas apoiadas por estudos acadêmicos e industriais. No entanto, é importante notar que nenhuma dessas metodologias - que em muitos casos resumem-se apenas a heurísticas extraídas da experiência de seus autores ou a orientações sobre como alcançar bons resultados - atende por completo aos requisitos potenciais do projeto de uma ontologia. O que se propõe neste trabalho é a unificação de disciplinas e atividades oriundas de metodologias distintas em um framework de processos abrangente, entitulado KUP - Knowldge Unified Process, que permite um adequado projeto e desenvolvimento de ontologias e bases de conhecimento. Entende-se como um processo um conjunto de atividades e resultados associados a essas atividades com o objetivo de garantir a geração de um produto final, seja este produto um software, uma ontologia ou uma ontologia associada a sua base de conhecimento. A unificação deste processo segue as melhores práticas em engenharia de software existentes na indústria e é apoiada por um framework de avaliação de metodologias consolidado na academia. Foram realizados dois estudos de caso para este framework de processos, um envolvendo o desenvolvimento de uma solução de gestão de conhecimento em segurança da informação e outro envolvendo a integração de uma ferramenta de gestão de competências para ambientes de educação a distância. / [en] The Semantic Web is now a reality. Several projects all around the world are already using tools technologies developed to support the second generation of the Web to provide machine-processable content for software agents, web services and applications. However, computers can not agree on a consesual language by themselves. Ontologies can be used as a way to provide this shared conceptualization, making posssible the desired communication among organizations, people and apllications. Several proposals have been already presented regarding ontology engineering - many supported by academic and industrial case studies. However, none of them encompasses all the requirements identified for an ontology construction project. This work describes the unification of different features extracted from those methodologies to build a process framework named KUP - the Knowledge Unified Process. This unified process is based on several industry best practices and on a well accepted ontology methodology evaluation framework. Two case studies were developed so as to support and validate this process framework. The first was the development of a semantic web solution for security information knowledge management and the second one was the integration of a skill management tool to a learning management system, through ontologies.
24

[en] FGRUPOS: A MULTI-AGENT FRAMEWORK FOR INTEREST GROUPS FORMATION / [pt] FGRUPOS: UM FRAMEWORK MULTI-AGENTE PARA A FORMAÇÃO DE GRUPOS DE INTERESSE

ANGELA BRIGIDA ALBARELLO 08 July 2005 (has links)
[pt] O crescente uso da tecnologia da informação exerce nos dias atuais grande influência sobre o comportamento da sociedade. Isso é parcialmente decorrente da aplicação de novas estratégias organizacionais que fazem com que pessoas e entidades se beneficiem e evoluam em suas atividades. Uma tendência observada no presente está associada aos benefícios alcançados quando pessoas com o mesmo interesse se unem para a realização de uma tarefa comum. Esta dissertação apresenta um framework multi-agente que permite a instanciação de aplicações que fornecem como resultado um relatório de grupos de interesse formados a partir de qualquer base de dados, heurística de definição de perfil do usuário, heurística de definição de perfil do grupo, estratégia de formação de grupos, e formato de apresentação dos dados. / [en] The current growth on the use of information technology exerts great influence on the behavior of the society. That is partially due to the application of new organization strategies which assist people and institutions on the development of their activities. A tendency which can be currently observed is associated with the benefits that occur when people with the same interest are grouped together for the accomplishment of a common task. This dissertation presents a Multi Agent framework that allows for the instantiation of applications that generate interest groups reports from any database, user profile definition heuristic, group formation strategy and data presentation format.
25

[en] WORKFLOW FOR BIOINFORMATICS / [pt] WORKFLOW PARA BIOINFORMÁTICA

MELISSA LEMOS 11 February 2005 (has links)
[pt] Os projetos para estudo de genomas partem de uma fase de sequenciamento onde são gerados em laboratório dados brutos, ou seja, sequências de DNA sem significado biológico. As sequências de DNA possuem códigos responsáveis pela produção de proteínas e RNAs, enquanto que as proteínas participam de todos os fenômenos biológicos, como a replicação celular, produção de energia, defesa imunológica, contração muscular, atividade neurológica e reprodução. As sequências de DNA, RNA e proteínas são chamadas nesta tese de biossequências. Porém, o grande desafio destes projetos consiste em analisar essas biossequências, e obter informações biologicamente relevantes. Durante a fase de análise, os pesquisadores usam diversas ferramentas, programas de computador, e um grande volume de informações armazenadas em fontes de dados de Biologia Molecular. O crescente volume e a distribuição das fontes de dados e a implementação de novos processos em Bioinformática facilitaram enormemente a fase de análise, porém criaram uma demanda por ferramentas e sistemas semi-automáticos para lidar com tal volume e complexidade. Neste cenário, esta tese aborda o uso de workflows para compor processos de Bioinformática, facilitando a fase de análise. Inicialmente apresenta uma ontologia modelando processos e dados comumente utilizados em Bioinformática. Esta ontologia foi derivada de um estudo cuidadoso, resumido na tese, das principais tarefas feitas pelos pesquisadores em Bioinformática. Em seguida, a tese propõe um framework para um sistema de gerência de análises em biossequências, composto por dois sub-sistemas. O primeiro é um sistema de gerência de workflows de Bioinformática, que auxilia os pesquisadores na definição, validação, otimização e execução de workflows necessários para se realizar as análises. O segundo é um sistema de gerência de dados em Bioinformática, que trata do armazenamento e da manipulação dos dados envolvidos nestas análises. O framework inclui um gerente de ontologias, armazenando ontologias para Bioinformática, nos moldes da apresentada anteriormente. Por fim, a tese descreve instanciações do framework para três tipos de ambiente de trabalho comumente encontrados e sugestivamente chamados de ambiente pessoal, ambiente de laboratório e ambiente de comunidade. Para cada um destes ambientes, a tese discute em detalhe os aspectos particulares da execução e otimização de workflows. / [en] Genome projects usually start with a sequencing phase, where experimental data, usually DNA sequences, is generated, without any biological interpretation. DNA sequences have codes which are responsible for the production of protein and RNA sequences, while protein sequences participate in all biological phenomena, such as cell replication, energy production, immunological defense, muscular contraction, neurological activity and reproduction. DNA, RNA and protein sequences are called biosequences in this thesis. The fundamental challenge researchers face lies exactly in analyzing these sequences to derive information that is biologically relevant. During the analysis phase, researchers use a variety of analysis programs and access large data sources holding Molecular Biology data. The growing number of Bioinformatics data sources and analysis programs indeed enormously facilitated the analysis phase. However, it creates a demand for systems that facilitate using such computational resources. Given this scenario, this thesis addresses the use of workflows to compose Bioinformatics analysis programs that access data sources, thereby facilitating the analysis phase. An ontology modeling the analysis program and data sources commonly used in Bioinformatics is first described. This ontology is derived from a careful study, also summarized in the thesis, of the computational resources researchers in Bioinformatics presently use. A framework for biosequence analysis management systems is next described. The system is divided into two major components. The first component is a Bioinformatics workflow management system that helps researchers define, validate, optimize and run workflows combining Bioinformatics analysis programs. The second component is a Bioinformatics data management system that helps researchers manage large volumes of Bioinformatics data. The framework includes an ontology manager that stores Bioinformatics ontologies, such as that previously described. Lastly, instantiations for the Bioinformatics workflow management system framework are described. The instantiations cover three types of working environments commonly found and suggestively called personal environment, laboratory environment and community environment. For each of these instantiations, aspects related to workflow optimization and execution are carefully discussed.
26

[en] A MODEL FOR EXPLORATION OF SEMI-STRUCTURED DATASETS / [pt] UM MODELO PARA EXPLORAÇÃO DE DADOS SEMIESTRUTURADOS

THIAGO RIBEIRO NUNES 05 February 2018 (has links)
[pt] Tarefas de exploração de informação são reconhecidas por possuir características tais como alta complexidade, falta de conhecimento do usuário sobre o domínio da tarefa e incertezas sobre as estratégias de solução. O estado-da-arte em exploração de dados inclui uma variedade de modelos e ferramentas baseadas em diferentes paradigmas de interação, como por exemplo, busca por palavras-chave, busca facetada e orientação-a-conjuntos. Não obstante os muitos avanços das últimas décadas, a falta de uma abordagem formal do processo de exploração, juntamente com a falta de uma adoção mais pragmática do princípio de separação-de-responsabilidades no design dessas ferramentas são a causa de muitas limitações. Dentre as limitações, essa tese aborda a falta de expressividade, caracterizada por restrições na gama de estratégias de solução possíveis, e dificuldades de análise e comparação entre as ferramentas propostas. A partir desta observação, o presente trabalho propõe um modelo formal de ações e processos de exploração, uma nova abordagem para o projeto de ferramentas de exploração e uma ferramenta que generaliza o estado-da-arte em exploração de informação. As avaliações do modelo, realizadas por meio de estudos de caso, análises e comparações o estado-da-arte, corroboram a utilidade da abordagem. / [en] Information exploration processes are usually recognized by their inherent complexity, lack of knowledge and uncertainty, concerning both the domain and the solution strategies. Even though there has been much work on the development of computational systems supporting exploration tasks, such as faceted search and set-oriented interfaces, the lack of a formal understanding of the exploration process and the absence of a proper separation of concerns approach in the design phase is the cause of many expressivity issues and serious limitations. This work proposes a novel design approach of exploration tools based on a formal framework for representing exploration actions and processes. Moreover, we present a new exploration system that generalizes the majority of the state-of-the art exploration tools. The evaluation of the proposed framework is guided by case studies and comparisons with state-of-the-art tools. The results show the relevance of our approach both for the design of new exploration tools with higher expressiveness, and formal assessments and comparisons between different tools.
27

[en] USING DECISION TABLES TO AUTOMATE THE GENERATION AND EXECUTION OF TEST CASES / [pt] O USO DE TABELAS DE DECISÃO PARA A AUTOMAÇÃO DA GERAÇÃO E DA EXECUÇÃO DE CASOS DE TESTE

LUANA LACHTERMACHER 31 August 2010 (has links)
[pt] Teste é uma etapa muito importante no desenvolvimento de software. No entanto, essa área ainda carece de ferramentas mais eficazes e com um grau de automação maior e mais abrangente do que o atualmente disponível. Uma boa parte das técnicas de geração de casos de teste utiliza explicitamente ou implicitamente tabelas de decisão como instrumento intermediário na geração dos casos de teste específicos. Essa dissertação tem por objetivo desenvolver um processo semi-automático de geração de suítes de teste e que inicia em tabelas de decisão. As suítes geradas devem ser adequadas a ferramentas de execução dos testes totalmente automáticas. Para atingir esse objetivo foram implementados: (i) um editor de tabelas de decisão, (ii) um gerador automático de casos de teste e (iii) um gerador de scripts de teste para o framework FEST. A seguir foram avaliados os benefícios que esse conjunto de ferramentas pode trazer ao processo de automação dos testes, tanto no planejamento (geração de casos de testes valorados a partir dos casos de teste semânticos) quanto na execução dos casos de teste. A avaliação foi baseada em uma série de exemplos envolvendo elementos específicos de interfaces humanas, e, também, na aplicação a um software real. / [en] Testing is a very important area in the software development. However, this area needs more effective tools with a higher level of automation with are more comprehensive than the tools available today. A large part of the techniques that do generation of test cases use explicity or implicitly decision tables as an auxiliary tool. This dissertation aims to develop a semi-automatic process that has as outputs tests suites that were generated using decision tables. These suites must be appropriate for the test automation tools. To achieve these goals were implemented: (i) an decision table editor, (ii) a automatic generator case test, and (iii) an automatic test scripts generator of the FEST framework. After it was necessary evaluate the benefits that these tools could bring for the test area, both in the planning (generation of valued test cases from semantic test cases) and in the execution of test cases. The evaluation was based on a series of examples involving specific elements of human interfaces, and also in application to real software.
28

[en] A FRAMEWORK FOR VOCABULARY BUILDING HEURISTIC AND YOURS APPLICATION TO THE CAR SEQUENCING PROBLEM / [pt] UM FRAMEWORK PARA CONSTRUÇÃO DE VOCABULÁRIO E SUA APLICAÇÃO AO PROBLEMA DE SEQÜENCIAMENTO DE CARROS

DARLINTON BARBOSA FERES CARVALHO 18 September 2007 (has links)
[pt] Construção de vocabulário é uma heurística para problemas de otimização combinatória que propõe identificar porções de boas soluções e recombiná-las de modo a intensificar a busca em regiões do espaço de soluções identificadas como promissoras. A técnica de construção de vocabulário pode ser aplicada de diversas maneiras na resolução de problemas. Para facilitar a implementação e comparação de algoritmos de um mesmo domínio, a tecnologia de frameworks é uma solução que já demonstrou ser muito eficaz. O objetivo deste trabalho é desenvolver um framework para a implementação de heurísticas baseadas em construçao de vocabulário. O desenvolvimento foi fundamentado em extensa revisão bibliográfica sobre a técnica e em boas práticas de engenharia de software, como frameworks orientados a objetos e padrões de projeto. Como um estudo de caso, foram geradas aplicações a partir do framework para a resolução do problema de seqüenciamento da produção de carros, que é um problema combinatório proposto a partir de necessidades reais da indústria / [en] Vocabulary building is a heuristic for solving combinatorial optimization problems, based on the identification of solution fragments which are common to good solutions and on their combination to intensify the search on promising regions of the solution space. This technique can be vastly applied on problem solving. The technology of frameworks is an efficient strategy to facilitate the implementation and comparison of same domain algorithms. The objective of this work is to develop a framework for the implementation of heuristics based on vocabulary building. Its development was based on a wide bibliographic revision about the technique and good software engineering practices, like oriented objects frameworks and design patters. We generated applications of the framework to solve the car sequencing problem, which is a combinatorial problem proposed by real requirements of the industry
29

[en] CARIOCA: FRAMEWORK FOR THE CONFIGURATION OF SMART ENVIRONMENTS USING RESOURCE-CONSTRAINED DEVICES / [es] CARIOCA: FRAMEWORK PARA LA CONFIGURACIÓN DE AMBIENTES INTELIGENTES UTILIZANDO DISPOSITIVOS CON RECURSOS LIMITADOS / [pt] CARIOCA: FRAMEWORK PARA A CONFIGURAÇÃO DE AMBIENTES INTELIGENTES UTILIZANDO DISPOSITIVOS COM RECURSOS LIMITADOS

ISABEL BEBELÚ CRISÓLOGO BOHORQUEZ 16 January 2017 (has links)
[pt] Neste trabalho apresentamos um framework para disponibilizar coisas na Web fazendo uso de uma rede de sensores sem fio com nós de recursos limitados seguindo o paradigma da Web das Coisas (Web of Things). Nós focamos nos tipos de nós que não utilizam endereçamento IP e que possuem uma capacidade de memoria limitada. Oferecemos uma ferramenta reutilizável e configurável para cenários de aplicação dentro da área de Smart Home que, em conjunto com a rede de sensores, possibilita monitorar e intervir no ambiente físico através da Web. Para a implementação de aplicações na rede de sensores sem fio utilizamos a ferramenta TERRA a qual nos oferece configuração e programação remota dos nós da rede. Realizamos uma avaliação funcional e um caso de estudo. Na avaliação do sistema buscou-se provar que os objetivos planejados inicialmente se refletem no nosso software. O caso de estudo foi realizado considerando um usuário programador do framework. A principal contribuição deste trabalho é oferecer um framework para o monitoramento de nós sensores, incluindo a adequação do framework para outras aplicações de ambientes físicos. Essa contribuição é baseada numa abordagem que possibilita a programação distribuída de nós a partir da ferramenta TERRA em dispositivos de recursos limitados. Este trabalho apresenta o processo da prototipação do framework, os casos de aplicação e as dificuldades que se apresentaram. / [en] In this work we introduce a framework in order to have available Things in to the Web making use of a wireless sensor network with limited resource nodes following the paradigm of the Web of Things. We focused on those type of nodes that do not have an IP address and have capacity of limited memory. We offer one tool that will be reusable and configurable for scenarios inside the area of Smart Home that united with the wireless sensor network make possible to monitor and intervene in to the physical environment through the Web. For the implementation of wireless sensor networks applications we used the TERRA tool which offers remote configuration and remote programming of the nodes. A functional evaluation and a case study were realized. In evaluating the system we looked for prove that the initial planned objectives was reflected in our software. The case study was realized for the programmer user of the framework. The most important contribution of this work is offering a framework for the monitoring of this sensor nodes and the adequacy of the framework to other applications of physical environments. These contributions were based on an approach that makes possible the distributed programming of nodes using TERRA in devices of limited resources. This work shows all the process of prototyping the framework, the application cases, and the difficulties presented. / [es] En este trabajo presentamos un framework para disponibilizar cosas a la Web haciendo uso de una red de sensores inalámbricos con nodos de recursos limitados siguiendo el paradigma de la Web de las Cosas (Web of Things). Nos enfocamos en los tipos de nodos que no utilizan dirección IP y que poseen una capacidad de memoria limitada. Ofrecemos una herramienta reutilizable y configurable para escenarios de aplicación dentro da área de Smart Home que, en conjunto con la red de sensores, posibilita monitorear e intervenir en el ambiente físico a través de la Web. Para la implementación de aplicaciones con la red de sensores inalámbricos utilizamos la herramienta TERRA la cual nos ofrece configuración y programación remota de los nodos de la red. Realizamos una evaluación funcional y un caso de estudio. Con la evaluación del sistema se buscó probar que los objetivos planeados inicialmente se reflejan en nuestro software. El caso de estudio fue realizado considerando un usuario programador del framework. La principal contribución de este trabajo es ofrecer un framework para el monitoreo de nodos sensores, incluyendo la adecuación del framework para otras aplicaciones de ambientes físicos. Esa contribución es basada en un abordaje que posibilita la programación distribuida de nodos a partir de la herramienta TERRA en dispositivos de recursos limitados. Este trabajo presenta el proceso da prototipación del framework, los casos de aplicación y las dificultades que se presentaron.
30

[en] PRODUCT OFFERING CLASSIFICATION / [pt] CLASSIFICAÇÃO DE OFERTAS DE PRODUTOS

FELIPE REIS GOMES 26 February 2014 (has links)
[pt] Este trabalho apresenta o EasyLearn, um framework para apoiar o desenvolvimento de aplicações voltadas ao aprendizado supervisionado. O EasyLearn define uma camada intermediaria, de simples configuração e entendimento, entre a aplicação e o WEKA, um framework de aprendizado de máquina criado pela Universidade de Waikato. Todos os classificadores e filtros implementados pelo WEKA podem ser facilmente encapsulados para serem utilizados pelo EasyLearn. O EasyLearn recebe como entrada um conjunto de arquivos de configuração no formato XML contendo a definição do fluxo de processamento a ser executado, além da fonte de dados a ser processada, independente do formato. Sua saída é adaptável e pode ser configurada para produzir, por exemplo, relatórios de acurácia da classificação, a própria da fonte de dados classificada, ou o modelo de classificação já treinado. A arquitetura do EasyLearn foi definida após a análise detalhada dos processos de classificação, permitindo identificar inúmeras atividades em comum entre os três processos estudados aprendizado, avaliação e classificação). Através desta percepção e tomando as linguagens orientadas a objetos como inspiração, foi criado um framework capaz de comportar os processos de classificação e suas possíveis variações, além de permitir o reaproveitamento das configurações, através da implementação de herança e polimorfismo para os seus arquivos de configuração. A dissertação ilustra o uso do framework criado através de um estudo de caso completo sobre classificação de produtos do comércio eletrônico, incluindo a criação do corpus, engenharia de atributos e análise dos resultados obtidos. / [en] This dissertation presents EasyLearn, a framework to support the development of supervised learning applications. EasyLearn dfines an intermediate layer, which is easy to configure and understand, between the application and WEKA, a machine learning framework created by the University of Waikato. All classifiers and filters implemented by WEKA can be easily encapsulated to be used by EasyLearn. EasyLearn receives as input a set of configuration files in XML format containing the definition of the processing flow to be executed, in addition to the data source to be classified, regardless of format. Its output is customizable and can be configured to produce classification accuracy reports, the classified data source, or the trained classification model. The architecture of EasyLearn was defined after a detailed analysis of the classification process, which identified a set of common activities among the three analyzed processes (learning, evaluation and classification). Through this insight and taking the object-oriented languages as inspiration, a framework was created which is able to support the classification processes and its variations, and which also allows reusing settings by implementing inheritance and polymorphism in their configuration files. This dissertation also illustrates the use of the created framework presenting a full case study about e-commerce product classification, including corpus creation, attribute engineering and result analysis.

Page generated in 0.046 seconds