• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 78
  • 4
  • 1
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 82
  • 82
  • 76
  • 27
  • 25
  • 14
  • 13
  • 12
  • 12
  • 11
  • 9
  • 9
  • 9
  • 9
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Definição de um gerenciador para o modelo de dados temporal TF-ORM / Definition of a manager for a TF-ORM temporal data model

Hubler, Patricia Nogueira January 2000 (has links)
Há alguns anos, a necessidade de armazenar a história das informações e o período no qual as mesmas são válidas ou não no mundo real, está crescendo. As próprias leis vigentes no país fazem com que isto seja uma necessidade quando, por exemplo, criam uma tabela de tempo de validade para o armazenamento de documentos fiscais ou de recursos humanos. Neste âmbito destaca-se a importância do estudo de modelos de dados temporais que gerenciem este tipo de informação. Tais modelos definem a forma como as informações são organizadas, mantidas e recuperadas. A implementação destes modelos, entretanto, é realizada sobre bancos de dados (BD) convencionais, uma vez que ainda não existe um BD totalmente temporal. O mapeamento de um modelo temporal sobre um convencional não impede que sejam satisfeitas todas as necessidades de representação temporal, desde que seja realizado de forma coerente. As diferentes informações temporais que podem ser utilizadas para a representação de tempo são o tempo de transação e o tempo de validade. Quando se deseja uma representação completa da realidade, utilizam-se bancos de dados bitemporais, através dos quais é possível recuperar todas as informações passadas, presentes e futuras. Este trabalho apresenta o mapeamento de um modelo de dados bitemporal (modelo TF-ORM) para um SGBD convencional (Oracle). Este mapeamento compreende, além das informações temporais, todas as características do modelo, dentre as quais: classes e papéis, mensagens, regras, propriedades dinâmicas e estáticas. É apresentada, ainda, a definição de um gerenciador temporal, o qual busca automatizar o que é implementado. Complementando o estudo realizado, são apresentadas sugestões de operações a serem realizadas pelos desenvolvedores de aplicações temporais quando da manutenção das informações. As operações de inserção, atualização e remoção em uma base temporal são analisadas, independente do tipo de BD temporal implementado. Um estudo de caso é apresentado para validar todas as definições realizadas. / The need for storing the information’s history and the period in which they are still valid in the real world has been growing in the last few years. The very existing laws in the country make it necessary when, for instance, a validity temporal table is created for storing business or human resources documents. Therefore, the study of temporal data models which manage this kind of information has become very important. Such models define the way in which the information is organized, kept and recovered. The implementation of these models, though, is carried out over conventional data bases (DB), once there is no a totally temporal DB. The mapping of a temporal model over a conventional one allows all of its requirements to be met, as long as it is made coherently. The different temporal information that can be used for time representation are the transaction time and the validity time. Whenever a complete representation of the reality is wanted, bitemporal databases are used. These bases make it possible to recover all the past information as well as present and future information. This work presents the mapping of a temporal data model (TF-ORM model) for a conventional DBMS (Oracle). Besides the temporal information, this mapping comprehends all the model’s characteristics, such as: classes and roles, messages, rules, dynamic and static properties. It is also presented a definition of a temporal manager which aims at automating what is implemented. In addition to this study, suggestions of operations to be carried out by the developers of temporal applications for the maintenance of the information are presented. The operations of inserting, updating and removing on temporal base are analyzed, apart from the kind of DB implemented. A case study is presented in order to validate all the definitions made.
72

Algoritmo kNN para previsão de dados temporais: funções de previsão e critérios de seleção de vizinhos próximos aplicados a variáveis ambientais em limnologia / Time series prediction using a KNN-based algorithm prediction functions and nearest neighbor selection criteria applied to limnological data

Ferrero, Carlos Andres 04 March 2009 (has links)
A análise de dados contendo informações sequenciais é um problema de crescente interesse devido à grande quantidade de informação que é gerada, entre outros, em processos de monitoramento. As séries temporais são um dos tipos mais comuns de dados sequenciais e consistem em observações ao longo do tempo. O algoritmo k-Nearest Neighbor - Time Series Prediction kNN-TSP é um método de previsão de dados temporais. A principal vantagem do algoritmo é a sua simplicidade, e a sua aplicabilidade na análise de séries temporais não-lineares e na previsão de comportamentos sazonais. Entretanto, ainda que ele frequentemente encontre as melhores previsões para séries temporais parcialmente periódicas, várias questões relacionadas com a determinação de seus parâmetros continuam em aberto. Este trabalho, foca-se em dois desses parâmetros, relacionados com a seleção de vizinhos mais próximos e a função de previsão. Para isso, é proposta uma abordagem simples para selecionar vizinhos mais próximos que considera a similaridade e a distância temporal de modo a selecionar os padrões mais similares e mais recentes. Também é proposta uma função de previsão que tem a propriedade de manter bom desempenho na presença de padrões em níveis diferentes da série temporal. Esses parâmetros foram avaliados empiricamente utilizando várias séries temporais, inclusive caóticas, bem como séries temporais reais referentes a variáveis ambientais do reservatório de Itaipu, disponibilizadas pela Itaipu Binacional. Três variáveis limnológicas fortemente correlacionadas são consideradas nos experimentos de previsão: temperatura da água, temperatura do ar e oxigênio dissolvido. Uma análise de correlação é realizada para verificar se os dados previstos mantem a correlação das variáveis. Os resultados mostram que, o critério de seleção de vizinhos próximos e a função de previsão, propostos neste trabalho, são promissores / Treating data that contains sequential information is an important problem that arises during the data mining process. Time series constitute a popular class of sequential data, where records are indexed by time. The k-Nearest Neighbor - Time Series Prediction kNN-TSP method is an approximator for time series prediction problems. The main advantage of this approximator is its simplicity, and is often used in nonlinear time series analysis for prediction of seasonal time series. Although kNN-TSP often finds the best fit for nearly periodic time series forecasting, some problems related to how to determine its parameters still remain. In this work, we focus in two of these parameters: the determination of the nearest neighbours and the prediction function. To this end, we propose a simple approach to select the nearest neighbours, where time is indirectly taken into account by the similarity measure, and a prediction function which is not disturbed in the presence of patterns at different levels of the time series. Both parameters were empirically evaluated on several artificial time series, including chaotic time series, as well as on a real time series related to several environmental variables from the Itaipu reservoir, made available by Itaipu Binacional. Three of the most correlated limnological variables were considered in the experiments carried out on the real time series: water temperature, air temperature and dissolved oxygen. Analyses of correlation were also accomplished to verify if the predicted variables values maintain similar correlation as the original ones. Results show that both proposals, the one related to the determination of the nearest neighbours as well as the one related to the prediction function, are promising
73

"Visualizações temporais em uma plataforma de software extensível e adaptável" / "Temporal visualizations in an extensible and adaptable software platform"

Shimabukuro, Milton Hirokazu 05 July 2004 (has links)
Repositórios com volumes de dados cada vez maiores foram viabilizados pelo desenvolvimento tecnológico, criando importantes fontes de informação em diversas áreas da atividade humana. Esses repositórios freqüentemente incluem informação sobre o comportamento temporal e o posicionamento espacial dos itens neles representados, os quais são extremamente relevantes para a análise dos dados. O processo de descoberta de conhecimento a partir de grandes volumes de dados tem sido objeto de estudo em diversas disciplinas, dentre elas a Visualização de Informação, cujas técnicas podem apoiar diversas etapas desse processo. Esta tese versa sobre o uso da Visualização Exploratória em conjuntos de dados com atributos temporais e espaciais, empregando a estratégia de múltiplas visualizações coordenadas para apoiar o tratamento de dados em estágios iniciais de processos de descoberta de conhecimento. São propostas duas novas representações visuais temporais – denominadas ‘Variação Temporal Uni-escala’ e ‘Variação Temporal Multi-escala’ – para apoiar a análise exploratória de dados temporais. Adicionalmente, é proposto um modelo de arquitetura de software – AdaptaVis, que permite a integração dessas e outras representações visuais em uma plataforma de visualização de informação flexível, extensível e adaptável às necessidades de diferentes usuários, tarefas e domínios de aplicação – a plataforma InfoVis. Sessões de uso realizadas com dados e usuários reais dos domínios de Climatologia e Negócios permitiram validar empiricamente as representações visuais e o modelo. O modelo AdaptaVis e a plataforma InfoVis estabelecem bases para a continuidade de diversas pesquisas em Visualização de Informação, particularmente o estudo de aspectos relacionados ao uso coordenado de múltiplas visualizações, à modelagem do processo de coordenação, e à integração entre múltiplas técnicas visuais e analíticas. / Data repositories with ever increasing volumes have been made possible by the evolution in data collection technologies, creating important sources of information in several fields of human activity. Such data repositories often include information about both the temporal behavior and the spatial positioning of data items that will be relevant in future data analysis tasks. The process of discovering knowledge embedded in great volumes of data is a topic of study in several disciplines, including Information Visualization, which offers a range of techniques to support different stages of a discovery process. This thesis addresses the application of Exploratory Visualization techniques on datasets with temporal and spatial attributes, using the strategy of coordinating multiple data views, to assist data treatment on early stages of knowledge discovery processes. Two temporal visual representations are proposed – ‘Uni-scale Temporal Behavior’ and ‘Multi-scale Temporal Behavior’ – that support the exploratory analysis of temporal data. Moreover, a software architecture model is introduced – AdaptaVis, that allows the integration of these and other visualization techniques into a flexible, extensible and adaptable information visualization platform – called InfoVis – that may be tailored to meet the requirements of different users, tasks and application domains. Sessions conducted with real data and users from the Climatology and Business application domains allowed an empirical validation of both the visual representations and the model. The AdaptaVis model and the InfoVis platform establish the basis for further research on issues related to the coordinated use of multiple data views, the modeling of the coordination process and the integration amongst multiple visual and analytical techniques.
74

Uma abordagem de recomendação de colaborações acadêmicas através da análise de séries temporais / An approach for academic collaborations recommendation through time-series analysis

Ribacki, Guilherme Haag January 2016 (has links)
O avanço da tecnologia nos últimos anos permitiu a criação de Sistemas de Informação com acesso a grandes bases de dados, abrindo diversas possibilidades de aplicações. Tem-se como exemplo a Internet, onde uma enorme quantidade de dados é gerada e publicada a todo momento por usuários ao redor do mundo. Com isso, aos poucos foi surgindo a necessidade de métodos para filtrar o conteúdo disponível de forma a permitir que um usuário pudesse focar apenas nos seus interesses. Nesse contexto surgiram os Sistemas de Recomendação e as Redes Sociais, onde, mais recentemente, surgiram trabalhos que apresentam abordagens para o uso de Sistemas de Recomendação no contexto acadêmico, de forma a aumentar a produtividade de grupos de pesquisa. Também têm sido bastante exploradas formas de se utilizar informações temporais em Sistemas de Recomendação de maneira a melhorar as recomendações feitas. O presente trabalho propõe uma abordagem de recomendação de colaborações acadêmicas utilizando a técnica de Análise de Séries Temporais, buscando melhorar os resultados obtidos por trabalhos anteriores. Foi realizado um experimento offline para avaliar o desempenho da abordagem proposta em relação às abordagens anteriores e um estudo de usuários para fazer uma análise mais profunda com feedback de usuários. Foram utilizadas métricas conhecidas das áreas de Recuperação de Informação e Sistemas de Recomendação, mas alguns resultados se mostraram inferiores em comparação com as abordagens existentes; outros, porém, foram similares. Também foram utilizadas algumas métricas de avaliação focadas em Sistemas de Recomendação, e os resultados obtidos foram similares em todas as abordagens testadas. / The advance of technology in recent years made possible the creation of Information Systems with access to large databases, opening many applications possibilities. There’s the Internet, for example, where a vast amount of data is generated and published all the time by users around the world. In this sense, the need for methods to filter the available content to enable users to focus only on their interests slowly emerged. In this context, Recommender Systems and Social Networks appeared, where, recently, works reporting approaches to provide recommendations in the academic context appeared, increasing the productivity of research groups. New ways to employ temporal information in Recommender Systems to make better recommendations are also being explored. The present work proposes an approach to academic collaborations recommendation using Time Series Analysis, aiming to improve results reported on previous and current works. An offline experiment was done to evaluate the proposed approach in comparison with other works and a user study was done to make a deeper analysis from user feedback. Known metrics from the Information Retrieval and Recommender Systems fields were used, and in some cases the results obtained were lower compared to the current methods but similar in others. Some evaluation metrics from Recommender Systems were also used, and the results were similar to all approaches.
75

SES : sistema de extração semântica de informações / System of semantic extraction of information

Scarinci, Rui Gureghian January 1997 (has links)
Entre as áreas que mais se desenvolvem na informática nos últimos anos estão aquelas relacionadas ao crescimento da rede Internet, que interliga milhões de usuários de todo o mundo. Esta rede disponibiliza aos usuários uma a enorme variedade e quantidade de informações, principalmente dados armazenados de forma não estruturada ou semi estruturada. Contudo, tal volume e heterogeneidade acaba dificultando a manipulação dos dados recuperados a partir da Internet. Este problema motivou o desenvolvimento deste trabalho. Mesmo com o auxílio de várias ferramentas de pesquisa na Internet, buscando realizar pesquisas sobre assuntos específicos, o usuário ainda tem que manipular em seu computador pessoal uma grande quantidade de informação, pois estas ferramentas não realizam um processo de seleção detalhado. Ou seja, são recuperados muitos dados não interessantes ao usuário. Existe, também, uma grande diversidade de assuntos e padrões de transferência e armazenamento da informação criando os mais heterogêneos ambientes de pesquisa e consulta de dados. Esta heterogeneidade faz com que o usuário da rede deva conhecer todo um conjunto de padrões e ferramentas a fim de obter a informação desejada. No entanto, a maior dificuldade de manipulação esta ligada aos formatos de armazenamento não estruturados ou pouco estruturados, como, por exemplo: arquivos textos, Mails (correspondência eletrônica) e artigos de News (jornais eletrônicos). Nestes formatos, o entendimento do documento exige a leitura do mesmo pelo usuário, o que muitas vezes acarreta em um gasto de tempo desnecessário, pois o documento, por exemplo, pode não ser de interesse deste ou, então, ser de interesse, mas sua leitura completa só seria útil posteriormente. Várias informações, como chamadas de trabalhos para congressos, preços de produtos e estatísticas econômicas, entre outras, apresentam validade temporal. Outras informações são atualizadas periodicamente. Muitas dessas características temporais são explicitas, outras estão implícitas no meio de outros tipos de dados. Isto torna muito difícil a recuperação de tal tipo de informação, gerando, várias vezes, a utilização de informações desatualizadas, ou a perda de oportunidades. Desta forma, o grande volume de dados em arquivos pessoais obtidos a partir da Internet criou uma complexa tarefa de gerenciamento dos mesmos em conseqüência da natureza não estruturada dos documentos recuperados e da complexidade da análise do tempo de validade inerente a estes dados. Com o objetivo de satisfazer as necessidades de seleção e conseqüente manipulação das informações existentes a nível local (computador pessoal), neste trabalho, é descrito um sistema para extração e sumarização destes dados, utilizando conceitos de IE (Information Extraction) e Sistemas Baseados em Conhecimento. Os dados processados são parcialmente estruturados ou não estruturados, sendo manipulados por um extrator configurado a partir de bases de conhecimento geradas pelo usuário do sistema. O objetivo final desta dissertação é a implementação do Sistema de Extração Semântica de Informações, o qual permite a classificação dos dados extraídos em classes significativas para o usuário e a determinação da validade temporal destes dados a partir da geração de uma base de dados estruturada. / One of the most challenging area in Computer Science is related to Internet technology. This network offers to the users a large variety and amount of information, mainly, data storage in unstructured or semi-structured formats. However, the vast data volume and heterogeneity transforms the retrieved data manipulation a very arduous work. This problem was the prime motivation of this work. As with many tools for data retrieval and specific searching, the user has to manipulate in his personal computer an increasing amount of information, because these tools do not realize a precise data selection process. Many retrieval data are not interesting for the user. There are, also, a big diversity of subjects and standards in information transmission and storage, creating the most heterogeneous environments in data searching and retrieval. Due to this heterogeneity, the user has to know many data standards and searching tools to obtain the requested information. However, the fundamental problem for data manipulation is the partially or fully unstructured data formats, as text, mail and news data structures. For files in these formats, the user has to read each of the files to filter the relevant information, originating a loss of time, because the document could be not interesting for the user, or if it is interesting, its complete reading may be unnecessary at the moment. Some information as call-for-papers, product prices, economic statistics and others, has associated a temporal validity. Other information are updated periodically. Some of these temporal characteristics are explicit, others are implicitly embedded in other data types. As it is very difficult to retrieve the temporal data automatically, which generate, many times, the use of invalid information, as a result, some opportunities are lost. On this paper a system for extraction and summarizing of data is described. The main objective is to satisfy the user's selection needs and consequently information manipulation stored in a personal computer. To achieve this goal we are employed the concepts of Information Extraction (IE) and Knowledge Based Systems. The input data manipulation is done by an extraction procedure configured by a user who defined knowledge base. The objective of this paper is to develop a System of Semantic Extraction of Information which classifies the data extracted in meaningful classes for the user and to deduce the temporal validity of this data. This goal was achieved by the generation of a structured temporal data base.
76

[en] VISUAL INTERACTIVE SUPPORT FOR SELECTING SCENARIOS FROM TIME-SERIES ENSEMBLES / [pt] UMA ABORDAGEM VISUAL E INTERATIVA PARA A SELEÇÃO DE CONJUNTOS DE CENÁRIOS TEMPORAIS

GUILHERME GONCALVES SCHARDONG 14 December 2018 (has links)
[pt] O uso de abordagens de programação estocástica e redução de cenários tem se tornado imprescindível na análise e predição de comportamento de sistemas dinâmicos. Entretanto, tais técnicas não levam em conta o conhecimento prévio sobre domínio que o usuário possui. O presente trabalho tem por objetivo o desenvolvimento de uma abordagem visual e interativa para abordar o problema de redução de cenários com dados temporais. Para tanto, nós propomos a implementação de uma série de visualizações de dados temporais integradas. Também propomos a adaptação de um algoritmo de projeção multidimensional para lidar com dados temporais. Desta forma, podemos representar graficamente a evolução de um conjunto de cenários ao longo do tempo. Outra visualização proposta no presente trabalho é uma adaptação de Bump chart para lidar com dados temporais acumulados; através dele, um usuário pode comparar a evolução das distâncias entre os diferentes cenários e um cenário de referência. Para validar a nossa proposta, fizemos uma implementação das técnicas propostas e conduzimos um estudo com usuários de diferentes áreas do conhecimento e níveis de experiência. Os resultados obtidos até então indicam que uma abordagem visual para o problema de redução de cenários é viável, e permite a seleção de um conjunto razoável de cenários. Além disso, constatamos que essa abordagem pode ser útil em um contexto de exploração de dados visando a redução de cenários. O usuário também pode explorar visualmente os resultados de outras técnicas de redução de cenários usando nossa abordagem. Os usuários entrevistados reportaram facilidade em cumprir as tarefas propostas e comentaram positivamente sobre os mecanismos de interação fornecidos pelo nosso protótipo. Também testamos os cenários escolhidos usando nossa proposta contra outras abordagens encontradas tanto na literatura quanto em uso na indústria. Os resultados obtidos foram bons, indicando que nossa proposta é viável em casos de uso reais. / [en] Stochastic programming and scenario reduction approaches have become invaluable in the analysis and behavior prediction of dynamic systems. However, such techniques often fail to take advantage of the user s own expertise about the problem domain. This work provides visual interactive support to assist users in solving the scenario reduction problem with timeseries data. We employ a series of time-based visualization techniques linked together to perform the task. By adapting a multidimensional projection algorithm to handle temporal data, we can graphically present the evolution of the ensemble. We also propose to use cumulative bump charts to visually compare the ranks of distances between the ensemble time series and a baseline series. To evaluate our approach, we developed a prototype application and conducted observation studies with volunteer users of varying backgrounds and levels of expertise. Our results indicate that a graphical approach to scenario reduction may result in a good subset of scenarios and provides a valuable tool for data exploration in this context. The users liked the interaction mechanisms provided and judged the task to be easy to perform with the tools we have developed. We tested the proposed approach against state-of-the-art techniques proposed in the literature and used in the industry and obtained good results, thus indicating that our approach is viable in a real-world scenario.
77

Uma abordagem de recomendação de colaborações acadêmicas através da análise de séries temporais / An approach for academic collaborations recommendation through time-series analysis

Ribacki, Guilherme Haag January 2016 (has links)
O avanço da tecnologia nos últimos anos permitiu a criação de Sistemas de Informação com acesso a grandes bases de dados, abrindo diversas possibilidades de aplicações. Tem-se como exemplo a Internet, onde uma enorme quantidade de dados é gerada e publicada a todo momento por usuários ao redor do mundo. Com isso, aos poucos foi surgindo a necessidade de métodos para filtrar o conteúdo disponível de forma a permitir que um usuário pudesse focar apenas nos seus interesses. Nesse contexto surgiram os Sistemas de Recomendação e as Redes Sociais, onde, mais recentemente, surgiram trabalhos que apresentam abordagens para o uso de Sistemas de Recomendação no contexto acadêmico, de forma a aumentar a produtividade de grupos de pesquisa. Também têm sido bastante exploradas formas de se utilizar informações temporais em Sistemas de Recomendação de maneira a melhorar as recomendações feitas. O presente trabalho propõe uma abordagem de recomendação de colaborações acadêmicas utilizando a técnica de Análise de Séries Temporais, buscando melhorar os resultados obtidos por trabalhos anteriores. Foi realizado um experimento offline para avaliar o desempenho da abordagem proposta em relação às abordagens anteriores e um estudo de usuários para fazer uma análise mais profunda com feedback de usuários. Foram utilizadas métricas conhecidas das áreas de Recuperação de Informação e Sistemas de Recomendação, mas alguns resultados se mostraram inferiores em comparação com as abordagens existentes; outros, porém, foram similares. Também foram utilizadas algumas métricas de avaliação focadas em Sistemas de Recomendação, e os resultados obtidos foram similares em todas as abordagens testadas. / The advance of technology in recent years made possible the creation of Information Systems with access to large databases, opening many applications possibilities. There’s the Internet, for example, where a vast amount of data is generated and published all the time by users around the world. In this sense, the need for methods to filter the available content to enable users to focus only on their interests slowly emerged. In this context, Recommender Systems and Social Networks appeared, where, recently, works reporting approaches to provide recommendations in the academic context appeared, increasing the productivity of research groups. New ways to employ temporal information in Recommender Systems to make better recommendations are also being explored. The present work proposes an approach to academic collaborations recommendation using Time Series Analysis, aiming to improve results reported on previous and current works. An offline experiment was done to evaluate the proposed approach in comparison with other works and a user study was done to make a deeper analysis from user feedback. Known metrics from the Information Retrieval and Recommender Systems fields were used, and in some cases the results obtained were lower compared to the current methods but similar in others. Some evaluation metrics from Recommender Systems were also used, and the results were similar to all approaches.
78

SES : sistema de extração semântica de informações / System of semantic extraction of information

Scarinci, Rui Gureghian January 1997 (has links)
Entre as áreas que mais se desenvolvem na informática nos últimos anos estão aquelas relacionadas ao crescimento da rede Internet, que interliga milhões de usuários de todo o mundo. Esta rede disponibiliza aos usuários uma a enorme variedade e quantidade de informações, principalmente dados armazenados de forma não estruturada ou semi estruturada. Contudo, tal volume e heterogeneidade acaba dificultando a manipulação dos dados recuperados a partir da Internet. Este problema motivou o desenvolvimento deste trabalho. Mesmo com o auxílio de várias ferramentas de pesquisa na Internet, buscando realizar pesquisas sobre assuntos específicos, o usuário ainda tem que manipular em seu computador pessoal uma grande quantidade de informação, pois estas ferramentas não realizam um processo de seleção detalhado. Ou seja, são recuperados muitos dados não interessantes ao usuário. Existe, também, uma grande diversidade de assuntos e padrões de transferência e armazenamento da informação criando os mais heterogêneos ambientes de pesquisa e consulta de dados. Esta heterogeneidade faz com que o usuário da rede deva conhecer todo um conjunto de padrões e ferramentas a fim de obter a informação desejada. No entanto, a maior dificuldade de manipulação esta ligada aos formatos de armazenamento não estruturados ou pouco estruturados, como, por exemplo: arquivos textos, Mails (correspondência eletrônica) e artigos de News (jornais eletrônicos). Nestes formatos, o entendimento do documento exige a leitura do mesmo pelo usuário, o que muitas vezes acarreta em um gasto de tempo desnecessário, pois o documento, por exemplo, pode não ser de interesse deste ou, então, ser de interesse, mas sua leitura completa só seria útil posteriormente. Várias informações, como chamadas de trabalhos para congressos, preços de produtos e estatísticas econômicas, entre outras, apresentam validade temporal. Outras informações são atualizadas periodicamente. Muitas dessas características temporais são explicitas, outras estão implícitas no meio de outros tipos de dados. Isto torna muito difícil a recuperação de tal tipo de informação, gerando, várias vezes, a utilização de informações desatualizadas, ou a perda de oportunidades. Desta forma, o grande volume de dados em arquivos pessoais obtidos a partir da Internet criou uma complexa tarefa de gerenciamento dos mesmos em conseqüência da natureza não estruturada dos documentos recuperados e da complexidade da análise do tempo de validade inerente a estes dados. Com o objetivo de satisfazer as necessidades de seleção e conseqüente manipulação das informações existentes a nível local (computador pessoal), neste trabalho, é descrito um sistema para extração e sumarização destes dados, utilizando conceitos de IE (Information Extraction) e Sistemas Baseados em Conhecimento. Os dados processados são parcialmente estruturados ou não estruturados, sendo manipulados por um extrator configurado a partir de bases de conhecimento geradas pelo usuário do sistema. O objetivo final desta dissertação é a implementação do Sistema de Extração Semântica de Informações, o qual permite a classificação dos dados extraídos em classes significativas para o usuário e a determinação da validade temporal destes dados a partir da geração de uma base de dados estruturada. / One of the most challenging area in Computer Science is related to Internet technology. This network offers to the users a large variety and amount of information, mainly, data storage in unstructured or semi-structured formats. However, the vast data volume and heterogeneity transforms the retrieved data manipulation a very arduous work. This problem was the prime motivation of this work. As with many tools for data retrieval and specific searching, the user has to manipulate in his personal computer an increasing amount of information, because these tools do not realize a precise data selection process. Many retrieval data are not interesting for the user. There are, also, a big diversity of subjects and standards in information transmission and storage, creating the most heterogeneous environments in data searching and retrieval. Due to this heterogeneity, the user has to know many data standards and searching tools to obtain the requested information. However, the fundamental problem for data manipulation is the partially or fully unstructured data formats, as text, mail and news data structures. For files in these formats, the user has to read each of the files to filter the relevant information, originating a loss of time, because the document could be not interesting for the user, or if it is interesting, its complete reading may be unnecessary at the moment. Some information as call-for-papers, product prices, economic statistics and others, has associated a temporal validity. Other information are updated periodically. Some of these temporal characteristics are explicit, others are implicitly embedded in other data types. As it is very difficult to retrieve the temporal data automatically, which generate, many times, the use of invalid information, as a result, some opportunities are lost. On this paper a system for extraction and summarizing of data is described. The main objective is to satisfy the user's selection needs and consequently information manipulation stored in a personal computer. To achieve this goal we are employed the concepts of Information Extraction (IE) and Knowledge Based Systems. The input data manipulation is done by an extraction procedure configured by a user who defined knowledge base. The objective of this paper is to develop a System of Semantic Extraction of Information which classifies the data extracted in meaningful classes for the user and to deduce the temporal validity of this data. This goal was achieved by the generation of a structured temporal data base.
79

Uma abordagem de recomendação de colaborações acadêmicas através da análise de séries temporais / An approach for academic collaborations recommendation through time-series analysis

Ribacki, Guilherme Haag January 2016 (has links)
O avanço da tecnologia nos últimos anos permitiu a criação de Sistemas de Informação com acesso a grandes bases de dados, abrindo diversas possibilidades de aplicações. Tem-se como exemplo a Internet, onde uma enorme quantidade de dados é gerada e publicada a todo momento por usuários ao redor do mundo. Com isso, aos poucos foi surgindo a necessidade de métodos para filtrar o conteúdo disponível de forma a permitir que um usuário pudesse focar apenas nos seus interesses. Nesse contexto surgiram os Sistemas de Recomendação e as Redes Sociais, onde, mais recentemente, surgiram trabalhos que apresentam abordagens para o uso de Sistemas de Recomendação no contexto acadêmico, de forma a aumentar a produtividade de grupos de pesquisa. Também têm sido bastante exploradas formas de se utilizar informações temporais em Sistemas de Recomendação de maneira a melhorar as recomendações feitas. O presente trabalho propõe uma abordagem de recomendação de colaborações acadêmicas utilizando a técnica de Análise de Séries Temporais, buscando melhorar os resultados obtidos por trabalhos anteriores. Foi realizado um experimento offline para avaliar o desempenho da abordagem proposta em relação às abordagens anteriores e um estudo de usuários para fazer uma análise mais profunda com feedback de usuários. Foram utilizadas métricas conhecidas das áreas de Recuperação de Informação e Sistemas de Recomendação, mas alguns resultados se mostraram inferiores em comparação com as abordagens existentes; outros, porém, foram similares. Também foram utilizadas algumas métricas de avaliação focadas em Sistemas de Recomendação, e os resultados obtidos foram similares em todas as abordagens testadas. / The advance of technology in recent years made possible the creation of Information Systems with access to large databases, opening many applications possibilities. There’s the Internet, for example, where a vast amount of data is generated and published all the time by users around the world. In this sense, the need for methods to filter the available content to enable users to focus only on their interests slowly emerged. In this context, Recommender Systems and Social Networks appeared, where, recently, works reporting approaches to provide recommendations in the academic context appeared, increasing the productivity of research groups. New ways to employ temporal information in Recommender Systems to make better recommendations are also being explored. The present work proposes an approach to academic collaborations recommendation using Time Series Analysis, aiming to improve results reported on previous and current works. An offline experiment was done to evaluate the proposed approach in comparison with other works and a user study was done to make a deeper analysis from user feedback. Known metrics from the Information Retrieval and Recommender Systems fields were used, and in some cases the results obtained were lower compared to the current methods but similar in others. Some evaluation metrics from Recommender Systems were also used, and the results were similar to all approaches.
80

SES : sistema de extração semântica de informações / System of semantic extraction of information

Scarinci, Rui Gureghian January 1997 (has links)
Entre as áreas que mais se desenvolvem na informática nos últimos anos estão aquelas relacionadas ao crescimento da rede Internet, que interliga milhões de usuários de todo o mundo. Esta rede disponibiliza aos usuários uma a enorme variedade e quantidade de informações, principalmente dados armazenados de forma não estruturada ou semi estruturada. Contudo, tal volume e heterogeneidade acaba dificultando a manipulação dos dados recuperados a partir da Internet. Este problema motivou o desenvolvimento deste trabalho. Mesmo com o auxílio de várias ferramentas de pesquisa na Internet, buscando realizar pesquisas sobre assuntos específicos, o usuário ainda tem que manipular em seu computador pessoal uma grande quantidade de informação, pois estas ferramentas não realizam um processo de seleção detalhado. Ou seja, são recuperados muitos dados não interessantes ao usuário. Existe, também, uma grande diversidade de assuntos e padrões de transferência e armazenamento da informação criando os mais heterogêneos ambientes de pesquisa e consulta de dados. Esta heterogeneidade faz com que o usuário da rede deva conhecer todo um conjunto de padrões e ferramentas a fim de obter a informação desejada. No entanto, a maior dificuldade de manipulação esta ligada aos formatos de armazenamento não estruturados ou pouco estruturados, como, por exemplo: arquivos textos, Mails (correspondência eletrônica) e artigos de News (jornais eletrônicos). Nestes formatos, o entendimento do documento exige a leitura do mesmo pelo usuário, o que muitas vezes acarreta em um gasto de tempo desnecessário, pois o documento, por exemplo, pode não ser de interesse deste ou, então, ser de interesse, mas sua leitura completa só seria útil posteriormente. Várias informações, como chamadas de trabalhos para congressos, preços de produtos e estatísticas econômicas, entre outras, apresentam validade temporal. Outras informações são atualizadas periodicamente. Muitas dessas características temporais são explicitas, outras estão implícitas no meio de outros tipos de dados. Isto torna muito difícil a recuperação de tal tipo de informação, gerando, várias vezes, a utilização de informações desatualizadas, ou a perda de oportunidades. Desta forma, o grande volume de dados em arquivos pessoais obtidos a partir da Internet criou uma complexa tarefa de gerenciamento dos mesmos em conseqüência da natureza não estruturada dos documentos recuperados e da complexidade da análise do tempo de validade inerente a estes dados. Com o objetivo de satisfazer as necessidades de seleção e conseqüente manipulação das informações existentes a nível local (computador pessoal), neste trabalho, é descrito um sistema para extração e sumarização destes dados, utilizando conceitos de IE (Information Extraction) e Sistemas Baseados em Conhecimento. Os dados processados são parcialmente estruturados ou não estruturados, sendo manipulados por um extrator configurado a partir de bases de conhecimento geradas pelo usuário do sistema. O objetivo final desta dissertação é a implementação do Sistema de Extração Semântica de Informações, o qual permite a classificação dos dados extraídos em classes significativas para o usuário e a determinação da validade temporal destes dados a partir da geração de uma base de dados estruturada. / One of the most challenging area in Computer Science is related to Internet technology. This network offers to the users a large variety and amount of information, mainly, data storage in unstructured or semi-structured formats. However, the vast data volume and heterogeneity transforms the retrieved data manipulation a very arduous work. This problem was the prime motivation of this work. As with many tools for data retrieval and specific searching, the user has to manipulate in his personal computer an increasing amount of information, because these tools do not realize a precise data selection process. Many retrieval data are not interesting for the user. There are, also, a big diversity of subjects and standards in information transmission and storage, creating the most heterogeneous environments in data searching and retrieval. Due to this heterogeneity, the user has to know many data standards and searching tools to obtain the requested information. However, the fundamental problem for data manipulation is the partially or fully unstructured data formats, as text, mail and news data structures. For files in these formats, the user has to read each of the files to filter the relevant information, originating a loss of time, because the document could be not interesting for the user, or if it is interesting, its complete reading may be unnecessary at the moment. Some information as call-for-papers, product prices, economic statistics and others, has associated a temporal validity. Other information are updated periodically. Some of these temporal characteristics are explicit, others are implicitly embedded in other data types. As it is very difficult to retrieve the temporal data automatically, which generate, many times, the use of invalid information, as a result, some opportunities are lost. On this paper a system for extraction and summarizing of data is described. The main objective is to satisfy the user's selection needs and consequently information manipulation stored in a personal computer. To achieve this goal we are employed the concepts of Information Extraction (IE) and Knowledge Based Systems. The input data manipulation is done by an extraction procedure configured by a user who defined knowledge base. The objective of this paper is to develop a System of Semantic Extraction of Information which classifies the data extracted in meaningful classes for the user and to deduce the temporal validity of this data. This goal was achieved by the generation of a structured temporal data base.

Page generated in 0.4571 seconds