Spelling suggestions: "subject:"recuperacao : informacao"" "subject:"recuperacao : conformacao""
211 |
Grafos de avaliação : um modelo conceitual para avaliação escolar apoiada por computador / Evaluation graphs : a conceptual model to help the assessment of studentsMizusaki, Lucas Eishi Pimentel January 2016 (has links)
Seja por meio de novas metodologias, por novas ferramentas, ou pela simples presença nas salas de aula, as Tecnologias de Informação e Comunicação estão alterando profundamente as práticas educativas. Este trabalho se debruça sobre a interação entre as teorias de aprendizagem e as diferentes ferramentas computacionais para educação. Apontando uma incompatibilidade metodológica entre os modelos de avaliação do aluno existentes em Learning Management Systems e em ontologias computacionais frente a metodologias de ensino cognitivistas, propõe-se um novo modelo computacional de avaliação para representar aspectos cognitivos e comportamentais dos alunos. Chamado de grafos de avaliação, é um modelo baseado na área de sistemas de suporte à tomada de decisões em grupo, desenvolvida usando uma metodologia orientada ao consenso junto ao Projeto Amora do Colégio de Aplicação da UFRGS. Espera-se que esse trabalho possa servir de base para a construção de ferramentas de avaliação computacional adequadas para essas metodologias. / Through the use of new methodologies and tools, or by its simple presence in classrooms, Information and Communication Technologies are radically changing educational practices. In this context, this work focuses on issues manifested in computational tools through the scope of different learning theories. It points out a methodological incompatibility among traditional student assessment tools available in current Learning Management Systems and some Computational Ontologies concerning cognitivist learning theories. Therefore, a new computational technique is proposed to evaluate cognitive and behavioral aspects of students. Called evaluation graphs, it is a Decision Support System developed as a consensus-driven methodology to be used in the AMORA project that is being conducted in the application school at UFRGS. It is expected that this new model will serve as the basis to build new student assessment tools compatible with these methodologies.
|
212 |
Um modelo de pontuação na busca de competências acadêmicas de pesquisadores / A score-based model for assessing academic researchers competencesRech, Rodrigo Octavio January 2007 (has links)
Esta pesquisa descreve um modelo para descobrir e pontuar competências acadêmicas de pesquisadores, baseado na combinação de indicadores quantitativos que permitem mensurar a produção acadêmica dos cientistas. Um diferencial do modelo é a inclusão de indicadores quantitativos relacionados com a importância da produção bibliográfica dos pesquisadores. Estes indicadores possibilitam uma avaliação da produção considerando aspectos como repercussão na comunidade acadêmica e nível dos veículos de publicação. A pesquisa também contribui com a especificação de uma arquitetura flexível e extensível fundamentada em técnicas de extração de dados na Web e casamento aproximado de dados (através de funções de similaridade). A arquitetura foi implementada em um sistema Web cuja principal característica é a integração de diversas tecnologias open source. O sistema desenvolvido permite que qualquer pesquisador avalie quantitativamente sua produção científica, automatizando diversos aspectos relacionados à tarefa de avaliação, como a obtenção dos indicadores e a integração das diferentes bases de informações. / The present research describes a model that aims finding out and scoring academic researchers skills or competences based on the combination of quantitative indicators that make it possible to measure the production of academic scientists. A special feature concerning our model is the inclusion of quantitative indicators related to the importance of the researchers’ bibliographic production. These indicators allow the evaluation of the production considering both the outcome it has had in the academic community, and the quality level of the place it was published. The study also presents a flexible and extensible architecture specification based on techniques of web data extraction, and on approximate data matching (which is carried out through similarity functions). The architecture has been implemented in a web system whose main feature relies on the integration of several open-source technologies. The developed system allows any researcher to evaluate his/her own scientific production in quantitative terms, automating as well the so many aspects regarding the evaluation task, by making it easier to obtain the indicators and to integrate the different information databases, for instance.
|
213 |
Um modelo de pontuação na busca de competências acadêmicas de pesquisadores / A score-based model for assessing academic researchers competencesRech, Rodrigo Octavio January 2007 (has links)
Esta pesquisa descreve um modelo para descobrir e pontuar competências acadêmicas de pesquisadores, baseado na combinação de indicadores quantitativos que permitem mensurar a produção acadêmica dos cientistas. Um diferencial do modelo é a inclusão de indicadores quantitativos relacionados com a importância da produção bibliográfica dos pesquisadores. Estes indicadores possibilitam uma avaliação da produção considerando aspectos como repercussão na comunidade acadêmica e nível dos veículos de publicação. A pesquisa também contribui com a especificação de uma arquitetura flexível e extensível fundamentada em técnicas de extração de dados na Web e casamento aproximado de dados (através de funções de similaridade). A arquitetura foi implementada em um sistema Web cuja principal característica é a integração de diversas tecnologias open source. O sistema desenvolvido permite que qualquer pesquisador avalie quantitativamente sua produção científica, automatizando diversos aspectos relacionados à tarefa de avaliação, como a obtenção dos indicadores e a integração das diferentes bases de informações. / The present research describes a model that aims finding out and scoring academic researchers skills or competences based on the combination of quantitative indicators that make it possible to measure the production of academic scientists. A special feature concerning our model is the inclusion of quantitative indicators related to the importance of the researchers’ bibliographic production. These indicators allow the evaluation of the production considering both the outcome it has had in the academic community, and the quality level of the place it was published. The study also presents a flexible and extensible architecture specification based on techniques of web data extraction, and on approximate data matching (which is carried out through similarity functions). The architecture has been implemented in a web system whose main feature relies on the integration of several open-source technologies. The developed system allows any researcher to evaluate his/her own scientific production in quantitative terms, automating as well the so many aspects regarding the evaluation task, by making it easier to obtain the indicators and to integrate the different information databases, for instance.
|
214 |
Towards completely automatized HTML form discovery on the webMoraes, Maurício Coutinho January 2013 (has links)
The forms discovered by our proposal can be directly used as training data by some form classifiers. Our experimental validation used thousands of real Web forms, divided into six domains, including a representative subset of the publicly available DeepPeep form base (DEEPPEEP, 2010; DEEPPEEP REPOSITORY, 2011). Our results show that it is feasible to mitigate the demanding manual work required by two cutting-edge form classifiers (i.e., GFC and DSFC (BARBOSA; FREIRE, 2007a)), at the cost of a relatively small loss in effectiveness.
|
215 |
Conversão de imagens do formato DICOM visando a inter-operacionalidade de sistemas através da WEB / Conversion of images of the DICOM format seeking interaction of systems from WEBGuimarães, Renato Rangel January 2002 (has links)
Este trabalho apresenta uma proposta para a publicação eletrônica de imagens e metadados do formato DICOM, visando à interoperabilidade de sistemas heterogêneos, que têm a capacidade de se adaptarem às particularidades do ambiente médico, através da Web, proporcionando assim, ambientes propícios à área da saúde. Atualmente, para desenvolver ambientes de visualização de imagens na Web, são utilizados padrões de imagens, conceitos de metadados e adaptação de tecnologias para este fim. Utilizando o formato padrão de imagens médicas DICOM, com este trabalho se propõe construir um Framework para visualizar e trocar informações através da Web. Entre as suas aplicações estão a telemedicina e a integração de imagens aos sistemas de informação na área da saúde. / The present work presents a proposal for electronic publishing of images and metadata of the DICOM format. It aims interoperation of heterogeneous systems, which have the capacity to adapt themselves to the specificities of medical environment, via Web, providing this way, proper environments to the health area. Nowadays, in order to develop environments for visualizing images on the Web, it is necessary to use patterns of images, metadata concepts and adaptations of technologies for this purpose. Throughout the use of standard format of medical images DICOM, this work proposes the construction of a Framework to visualize and exchange information via Web. Among its applications are the telemedicine and the image integration to the information systems in the health area.
|
216 |
GraphSchema : uma linguagem visual para a criação de modelos de contratos com SML / GraphSchema : a visual language to create contract models with SMLRivaldo, Ricardo de Moura January 2008 (has links)
É usual falar da onipresença dos documentos de texto e na quantidade de informação não estruturada, armazenada sob a forma de arquivos com documentos de texto em linguagem natural. Este fato torna-se mais dramático no domínio jurídico, onde o texto é a ferramenta básica de trabalho dos profissionais da área, tanto na forma das fontes de consulta, i.e., a legislação, como no principal produto da atividade jurídica, especificamente a criação de documentos escritos. Desde a invenção do editor de texto existem iniciativas de utilização de tecnologias da informação para auxiliar a geração, armazenamento e consulta de documentos jurídicos. Dentre os diversos ramos da atividade jurídica, a criação de contratos é especialmente importante, devido a sua onipresença nas interações entre os agentes sociais, sejam elas pessoas físicas, jurídicas ou agentes de governo. Com foco na criação de modelos de contratos, este trabalho introduz a linguagem gráfica GraphSchema. Projetada para usuários finais, GraphSchema utiliza uma representação visual para criação de modelos de contratos jurídicos, permitindo a modelagem dos conceitos, relacionamentos e restrições entre estes. A representação visual é diretamente mapeada na linguagem SML, uma extensão do XML Schema. Ao possibilitar a criação de modelos conceituais de contratos diretamente por parte dos usuários finais sem forçar um vocabulário ou ontologia específicos, GraphSchema e, conseqüentemente, a utilização de SML, apresenta vantagens quando comparado com a utilização de XML Schema, RDF e OWL. Mas principalmente apresenta vantagens quando comparada com outras abordagens baseadas em definição de vocabulários e utilização de ontologias formais. Estas vantagens decorrem de sua simplicidade e flexibilidade que permite a utilização de padrões existentes para a definição de modelos de contratos, tais como, o padrão eContracts definido pelo consórcio LegalXML. Deste modo, GraphSchema apresenta-se como uma opção para a implementação e aplicação prática deste padrão. A disponibilidade de uma linguagem para usuários não técnicos permitirá a criação de contratos com marcação a priori, quando utilizado em conjunto com editores de texto guiados por XML. Isto irá abrir caminho para o aumento da produtividade na criação de contratos e documentos jurídicos. / It is common place to talk about the widespread presence of text documents and unstructured information stored in natural language text documents file format. This fact is still more dramatic to law professionals where text is the basic tool for their work. Those texts came from multiple sources like research documents and legislation and also are the main product from law activities, i.e., text documents which are created by law professionals. Since the first text editor there are several initiatives to use information technologies to help the generation, storage and search of law documents. From all documents, legal contracts generation is especially important due to its ubiquity and use by all social actors like common people, companies and government agencies. This work main focus is legal contract model generation. GraphSchema graphical language is introduced as a proposed solution to enable users to create contract models without help from a computer professional. It uses a visual representation to create legal contracts models, where concepts, relationships between those and constraints can be represented in a visual paradigm which can be understood by users. The graphical representation is translated to SML, a XML Schema extension. On enabling final user conceptual contract modeling without forcing a restrict vocabulary or ontology, GraphSchema and. by consequence, the use of SML, has several advantages in comparison with the use of simple XML Schema, RDF and OWL. But mainly show advantages when compared with other approaches based on vocabulary definition and formal ontology usage. Those advantages are mainly due to its simplicity and flexibility which enable the use of existing standards to define contract models like the eContracts standard defined by LegalXML consortium. This way, GraphSchema appears as an option to implement and use this standard in real world cases. The availability of a language directed towards non technical user will enable the contracts creation with tag markup from the beginning when used with XML guided text editors. This opens a door to productivity grow on contracts and legal documents creation.
|
217 |
Aplicando a relevância da opinião de usuários em sistema de recomendação para pesquisadores / Applying user’s opinion relevance in a Recommender System to ResearchersCazella, Silvio Cesar January 2006 (has links)
As pessoas têm acesso a uma vasta gama de informações devido a grande oferta e aos recursos da Internet, porém despendem muito tempo na busca do que realmente é interessante ou útil para elas. A dificuldade de encontrar a informação correta é aumentada quando a informação disputa a atenção de uma pessoa com uma série de outras informações não tão relevantes. Procurando minimizar esta dificuldade e auxiliar no acesso a informação interessante, são aplicados desde sistemas de recuperação de informação até sistemas de filtragem de informação. Os sistemas de recuperação são amplamente difundidos na Internet através dos motores de busca (por exemplo, google.com, av.com, citeseer.ist.psu.edu), porém um problema neste tipo de aplicação constitui-se na necessidade do usuário apresentar os termos (palavras-chave) que são relevantes para a consulta. filtragem de informação, tendo como representante os Sistemas de Recomendação, surge como uma nova abordagem que procura liberar o usuário da exigência de criar consultas com palavras-chave, ou seja, a filtragem baseada em conteúdo procura casar o perfil do usuário e o conteúdo dos itens a serem recomendados, e então, oferecer alguns destes itens aos usuários. Por fim, surgiram sistemas que não se baseavam na análise do conteúdo dos itens, mas sim na reputação de um item junto aos outros usuários, ou seja, o usuário recebe a recomendação de um item que pode ser do seu interesse frente à colaboração de outros usuários que avaliaram o item. A questão maior nesta abordagem está no quanto a opinião de um usuário que avaliou um item é relevante para servir como colaboração na elaboração da recomendação para outro usuário. Esta tese constitui-se em uma proposta para modelar e incluir a relevância da opinião do usuário no processo de recomendação colaborativa, ou seja, apresenta uma abordagem de Sistemas de Recomendação para recomendar itens baseando-se em informação adicional − definida como relevância da opinião do usuário − além das típicas informações utilizadas na grande maioria dos Sistemas de Recomendação. Esta inclusão da relevância da opinião constitui-se em uma alternativa para que o usuário alvo da recomendação consiga identificar qual a importância de um determinado item recomendado frente à relevância de opinião dos recomendadores. A idéia apresentada é a de que pessoas com maior relevância de opinião poderiam melhor avaliar e recomendar itens. / Nowadays, people have access to a huge amount of information due to the Internet's resources. However they spend too much time searching for interesting, adequate or useful information. The difficulty to find worthwhile information increases when interesting things dispute the user's attention. Information retrieval and information filtering systems are applicable in order to minimize search difficulties, aiming to aid the user in the search for worthwhile information. Information retrieval systems are widely spread in the Internet through search engines (e.g., google.com, av.com, citeseer.ist.psu.edu). However there is a problem in this kind of application, which consists in compelling the user to know the terms (keywords) that are relevant for the search. Recommender Systems are an information filtering solution. They present a different approach that frees the user from creating queries with keywords. It means that the system tries to match the user's profile (historical interests) with the content of items to be recommended, and then offers these items to the user (recommendee). In parallel, an alternative approach to item recommendation was proposed, this one based on the offering of items based on other users’ opinion, i.e. the user receives an item recommendation based on the evaluation of other users (collaborative filtering or social filtering). However, a different question is raised here − how much the opinion of a user who evaluated an item is relevant to be employed in the recommendation process applying a collaborative method? This thesis presents a new approach to model and include in the collaborative recommendation process additional information named Recommender's Rank, which represents the relevance of the user's opinion and complements the typical information used in the large majority of Recommender Systems. This approach is an alternative to aid the user to identify the importance of a recommended item based on other users' opinions, as people with higher relevance of opinion are more likely to better evaluate and recommend items.
|
218 |
Aplicando a relevância da opinião de usuários em sistema de recomendação para pesquisadores / Applying user’s opinion relevance in a Recommender System to ResearchersCazella, Silvio Cesar January 2006 (has links)
As pessoas têm acesso a uma vasta gama de informações devido a grande oferta e aos recursos da Internet, porém despendem muito tempo na busca do que realmente é interessante ou útil para elas. A dificuldade de encontrar a informação correta é aumentada quando a informação disputa a atenção de uma pessoa com uma série de outras informações não tão relevantes. Procurando minimizar esta dificuldade e auxiliar no acesso a informação interessante, são aplicados desde sistemas de recuperação de informação até sistemas de filtragem de informação. Os sistemas de recuperação são amplamente difundidos na Internet através dos motores de busca (por exemplo, google.com, av.com, citeseer.ist.psu.edu), porém um problema neste tipo de aplicação constitui-se na necessidade do usuário apresentar os termos (palavras-chave) que são relevantes para a consulta. filtragem de informação, tendo como representante os Sistemas de Recomendação, surge como uma nova abordagem que procura liberar o usuário da exigência de criar consultas com palavras-chave, ou seja, a filtragem baseada em conteúdo procura casar o perfil do usuário e o conteúdo dos itens a serem recomendados, e então, oferecer alguns destes itens aos usuários. Por fim, surgiram sistemas que não se baseavam na análise do conteúdo dos itens, mas sim na reputação de um item junto aos outros usuários, ou seja, o usuário recebe a recomendação de um item que pode ser do seu interesse frente à colaboração de outros usuários que avaliaram o item. A questão maior nesta abordagem está no quanto a opinião de um usuário que avaliou um item é relevante para servir como colaboração na elaboração da recomendação para outro usuário. Esta tese constitui-se em uma proposta para modelar e incluir a relevância da opinião do usuário no processo de recomendação colaborativa, ou seja, apresenta uma abordagem de Sistemas de Recomendação para recomendar itens baseando-se em informação adicional − definida como relevância da opinião do usuário − além das típicas informações utilizadas na grande maioria dos Sistemas de Recomendação. Esta inclusão da relevância da opinião constitui-se em uma alternativa para que o usuário alvo da recomendação consiga identificar qual a importância de um determinado item recomendado frente à relevância de opinião dos recomendadores. A idéia apresentada é a de que pessoas com maior relevância de opinião poderiam melhor avaliar e recomendar itens. / Nowadays, people have access to a huge amount of information due to the Internet's resources. However they spend too much time searching for interesting, adequate or useful information. The difficulty to find worthwhile information increases when interesting things dispute the user's attention. Information retrieval and information filtering systems are applicable in order to minimize search difficulties, aiming to aid the user in the search for worthwhile information. Information retrieval systems are widely spread in the Internet through search engines (e.g., google.com, av.com, citeseer.ist.psu.edu). However there is a problem in this kind of application, which consists in compelling the user to know the terms (keywords) that are relevant for the search. Recommender Systems are an information filtering solution. They present a different approach that frees the user from creating queries with keywords. It means that the system tries to match the user's profile (historical interests) with the content of items to be recommended, and then offers these items to the user (recommendee). In parallel, an alternative approach to item recommendation was proposed, this one based on the offering of items based on other users’ opinion, i.e. the user receives an item recommendation based on the evaluation of other users (collaborative filtering or social filtering). However, a different question is raised here − how much the opinion of a user who evaluated an item is relevant to be employed in the recommendation process applying a collaborative method? This thesis presents a new approach to model and include in the collaborative recommendation process additional information named Recommender's Rank, which represents the relevance of the user's opinion and complements the typical information used in the large majority of Recommender Systems. This approach is an alternative to aid the user to identify the importance of a recommended item based on other users' opinions, as people with higher relevance of opinion are more likely to better evaluate and recommend items.
|
219 |
Proposta de suporte XML para ambientes de desenvolvimento de sistemas visuais interativos baseados em gramáticas / A XML support propose to development environments of interactive visual systems based on grammarsTelecken, Tiago Lopes January 2008 (has links)
Ambientes de Desenvolvimento Baseados em Gramática (ADBG) utilizam uma rigorosa semântica e sintaxe para prover poderosas ferramentas que são capazes de especificar com precisão as propriedades de um sistema visual interativo. Por intermédio destas ferramentas, os ADBGs auxiliam a edição de gramáticas e a partir destas gramáticas geram o sistema visual interativo especificado. Estes ambientes utilizam componentes dos mais diferentes espaços tecnológicos e esta tese em particular está focalizada no estudo da utilização de componentes da eXtended Markup language (XML) em ADBGs. Componentes XML oferecem inúmeras soluções que visam a interoperabilidade e armazenamento de dados. Porém, apesar de amplamente difundidos a complexidade destes componentes causa uma série de problemas que vão desde o baixo desempenho de processamentos até a inviabilização da implementação de operações mais elaboradas. Com o objetivo de diminuir esta complexidade, a presente tese propõe um conjunto simplificado de componentes XML. O conjunto dos componentes XML propostos e seus relacionamentos formam um framework que pode ser utilizado para se construir ADBGs. Após a definição do framework, o mesmo foi utilizado para se implementar o protótipo de um ADBG. A implementação e uso deste protótipo demonstrou concretamente a viabilidade e aplicabilidade das propostas desta tese. Já para demonstrar a referida diferença de complexidade, os componentes XML do framework proposto foram comparados com os componentes XML dos demais ADBGs. A comparação revelou que os componentes XML das demais abordagens têm entidades adicionais que não estão presentes nos componentes propostos. Este conjunto adicional de entidades comprovou a maior complexidade dos componentes XML utilizados nos demais ADBGs. Adicionalmente, a referida comparação demonstrou que mesmo sendo mais simples os componentes propostos mantêm as mesmas funcionalidades que os componentes atualmente utilizados. / Development Environments Based on Grammar (DEBGs) often rely on rigorous syntax and semantics, which provide powerful tools to fully specify visual interactive systems and its properties. Such environments provide to visual interactive system developers a set of editors to aid the grammar specification. From these grammars specifications the DEBGs can generate the specified visual interactive systems. Such environments can use components from several technological spaces. However this thesis is focused on the application of eXtended Markup language (XML) components in DEBGs. XML components provide many solutions in terms of interoperability and data storing. Despite of its widely application, the complexity of XML components is the cause of problems such as low processing performance and inviability of many implementations. Aiming to decrease such complexity, we propose a set of simplified XML components. The set of proposed XML components and its relationships compose a framework that can be used to develop DEBGs. After the framework specification, the framework was used to implement a DEBG prototype. Such prototype shows the viability and applicability our proposals. We demonstrate the referred complexity difference comparing the XML components proposed in this thesis with the XML components applied in others DEBGs. Basically, the XML component of others DEBGs has all entities of correspondent component proposed in this thesis more a set of extra entities. This set of extra entities demonstrates the greater complexity of other approaches. Additionally, the referred comparison demonstrates that despite of its simplifications, the proposed components have the same functionalities than the current components.
|
220 |
SES : sistema de extração semântica de informações / System of semantic extraction of informationScarinci, Rui Gureghian January 1997 (has links)
Entre as áreas que mais se desenvolvem na informática nos últimos anos estão aquelas relacionadas ao crescimento da rede Internet, que interliga milhões de usuários de todo o mundo. Esta rede disponibiliza aos usuários uma a enorme variedade e quantidade de informações, principalmente dados armazenados de forma não estruturada ou semi estruturada. Contudo, tal volume e heterogeneidade acaba dificultando a manipulação dos dados recuperados a partir da Internet. Este problema motivou o desenvolvimento deste trabalho. Mesmo com o auxílio de várias ferramentas de pesquisa na Internet, buscando realizar pesquisas sobre assuntos específicos, o usuário ainda tem que manipular em seu computador pessoal uma grande quantidade de informação, pois estas ferramentas não realizam um processo de seleção detalhado. Ou seja, são recuperados muitos dados não interessantes ao usuário. Existe, também, uma grande diversidade de assuntos e padrões de transferência e armazenamento da informação criando os mais heterogêneos ambientes de pesquisa e consulta de dados. Esta heterogeneidade faz com que o usuário da rede deva conhecer todo um conjunto de padrões e ferramentas a fim de obter a informação desejada. No entanto, a maior dificuldade de manipulação esta ligada aos formatos de armazenamento não estruturados ou pouco estruturados, como, por exemplo: arquivos textos, Mails (correspondência eletrônica) e artigos de News (jornais eletrônicos). Nestes formatos, o entendimento do documento exige a leitura do mesmo pelo usuário, o que muitas vezes acarreta em um gasto de tempo desnecessário, pois o documento, por exemplo, pode não ser de interesse deste ou, então, ser de interesse, mas sua leitura completa só seria útil posteriormente. Várias informações, como chamadas de trabalhos para congressos, preços de produtos e estatísticas econômicas, entre outras, apresentam validade temporal. Outras informações são atualizadas periodicamente. Muitas dessas características temporais são explicitas, outras estão implícitas no meio de outros tipos de dados. Isto torna muito difícil a recuperação de tal tipo de informação, gerando, várias vezes, a utilização de informações desatualizadas, ou a perda de oportunidades. Desta forma, o grande volume de dados em arquivos pessoais obtidos a partir da Internet criou uma complexa tarefa de gerenciamento dos mesmos em conseqüência da natureza não estruturada dos documentos recuperados e da complexidade da análise do tempo de validade inerente a estes dados. Com o objetivo de satisfazer as necessidades de seleção e conseqüente manipulação das informações existentes a nível local (computador pessoal), neste trabalho, é descrito um sistema para extração e sumarização destes dados, utilizando conceitos de IE (Information Extraction) e Sistemas Baseados em Conhecimento. Os dados processados são parcialmente estruturados ou não estruturados, sendo manipulados por um extrator configurado a partir de bases de conhecimento geradas pelo usuário do sistema. O objetivo final desta dissertação é a implementação do Sistema de Extração Semântica de Informações, o qual permite a classificação dos dados extraídos em classes significativas para o usuário e a determinação da validade temporal destes dados a partir da geração de uma base de dados estruturada. / One of the most challenging area in Computer Science is related to Internet technology. This network offers to the users a large variety and amount of information, mainly, data storage in unstructured or semi-structured formats. However, the vast data volume and heterogeneity transforms the retrieved data manipulation a very arduous work. This problem was the prime motivation of this work. As with many tools for data retrieval and specific searching, the user has to manipulate in his personal computer an increasing amount of information, because these tools do not realize a precise data selection process. Many retrieval data are not interesting for the user. There are, also, a big diversity of subjects and standards in information transmission and storage, creating the most heterogeneous environments in data searching and retrieval. Due to this heterogeneity, the user has to know many data standards and searching tools to obtain the requested information. However, the fundamental problem for data manipulation is the partially or fully unstructured data formats, as text, mail and news data structures. For files in these formats, the user has to read each of the files to filter the relevant information, originating a loss of time, because the document could be not interesting for the user, or if it is interesting, its complete reading may be unnecessary at the moment. Some information as call-for-papers, product prices, economic statistics and others, has associated a temporal validity. Other information are updated periodically. Some of these temporal characteristics are explicit, others are implicitly embedded in other data types. As it is very difficult to retrieve the temporal data automatically, which generate, many times, the use of invalid information, as a result, some opportunities are lost. On this paper a system for extraction and summarizing of data is described. The main objective is to satisfy the user's selection needs and consequently information manipulation stored in a personal computer. To achieve this goal we are employed the concepts of Information Extraction (IE) and Knowledge Based Systems. The input data manipulation is done by an extraction procedure configured by a user who defined knowledge base. The objective of this paper is to develop a System of Semantic Extraction of Information which classifies the data extracted in meaningful classes for the user and to deduce the temporal validity of this data. This goal was achieved by the generation of a structured temporal data base.
|
Page generated in 0.4747 seconds