Concept Approximations

Métrologie des graphes de terrain, application à la construction de ressources lexicales et à la recherche d'information / Metrology of terrain networks, application to lexical resources enrichment and to information retrieval

Navarro, Emmanuel 04 November 2013 (has links)
Cette thèse s'organise en deux parties : une première partie s'intéresse aux mesures de similarité entre sommets d'un graphe, une seconde aux méthodes de clustering de graphe biparti. Une nouvelle mesure de similarité entre sommets basée sur des marches aléatoires en temps courts est introduite. Cette méthode a l'avantage, en particulier, d'être insensible à la densité du graphe. Il est ensuite proposé un large état de l'art des similarités entre sommets, ainsi qu'une comparaison expérimentale de ces différentes mesures. Cette première partie se poursuit par la proposition d'une méthode robuste de comparaison de graphes partageant le même ensemble de sommets. Cette mesure est mise en application pour comparer et fusionner des graphes de synonymie. Enfin une application d'aide à la construction de ressources lexicales est présentée. Elle consiste à proposer de nouvelles relations de synonymie à partir de l'ensemble des relations de synonymie déjà existantes. Dans une seconde partie, un parallèle entre l'analyse formelle de concepts et le clustering de graphe biparti est établi. Ce parallèle conduit à l'étude d'un cas particulier pour lequel une partition d’un des groupes de sommets d’un graphe biparti peut-être déterminée alors qu'il n'existe pas de partitionnement correspondant sur l’autre type de sommets. Une méthode simple qui répond à ce problème est proposée et évaluée. Enfin Kodex, un système de classification automatique des résultats d'une recherche d'information est présenté. Ce système est une application en RI des méthodes de clustering vues précédemment. Une évaluation sur une collection de deux millions de pages web montre les avantages de l'approche et permet en outre de mieux comprendre certaines différences entre méthodes de clustering. / This thesis is organized in two parts : the first part focuses on measures of similarity (or proximity) between vertices of a graph, the second part on clustering methods for bipartite graph. A new measure of similarity between vertices, based on short time random walks, is introduced. The main advantage of the method is that it is insensitive to the density of the graph. A broad state of the art of similarities between vertices is then proposed, as well as experimental comparisons of these measures. This is followed by the proposal of a robust method for comparing graphs sharing the same set of vertices. This measure is shown to be applicable to the comparison and merging of synonymy networks. Finally an application for the enrichment of lexical resources is presented. It consists in providing candidate synonyms on the basis of already existing links. In the second part, a parallel between formal concept analysis and clustering of bipartite graph is established. This parallel leads to the particular case where a partition of one of the vertex groups can be determined whereas there is no corresponding partition on the other group of vertices. A simple method that addresses this problem is proposed and evaluated. Finally, a system of automatic classification of search results (Kodex) is presented. This system is an application of previously seen clustering methods. An evaluation on a collection of two million web pages shows the benefits of the approach and also helps to understand some differences between clustering methods.

On the lattice of varieties of almost-idempotent semirings / Über den Varietätenverband fast-idempotenter Halbringe

Uso de informação linguística e análise de conceitos formais no aprendizado de ontologias / Use of linguistic information and formal concept analysis for ontology learning.

Carlos Eduardo Atencio Torres 08 October 2012 (has links)
Na atualidade, o interesse pelo uso de ontologias tem sido incrementado. No entanto, o processo de construção pode ser custoso em termos de tempo. Para uma ontologia ser construída, precisa-se de um especialista com conhecimentos de um editor de ontologias. Com a finalidade de reduzir tal processo de construção pelo especialista, analisamos e propomos um método para realizar aprendizado de ontologias (AO) de forma supervisionada. O presente trabalho consiste em uma abordagem combinada de diferentes técnicas no AO. Primeiro, usamos uma técnica estatística chamada C/NC-values, acompanhada da ferramenta Cogroo, para extrair os termos mais representativos do texto. Esses termos são considerados por sua vez como conceitos. Projetamos também uma gramática de restrições (GR), com base na informação linguística do Português, com o objetivo de reconhecer e estabelecer relações entre conceitos. Para poder enriquecer a informação na ontologia, usamos a análise de conceitos formais (ACF) com o objetivo de identificar possíveis superconceitos entre dois conceitos. Finalmente, extraímos ontologias para os textos de três temas, submetendo-as à avaliação dos especialistas na área. Um web site foi feito para tornar o processo de avaliação mais amigável para os avaliadores e usamos o questionário de marcos de características proposto pelo método OntoMetrics. Os resultados mostram que nosso método provê um ponto de partida aceitável para a construção de ontologias. / Nowadays, the interest in the use of ontologies has increased, nevertheless, the process of ontology construction can be very time consuming. To build an ontology, we need a domain expert with knowledge in an ontology editor. In order to reduce the time needed by the expert, we propose and analyse a supervised ontology learning (OL) method. The present work consists of a combined approach of different techniques in OL. First, we use a statistic technique called C/NC-values, with the help of the Cogroo tool, to extract the most significant terms. These terms are considered as concepts consequently. We also design a constraint grammar (CG) based in linguistic information of Portuguese to recognize relations between concepts. To enrich the ontology information, we use the formal concept analysis (FCA) in order to discover a parent for a set of concepts. In order to evaluate the method, we have extracted ontologies from text on three different domains and tested them with corresponding experts. A web site was built to make the evaluation process friendlier for the experts and we used an evaluation framework proposed in the OntoMetrics method. The results show that our method provides an acceptable starting point for the construction of ontologies.

Topologické vlastnosti zobecněných kontextových struktur / Topological Properties of Generalized Context Structures

Chernikava, Alena January 2014 (has links)
Práce je zaměřena na vzájemnou interakci několika odvětví matematiky. Hlavní myšlenkou práce bylo najít závislosti, vztahy a analogie mezi nimi. První část práce se týká vztahu mezi formální pojmovou analýzou, topologií a parciálními metrikami. Formální kontext je velice obecná matematická struktura, která může reprezentovat ostatní matematické struktury v jednotné a sjednocené formě. Přirozeným způsobem bychom mohli reprezentovat informaci podobně jako v tabulce, reprezentující formální kontext (s respektem ke všem množinově-teoretickým omezením) a generovat určité topologie na množinách atributů a objektů. V druhé části studujeme především pretopologické systémy jako speciální případ formálních kontextů. Od topologických systémů se pretopologické systémy liší především obecnější uspořádanou strukturou na množině atributů, reprezentujících zobecněné otevřené množiny. Vlastnosti tohoto uspořádání podstatně ovlivňují chování celé struktury a proto mu věnujeme zvláštní pozornost v závěru kapitoly, kde se mj. zabýváme konstrukcí analogie de Grootova duálu, včetně jeho iterovaných vlastností. Třetí část práce je zasvěcena struktuře framework, která má přirozenou strukturu formálního kontextu. Framework se skládá ze dvojice množin, z nichž první je množina míst a druhá obsahuje jistý systém podmnožin první množiny, aniž by bylo vyžadováno splnění nějakých axiómů. Struktura je opatřena jednoduchou konstrukcí duality, umožňující přepínání mezi klasickým, bodově-množinovým přístupem, podobně jako v topologii a bezbodovou reprezentací topologických vztahů. V závěru navrhujeme a studujeme, jak aproximovat libovolný framework pomocí usměrněného souboru konečných frameworků z hlediska generované topologie. V poslední části práce používáme metody obecné topologie ke korekci a zlepšení jednoho ze základních teorémů teorie her. Dokázali jsme mimo jiné, že pro hru v normální formě, v níž má i-tý hráč spojitou výherní funkci a množina jeho strategií je skoro-kompaktní, má tento hráč nedominovanou strategii. Kromě tohoto výsledku v poslední a předposlední kapitole ukazujeme, že teorie her přirozeným způsobem generuje velmi obecné, například nehausdorffovské topologické a kontextové struktury, čímž posouvá tradiční chápání reality neobvyklým směrem.

On the lattice of varieties of almost-idempotent semirings

Michalski, Burkhard 01 December 2017 (has links)
Die Arbeit beschäftigt sich mit fast-idempotenten Halbringen, die eine Verallgemeinerung der idempotenten Halbringe darstellen. Es werden - ausgehend von Halbringen mit zwei Elementen - bis auf isomorphe Bilder sämtliche fast-idempotente Halbringe mit drei Elementen generiert, diejenigen Halbringe, die schon in durch zweielementige Halbringe erzeugten Varietäten liegen, aussortiert und die in den verbleibenden elf Halbringen gültigen Gleichungen charakterisiert. Der Verband L(IA3) der Varietäten generiert durch fast-idempotente Halbringe mit maximal drei Elementen wird mit Hilfe eines Kontexts mit 21 Halbringen als Attribute und 28 trennenden Gleichungen als Objekte vollständig bestimmt und besteht aus 19.901 Varietäten. Im Anschluss richtet sich der Fokus der Arbeit auf den Verband L(IA) der fast-idempotenten Halbringe. In diesem werden insbesondere die Varietät V = [xy = yx, xy = xy+x] und deren Untervarietäten V_k = [x^k = x^(k+1)], k >= 2; untersucht. Für all diese Varietäten wird jeweils eine Konstruktionsmethode für eine abzählbare Kette an Untervarietäten der gegebenen Varietät eingeführt und somit schließlich gezeigt, dass der Verband L(IA) aus mindestens abzählbar unendlich vielen Varietäten besteht.

Concept Approximations: Approximative Notions for Concept Lattices

Meschke, Christian 13 April 2012 (has links)
In this thesis, we present a lattice theoretical approach to the field of approximations. Given a pair consisting of a kernel system and a closure system on an underlying lattice, one receives a lattice of approximations. We describe the theory of these lattices of approximations. Furthermore, we put a special focus on the case of concept lattices. As it turns out, approximation of formal concepts can be interpreted as traces, which are preconcepts in a subcontext.:Preface 1. Preliminaries 2. Approximations in Complete Lattices 3. Concept Approximations 4. Rough Sets List of Symbols Index Bibliography / In der vorliegenden Arbeit beschreiben wir einen verbandstheoretischen Zugang zum Thema Approximieren. Ausgehend von einem Kern- und einem Hüllensystem auf einem vollständigen Verband erhält man einen Approximationsverband. Wir beschreiben die Theorie dieser Approximationsverbände. Des Weiteren liegt dabei ein Hauptaugenmerk auf dem Fall zugrundeliegender Begriffsverbände. Wie sich nämlich herausstellt, lassen sich Approximationen formaler Begriffe als Spuren auffassen, welche diese in einem vorgegebenen Teilkontext hinterlassen.:Preface 1. Preliminaries 2. Approximations in Complete Lattices 3. Concept Approximations 4. Rough Sets List of Symbols Index Bibliography

Relational Exploration: Combining Description Logics and Formal Concept Analysis for Knowledge Specification

Rudolph, Sebastian 01 December 2006 (has links)
Facing the growing amount of information in today's society, the task of specifying human knowledge in a way that can be unambiguously processed by computers becomes more and more important. Two acknowledged fields in this evolving scientific area of Knowledge Representation are Description Logics (DL) and Formal Concept Analysis (FCA). While DL concentrates on characterizing domains via logical statements and inferring knowledge from these characterizations, FCA builds conceptual hierarchies on the basis of present data. This work introduces Relational Exploration, a method for acquiring complete relational knowledge about a domain of interest by successively consulting a domain expert without ever asking redundant questions. This is achieved by combining DL and FCA: DL formalisms are used for defining FCA attributes while FCA exploration techniques are deployed to obtain or refine DL knowledge specifications.

Learning Description Logic Knowledge Bases from Data Using Methods from Formal Concept Analysis

Distel, Felix 27 April 2011 (has links)
Description Logics (DLs) are a class of knowledge representation formalisms that can represent terminological and assertional knowledge using a well-defined semantics. Often, knowledge engineers are experts in their own fields, but not in logics, and require assistance in the process of ontology design. This thesis presents three methods that can extract terminological knowledge from existing data and thereby assist in the design process. They are based on similar formalisms from Formal Concept Analysis (FCA), in particular the Next-Closure Algorithm and Attribute-Exploration. The first of the three methods computes terminological knowledge from the data, without any expert interaction. The two other methods use expert interaction where a human expert can confirm each terminological axiom or refute it by providing a counterexample. These two methods differ only in the way counterexamples are provided.

A Connection Between Clone Theory and FCA Provided by Duality Theory

Kerkhoff, Sebastian 02 August 2012 (has links)
The aim of this paper is to show how Formal Concept Analysis can be used for the bene t of clone theory. More precisely, we show how a recently developed duality theory for clones can be used to dualize clones over bounded lattices into the framework of Formal Concept Analysis, where they can be investigated with techniques very di erent from those that universal algebraists are usually armed with. We also illustrate this approach with some small examples.

