Return to search

Ein Repräsentationsformat zur standardisierten Beschreibung und wissensbasierten Modellierung genomischer Expressionsdaten

Die Auswertung von Microarray-Daten beginnt oft mit information retrieval-Ansätzen, welche die Datenmassen auf eine im Hinblick auf eine bestimmte Fragestellung besonders interessante und überschaubare Menge von Genen bzw. probe set IDs reduzieren sollen. Vorraussetzung für eine effiziente Suche im Datenbestand ist jedoch eine Semantisierung bzw. Formalisierung der verwendeten Datenformate. Hier wird eine Ontologie als standardisiertes und semantisch definiertes Repräsentationskonstrukt vorgestellt, welches die Formalisierung von Fachwissen in einem interaktiven Wissensmodell erlaubt, das umfassend abgefragt, konsistent interpretiert und gegebenenfalls automatisiert weiterverarbeitet werden kann. Anhand einer molekularbiologischen Ontologie aus 1200 hierarchisch strukturierten Begriffen und am Beispiel des Toll-Like Receptor-Signalwegs wird aufgezeigt, wie ein solch ein objektorientiertes Beschreibungsvokabular zur Annotierung von Genen auf Affymetrix-Microarrays genutzt werden kann. Die Annotationsbegriffe werden über ontologische Konzepte, deren Eigenschaften und deren semantische Verbindungen (relationale Slots) im Wissensbank-Editor Protégé-2000 modelliert. Annotation bedeutet hier ein Gen formal in einen definierten funktionalen Kontext einzubetten. In der Anwendung der Wissensbank entspricht eine Annotation einem "drag and drop" von Genen in ontologische, die Funktion dieser Gene beschreibende, Konzepte. Die weitergehende kontextuale Annotation erfolgt über eine Vernetzung der Gene zu anderen Konzepten oder Genen. Das so erstellte vernetzte Wissensmodell (die knowledgebase) ermöglicht ein inhaltsbasiertes, assoziatives und kontextgeleitetes "Wissens-Browsing". Ontologisch annotierte Gendaten erlauben auch die Anwendung automatischer datengetriebener Visualisierungsstrategien, wie am Beispiel semantischer Netze gezeigt wird. Eine ontologische Anfrageschnittstelle erlaubt auch semantisch komplexe Anfragen an den Datenbestand bei erhöhter Trefferquote und Präzision. / Functional gene annotations provide important search targets and cluster criteria. We introduce an annotation system that exploits the possibilities of modern knowledge management tools, i.e. ontological querying, inference, networking of annotations and automatic datadriven visualization of the annotated model. The Gandr (gene annotation data representation) knowledgebase is an ontological framework for laboratory-specific gene annotation and knowledgemanagement. Gandr uses Protégé-2000 for editing, querying and visualizing microarray data and annotations. Genes can be annotated with provided, newly created or imported ontological concepts. Annotated genes can inherit assigned concept properties and can be related to each other. The resulting knowledgebase can be visualized as interactive semantic network of nodes and edges representing genes with annotations and their functional relationships. This allows for immediate and associative gene context exploration. Ontological query techniques allow for powerful data access. Annotating genes with formal conceptual descriptions can be performed using ‘drag and drop’ of one or more gene instances onto an annotating concept. Compared with unstructured annotation systems, the annotation process itself becomes faster and leads to annotation schemes of better quality owing to enforcement of constraints provided by the ontology. GandrKB enables lab-bench scientists to query for implicit domain knowledge, inferred from the ontological domain model. Full access to data semantics through queries for properties and relationships ensures a more complete and adequate reply of the system.

Identiferoai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/16133
Date08 June 2006
CreatorsSchober, Daniel
ContributorsReich, J. G., Pöppl, S., Schuster, St.
PublisherHumboldt-Universität zu Berlin, Medizinische Fakultät - Universitätsklinikum Charité
Source SetsHumboldt University of Berlin
LanguageGerman
Detected LanguageEnglish
TypedoctoralThesis, doc-type:doctoralThesis
Formatapplication/pdf

Page generated in 0.0031 seconds