71 |
A Genetic-Based Search for Adaptive Table Recognition in SpreadsheetsLehner, Wolfgang, Koci, Elvis, Thiele, Maik, Romero, Oscar 22 June 2023 (has links)
Spreadsheets are very successful content generation tools, used in almost every enterprise to create a wealth of information. However, this information is often intermingled with various formatting, layout, and textual metadata, making it hard to identify and interpret the tabular payload. Previous works proposed to solve this problem by mainly using heuristics. Although fast to implement, these approaches fail to capture the high variability of user-generated spreadsheet tables. Therefore, in this paper, we propose a supervised approach that is able to adapt to arbitrary spreadsheet datasets. We use a graph model to represent the contents of a sheet, which carries layout and spatial features. Subsequently, we apply genetic-based approaches for graph partitioning, to recognize the parts of the graph corresponding to tables in the sheet. The search for tables is guided by an objective function, which is tuned to match the specific characteristics of a given dataset. We present the feasibility of this approach with an experimental evaluation, on a large, real-world spreadsheet corpus.
|
72 |
Wege und Mehrwerte der Vernetzung von Kulturdaten: Erfahrungen aus der Arbeit der SLUB DresdenMunke, Martin 16 September 2024 (has links)
No description available.
|
73 |
Digitalisierungsstrategie für Archive von LokalfernsehsendernRickert, Markus 05 April 2018 (has links)
Der Freistaat Sachsen hat eine hohe Dichte an unabhängigen lokalen und regionalen Fernsehsendern. Aus den Antennengemeinschaften zur Zeit der DDR entwickelten sich private Fernsehsender nach der Wiedervereinigung. Diese lokalen TV-Sender dokumentierten in der Zeit der gesellschaftlichen Veränderungen in den 1990er Jahren die tiefgreifenden Veränderungen des Alltags des Einzelnen, der lokalen Gemeinschaften und der historischen Veränderungen in Gesellschaft und Wirtschaft in den ersten Jahren nach der deutschen Wiedervereinigung. Diese Aufnahmen sind ein wesentlicher Bestandteil des sächsischen Kulturerbes und von höchstem Interesse für die Sozial-, Kultur- und Medienforschung. Aufgrund der Art und Weise, wie das Originalmaterial auf Videobändern produziert wurde, sind die Aufnahmen heute vom Verfall bedroht. In den nächsten Jahren werden die Aufnahmen verloren gehen, wenn nicht schnell gehandelt wird. Einige staatliche und private Institutionen entwickeln derzeit Konzepte zur Erhaltung des audiovisuellen Erbes in Sachsen.
In diesem Konzept wird dargestellt, wie diese Medienobjekte im Sinne medien- und soziokultureller Dimensionen, Fragen und Kategorien wissenschaftlich untersucht werden sollen. Basierend auf den Erfahrungen aus Vorarbeiten und Pilotprojekten sowie neuen Untersuchungen, wurde ein technisches Konzept entwickelt, das zeigt, wie man große Mengen von Videobändern digitalisieren, indexieren, beschreiben und kategorisieren kann, um diesen wichtigen Teil des kulturellen Erbes in Deutschland zu erhalten, zu archivieren und öffentlich zugänglich zu machen.:1 Einleitung
1.1 Vorarbeiten
2 Darstellung des Objektkorpus
2.1 Beschreibung und Umfang
2.1.1 Wissenschaftliche Relevanz
2.1.2 Wissenschaftliche Fragestellungen
2.2 Technischer Zustand und Umstände
2.2.1 Datenträger
2.2.1.1 Alterungsproblematik
2.2.1.2 VHS und S-VHS
2.2.1.3 DV und MiniDV
2.2.1.4 Betacam und Betacam SP
2.2.2 Abspielgeräte
2.2.2.1 Alterung und Verfügbarkeit
2.2.2.2 Signalschnittstellen
2.2.2.3 Reinigung und Wartung
2.3 Konservatorische Prüfung
2.4 Rechtlicher Status der anvisierten Objekte
2.4.1 Urheber- und Verwertungsrechte
2.4.2 Persönlichkeitsrechte
2.4.3 Rechteeinräumung
2.4.4 Verwertung und Veröffentlichung
3 Konzept und Datenmanagementplan
3.1 Strategie und Phasen
3.2 Digitalisierung
3.3 Datei- und Kompressionsformate
3.4 Erschließung
3.4.1 Besonderheiten bei der Erschließung von AV-Medien
3.4.2 Adaptives Erschließungsmodell
3.4.3 Metadaten
3.4.4 Automatische Analyse
3.5 Metadatenaustausch
3.5.1 METS
3.5.2 MOTS
3.5.3 MARC21
3.5.4 LIDO
3.5.5 MPEG-7
3.5.6 DublinCore und EBUCore
3.6 Persistente Identifizierung
3.6.1 URN
3.6.2 URI
3.6.3 DOI
3.6.4 PURL
3.6.5 ISAN
3.6.6 Diskussion
3.7 Archivierung und Zugang
3.7.1 Strategie
3.7.2 OAIS
3.7.3 LTO
3.7.4 Kosten
A Literaturverzeichnis
B Abbildungsverzeichnis
C Tabellenverzeichnis / The Free State of Saxony has a high density of independent local and regional television stations. From the antenna communities at the time of the GDR, private television stations developed after the reunification. These local TV stations documented in the period of social change in the 1990s the profound changes in everyday life of individuals, local communities, and historical changes in society and economy in the first years after German reunification. These videos are an integral part of Saxony’s cultural heritage and of the utmost interest in social, cultural and media research. Due to the way the original material was produced on videotapes, the recordings today are in danger of decay. In the next few years, the recordings will be lost unless action is taken quickly. Some state and private institutions are currently developing concepts for the preservation of audiovisual heritage in Saxony.
This concept shows how these media objects should be scientifically investigated in terms of media and socio-cultural dimensions, questions and categories. Based on the experience of preparatory work and pilot projects as well as new investigations, a technical concept was developed which shows how to digitize, index, describe and categorize large volumes of videotapes in order to preserve, archive and preserve this important part of the cultural heritage in Germany publicly accessible.:1 Einleitung
1.1 Vorarbeiten
2 Darstellung des Objektkorpus
2.1 Beschreibung und Umfang
2.1.1 Wissenschaftliche Relevanz
2.1.2 Wissenschaftliche Fragestellungen
2.2 Technischer Zustand und Umstände
2.2.1 Datenträger
2.2.1.1 Alterungsproblematik
2.2.1.2 VHS und S-VHS
2.2.1.3 DV und MiniDV
2.2.1.4 Betacam und Betacam SP
2.2.2 Abspielgeräte
2.2.2.1 Alterung und Verfügbarkeit
2.2.2.2 Signalschnittstellen
2.2.2.3 Reinigung und Wartung
2.3 Konservatorische Prüfung
2.4 Rechtlicher Status der anvisierten Objekte
2.4.1 Urheber- und Verwertungsrechte
2.4.2 Persönlichkeitsrechte
2.4.3 Rechteeinräumung
2.4.4 Verwertung und Veröffentlichung
3 Konzept und Datenmanagementplan
3.1 Strategie und Phasen
3.2 Digitalisierung
3.3 Datei- und Kompressionsformate
3.4 Erschließung
3.4.1 Besonderheiten bei der Erschließung von AV-Medien
3.4.2 Adaptives Erschließungsmodell
3.4.3 Metadaten
3.4.4 Automatische Analyse
3.5 Metadatenaustausch
3.5.1 METS
3.5.2 MOTS
3.5.3 MARC21
3.5.4 LIDO
3.5.5 MPEG-7
3.5.6 DublinCore und EBUCore
3.6 Persistente Identifizierung
3.6.1 URN
3.6.2 URI
3.6.3 DOI
3.6.4 PURL
3.6.5 ISAN
3.6.6 Diskussion
3.7 Archivierung und Zugang
3.7.1 Strategie
3.7.2 OAIS
3.7.3 LTO
3.7.4 Kosten
A Literaturverzeichnis
B Abbildungsverzeichnis
C Tabellenverzeichnis
|
74 |
MKM – ein Metamodell für KorpusmetadatenOdebrecht, Carolin 11 September 2018 (has links)
Korpusdokumentation wird in dieser Arbeit als eine Voraussetzung für die Wiederverwendung von Korpora und als ein Bestandteil des Forschungsdatenmanagements verstanden, welches unter anderem die Veröffentlichung und Archivierung von Korpora umfasst. Verschiedene Forschungsdaten stellen ganz unterschiedliche Anforderungen an die Dokumentation und können auch unterschiedlich wiederverwendet werden. Ein geeignetes Anwendungsbeispiel stellen historische Textkorpora dar, da sie in vielen Fächern als empirische Grundlage für die Forschung genutzt werden können. Sie zeichnen sich im Weiteren durch vielfältige Unterschiede in ihrer Aufbereitung und durch ein komplexes Verhältnis zu der historischen Vorlage aus. Die Ergebnisse von Transkription und Normalisierung müssen als eigenständige Repräsentationen und Interpretationen im Vergleich zur Vorlage verstanden werden. Was müssen Forscherinnen und Forscher über ihr Korpus mit Hilfe von Metadaten dokumentieren, um dessen Erschließung und Wiederverwendung für andere Forscherinnen und Forscher zu ermöglichen? Welche Funktionen übernehmen dabei die Metadaten? Wie können Metadaten modelliert werden, um auf alle Arten von historischen Korpora angewendet werden zu können? Die Arbeit und ihre Fragestellung sind fest in einem interdisziplinären Kontext verortet. Für die Beantwortung der Forschungsfragen wurden Erkenntnisse und Methoden aus den Fachbereichen der Korpuslinguistik, der historischen Linguistik, der Informationswissenschaft sowie der Informatik theoretisch und empirisch betrachtet und für die Entwicklung eines Metamodells für Korpusmetadaten fruchtbar gemacht. Das im Rahmen dieser Arbeit in UML entwickelte Metamodell für Korpusmetadaten modelliert Metadaten von historischen textbasierten Korpora aus einer technisch-abstrakten, produktorientierten und überfachlichen Perspektive und ist in einer TEI-Spezifikation mit Hilfe der TEI-eigenen Modellierungssprache ODD realisiert. / Corpus documentation is a requirement for enabling corpus reuse scenarios and is a part of research data management which covers, among others, data publication and archiving. Different types of research data make differing demands on corpus documentation, and may be reused in various ways. Historical corpora represent an interesting and challenging use case because they are the foundation for empirical studies in many disciplines and show a great variety of reuse possibilities, of data creation, and of data annotation. Furthermore, the relation between the historical corpus and the historical original is complex. The transcription and normalisation of historical texts must be understood as independent representations and interpretations in their own right. Which kind of metadata information, then, must be included in a corpus documentation in order to enable intellectual access and reuse scenarios? What kind of role do metadata play? How can metadata be designed to be applicable to all types of historical corpora? These research questions can only be addressed with help of an interdisciplinary approach, considering findings and methods of corpus linguistics, historical linguistics, information science and computer science. The metamodel developed in this thesis models metadata of historical text-based corpora from a technical, abstract, and interdisciplinary point of view with help of UML. It is realised as a TEI-specification using the modelling language ODD.
|
75 |
MONARCH - Publikationsserver der Technischen Universität ChemnitzBlumtritt, Ute 13 May 2005 (has links)
Der Vortrag wurde auf dem 5. Workshop DissOnline: Abschlussworkshop des DFG-Projektes "Aufbau einer Koordinierungsstelle für elektronische Hochschulschriften" am 25. Februar 2005 gehalten. Der Datentransfer elektronischer Hochschulschriften an die Deutsche Bibliothek (DDB) sowie den Südwestdeutschen Bibliotheksverbund (SWB) ist erläutert. Die Technologie zur Erfassung, Aufbereitung und Datenübermittlung ist für das Meldeinterface DDB und SWB äquivalent. Dabei erfolgt die automatische Vergabe von Persistent Identifiern (URN) für jedes Dokument. Die per Onlineformular vom Autor eingetragenen Metadaten werden zur Abholung und Speicherung auf dem Server der Deutschen Bibliothek in das Format XMetaDiss transformiert und über die OAI Schnittstelle zum Download bereitgestellt. Für die in MONARCH achivierten Dissertationen und Habilitationen ist die Langzeitverfügbarkeit und der persistente Zugriff auf den Volltext gesichert.
|
76 |
Workshop Audiovisuelle MedienEibl, Maximilian, Kürsten, Jens, Ritter, Marc 03 June 2009 (has links) (PDF)
Audiovisuelle Medien stellen Archive vor zunehmende Probleme. Ein stark wachsender (Web-)TV-Markt mit Sende- oder Rohmaterial, zunehmender Einsatz von medial aufbereitetem Lehrmaterial in Schulen, Hochschulen und Firmen, die Verbreitung der Videoanalyse als Forschungs- und Lehrmethode, die Ausbreitung von Überwachungskameras sowie die immer günstigeren Produktionsbedingungen vom professionellen Produzenten bis zum Heimvideo sind nur einige Stichworte um die neuen quantitativen Dimensionen zu umreißen. Die archivarischen und dokumentarischen Werkzeuge sind heute mit dieser Situation überfordert.
Der Workshop versucht hier Probleme und Lösungsmöglichkeiten zu umreißen und beschäftigt sich mit den technologischen Fragestellungen rund um die Archivierung audiovisueller Medien, seien es analoge, digitalisierte oder digitale Medien. Dabei werden zum einen die technologischen Probleme angesprochen, die zum Aufbau und Management eines Archivs bewältigt werden müssen. Zum anderen wird der praktische Einsatz von der Gestaltung der Benutzungsoberfläche bis zur Frage des Umgangs mit kritischem Material diskutiert.
|
77 |
Workshop Audiovisuelle MedienEibl, Maximilian, Kürsten, Jens, Ritter, Marc 03 June 2009 (has links)
Audiovisuelle Medien stellen Archive vor zunehmende Probleme. Ein stark wachsender (Web-)TV-Markt mit Sende- oder Rohmaterial, zunehmender Einsatz von medial aufbereitetem Lehrmaterial in Schulen, Hochschulen und Firmen, die Verbreitung der Videoanalyse als Forschungs- und Lehrmethode, die Ausbreitung von Überwachungskameras sowie die immer günstigeren Produktionsbedingungen vom professionellen Produzenten bis zum Heimvideo sind nur einige Stichworte um die neuen quantitativen Dimensionen zu umreißen. Die archivarischen und dokumentarischen Werkzeuge sind heute mit dieser Situation überfordert.
Der Workshop versucht hier Probleme und Lösungsmöglichkeiten zu umreißen und beschäftigt sich mit den technologischen Fragestellungen rund um die Archivierung audiovisueller Medien, seien es analoge, digitalisierte oder digitale Medien. Dabei werden zum einen die technologischen Probleme angesprochen, die zum Aufbau und Management eines Archivs bewältigt werden müssen. Zum anderen wird der praktische Einsatz von der Gestaltung der Benutzungsoberfläche bis zur Frage des Umgangs mit kritischem Material diskutiert.:Interaction
MedioVis 2.0 - A novel User Interface for Seeking Audio-Visual Media Libraries
Harald Reiterer, Mathias Heilig and Sebastian Rexhausen
SIVA Suite – Konzeption eines Frameworks zur Erstellung von interaktiven Videos
B. Meixner, B. Siegel, G. Hölbling, H. Kosch und F. Lehner
Online-Werbung als digitales Kulturgut: Analyse, Erschließung und Archivierung
Christian Wolff
Beyond Basic Blanks – Vertrauenserhaltende, schrittweise Implementierung neuer Funktionen im Information Retrieval
Arne Berger
Beyond Basic Blanks – Akzeptanz adaptiver Annotations- und Rechercheoberflächen
Arne Berger
Media Usage
Nutzung von Mediatheken öffentlich-rechtlicher Fernsehsender
Sven Pagel, Carina Bischoff, Sebastian Goldstein und Alexander
Jürgens
Video-Tools im Schulunterricht: Psychologisch-pädagogische Forschung zur Nutzung audiovisueller Medien
Carmen Zahn, Karsten Krauskopf und Friedrich W. Hesse
Special Issues in Multimedia Archiving
Einsatz Pixelbasierter Datenfusion zur Objektklassifikation
Jan Thomanek, Holger Lietz, Basel Fardi, Gerd Wanielik
Grundlagen für das Retrieval rotationssymmetrischer Gefäße
Stefan Wagner, Christian Hörr, David Brunner und Guido Brunnett
Verschmelzendes Clustering in Artmap
Frederik Beuth und Marc Ritter
Von der Bildrepräsentation zur Objekterkennung – Bewegungsanalyse als mächtiges Werkzeug der automatischen Bildinterpretation
Tobias John, Basel Fardi und Gerd Wanielik
Aspekte zur Archivierung audiovisueller Unterlagen im Sächsischen Staatsarchiv
Stefan Gööck
FusionSystems GmbH Systeme zur Sensor-Daten-Fusion und Szeneninterpretation
Ullrich Scheunert und Basel Fardi
Multimedia Analysis and Retrieval
Visualisierung von Prozessketten zur Shot Detection
Marc Ritter
Textdetektion und -extraktion mit gewichteter DCT und mehrwertiger
Bildzerlegung
Stephan Heinich
Sprechererkennungssystem auf Basis der Vektorquantisierung mit Störgeräuschfilterung
Stephan Heinich
Metadatenstandards und –formate für audiovisuelle Inhalte
Jens Kürsten
Entwurf einer Service-orientierten Architektur als Erweiterung einer Plattform zum Programm-Austausch
Jens Kürsten
Untersuchungen zu semantischem Retrieval von Bildern mit Hilfe von MPEG7 anhand einer Beispielapplikation
Daniel Pötzinger
Distribution Aspects
Dynamische Distribution personalisierten Mobilfernsehens in hybriden Netzen
Albrecht Kurze, Robert Knauf und Arne Berger
Multimedia Archives – Music
Evaluation of an Image and Music Indexing Prototype
Peter Dunker, Ronny Paduschek, Christian Dittmar, Stefanie Nowak
and Matthias Gruhne
Aspekte inhaltlicher Modellierung von Musikdokumenten in digitalen
Archiven
Michael Rentzsch und Frank Seifert
|
78 |
Von Open Access zu Open Knowledge - wie wir Informationsflüsse der Wissenschaft in der Digitalen Welt organisieren könnenAuer, Sören 14 November 2019 (has links)
Trotz eines verbesserten digitalen Zugangs zu wissenschaftlichen Publikationen in den letzten Jahren bleiben die Grundprinzipien der wissenschaftlichen Kommunikation unverändert und sind weiterhin weitgehend dokumentenbasiert. Die dokumentorientierten Arbeitsabläufe in der Wissenschaft haben die Grenzen der Angemessenheit erreicht, wie die jüngsten Diskussionen über das ungebremste Wachstum wissenschaftlicher Literatur, die Mängel des Peer-Review und die Reproduzierbarkeitskrise zeigen. Open Access ist eine wichtige Voraussetzung diesen Herausforderungen zu begegnen, aber auch nur der erste Schritt. Wir müssen die wissenschaftliche Kommunikation stärker wissensbasiert organisieren, indem wir wissenschaftliche Beiträge und verwandte Artefakte durch semantisch reichhaltige, vernetzte Wissensgraphen ausdrücken und miteinander vernetzen. In diesem Vortrag werden wir mit der Open Research Knowledge Graph Initiative erste Schritte in diese Richtung vorstellen.
|
79 |
Workshop Audiovisuelle MedienEibl, Maximilian, Kürsten, Jens, Knauf, Robert, Ritter, Marc 29 July 2010 (has links) (PDF)
Die Distribution audiovisueller Medien befindet sich im Umbruch. Die Durchschlagkraft des Internets mit seinen on-demand-Diensten stellt einen Gegenentwurf zum klassischen Broadcasting dar. Hier wiederum hat die Digitalisierung zunächst im TV-Bereich und nun auch im Hörfunk Möglichkeiten geschaffen, dem Internet technologisch nachzuziehen. Interaktive, lokalisierte und personalisierte Dienste sind jetzt auch auf dem heimischen Fernsehgerät möglich. Die strikte Trennung von Internet und Fernsehen wird aufgehoben und in konvergenten Diensten verschmolzen. Die Anwendungsszenarien erreichen durch Computer, Fernseh- und mobile Geräte eine beeindruckende Vielfalt, die sowohl bei der technischen Gestaltung als auch bei der inhaltlichen Erstellung Herausforderungen und Chancen bieten.
Der Workshop versucht hier Probleme und Lösungsmöglichkeiten zu umreißen und beschäftigt sich mit den technologischen Fragestellungen rund um die Distribution audiovisueller Medien.
|
80 |
Workshop Audiovisuelle MedienEibl, Maximilian, Kürsten, Jens, Knauf, Robert, Ritter, Marc 29 July 2010 (has links)
Die Distribution audiovisueller Medien befindet sich im Umbruch. Die Durchschlagkraft des Internets mit seinen on-demand-Diensten stellt einen Gegenentwurf zum klassischen Broadcasting dar. Hier wiederum hat die Digitalisierung zunächst im TV-Bereich und nun auch im Hörfunk Möglichkeiten geschaffen, dem Internet technologisch nachzuziehen. Interaktive, lokalisierte und personalisierte Dienste sind jetzt auch auf dem heimischen Fernsehgerät möglich. Die strikte Trennung von Internet und Fernsehen wird aufgehoben und in konvergenten Diensten verschmolzen. Die Anwendungsszenarien erreichen durch Computer, Fernseh- und mobile Geräte eine beeindruckende Vielfalt, die sowohl bei der technischen Gestaltung als auch bei der inhaltlichen Erstellung Herausforderungen und Chancen bieten.
Der Workshop versucht hier Probleme und Lösungsmöglichkeiten zu umreißen und beschäftigt sich mit den technologischen Fragestellungen rund um die Distribution audiovisueller Medien.:<b>Keynote</b>
Cross-Cultural User-Experience Design; The Green Machine; Combined Keynote Lectures for Mobile Media Conference - Aaron Marcus
Rundfunknetze der Zukunft - Keynote zu Konzepten für hybride Rundfunknetze - Albrecht Mugler
<b>Media Trends</b>
Future-Media-Trends - Bedeutung der Medien im Jahr 2015 - Sebastian Buggert und Frank Szymkowiak
Hybride Endgeräte – Anforderungen Inhalte-Wirtschaft - Sebastian Artymiak
Audiovisuelle Medien – Zukunft des Internets: Multiview-Streaming und 3D-Web-TV - Jürgen Lohr
<b>Media Recommendation</b>
Ein Ansatz zur hybriden TV-Empfehlungsgebung basierend auf Programm-Metadaten und Tags - Günther Hölbling
Ein meta-hybrides recommendation system für die webbasierte Filmplattform Critic.de - Krasen Dimitrov und Christian Wolff
<b>Media Platforms</b>
Formatübergreifende Plattform für Produktion und Archiv - Matthias Schnöll
SocialMedia: Unterstützung von Kommunikation und Austausch in Home-IT Umgebungen - Jan Heß, Benedikt Ley, Corinna Ogonowski und Lin Wan
<B>Interactive Video / Rich Media</B>
XML-Schema für interaktive Videos - Britta Meixner, Jan-Oliver Janda, Beate Siegel, Günther Hölbling, Harald Kosch und Franz Lehner
non-linear video - Robert Seeliger, Christian Raeck, Stefan Arbanowski
Videomarkup – Vom Betrachter zum Produzent - Peter Schultes, Franz Lehner und Harald Kosch
<b>Media Classification</b>
Automated Classification of Film Scenes based on Film Grammar - Cornelia Lanz, Hanna Lukashevich, Stefanie Nowak
|
Page generated in 0.0698 seconds