En modell för utformandet av biografiska ordböcker / A model for the design of biographical dictionaries

Ginman, Johan January 2021 (has links)
Every website, computer and IT system have users who need to verify their identity throughauthentication. The most common form of authentication today is to apply an alphanumericpassword. Passwords are often based on biographical information that can be derived from the userhimself and common elements that are usually utilized while creating passwords are names, petnames, family related, and date of birth. While passwords today are often based on the individual'sbiographical elements, the police have problems cracking encrypted devices because it takes a longtime and is complex to identify the correct password among all possible combinations. This problemis the basis for the work and is the reason why this model for how biographical dictionaries should bestructured and contain is created. To design the model, a literature review has been carried outwhere elements have been defined and a structure formed. Interviews with IT forensics from thepolice and NFC were then held to refine the different elements and structure of the initial model andto create a reality anchor. The result of this work is a product in the form of a model that can be usedto create biographical dictionaries based on target people. The model demonstrates whichbiographical elements are relevant for finding potential passwords. The conclusion drawn is that themodel can facilitate the work of the police and IT forensics when it comes to cracking people'sbiographical passwords. By using a dictionary that is built with the model, time-consuming attackssuch as brute-force attacks or more general dictionary attacks do not need to be applied. / Till varje hemsida, dator och IT-system finns användare som behöver verifiera sin identitet genomautentisering. Den vanligaste formen av autentisering är idag att applicera ett alfanumerisktlösenord. Lösenord bygger ofta på biografiska uppgifter som kan härledas från användaren själv ochvanliga element som brukar användas vid lösenordsgenerering är: namn, husdjursnamn, familj ochfödelsedatum. Samtidigt som lösenord idag ofta bygger på individens biografiska element har polisenproblem att knäcka krypterade enheter på grund av att det tar lång tid och är väldigt komplext attidentifiera rätt lösenord bland alla möjliga kombinationer. Detta problem ligger till grund för arbetetsamt är orsaken till varför denna modell för hur biografiska ordböcker ska vara strukturerade ochinnehålla skapas. För att utforma modellen har en litteraturöversikt genomförts där element hardefinierats och en struktur formats. Intervjuer med IT-forensiker från polisen och NFC hölls därefterför att förädla den initiala modellens olika element och struktur samt att skapa enverklighetsförankring. Resultatet av detta arbete är en slutprodukt i form av en modell som går attnyttja för att skapa biografiska ordböcker utifrån målpersoner. Modellen påvisar vilka biografiskaelement som är relevanta för att hitta potentiella lösenord. Slutsatsen som dras gör gällande attmodellen kan underlätta polisens och IT-forensikers arbete när det kommer till att knäcka personersbiografiska lösenord. Genom att nyttja en ordbok som är uppbyggd med modellen behöver intetidskrävande angrepp som ”brute force” attacker eller mer generella ordboksattacker appliceras.

Exploring Krapf's dictionary: special issue

Miehe, Gudrun, Firsching, Henrike January 2009 (has links)
This collection summarizes the items on society, history and culture from Krapf’s famous dictionary which may be of some interest to today’s audience. The idea of arranging the sometimes idiosyncratic Swahili for modern use came up during preparations for the Krapf Workshop held on 11 September 2007 at Fort Jesus in Mombasa.1 The lemmas found in this first comprehensive Swahili dictionary were checked against Frederick Johnson’s Standard dictionary of 1939. In addition, the dictionary by Charles Sacleux of 1939 and the revised version of Krapf’s dictionary by Harry Kerr Binns (1925) served as sources of information. With the exception of those entries which Krapf had already marked with a question mark, all others were selected, which are not found in Johnson or which are described differently or in less depth than in Krapf\''s work.:1. Introduction 1 1.1 Krapf’s spelling conventions 2 2. The inventory 7 2.1 Society, law 8 2.2 References to stories and historical events 37 2.3 Language, pronunciation, etymologies, different use according to sexes 41 2.4 Religion, superstition 44 2.5 Attitudes towards neighbouring peoples 54 2.6 Geographical and ethnic terms 55 2.7 The body (body parts, diseases, body care) 62 2.8 Sickness, handicaps, medical treatment and medicine 67 2.9 Agriculture, food (plants, trees, products) 73 2.10 Animals 97 2.11 Season, times, environment 111 2.12 Material culture 117 2.13 Measures 141 2.14 Comparison of meanings 143 2.15 Critical statements and prejudices 151 3. Proverbs and songs quoted in Johann Ludwig Krapf’s Dictionary 153 3.1 Proverbs 153 3.2 Songs 158 4. Indices 165 4.1 Index Swahili – English 165 4.2 Index English – Swahili 189 Sources 203

TUKI 2004. Kamusi ya Kiswahili Sanifu. Toleo la Pili. [A standard Swahili dictionary. Second edition]. Nairobi: Oxford University Press. xviii, 477 pp. ISBN 0195732227. (ca. 15000 ThS/ 15.- €): Review

Herms, Irmtraud 14 August 2012 (has links)
Book review: In 2004 the long awaited second edition of the Standard Swahili - Swahili Dictionary, edited by the Insitute of Kiswahili Research (TUKI) at the University of Dar es Salaam, appeared. With this publication TUKI has once again confirmed its leading role in the field of Swahili lexicography in East Africa. it is up to date, containing new words and phrases which are in use in East Africa in order to cope with the development in science and technology, society, economics and globalization.

Gestikon. Konzeption eines translationsgerichteten kollaborativen Wörterbuchs der Kinegramme

Weiler, Thomas 27 April 2007 (has links)
Übersetzer bewegen Sprache. Und sie bewegen sich in Sprachen. Eine dieser Sprachen ist die Körpersprache. Lange Zeit wurde diese nonverbale Sprache von der Sprachwissenschaft vernachlässigt, wurden kaum Versuche unternommen, dieses weite Feld zu beackern. Mittlerweile wurde jedoch die Bedeutung des Nonverbalen erkannt, was nicht zuletzt die Fülle an Publikationen in Kommunikationswissenschaft, Semiotik, Psychologie und eben auch in der Linguistik dokumentiert. Die Relevanz der Beschäftigung mit Körpersprache liegt aufgrund der „interkulturell körpersensiblen Dolmetschsituationen“ (KALVERKÄMPER 2003:262) für die Dolmetschwissenschaft auf der Hand (vgl. z. B. NORD 19912:123 ff; AHRENS 1998; POYATOS 2002a:271 ff; KUTZ 2007:30). Doch auch für die Übersetzungswissenschaft bieten sich wichtige Anknüpfungspunkte, die bislang kaum Beachtung gefunden haben. Die Felder des Verbalen und des Nonverbalen weisen zahlreiche Überschneidungen, Verschränkungen und Berührungspunkte auf. So finden sich schon bei WALTHER von der Vogelweide verbale Fixierungen nonverbalen Verhaltens: Ich saz ûf eime steine und dahte bein mit beine: dar ûf saztẹ ich den ellenbogen: ich hetẹ in mîne hant gesmogen daz kinnẹ und ein mîn wange. Der körpersprachliche Ausdruck, per definitionem ein nonverbales Zeichen, kann also auch verbal kodiert werden. Dieser intersemiotische Transferprozess geht, wie der Übersetzungsprozess im Allgemeinen, nicht ohne Verschiebungen und Verluste vonstatten. Was das Auge in Sekundenbruchteilen erfassen kann, würde in Worten beschrieben nicht selten Seiten füllen und bliebe dabei doch nur eine Annäherung an das Gesehene. Statt wortreicher Beschreibungen stehen den Autoren verschiedenster Sprachen aber auch konventionalisierte Wendungen zur Verfügung, mit denen sich Körpersprache prägnant abbilden lässt. Diese Wendungen unterscheiden sich von Sprache zu Sprache nicht nur bezüglich Anzahl und Frequenz. Sie können auch in ihrer Differenziertheit voneinander abweichen und unterschiedlichen stilistischen, zeitlichen, pragmatischen oder morphosyntaktischen Verwendungsrestriktionen unterliegen. Die Übersetzung verbalisierter Kine, verschriftlichter Struktureinheiten der Körpersprache, ist also häufig mit Problemen behaftet. Die kodierte Bewegung muss zunächst als solche erkannt, dann vom Übersetzer imaginiert und interpretiert und schließlich in eine entsprechende zielsprachliche Form gegossen werden. Der Translationsprozess wird damit von einem zusätzlichen Codewechsel, dem zwischen verbalem und nonverbalem Code, überlagert und weiter verkompliziert (Roman JAKOBSON (2002:261) spricht von ‘intersemiotic translation’ oder ‘transmutation’). Besonders Literaturübersetzer sehen sich häufig mit aus verbalisierten Kinen resultierenden Übersetzungsschwierigkeiten konfrontiert, ohne ein für diese Fälle zugeschnittenes Hilfsmittel zur Hand zu haben. Auf den Bedarf an entsprechenden Nachschlagewerken wies bereits 1989 Hans J. VERMEER hin, der damals schon die besondere Eignung digitaler Medien erkannt hatte: „Nonverbale Kommunikation macht etwa 70 % aller Kommunikation aus; sie ist vielfach wichtiger als die verbale. Wir brauchen mehr ‘Wörterbücher’ zur nonverbalen Kommu-nikation. – Ausführlichkeit und Spezialisierung schlossen sich bisher aus ökonomischen Gründen aus; desgleichen Ausführlichkeit und Aktualität; beide Probleme werden mit komputerisierten Terminologiedatenbanken lösbar.“ (VERMEER 1989:172). Mittlerweile liegen mehrere Printwörterbücher zu konventionalisierten Gesten verschiedener Kulturen vor (Vgl. die Aufstellungen in MEO-ZILIO 1990, KÜHN 2002:168, POYATOS 2002b:383, sowie für das Russi-sche GATTNAR 2003:68 ff. Ein deutsches Gestikon existiert bislang nicht.), allerdings richten sich diese nicht – zumindest nicht in erster Linie – an Übersetzer und sind nicht auf deren besondere Bedürfnisse abgestimmt. Aus dieser Situation heraus entstand die Überlegung, selbst ein derartiges Instrument, ein translationsgerichtetes Nachschlagewerk zu schaffen. Bei der Jahrestagung des Verbandes deutschsprachiger Übersetzer literarischer und wissenschaftlicher Werke e. V. (VdÜ) im September 2006 in Wolfenbüttel fand sich eine Gruppe von Übersetzern zusammen, die über Sinn und Zweck, Ausgestaltung und Realisierungsmöglichkeiten eines Gestikons diskutierte. Andreas TRETNER, Übersetzer und Hauptinitiator der Initiative, hatte den Begriff des Gestikons eingebracht.( Auch NOLL spricht in Anlehnung an POGGIs ‘Gestionary’ von ‘Gestikon’ (vgl. NOLL 1998:155), weitere Hinweise auf ähnliche Bezeichnungen finden sich bei KRENN/PIRKER (o. J.).) Dieser soll als griffige und kompakte Benennung auch in der vorliegenden Arbeit Verwendung finden, hilft er doch, die zweifelhafte Rede vom „Wörter“-Buch der Kinegramme zu vermeiden. Als Ergebnis der Wolfenbütteler Diskussion ließ sich festhalten, dass eine multilinguale Datenbank angestrebt wird, mit der Möglichkeit der kontinuierlichen Erweiterung, Bearbeitung und Nutzung durch registrierte User im Internet. Dabei herrschte weitgehend Konsens, dass die Datenbank aus identisch strukturierten einsprachigen Wörterbüchern bestehen soll, eine zweisprachige Anlage wurde als der Komplexität des Gegenstandes nicht angemessen verworfen. Ziel dieser Arbeit soll es nun sein, aus Übersetzerperspektive die Anforderungen an das zu schaffende Instrument zu formulieren und auf dieser Grundlage eine Konzeption für die Struktur des Gestikons und seiner Einträge zu erarbeiten. Diese Konzeption kann dann als Orientierungshilfe bei der Erstellung der Datenbankstruktur durch Informatiker oder Computerlinguisten Verwendung finden. Im Rahmen dieser Arbeit wird zunächst der aktuelle Forschungsstand aufgearbeitet und das zur Verbalisierung von Körpersprache anzutreffende terminologische Inventar vorgestellt und diskutiert. Im Anschluss an die Diskussion werden die in dieser Diplomarbeit verwendeten Termini definiert und mit Beispielen illustriert. Auf den Nachweis der Übersetzungsrelevanz des Themas folgt eine Beschreibung der intendierten Benutzergruppe des Gestikons und eine Analyse der für diese Adressatengruppe zu erwartenden Benutzungssituationen. Innerhalb der lexikographischen Diskussion wird auf konkrete Fragen der Kodifizierung und der Makrostruktur eingegangen, bevor schließlich die Mikrostruktur des Gestikons erarbeitet und mit mehreren Mustereinträgen in deutscher und russischer Sprache im Anhang anschaulich dargestellt wird. Abschließend werden Überlegungen und Ergebnisse der Arbeit zusammengefasst und die Perspektiven für das Gestikon-Projekt skizziert.

Représentations pour la détection d’anomalies : Application aux données vibratoires des moteurs d’avions / Representations for anomaly detection : Application to aircraft engines’ vibration data

Abdel Sayed, Mina 03 July 2018 (has links)
Les mesures de vibrations sont l’une des données les plus pertinentes pour détecter des anomalies sur les moteurs. Les vibrations sont acquises sur banc d’essai en phase d’accélération et de décélération pour assurer la fiabilité du moteur à la sortie de la chaine de production. Ces données temporelles sont converties en spectrogrammes pour permettre aux experts d’effectuer une analyse visuelle de ces données et de détecter les différentes signatures atypiques. Les sources vibratoires correspondent à des raies sur les spectrogrammes. Dans cette thèse, nous avons mis en place un outil d’aide à la décision automatique pour analyser les spectrogrammes et détecter tout type de signatures atypiques, ces signatures ne proviennent pas nécessairement d’un endommagement du moteur. En premier lieu, nous avons construit une base de données numérique de spectrogrammes annotés. Il est important de noter que les signatures inusuelles sont variables en forme, intensité et position et se trouvent dans un faible nombre de données. Par conséquent, pour détecter ces signatures, nous caractérisons les comportements normaux des spectrogrammes, de manière analogue aux méthodes de détection de nouveautés, en représentant les patchs des spectrogrammes sur des dictionnaires comme les curvelets et la Non-negative matrix factorization (NMF), ainsi qu’en estimant la distribution de chaque point du spectrogramme à partir de données normales dépendamment ou non de leur voisinage. La détection des points atypiques est réalisée par comparaison des données tests au modèle de normalité estimé sur des données d’apprentissage normales. La détection des points atypiques permet la détection des signatures inusuelles composées par ces points. / Vibration measurements are one of the most relevant data for detecting anomalies in engines. Vibrations are recorded on a test bench during acceleration and deceleration phases to ensure the reliability of every flight engine at the end of the production line. These temporal signals are converted into spectrograms for experts to perform visual analysis of these data and detect any unusual signature. Vibratory signatures correspond to lines on the spectrograms. In this thesis, we have developed a decision support system to automatically analyze these spectrograms and detect any type of unusual signatures, these signatures are not necessarily originated from a damage in the engine. Firstly, we have built a numerical spectrograms database with annotated zones, it is important to note that data containing these unusual signatures are sparse and that these signatures are quite variable in shape, intensity and position. Consequently, to detect them, like in the novelty detection process, we characterize the normal behavior of the spectrograms by representing patches of the spectrograms in dictionaries such as the curvelets and the Non-negative matrix factorization (NMF) and by estimating the distribution of every points of the spectrograms with normal data depending or not of the neighborhood. The detection of the unusual points is performed by comparing test data to the model of normality estimated on learning normal data. The detection of the unusual points allows the detection of the unusual signatures composed by these points.

Représentations Convolutives Parcimonieuses -- application aux signaux physiologiques et interpétabilité de l'apprentissage profond / Convolutional Sparse Representations -- application to physiological signals and interpretability for Deep Learning

Moreau, Thomas 19 December 2017 (has links)
Les représentations convolutives extraient des motifs récurrents qui aident à comprendre la structure locale dans un jeu de signaux. Elles sont adaptées pour l’analyse des signaux physiologiques, qui nécessite des visualisations mettant en avant les informations pertinentes. Ces représentations sont aussi liées aux modèles d’apprentissage profond. Dans ce manuscrit, nous décrivons des avancées algorithmiques et théoriques autour de ces modèles. Nous montrons d’abord que l’Analyse du Spectre Singulier permet de calculer efficacement une représentation convolutive. Cette représentation est dense et nous décrivons une procédure automatisée pour la rendre plus interprétable. Nous proposons ensuite un algorithme asynchrone, pour accélérer le codage parcimonieux convolutif. Notre algorithme présente une accélération super-linéaire. Dans une seconde partie, nous analysons les liens entre représentations et réseaux de neurones. Nous proposons une étape d’apprentissage supplémentaire, appelée post-entraînement, qui permet d’améliorer les performances du réseau entraîné, en s’assurant que la dernière couche soit optimale. Puis nous étudions les mécanismes qui rendent possible l’accélération du codage parcimonieux avec des réseaux de neurones. Nous montrons que cela est lié à une factorisation de la matrice de Gram du dictionnaire. Finalement, nous illustrons l’intérêt de l’utilisation des représentations convolutives pour les signaux physiologiques. L’apprentissage de dictionnaire convolutif est utilisé pour résumer des signaux de marche et le mouvement du regard est soustrait de signaux oculométriques avec l’Analyse du Spectre Singulier. / Convolutional representations extract recurrent patterns which lead to the discovery of local structures in a set of signals. They are well suited to analyze physiological signals which requires interpretable representations in order to understand the relevant information. Moreover, these representations can be linked to deep learning models, as a way to bring interpretability intheir internal representations. In this disserta tion, we describe recent advances on both computational and theoretical aspects of these models.First, we show that the Singular Spectrum Analysis can be used to compute convolutional representations. This representation is dense and we describe an automatized procedure to improve its interpretability. Also, we propose an asynchronous algorithm, called DICOD, based on greedy coordinate descent, to solve convolutional sparse coding for long signals. Our algorithm has super-linear acceleration.In a second part, we focus on the link between representations and neural networks. An extra training step for deep learning, called post-training, is introduced to boost the performances of the trained network by making sure the last layer is optimal. Then, we study the mechanisms which allow to accelerate sparse coding algorithms with neural networks. We show that it is linked to afactorization of the Gram matrix of the dictionary.Finally, we illustrate the relevance of convolutional representations for physiological signals. Convolutional dictionary learning is used to summarize human walk signals and Singular Spectrum Analysis is used to remove the gaze movement in young infant’s oculometric recordings.

Interjekce v německo-českých slovnících / Interjections in German-Czech Dictionaries

Felbr, Lukáš January 2021 (has links)
This master's thesis analyses the lexicographical treatment of interjections in current German- Czech commercial dictionaries, special focus is laid on user aspect. The goal of this thesis is to provide an overview of possible issues in the lexicographical processing of interjections. The focus is on both the macrostructure with the selection of lemmas and microstructure of the respective analysed entries. Compared to corpus data and to monolingual dictionaries, problems include especially part of speech specifications, selection of Czech translation equivalents, lack of examples demonstrating the pragmatic function of the interjections, or insufficient metalanguage comments. The example of the dictionary entry of the lemma ach shows which steps and decisions must be made by the lexicographical work. At the end, concrete solutions for the lexicographical treatment of interjections are proposed, such as the exact classification of the respective meanings, metalanguage comments on these meanings, necessary attention to the prosodic and syntactic properties, and dialogical examples.

Harmonizace melodie / Melody Harmonization

Svoboda, Jan Unknown Date (has links)
The Master's Thesis discusses the possibilities of automatic melody harmonization. System use dictionary method for harmonization, this was inspired with comprimation algorithm LZW. System's output file is in MusicXML format.

Multimediální systém pro podporu výuky jazyků / Multimedia System for Support of Languages Education

Drápal, Libor Unknown Date (has links)
This project is about electronic learning (e-learning). The first part of this document explains the meaning of the term e-learning, where it is used and what advantages and disadvantages has this type of learning compared to the other methods of learning. The user gets familiar with tools that create the electronic lesson and how to design the lesson. In the second part there are described different techniques and tools to create application interface, to display 3D graphic and to play audio records in different operating systems. In this part, there are described tools in more detail for the operating system Microsoft Windows. The goal of this project is to design and to realize the multimedia system for language education. With the use of 3D graphic and audio records the educational system was created with sophisticated appearance and comfortable control.

Метаязыковые высказывания: лексикографическая интерпретация и эвристический потенциал : магистерская диссертация / Metalinguistic utterances: lexicographic interpretation and heuristic potential

Sidorova, V. V., Сидорова, В. В. January 2014 (has links)
The magister paper investigates the dictionary description of metalinguistic operators. The objects of research are the reflexives, working for different communicative ideas of the speaker. The first chapter of the paper presents lexicographic reflexives interpretations, distinguishes the principles of the dictionary article formation and describes the specific lexicographic material. The second chapter distinguishes heuristic potential of the metalinguistic utterances, which serve as a methodological database for different researches. The paper analyses metalinguistic material, showing the active processes, developing in contemporary Russian language. / В магистерской диссертации предпринята попытка словарного описания корпуса метаязыковых операторов. Объект исследования – рефлексивы, «работающие» на разный коммуникативный замысел говорящего. В первой главе диссертации представлена лексикографическая интерпретация рефлексивов, определяются принципы составления словарной статьи, приводится конкретный лексикографический материал. Во второй главе определяется эвристический потенциал метаязыковых высказываний, которые служат определенной методологической базой для разноаспектных исследований. В работе анализируется метаязыковой материал, проливающий свет на активные процессы, происходящие в современном русском языка.

