Spelling suggestions: "subject:"shortterm memory."" "subject:"short1term memory.""
451 |
Outlier detection with ensembled LSTM auto-encoders on PCA transformed financial data / Avvikelse-detektering med ensemble LSTM auto-encoders på PCA-transformerad finansiell dataStark, Love January 2021 (has links)
Financial institutions today generate a large amount of data, data that can contain interesting information to investigate to further the economic growth of said institution. There exists an interest in analyzing these points of information, especially if they are anomalous from the normal day-to-day work. However, to find these outliers is not an easy task and not possible to do manually due to the massive amounts of data being generated daily. Previous work to solve this has explored the usage of machine learning to find outliers in these financial datasets. Previous studies have shown that the pre-processing of data usually stands for a big part in information loss. This work aims to study if there is a proper balance in how the pre-processing is carried out to retain the highest amount of information while simultaneously not letting the data remain too complex for the machine learning models. The dataset used consisted of Foreign exchange transactions supplied by the host company and was pre-processed through the use of Principal Component Analysis (PCA). The main purpose of this work is to test if an ensemble of Long Short-Term Memory Recurrent Neural Networks (LSTM), configured as autoencoders, can be used to detect outliers in the data and if the ensemble is more accurate than a single LSTM autoencoder. Previous studies have shown that Ensemble autoencoders can prove more accurate than a single autoencoder, especially when SkipCells have been implemented (a configuration that skips over LSTM cells to make the model perform with more variation). A datapoint will be considered an outlier if the LSTM model has trouble properly recreating it, i.e. a pattern that is hard to classify, making it available for further investigations done manually. The results show that the ensembled LSTM model proved to be more accurate than that of a single LSTM model in regards to reconstructing the dataset, and by our definition of an outlier, more accurate in outlier detection. The results from the pre-processing experiments reveal different methods of obtaining an optimal number of components for your data. One of those is by studying retained variance and accuracy of PCA transformation compared to model performance for a certain number of components. One of the conclusions from the work is that ensembled LSTM networks can prove very powerful, but that alternatives to pre-processing should be explored such as categorical embedding instead of PCA. / Finansinstitut genererar idag en stor mängd data, data som kan innehålla intressant information värd att undersöka för att främja den ekonomiska tillväxten för nämnda institution. Det finns ett intresse för att analysera dessa informationspunkter, särskilt om de är avvikande från det normala dagliga arbetet. Att upptäcka dessa avvikelser är dock inte en lätt uppgift och ej möjligt att göra manuellt på grund av de stora mängderna data som genereras dagligen. Tidigare arbete för att lösa detta har undersökt användningen av maskininlärning för att upptäcka avvikelser i finansiell data. Tidigare studier har visat på att förbehandlingen av datan vanligtvis står för en stor del i förlust av emphinformation från datan. Detta arbete syftar till att studera om det finns en korrekt balans i hur förbehandlingen utförs för att behålla den högsta mängden information samtidigt som datan inte förblir för komplex för maskininlärnings-modellerna. Det emphdataset som användes bestod av valutatransaktioner som tillhandahölls av värdföretaget och förbehandlades genom användning av Principal Component Analysis (PCA). Huvudsyftet med detta arbete är att undersöka om en ensemble av Long Short-Term Memory Recurrent Neural Networks (LSTM), konfigurerad som autoenkodare, kan användas för att upptäcka avvikelser i data och om ensemblen är mer precis i sina predikteringar än en ensam LSTM-autoenkodare. Tidigare studier har visat att en ensembel avautoenkodare kan visa sig vara mer precisa än en singel autokodare, särskilt när SkipCells har implementerats (en konfiguration som hoppar över vissa av LSTM-cellerna för att göra modellerna mer varierade). En datapunkt kommer att betraktas som en avvikelse om LSTM-modellen har problem med att återskapa den väl, dvs ett mönster som nätverket har svårt att återskapa, vilket gör datapunkten tillgänglig för vidare undersökningar. Resultaten visar att en ensemble av LSTM-modeller predikterade mer precist än en singel LSTM-modell när det gäller att återskapa datasetet, och då enligt vår definition av avvikelser, mer precis avvikelse detektering. Resultaten från förbehandlingen visar olika metoder för att uppnå ett optimalt antal komponenter för dina data genom att studera bibehållen varians och precision för PCA-transformation jämfört med modellprestanda. En av slutsatserna från arbetet är att en ensembel av LSTM-nätverk kan visa sig vara mycket kraftfulla, men att alternativ till förbehandling bör undersökas, såsom categorical embedding istället för PCA.
|
452 |
Deep Learning in the Web Browser for Wind Speed Forecasting using TensorFlow.js / Djupinlärning i Webbläsaren för Vindhastighetsprognoser med TensorFlow.jsMoazez Gharebagh, Sara January 2023 (has links)
Deep Learning is a powerful and rapidly advancing technology that has shown promising results within the field of weather forecasting. Implementing and using deep learning models can however be challenging due to their complexity. One approach to potentially overcome the challenges with deep learning is to run deep learning models directly in the web browser. This approach introduces several advantages, including accessibility, data privacy, and the ability to access device sensors. The ability to run deep learning models on the web browser thus opens new possibilities for research and development in areas such as weather forecasting. In this thesis, two deep learning models that run in the web browser are implemented using JavaScript and TensorFlow.js to predict wind speed in the near future. Specifically, the application of Long Short-Term Memory and Gated Recurrent Units models are investigated. The results demonstrate that both the Long Short-Term Memory and Gated Recurrent Units models achieve similar performance and are able to generate predictions that closely align with the expected patterns when the variations in the data are less significant. The best performing Long Short-Term Memory model achieved a mean squared error of 0.432, a root mean squared error of 0.657 and a mean average error of 0.459. The best performing Gated Recurrent Units model achieved a mean squared error of 0.435, a root mean squared error of 0.660 and a mean average error of 0.461. / Djupinlärning är en kraftfull teknik som genomgår snabb utveckling och har uppnått lovande resultat inom väderprognoser. Att implementera och använda djupinlärningsmodeller kan dock vara utmanande på grund av deras komplexitet. Ett möjligt sätt att möta utmaningarna med djupinlärning är att köra djupinlärningsmodeller direkt i webbläsaren. Detta sätt medför flera fördelar, inklusive tillgänglighet, dataintegritet och möjligheten att använda enhetens egna sensorer. Att kunna köra djupinlärningsmodeller i webbläsaren bidrar därför med möjligheter för forskning och utveckling inom områden såsom väderprognoser. I denna studie implementeras två djupinlärningsmodeller med JavaScript och TensorFlow.js som körs i webbläsaren för att prediktera vindhastighet i en nära framtid. Specifikt undersöks tillämpningen av modellerna Long Short-Term Memory och Gated Recurrent Units. Resultaten visar att både Long Short-Term Memory och Gated Recurrent Units modellerna presterar lika bra och kan generera prediktioner som är nära förväntade mönster när variationen i datat är mindre signifikant. Den Long Short-Term Memory modell som presterade bäst uppnådde en mean squared error på 0.432, en root mean squared error på 0.657 och en mean average error på 0.459. Den Gated Recurrent Units modell som presterade bäst uppnådde en mean squared error på 0.435, en root mean squared error på 0.660 och en mean average error på 0.461.
|
453 |
Pulse Repetition Interval Modulation Classification using Machine Learning / Maskininlärning för klassificering av modulationstyp för pulsrepetitionsintervallNorgren, Eric January 2019 (has links)
Radar signals are used for estimating location, speed and direction of an object. Some radars emit pulses, while others emit a continuous wave. Both types of radars emit signals according to some pattern; a pulse radar, for example, emits pulses with a specific time interval between pulses. This time interval may either be stable, change linearly, or follow some other pattern. The interval between two emitted pulses is often referred to as the pulse repetition interval (PRI), and the pattern that defines the PRI is often referred to as the modulation. Classifying which PRI modulation is used in a radar signal is a crucial component for the task of identifying who is emitting the signal. Incorrectly classifying the used modulation can lead to an incorrect guess of the identity of the agent emitting the signal, and can as a consequence be fatal. This work investigates how a long short-term memory (LSTM) neural network performs compared to a state of the art feature extraction neural network (FE-MLP) approach for the task of classifying PRI modulation. The results indicate that the proposed LSTM model performs consistently better than the FE-MLP approach across all tested noise levels. The downside of the proposed LSTM model is that it is significantly more complex than the FE-MLP approach. Future work could investigate if the LSTM model is too complex to use in a real world setting where computing power may be limited. Additionally, the LSTM model can, in a trivial manner, be modified to support more modulations than those tested in this work. Hence, future work could also evaluate how the proposed LSTM model performs when support for more modulations is added. / Radarsignaler används för att uppskatta plats, hastighet och riktning av objekt. Vissa radarer sänder ut signaler i form av pulser, medan andra sänder ut en kontinuerlig våg. Båda typer av radarer avger signaler enligt ett visst mönster, till exempel avger en pulsradar pulser med ett specifikt tidsintervall mellan pulserna. Detta tidsintervall kan antingen vara konstant, förändras linjärt, eller följa ett annat mönster. Intervallet mellan två pulser benämns ofta pulsrepetitionsintervall (PRI), och mönstret som definierar PRIn benämns ofta modulering. Att klassificera vilken PRI-modulering som används i en radarsignal är en viktig del i processen att identifiera vem som skickade ut signalen. Felaktig klassificering av den använda moduleringen kan leda till en felaktig gissning av identiteten av agenten som skickade ut signalen, vilket kan leda till ett dödligt utfall. Detta arbete undersöker hur väl det framtagna neurala nätverket som består av ett långt korttidsminne (LSTM) kan klassificera PRI-modulering i förhållande till en modern modell som använder särskilt utvalda beräknade särdrag från data och klassificerar dessa särdrag med ett neuralt nätverk. Resultaten indikerar att LSTM-modellen konsekvent klassificerar med högre träffsäkerhet än modellen som använder särdrag, vilket gäller för alla testade brusnivåer. Nackdelen med LSTM-modellen är att den är mer komplex än modellen som använder särdrag. Framtida arbete kan undersöka om LSTM-modellen är för komplex för att använda i ett verkligt scenario där beräkningskraften kan vara begränsad. Dessutom skulle framtida arbete kunna utvärdera hur väl LSTM-modellen kan klassificera PRI-moduleringar när stöd för fler moduleringar än de som testats i detta arbete läggs till, detta då stöd för ytterligare PRI-moduleringar kan läggas till i LSTM-modellen på ett trivialt sätt.
|
454 |
Link blockage modelling for channel state prediction in high-frequencies using deep learning / Länkblockeringsmodellering för förutsägelse av kanaltillstånd i höga frekvenser med djupinlärningChari, Shreya Krishnama January 2020 (has links)
With the accessibility to generous spectrum and development of high gain antenna arrays, wireless communication in higher frequency bands providing multi-gigabit short range wireless access has become a reality. The directional antennas have proven to reduce losses due to interfering signals but are still exposed to blockage events. These events impede the overall user connectivity and throughput. A mobile blocker such as a moving vehicle amplifies the blockage effect. Modelling the blockage effects helps in understanding these events in depth and in maintaining the user connectivity. This thesis proposes the use of a four state channel model to describe blockage events in high-frequency communication. Two deep learning architectures are then designed and evaluated for two possible tasks, the prediction of the signal strength and the classification of the channel state. The evaluations based on simulated traces show high accuracy, and suggest that the proposed models have the potential to be extended for deployment in real systems. / Med tillgängligheten till generöst spektrum och utveckling av antennmatriser med hög förstärkning har trådlös kommunikation i högre frekvensband som ger multi-gigabit kortdistans trådlös åtkomst blivit verklighet. Riktningsantennerna har visat sig minska förluster på grund av störande signaler men är fortfarande utsatta för blockeringshändelser. Dessa händelser hindrar den övergripande användaranslutningen och genomströmningen. En mobil blockerare såsom ett fordon i rörelse förstärker blockeringseffekten. Modellering av blockeringseffekter hjälper till att förstå dessa händelser på djupet och bibehålla användaranslutningen. Denna avhandling föreslår användning av en fyrstatskanalmodell för att beskriva blockeringshändelser i högfrekvent kommunikation. Två djupinlärningsarkitekturer designas och utvärderas för två möjliga uppgifter, förutsägelsen av signalstyrkan och klassificeringen av kanalstatusen. Utvärderingarna baserade på simulerade spår visar hög noggrannhet och föreslår att de föreslagna modellerna har potential att utökas för distribution i verkliga system.
|
455 |
Sensitivity to changes with and without awareness: An empirical investigationLaloyaux, Cédric 08 May 2007 (has links)
Ce travail a pour objectif d'investiguer le sort réservé à des changements de nature visuelle qui se produisent dans notre environnement et que nous ne détectons pas consciemment. J'investiguerai en particulier si de tels changements non-perçus consciemment peuvent néanmoins (1) être représentés d'une certaine manière en-dessous du seuil de la conscience, et (2) exercer une influence causale sur des tâches comportementales subséquentes. A cette fin, une première étude cherche à établir si les paradigmes classiques de détection de changement sous-évaluent les capacités réelles de la mémoire visuelle à court terme. Cette étude a effectivement montré qu'il était possible de récupérer de l'information stockée en mémoire visuelle à court terme (MVCT), suggérant donc qu'il existe plus de capacités mnésiques visuelles que ce qui est utilisé dans les tâches classiques de détection de changement. Ensuite, une seconde étude a répliqué un paradigme dit d'identification implicite de changements et qui était controversé dans la littérature en raison de biais potentiels. Après correction de ces biais, nous avons pu démontrer que ce paradigme suggère bel et bien un effet d'identification implicite de changement puisque l'identité d'un changement simple (changement d'orientation d'un rectangle parmi 8 rectangles orientés de différentes manières) peut indicer un jugement d'orientation subséquent. Finalement, dans le dernier groupe d'expériences, un nouveau paradigme dans lequel les changements se produisent très progressivement et très lentement sera décrit. En utilisant ce paradigme, j'ai pu démontrer qu'alors que les observateurs demeurent inconscients du changement, ils restent néanmoins sensibles aux changements puisqu'ils « synchronisent » leur représentation en mémoire visuelle avec le stimulus présenté à l'écran. Enfin, dans la conclusion, je m'attacherai également à développer l'idée selon laquelle nous sommes (1) capables, au minimum, de mettre à jour notre mémoire visuelle d'un changement et probablement d'identifier, un tel changement sans conscience et (2) influençables par ce changement. En effet, à la fin de ce travail, j'arriverai à la conclusion que les représentations visuelles sont ébruitéess et incomplètes. Ceci est dû (1) à la constitution de la rétine, qui n'est pas homogène (la quantité de photorécepteurs n'est pas identique dans la partie centrale et dans la périphérie du champ visuel), (2) aux imperfections des systèmes biologiques (des imperfections et des erreurs dans la planification des saccades et dans leurs exécutions surgissent,) et (3) aux limitations de nos capacités attentionnelles.
|
456 |
Étude électrophysiologique de la mémoire à court terme auditiveGuimond, Synthia 05 1900 (has links)
La présente étude s’intéresse aux mécanismes neuronaux qui sous-tendent la rétention en mémoire à court terme auditive (MCTA) en utilisant la technique des potentiels reliés aux événements (PRE). Dans l’Expérience 1, nous avons isolé une composante de PRE, nommée SAN pour « sustained anterior negativity ». La SAN augmentait en amplitude négative plus le nombre de sons à maintenir en MCTA augmentait. Cet effet de charge était présent, bien que la durée totale des stimuli restait la même entre les conditions. L’effet de charge observé par la SAN dans l’Expérience 1 disparaissait dans l’Expérience 2, où les mêmes sons étaient utilisés, mais où la mémorisation de ceux-ci n’était plus requise. Finalement, dans l’Expérience 3, la tâche de MCTA a été effectuée avec et sans suppression articulatoire durant l'intervalle de rétention. L’effet de charge trouvé dans l’Expérience 1 était de nouveau observé, lorsque les participants faisaient la tâche de suppression articulatoire ou non. Ces résultats suggèrent que la SAN reflète l'activité nécessaire pour le maintien des objets acoustiques dans un système de MCTA qui serait distinct de la répétition phonologique. / We studied the neuronal mechanisms that implement acoustic short-term memory (ASTM) for pitch using event-related potentials (ERP). Experiment 1 isolated an ERP component, the sustained anterior negativity (SAN), that increased in amplitude with increasing memory load in ASTM using stimuli with equal duration at all memory loads. The SAN load effect found in Experment 1, when pitch had to be remembered to perform the task, was absent in Experiment 2 using the same sounds when memory was not required. In Experiment 3 the memory task was performed without or with concurrent articulatory suppression during the retention interval, to suppress rehearsal via an articulatory loop. Load-related effects found in Experiment 1 were found again, whether participants engaged in concurrent suppression or not. The results suggest that the SAN reflects activity required to maintain pitch objects in an ASTM system that is distinct from articulatory rehearsal.
|
457 |
Approche psycholinguistique des relations entre le traitement sémantique des mots et la rétention à court terme chez l’individu sain et dans la démence de type AlzheimerMacé, Anne-Laure 01 1900 (has links)
Depuis ces deux dernières décennies, des efforts considérables en psychologie cognitive et neuropsychologie ont été déployés pour mieux comprendre les dynamiques entre les différents systèmes cognitifs (fonctions exécutives, mémoire, langage, etc.). L’observation d’une co-existence entre des atteintes en rétention à court terme verbale (RCTv) et en langage dans plusieurs pathologies a conduit certains chercheurs à concevoir une alternative à la conceptualisation classique de la RCTv, telle que proposée par le modèle initial de la mémoire de travail de Baddeley (1986). Particulièrement, les travaux sur l’aphasie ont conduit à l’émergence d’une approche psycholinguistique de la RCTv, postulant que le traitement et le maintien des mots font appel à des processus communs. Cette approche, et particulièrement le modèle d’activation interactive (N. Martin & Gupta, 2004; N. Martin & Saffran, 1997), prédit que les capacités en RCTv sont notamment modulées par les caractéristiques linguistiques engagées durant l’épreuve, variant selon la nature des items verbaux et la modalité de rappel, ainsi que par les compétences linguistiques des individus.
L’objectif de la présente thèse était de tester ces prédictions à partir d’une exploration des relations entre le traitement sémantique des mots et la RCTv chez l’adulte sain (article 1) et dans la démence de type Alzheimer (DTA) (article 2). Dans le premier article, deux expériences mettent en évidence l’influence des liens associatifs entre les mots sur les capacités à maintenir temporairement des informations verbales. Les participants ont tendance à faussement reconnaître des mots associés aux mots de la liste, reflet d’une activation du réseau sémantique durant la rétention temporaire. Cette contribution sémantique est accentuée en situation de suppression articulatoire, une condition qui empêche le participant de répéter les listes durant la tâche. Les résultats du second article indiquent que la modalité de réponse module différemment la performance en RCTv chez les participants âgés sans atteinte neurologique et ceux atteints de la DTA. Ces données en RCTv sont compatibles avec les atteintes spécifiques du traitement du mot, également trouvées chez le groupe avec DTA. Les implications théoriques et cliniques de ces résultats sont discutées. Les limites et perspectives futures sont également abordées. / For the past two decades, considerable efforts have been made in cognitive psychology and neuropsychology in order to improve our understanding of the interactions between different cognitive systems (executive functions, memory, language etc.). Evidence of short-term memory (STM) and language impairments in many clinical populations has lead some researchers to put forward an alternative to Baddeley’s working memory model (1986). Based on studies of aphasia, the psycholinguistic approach of STM postulated that word processing and maintenance refer to common processes. Specifically, the interactive activation model (N. Marin & Gupta, 2004; N. Martin & Saffran, 1997) predicts that STM capacities are in particular affected by the linguistic characteristics engaged during the test, and vary according to the nature of verbal items and recall modality, as well as word processing ability.
The goal of this thesis was to test some of these predictions by investigating the relationship between semantic treatment and STM in healthy adults (article 1) and dementia of Alzheimer Type (DAT) (article 2). In the first article, two experiments underline the influence of the associative links between words on the capacity to temporarily retain verbal information. Participants tend to wrongly recognize words associated with words from the list, reflecting an activation of the semantic network during temporary retention. This semantic contribution increases in a situation of articulatory suppression, a condition that limits the possibility to repeat lists during the task. The results of the second article indicated that recall modality influences differently the performance in STM of the elderly participants and those with DAT. These data in STM are compatible with a specific word processing impairment, also found in the group with DAT. The theoretical and clinical implications of these results are discussed. Limits and future research perspectives are also presented.
|
458 |
Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiateGilbert, Annie 03 1900 (has links)
Dans de nombreux comportements qui reposent sur le rappel et la production de séquences, des groupements temporels émergent spontanément, créés par des délais ou des allongements. Ce « chunking » a été observé tant chez les humains que chez certains animaux et plusieurs auteurs l’attribuent à un processus général de chunking perceptif qui est conforme à la capacité de la mémoire à court terme. Cependant, aucune étude n’a établi comment ce chunking perceptif s’applique à la parole. Nous présentons une recension de la littérature qui fait ressortir certains problèmes critiques qui ont nui à la recherche sur cette question. C’est en revoyant ces problèmes qu’on propose une démonstration spécifique du chunking perceptif de la parole et de l’effet de ce processus sur la mémoire immédiate (ou mémoire de travail). Ces deux thèmes de notre thèse sont présentés séparément dans deux articles.
Article 1 : The perceptual chunking of speech: a demonstration using ERPs
Afin d’observer le chunking de la parole en temps réel, nous avons utilisé un paradigme de potentiels évoqués (PÉ) propice à susciter la Closure Positive Shift (CPS), une composante associée, entre autres, au traitement de marques de groupes prosodiques. Nos stimuli consistaient en des énoncés et des séries de syllabes sans sens comprenant des groupes intonatifs et des marques de groupements temporels qui pouvaient concorder, ou non, avec les marques de groupes intonatifs. Les analyses démontrent que la CPS est suscitée spécifiquement par les allongements marquant la fin des groupes temporels, indépendamment des autres variables. Notons que ces marques d’allongement, qui apparaissent universellement dans la langue parlée, créent le même type de chunking que celui qui émerge lors de l’apprentissage de séquences par des humains et des animaux. Nos résultats appuient donc l’idée que l’auditeur chunk la parole en groupes temporels et que ce chunking perceptif opère de façon similaire avec des comportements verbaux et non verbaux. Par ailleurs, les observations de l’Article 1 remettent en question des études où on associe la CPS au traitement de syntagmes intonatifs sans considérer les effets de marques temporels.
Article 2 : Perceptual chunking and its effect on memory in speech processing:ERP and behavioral evidence
Nous avons aussi observé comment le chunking perceptif d’énoncés en groupes temporels de différentes tailles influence la mémoire immédiate d’éléments entendus. Afin d’observer ces effets, nous avons utilisé des mesures comportementales et des PÉ, dont la composante N400 qui permettait d’évaluer la qualité de la trace mnésique d’éléments cibles étendus dans des groupes temporels. La modulation de l’amplitude relative de la N400 montre que les cibles présentées dans des groupes de 3 syllabes ont bénéficié d’une meilleure mise en mémoire immédiate que celles présentées dans des groupes plus longs. D’autres mesures comportementales et une analyse de la composante P300 ont aussi permis d’isoler l’effet de la position du groupe temporel (dans l’énoncé) sur les processus de mise en mémoire.
Les études ci-dessus sont les premières à démontrer le chunking perceptif de la parole en temps réel et ses effets sur la mémoire immédiate d’éléments entendus. Dans l’ensemble, nos résultats suggèrent qu’un processus général de chunking perceptif favorise la mise en mémoire d’information séquentielle et une interprétation de la parole « chunk par chunk ». / In numerous behaviors involving the learning and production of sequences, temporal groups emerge spontaneously, created by delays or a lengthening of elements. This chunking has been observed across behaviors of both humans and animals and is taken to reflect a general process of perceptual chunking that conforms to capacity limits of short-term memory. Yet, no research has determined how perceptual chunking applies to speech. We provide a literature review that bears out critical problems, which have hampered research on this question. Consideration of these problems motivates a principled demonstration that aims to show how perceptual chunking applies to speech and the effect of this process on immediate memory (or “working memory”). These two themes are presented in separate papers in the format of journal articles.
Paper 1: The perceptual chunking of speech: a demonstration using ERPs
To observe perceptual chunking on line, we use event-related potentials (ERPs) and refer to the neural component of Closure Positive Shift (CPS), which is known to capture listeners’ responses to marks of prosodic groups. The speech stimuli were utterances and sequences of nonsense syllables, which contained intonation phrases marked by pitch, and both phrase-internal and phrase-final temporal groups marked by lengthening. Analyses of CPSs show that, across conditions, listeners specifically perceive speech in terms of chunks marked by lengthening. These lengthening marks, which appear universally in languages, create the same type of chunking as that which emerges in sequence learning by humans and animals. This finding supports the view that listeners chunk speech in temporal groups and that this perceptual chunking operates similarly for speech and non-verbal behaviors. Moreover, the results question reports that relate CPS to intonation phrasing without considering the effects of temporal marks.
Paper 2: Perceptual chunking and its effect on memory in speech processing: ERP and behavioral evidence
We examined how the perceptual chunking of utterances in terms of temporal groups of differing size influences immediate memory of heard speech. To weigh these effects, we used behavioural measures and ERPs, especially the N400 component, which served to evaluate the quality of the memory trace for target lexemes heard in the temporal groups. Variations in the amplitude of the N400 showed a better memory trace for lexemes presented in groups of 3 syllables compared to those in groups of 4 syllables. Response times along with P300 components revealed effects of position of the chunk in the utterance.
This is the first study to demonstrate the perceptual chunking of speech on-line and its effects on immediate memory of heard elements. Taken together the results suggest that a general perceptual chunking enhances a buffering of sequential information and a processing of speech on a chunk-by-chunk basis.
|
459 |
La saturation de la mémoire auditive à court terme, une étude en électrophysiologieAlunni-Menichini, Kristelle 10 1900 (has links)
La présente étude vise à approfondir les connaissances relatives aux mécanismes neuronaux qui sous-tendent la maintenance de sons variant en hauteur dans la mémoire auditive à court terme (MACT), plus précisément lors de sa saturation. À cet effet, la technique des potentiels reliés aux évènements (PRE) en électrophysiologie a été utilisée. La sélection des participants s’est déroulée par l’entremise de deux expériences comportementales : l’une était une tâche de discrimination et l’autre, une tâche qui évaluait l’habileté générale des participants à réussir une tâche similaire à celle de l’expérience principale en électroencéphalographie (EEG). Les résultats comportementaux de notre tâche en EEG ont montré que la performance diminuait de façon significative plus la charge en mémoire augmentait (séquences de 2, 4, 6 et 8 sons) et que l’estimation de la capacité de la MACT mesurée par K augmentait entre 2 et 4 sons pour atteindre un plafond à 4 sons (effet plafond). Le K maximum étant de 2.84 sons, l’empan mnésique (EM) auditif semble être près de 3 sons. Les résultats électrophysiologiques ont montré que la composante électrophysiologique reliée à la maintenance de sons en MACT, la Sustained Anterior Negativity (SAN), était modulée par le nombre de sons à maintenir : son amplitude augmentait de 2 à 4 sons et ce, jusqu’à l’atteinte d’un plafond à 4 sons. Ces résultats suggèrent que la maintenance de sons additionnels dans la MACT n’est plus possible après sa saturation. Nous soutenons donc que la SAN est un index électrophysiologique de l’activité neuronale associée à la maintenance d’items auditifs dans la MACT et que son amplitude est un bon indicateur de la capacité individuelle de la MACT, estimée par K. Des résultats post-hoc ont démontré que les musiciens et les non-musiciens tendent à avoir des différences au niveau de la SAN, sans pour autant modifier l’effet de charge en mémoire. Une analyse qualitative et quantitative de l’utilisation des stratégies mnésiques ont permis de clarifier leur implication et leur nature au sein d’une tâche cognitive de mémoire, plus précisément en audition. Pour conclure, l’ensemble de ces résultats suggère également que la SAN est reliée à la maintenance de sons dans la MACT et ainsi, un bon indicateur de sa capacité. / The aim of the current study is to further understand, through the use of event-related potentials (ERPs), the neural mechanisms that underlie the maintenance of pitch in auditory short-term memory (ASTM) after reaching the memory span. Two behavioral experiments were used to help perform the selection of the participants: the first one was an evaluation of the acoustic discrimination and the second one was a general evaluation of participants’ ability to succeed to a similar task of the one that will be used in the electrophysiological (EEG) part of the experiment. Behavioral results from the EEG task showed a significant decrease in accuracy when the load increased (sequences of 2, 4, 6 and 8 tones). The estimation of the memory capacity (named K), increased from load 2 to 4 and reached a plateau after 4 tones. The maximum K represented 2.84 tones; the auditory span seems to be around 3 tones. Experimental results showed that the ERP component related to the maintenance of tones in ASTM, as measured by the Sustained Anterior Negativity (SAN), was modulated by the load. More specifically, its amplitude increased when the load increased (from 2 to 4) and reached a plateau at load 4. These results suggest that the maintenance of additional tones in ASTM is not possible after its saturation. Thus, the SAN appears to be an adequate electrophysiological index of neuronal activity related to the maintenance of tones in ASTM, and its amplitude appears to be predicted by K. Post-hoc results showed that musician and non-musicians tend to have some differences in their electrophysiological results; however, no change related to the load effect was observed. Finally, a qualitative and quantitative analysis was done to investigate the impact of the use of different mnemonic strategies in ASTM. Taking together, our results support that the SAN component is related to the maintenance of tones in ASTM and can be considerate as a good indicator of its capacity.
|
460 |
Použití rekurentních neuronových sítí pro automatické rozpoznávání řečníka, jazyka a pohlaví / Neural networks for automatic speaker, language, and sex identificationDo, Ngoc January 2016 (has links)
Title: Neural networks for automatic speaker, language, and sex identifica- tion Author: Bich-Ngoc Do Department: Institute of Formal and Applied Linguistics Supervisor: Ing. Mgr. Filip Jurek, Ph.D., Institute of Formal and Applied Linguistics and Dr. Marco Wiering, Faculty of Mathematics and Natural Sciences, University of Groningen Abstract: Speaker recognition is a challenging task and has applications in many areas, such as access control or forensic science. On the other hand, in recent years, deep learning paradigm and its branch, deep neural networks have emerged as powerful machine learning techniques and achieved state-of- the-art in many fields of natural language processing and speech technology. Therefore, the aim of this work is to explore the capability of a deep neural network model, recurrent neural networks, in speaker recognition. Our pro- posed systems are evaluated on TIMIT corpus using speaker identification task. In comparison with other systems in the same test conditions, our systems could not surpass reference ones due to the sparsity of validation data. In general, our experiments show that the best system configuration is a combination of MFCCs with their dynamic features and a recurrent neural network model. We also experiment recurrent neural networks and convo- lutional neural...
|
Page generated in 0.0696 seconds