• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 16
  • 8
  • 2
  • Tagged with
  • 27
  • 27
  • 12
  • 11
  • 9
  • 6
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

On a PGD model order reduction technique for mid-frequency acoustic / Technique de réduction de modèle PGD en acoustique en moyennes fréquences

Barbarulo, Andrea 30 November 2012 (has links)
Aujourd'hui, les outils de simulations numériques sont omniprésents dans l'industrie, que ce soit dans l'industrie aéronautique, aérospatiale, ferroviaire ou automobile.En effet leur utilisation limite la fabrication (souvent très couteuse) de prototype, et permettent ainsi de réduire les couts et d'accélérer la phase de conception d'un nouveau produit.Dans le cadre des applications acoustiques, il est souvent recommandé de calculer la réponse sur l'ensemble de la bande de fréquences d'intérêt.Les outils de simulation numérique sur une bande de fréquences impliquent généralement plusieurs calculs à fréquences fixes.Même si c'est un moyen simple et naturel pour répondre au problème posé, une telle stratégie peut facilement conduire à des calculs énormes. Cela est particulièrement vrai dans la gamme des moyennes fréquences, où la réponse est particulièrement sensible à la fréquence.Dans cette thèse, la PGD (Proper Generalized Decomposition), est appliqué pour trouver une représentation fonctionnelle distincte de la fréquence et de l'amplitude des inconnues de la TVRC (théorie variationnelle des rayons complexes) sur une bande de fréquences donnée.Ceci permet d'obtenir une réponse de haute qualité sur une large bande en moyennes fréquences, sans nécessité de discrétisation fine de la plage de fréquences considérées. En outre, la représentation PGD de la solution permet d'économiser une grande quantité d'espace en terme de stockage de données. Dans un second temps, la technique PGD a été étendue à la stochastique. / In many industrial contexts, such as aerospace applications or cars design, numerical prediction techniquesbecome more and more useful. They restrict the use of real prototypes to a minimum and make easier thedesign phase. In such industries and in the specific for acoustic, engineers are interested in computing theresponses of systems on frequency bands. In order to predict the vibration behavior of systems overfrequency bands, standard numerical techniques usually involve many frequency-fixed computations, atmany different frequencies. Although it is a straightforward and natural mean to answer to the posed problem,such a strategy can easily lead to huge computations, and the amount of data to store often increasessignificantly. This is particularly true in the context of medium frequency bands, where these responses havea strong sensitivity to the frequency. In this work PGD (Proper Generalized Decomposition), in a first time, isapplied to found a separate functional representation over frequency and space of the unknown amplitude ofVTCR (Variational Theory of Complex Rays) formulation on a reduced frequency space. This allows tocalculate an high quality mid-frequency response over a wide band without a fine frequency discretization,saving computational resources. Moreover the PGD representation of the solution allows to save a hugeamount of space in term of stored data. In a second time, PGD technique as been applied to extend itspeculiarity to mid-frequency wide band with uncertainty.
2

Multifissuration en fatigue uniaxiale et biaxiale de l’acier inoxydable 304L / Multiple cracking in uniaxial and biaxial fatigue of 304L stainless steel

Rupil, Jérémie 24 September 2012 (has links)
Lorsqu’une pièce mécanique est soumise à une sollicitation mécanique répétée dans le temps, elle risque de s’endommager après un certain nombre de cycles d’utilisation par amorçage de plusieurs fissures et propagation d’une fissure principale. C’est le phénomène d’endommagement par fatigue. La thèse traite plus particulièrement du possible endommagement de certains composants de centrales nucléaires par fatigue thermique. Contrairement à l’endommagement classique en fatigue mécanique où une fissure principale vient rompre la pièce, l’endommagement par fatigue thermique se traduit généralement par l’apparition d’un réseau de fissures surfaciques. Deux aspects sont traités dans la thèse. Le premier est l’étude expérimentale de la phase de fissuration multiple ou multifissuration en fatigue. Pour cela deux campagnes d’essais avec détection de la multifissuration par corrélation d’images numériques ont été menées. Ces campagnes concernent des chargements mécaniques uniaxiaux et équibiaxiaux de traction/compression sans contrainte moyenne. Ce travail a permis de suivre et d’observer l’évolution de différents réseaux de fissures à travers des sollicitations de type mécanique. Le second est la simulation numérique du phénomène d’endommagement en fatigue mécanique et thermique. Plusieurs types de modélisation sont utilisés (stochastique, probabiliste, éléments finis cohésifs). Les résultats expérimentaux ont permis d’identifier une loi d’amorçage multiple en fatigue et sont également confrontés aux résultats numériques. Cette confrontation permet notamment de montrer la pertinence de l’utilisation d’un modèle probabiliste analytique afin de retrouver des résultats statistiques sur la densité de fissures qui peuvent être amorcées en fatigue thermique et mécanique. / When a mechanical part is subjected to a repeated mechanical stress, it may be damaged after a number of cycles by several crack initiations and the propagation of a main crack. This is the phenomenon of fatigue damage. The thesis specifically deals with possible damage in some components of nuclear plants due to thermal fatigue. Unlike conventional mechanical fatigue damage where a main crack develops in the part, thermal fatigue damage usually results in the appearance of a network of cracks on its surface. Two aspects are discussed in the thesis. The first is the experimental study of fatigue multiple cracking stage. Two mechanical test campaigns with multicracking detection by digital image correlation were conducted. They involve uniaxial and equibiaxial mechanical loads in tension/compression with no mean stress. This work allows the evolution of different networks of cracks to be monitored and quantified through mechanical loadings. The second is the numerical simulation of the phenomenon of fatigue damage. Three types of models are used (i.e., stochastic, probabilistic, and cohesive elements). The experimental results have led to the identification of a multiple crack initiation law in fatigue, which is compared with the numerical results. This comparison shows the relevance of the use of an analytical probabilistic model to obtain statistical results on the density of cracks that can be initiated with thermal and mechanical fatigue loadings.
3

Indexation de documents audio : Cas des grands volumes de données

Rougui, Jamal 16 July 2008 (has links) (PDF)
Cette thèse est consacrée à l’'élaboration et l’'évaluation des techniques visant à renforcer la robustesse des systèmes d’'indexation de documents audio au sens du locuteur. L’'indexation audio au sens du locuteur consiste à reconnaître l’'identité des locuteurs ainsi que leurs interventions dans un ux continu audio ou dans une base de données d’'archives audio, ne contenant que la parole. Dans ce cadre nous avons choisi de structurer les documents audio (restreints à des journaux radiodiffusés) selon une classication en locuteurs. La technique utilisée repose sur l’'extraction des coefficients mel-cepstrales, suivi par l’'apprentissage statistique de modèles de mélange de gaussiennes (MMG) et sur la détection des changements de locuteur au moyen de test d’'hypothèse Bayésien. Le processus est incrémental : au fur et à mesure que de nouveaux locuteurs sont détectés, ils sont identifiés à ceux de la base de données ou bien, le cas échéant, de nouvelles entrées sont créées dans la base. Comme toute structure de données adaptée au problème incrémental, notre système d’'indexation permet d’'effectuer la mise à jour des modèles MMG de locuteur à l’'aide de l’'algorithme fusion des MMG. Cet algorithme à été conçu à la fois pour créer une structure ascendante en regroupant deux à deux les modèles GMM jugés similaires. Enn, à travers de deux études utilisant des structures arborescentes binaire ou n’'aire, une réexion est conduite an de trouver une structure ordonnée et adaptée au problème incrémental. Quelques pistes de réexions sur l’'apport de l’'analyse vidéo sont discutées et les besoins futurs sont explorés.
4

Inversion de modèles probabilistes de structures à partir de fonctions<br />de transfert expérimentales

Arnst, Maarten 03 April 2007 (has links) (PDF)
L'objectif de la thèse est de développer une méthodologie d'identification expérimentale de modèles probabilistes qui prédisent le comportement dynamique de structures. Nous focalisons en particulier sur l'inversion de modèles probabilistes à paramétrage minimal, introduits par Soize, à partir de fonctions de transfert expérimentales. Nous montrons d'abord que les méthodes classiques d'estimation de la théorie des statistiques mathématiques, telle que la méthode du maximum de vraisemblance, ne sont pas bien adaptées pour aborder ce problème. En particulier, nous montrons que des difficultés numériques, ainsi que des problèmes conceptuels dus au risque d'une mauvaise spécification des modèles, peuvent entraver l'application des méthodes classiques. Ces difficultés nous motivent à formuler l'inversion de modèles probabilistes alternativement comme la minimisation, par rapport aux paramètres recherchés, d'une fonction objectif, mesurant une distance entre les données expérimentales et le modèle probabiliste. Nous proposons deux principes de construction pour la définition de telles distances, basé soit sur la fonction de logvraisemblance, soit l'entropie relative. Nous montrons comment la limitation de ces distances aux lois marginales d'ordre bas permet de surmonter les difficultés mentionnées plus haut. La méthodologie est appliquée à des exemples avec des données simulées et à un problème en ingénierie civile et environnementale avec des mesures réelles.
5

Modélisation à plusieurs échelles d'un milieu continu hétérogène aléatoire / Stochastic modeling of random heterogeneous materials

Tran, Vinh Phuc 05 October 2016 (has links)
Lorsque les longueurs caractéristiques sont bien séparées, la théorie de l'homogénéisation propose un cadre théorique rigoureux pour les matériaux hétérogènes. Dans ce contexte, les propriétés macroscopiques peuvent être calculées à partir de la résolution d’un problème auxiliaire formulé sur un volume élémentaire représentatif (avec des conditions limites adéquates). Dans le présent travail, nous nous intéressons à l’homogénéisation de matériaux hétérogènes décrits à l’échelle la plus fine par deux modèles différents (tous deux dépendant d’une longueur caractéristique spécifique) alors que le milieu homogène équivalent se comporte, dans les deux cas, comme un milieu de Cauchy classique.Dans la première partie, une microstructure aléatoire de type Cauchy est considérée. La résolution numérique du problème auxiliaire, réalisée sur plusieurs réalisations, implique un coût de calcul important lorsque les longueurs caractéristiques des constituants ne sont pas bien séparées et/ou lorsque le contraste mécanique est élevé. Pour surmonter ces limitations, nous basons notre étude sur une description mésoscopique du matériau combinée à la théorie de l'information. Dans cette mésostructure, obtenue par filtrage, les détails les plus fins sont lissés.Dans la seconde partie, nous nous intéressons aux matériaux à gradient dans lesquels il existe au moins une longueur interne, qui induit des effets de taille à l’échelle macroscopique. La microstructure aléatoire est décrite par un modèle à gradient de contrainte récemment proposé. Malgré leur similarité conceptuelle, nous montrerons que le modèle de stress-gradient et strain-gradient définissent deux classes de matériaux distinctes. Nous proposons ensuite des approches simples (méthodes de champs moyens) pour mieux comprendre les hypothèses de modélisation. Les résultats semi-analytiques obtenus nous permettent d’explorer l'influence des paramètres du modèle sur les propriétés macroscopiques et constituent la première étape vers la simulation en champs complets / If the length-scales are well separated, homogenization theory can provide a robust theoretical framework for heterogeneous materials. In this context, the macroscopic properties can be retrieved from the solution to an auxiliary problem, formulated over the representative volume element (with appropriate boundary conditions). In the present work, we focus on the homogenization of heterogeneous materials which are described at the finest scale by two different materials models (both depending on a specific characteristic length) while the homogeneous medium behaves as a classical Cauchy medium in both cases.In the first part, the random microstructure of a Cauchy medium is considered. Solving the auxiliary problem on multiple realizations can be very costly due to constitutive phases exhibiting not well-separated characteristic length scales and/or high mechanical contrasts. In order to circumvent these limitations, our study is based on a mesoscopic description of the material, combined with information theory. In the mesostructure, defined by a filtering framework, the fine-scale features are smoothed out.The second part is dedicated to gradient materials which induce microscopic size-effect due to the existence of microscopic material internal length(s). The random microstructure is described by a newly introduced stress-gradient model. Despite being conceptually similar, we show that the stress-gradient and strain-gradient models define two different classes of materials. Next, simple approaches such as mean-field homogenization techniques are proposed to better understand the assumptions underlying the stress-gradient model. The obtained semi-analytical results allow us to explore the influence on the homogenized properties of the model parameters and constitute a first step toward full-field simulations
6

Etude de la fatigue des aciers laminés à partir de l'auto-échauffement sous sollicitation cyclique : essais, observations, modélisation et influence d'une pré-déformation plastique / Study of fatigue properties of rolled steels from self-heating measurements under cyclic loading : tests, observations, model and influence of a plastic pre-strain

Munier, Rémi 03 February 2012 (has links)
La détermination des propriétés en fatigue à grand nombre de cycles des aciers laminés destinés à l'industrie automobile est un processus coûteux en temps et en quantité de matière : 25 éprouvettes et presque un mois d'essais sont nécessaires à l'obtention d'une courbe de fatigue standard. Dans l'objectif de réduire ces temps de caractérisation, une méthode rapide, basée sur l'auto-échauffement de la matière sous sollicitation cyclique est mise en place sur un très grand nombre de nuances. Les mesures d'auto-échauffement mettent en évidence la présence de deux régimes dissipatifs distincts, un pour les plus faibles amplitudes de chargement cyclique et un pour les plus hautes. Un modèle probabiliste à deux échelles est ensuite développé, dont le but est de prévoir le comportement en fatigue à grand nombre de cycles à partir des mesures d'auto-échauffement. Il est composé d'une matrice au comportement élasto-plastique et d'une population d'inclusions possédant un second comportement élasto-plastique dont le seuil d'activation est aléatoire. Les deux régimes d'auto-échauffement peuvent ainsi être décrits fidèlement. En utilisant l'hypothèse du maillon le plus faible et un critère énergétique, une prévision du comportement en fatigue est réalisée. Trois jours seulement sont alors requis pour obtenir une courbe de fatigue complète. La pertinence de l'approche est validée en comparant avec des courbes de fatigue standards. Puis, des observations par microscopie optique, par microscopie à force atomique et par EBSD sont entreprises sur un acier micro-allié. L'objectif est double : en premier lieu, mieux comprendre les phénomènes qui se produisent sous sollicitation cyclique conduisant à l'obtention des deux régimes d'auto-échauffement ; en second lieu, justifier la pertinence des ingrédients introduits dans la modélisation. Dans une seconde grande partie, il est question de l'influence d'une pré-déformation plastique sur l'évolution des propriétés en fatigue. En effet, les composants automobiles obtenus à partir de tôles en acier laminé subissent diverses opérations de mise en forme, conduisant à déformer plastiquement la matière. Ces modifications de l'état de la matière engendrent des évolutions des propriétés en fatigue qui ne sont cependant pas prises en compte dans le dimensionnement actuel des pièces (non déterminées par la méthode standard car trop coûteux en temps). La rapidité de la méthode développée autorise à caractériser ces évolutions. A partir des modifications des propriétés à l'auto-échauffement après divers modes de pré-déformation plastique (traction, traction plane, cisaillement) et en étudiant diverses directions de sollicitation, il est possible de prévoir l'évolution des propriétés en fatigue associée pour de larges gammes de pré-déformations. La qualité des prévisions est validée en comparant avec des courbes de fatigue standards. / The determination of high cycle fatigue properties of high strength steel sheets for automotive industry is time and specimens consuming : 25 specimens and almost one month are required to obtain a traditional fatigue SN curve. In order to reduce the time dedicated to the fatigue characterization, a fast method, based on the self-heating of steels under cyclic loading is developed and applied to a wide range of grades. Self-heating measurements show the presence of two distinct dissipative regimes, a firstone for the low amplitudes of cyclic loading and a secondary one for the highest. A two scales probabilistic model is then developed in order to establish a dialogue between self-heating measurements and the fatigue properties. It is composed by a matrix having an elasto-plastic behaviorand a population of inclusions having a second elasto-plastic behavior with a random activation threshold. Both self-heating regimes can be perfectly described. By using the weakest link theory and an energetic criterion, a prediction of fatigue properties is made. Only three days are required to obtain acomplete fatigue curve. The pertinence of the approach is validated by a comparison with standard fatigue curves. Then, observations with optical microscopy, atomic force microscopy and EBSD are made on a high strength low alloyed steel grade. This study has two objectives: a better understanding of phenomenon occurring during cyclic loading leading to the two self-heating regimes; a justification of the ingredients introduced into the model. In a second important section, it deals with the influence of aplastic pre-strain on the fatigue properties evolution. Indeed, automotive components obtained from high strength steel sheets are subjected to primary forming operations, inducing plastic strain. These modifications lead to fatigue properties evolutions that are nevertheless not taken into account intraditional fatigue design of components (not determined with the standard method because ofprohibitive time). The speed of the proposed approach authorizes to characterize these evolutions. From the modifications of the self-heating properties after different modes of plastic pre-strain (tension, planetension, shearing) and by studying different directions of loading, it is possible to predict the fatigue properties evolutions for a wide range of plastic strain. The quality of the predictions is validated by acomparison with standard fatigue curves.
7

Conception et application d'un modèle de l'information routière et ses effets sur le trafic

Nguyen, Thai Phu 29 June 2010 (has links) (PDF)
Les conditions de circulation sur un réseau routier subissent souvent de la congestion. Selon ses sources, la congestion routière peut être classée en deux catégories : la congestion récurrente déterminée par les lois de trafic et la congestion non-récurrente due aux incidents, accidents ou autres aléas sur la route. Grâce à l'avancement des technologies, notamment en informatique, communication et techniques de traitement des données, l'exploitant est devenu capable de détecter les perturbations, de mesurer les effets et même d'anticiper l'état du trafic afin de mieux adapter ses actions d'exploitation. L'information dynamique concernant les conditions de trafic permet aux usagers de réduire l'inconfort et d'effectuer leur choix d'itinéraire de manière plus raisonnable. Pour l'exploitant, le service d'information aux usagers peut servir à la gestion du trafic. Nous avons étudié la contribution potentielle de l'information dynamique au profit individuel des usagers et à la performance collective du système en prenant en compte : i) la congestion récurrente et non-récurrente ; ii) des différents comportements de choix d'itinéraire en fonction de l'accessibilité à l'information ; iii) d'autres actions de gestion du trafic menées par l'exploitant. Un modèle théorique avec une application analytique sur un réseau élémentaire de deux routes parallèles, une paire origine-destination et deux classes d'usagers respectivement informée ou non-informée nous a permis de retirer de nombreuses indications : i) la diffusion excessive de l'information avec un contenu " neutre " dégrade à la fois le profit individuel et la performance du système ; ii) l'information dynamique avec certain contenu " coopératif " peut contribuer l'optimisation du système sans causer le problème d'acceptabilité ; iii) l'information dynamique et d'autres mesures de gestion dynamique s'interagissent de manière complémentaire à l'optimisation du trafic
8

La carte bayésienne : un modèle probabiliste hiérarchique pour la navigation en robotique mobile

Diard, Julien 27 January 2003 (has links) (PDF)
Qu'est-ce qu'une carte ? Quelle est son utilité ? Qu'est-ce-qu'un lieu, un<br />comportement ? Qu'est-ce-que naviguer, se localiser et prédire, pour un<br />robot mobile devant accomplir une tâche donnée ?<br /><br />Ces questions n'ont pas de réponses uniques ou évidentes à ce jour, et<br />restent centrales à de nombreux domaines de recherches.<br /><br />La robotique, par exemple, souhaite y répondre en vue de la synthèse de<br />systèmes sensori-moteurs performants. Les sciences cognitives placent ces<br />questions comme essentielles à la compréhension des êtres vivants, de leurs<br />compétences, et au-delà, de leurs intelligences.<br /><br />Notre étude se situe à la croisée de ces disciplines. Nous étudions tout<br />d'abord les méthodes probabilistes classiques (Localisation Markovienne,<br />PDMPOs, MMCs, etc.), puis certaines approches dites "bio-inspirées"<br />(Berthoz, Franz, Kuipers). Nous analysons les avantages et inconvénients<br />respectifs de ces approches en les replaçant dans un cadre général de<br />programmation des robots basé sur l'inférence bayésienne (PBR).<br /><br />Nous proposons un formalisme original de modélisation probabiliste de<br />l'interaction entre un robot et son environnement : la carte bayésienne.<br /><br />Dans ce cadre, définir une carte revient à spécifier une distribution de<br />probabilités particulière. Certaines des questions évoquées ci-dessus se<br />ramènent alors à la résolution de problèmes d'inférence probabiliste.<br /><br />Nous définissons des opérateurs d'assemblage de cartes bayésiennes,<br />replaçant ainsi les notions de "hiérarchie de cartes" et de développement<br />incrémental comme éléments centraux de notre approche, en accord avec les<br />données biologiques. En appuyant l'ensemble de notre travail sur le<br />formalisme bayésien, nous profitons d'une part d'une capacité de traitement<br />unifié des incertitudes, et d'autre part, de fondations mathématiques<br />claires et rigoureuses. Notre formalisme est illustré par des exemples<br />implantés sur un robot mobile Koala.
9

Multifissuration en fatigue uniaxiale et biaxiale de l'acier inoxydable 304L

Rupil, Jérémie 24 September 2012 (has links) (PDF)
Lorsqu'une pièce mécanique est soumise à une sollicitation mécanique répétée dans le temps, elle risque de s'endommager après un certain nombre de cycles d'utilisation par amorçage de plusieurs fissures et propagation d'une fissure principale. C'est le phénomène d'endommagement par fatigue. La thèse traite plus particulièrement du possible endommagement de certains composants de centrales nucléaires par fatigue thermique. Contrairement à l'endommagement classique en fatigue mécanique où une fissure principale vient rompre la pièce, l'endommagement par fatigue thermique se traduit généralement par l'apparition d'un réseau de fissures surfaciques. Deux aspects sont traités dans la thèse. Le premier est l'étude expérimentale de la phase de fissuration multiple ou multifissuration en fatigue. Pour cela deux campagnes d'essais avec détection de la multifissuration par corrélation d'images numériques ont été menées. Ces campagnes concernent des chargements mécaniques uniaxiaux et équibiaxiaux de traction/compression sans contrainte moyenne. Ce travail a permis de suivre et d'observer l'évolution de différents réseaux de fissures à travers des sollicitations de type mécanique. Le second est la simulation numérique du phénomène d'endommagement en fatigue mécanique et thermique. Plusieurs types de modélisation sont utilisés (stochastique, probabiliste, éléments finis cohésifs). Les résultats expérimentaux ont permis d'identifier une loi d'amorçage multiple en fatigue et sont également confrontés aux résultats numériques. Cette confrontation permet notamment de montrer la pertinence de l'utilisation d'un modèle probabiliste analytique afin de retrouver des résultats statistiques sur la densité de fissures qui peuvent être amorcées en fatigue thermique et mécanique.
10

Modélisation du langage à l'aide de pénalités structurées / Modeling language with structured penalties

Nelakanti, Anil Kumar 11 February 2014 (has links)
La modélisation de la langue naturelle est l¿un des défis fondamentaux de l¿intelligence artificielle et de la conception de systèmes interactifs, avec applications dans les systèmes de dialogue, la génération de texte et la traduction automatique. Nous proposons un modèle log-linéaire discriminatif donnant la distribution des mots qui suivent un contexte donné. En raison de la parcimonie des données, nous proposons un terme de pénalité qui code correctement la structure de l¿espace fonctionnel pour éviter le sur-apprentissage et d¿améliorer la généralisation, tout en capturant de manière appropriée les dépendances à long terme. Le résultat est un modèle efficace qui capte suffisamment les dépendances longues sans occasionner une forte augmentation des ressources en espace ou en temps. Dans un modèle log-linéaire, les phases d¿apprentissage et de tests deviennent de plus en plus chères avec un nombre croissant de classes. Le nombre de classes dans un modèle de langue est la taille du vocabulaire, qui est généralement très importante. Une astuce courante consiste à appliquer le modèle en deux étapes: la première étape identifie le cluster le plus probable et la seconde prend le mot le plus probable du cluster choisi. Cette idée peut être généralisée à une hiérarchie de plus grande profondeur avec plusieurs niveaux de regroupement. Cependant, la performance du système de classification hiérarchique qui en résulte dépend du domaine d¿application et de la construction d¿une bonne hiérarchie. Nous étudions différentes stratégies pour construire la hiérarchie des catégories de leurs observations. / Modeling natural language is among fundamental challenges of artificial intelligence and the design of interactive machines, with applications spanning across various domains, such as dialogue systems, text generation and machine translation. We propose a discriminatively trained log-linear model to learn the distribution of words following a given context. Due to data sparsity, it is necessary to appropriately regularize the model using a penalty term. We design a penalty term that properly encodes the structure of the feature space to avoid overfitting and improve generalization while appropriately capturing long range dependencies. Some nice properties of specific structured penalties can be used to reduce the number of parameters required to encode the model. The outcome is an efficient model that suitably captures long dependencies in language without a significant increase in time or space requirements. In a log-linear model, both training and testing become increasingly expensive with growing number of classes. The number of classes in a language model is the size of the vocabulary which is typically very large. A common trick is to cluster classes and apply the model in two-steps; the first step picks the most probable cluster and the second picks the most probable word from the chosen cluster. This idea can be generalized to a hierarchy of larger depth with multiple levels of clustering. However, the performance of the resulting hierarchical classifier depends on the suitability of the clustering to the problem. We study different strategies to build the hierarchy of categories from their observations.

Page generated in 0.1432 seconds