Monika Vyas (18431835) 28 April 2024 (has links)
<p dir="ltr">This thesis delves into emotion recognition in Hindi-English code-mixed dialogues, particularly focusing on romanized text, which is essential for understanding multilingual communication dynamics. Using a dataset from bilingual television shows, the study employs machine learning and natural language processing techniques, with models like Support Vector Machine, Logistic Regression, and XLM-Roberta tailored to handle the nuances of code-switching and transliteration in romanized Hindi-English. To combat challenges such as data imbalance, SMOTE (Synthetic Minority Over-sampling Technique) is utilized, enhancing model training and generalization. The research also explores ensemble learning with methods like VotingClassifier to improve emotional classification accuracy. Logistic regression stands out for its high accuracy and robustness, demonstrated through rigorous cross-validation. The findings underscore the potential of advanced machine learning models and advocate for further exploration of deep learning and multimodal data to enhance emotion detection in diverse linguistic settings.</p>

Des chiffres et des êtres : impact de l’expérience sociale des parents sur la scolarité des enfants : le cas des minorités originaires d’Afrique du nord dans les enquêtes de l’Ined (1945-2011) / Figures and human beings : impact of parents’ social experience on the children school career : the case of the North-African minorities in the surveys of the French Institute for Demographic Studies (1945-2011)

Oumeddour, Leila-Fatiha 23 November 2016 (has links)
La recherche porte sur la construction de la catégorie statistique immigré qui désigne les personnes résidant en France, nées étrangères à l’étranger. La catégorie statistique est déconstruite au travers de l’exemple des descendants de Maghrébins, diplômés de l’enseignement supérieur, et des conditions d’émigration et d’immigration de leur famille. L’étude s’appuie sur l’analyse de deux corpus : le premier est constitué de deux travaux de l’Institut national d’études démographiques (Ined) qui ont pour objet l’étude des populations étrangères puis immigrées et leurs descendants ; le second est composé de quarante-trois récits biographiques de descendants de Maghrébins recueillis dans le cadre de la dernière enquête représentative de l’Ined, Trajectoires et Origines.Les résultats montrent qu’en dépit d’une transformation du profil des immigrants, la démographie aborde l’immigration maghrébine dans des approches similaires à celles qui caractérisent la période coloniale, à savoir, ethniciste et culturaliste. Cette conception a été réactivée en France depuis l’institutionnalisation de la catégorie statistique immigré (1990) qui ne tient pas compte de la dimension historique des immigrations. Elle ne permet pas, notamment, de contextualiser les vagues migratoires dans leurs cadres historiques différenciés. Les spécificités coloniales et postcoloniales des « Algériens », dont le statut juridique a varié selon les périodes, est néanmoins perceptible dans les deux corpus. Or, la prise en compte des ruptures qui ont rythmées les relations entre la métropole et ses possessions d’Afrique du Nord révèlent les effets, encore actifs, de l’héritage colonial sur les parcours scolaires des descendants de Maghrébins et ceux de leurs parents. L’analyse des trajectoires dans leurs dimensions temporelle et comparative permet d’avancer que la réussite scolaire des descendants dépend davantage du capital scolaire, socioculturel et économique de leurs parents que de traits culturels particuliers. De l’immigrant colonial illettré des années 1940 à l’intellectuel transnational Maghrébin des années 1990, la recherche française doit intégrer les transformations à l’œuvre dans cette composante de la population française. / The research is centered on the construction of statistical categories in France. In particular it focuses on the notional deficit that shows the immigré category which designates the individuals who are born abroad of foreign nationality. The category is deconstructed through the example of graduates’ trajectories of Maghreb ascendance as well as the circumstances which led their parents to emigrate and the conditions of their settlement in France. The analyzed materials are of two different natures: the first one is composed of two studies performed by the French Institute for Demographic Studies (Ined) which address the foreign and immigrant populations in France, and the second one, gathers forty-three biographical narratives of graduates of Maghreb ascendance. These later were collected within the frame of the last representative survey implemented by Ined: Trajectoires et Origines. The results show that despite a transformation of the immigrants’ profile, the French demography’s approach of the Maghreb immigration is largely similar to the one characterizing the colonial era: an ethnic and cultural conception. This approach has been reactivated in France when the statistical category “immigré” was institutionalized in 1990. This category, which only takes into account the country of birth of the migrants, displays a significant notional deficit in its definition and its application. In particular, it doesn’t contextualize the immigration waves in their differentiated historical realities. The colonial and postcolonial specificities of “Algerians”, whose legal status has varied across the different periods of time, are nonetheless noticeable in both the demographical studies and the biographical narratives.Yet, when the ruptures which have marked the relationships between France and its ex-possessions in North-Africa reveal the effects of the colonial heritage, which is still active, on the school careers of the Maghreb descendants’ and those of their parents. The analysis of the trajectories in their temporal and comparative dimensions proves that succeeding at school for the Maghreb descendant depends more on the sociocultural and economic capital that the parents possess, than cultural patterns. Indeed, from the illiterate colonial immigrant of the 1940 to the Maghreb transnational intellectuals of the 1990, the French research must integrate the changes occurring in this component of the French population.

Caractérisation différentielle de forums de discussion sur le VIH en vietnamien et en français : Éléments pour la fouille comportementale du web social / Differential characterization of discussion forums on HIV in Vietnamese and French : Elements for behaviour mining on the social web

Hô Dinh, Océane 22 December 2017 (has links)
Les discours normés que produisent les institutions sont concurrencés par les discours informels ou faiblement formalisés issus du web social. La démocratisation de la prise de parole redistribue l’autorité en matière de connaissance et modifie les processus de construction des savoirs. Ces discours spontanés sont accessibles par tous et dans des volumes exponentiels, ce qui offre aux sciences humaines et sociales de nouvelles possibilités d’exploration. Pourtant elles manquent encore de méthodologies pour appréhender ces données complexes et encore peu décrites. L’objectif de la thèse est de montrer dans quelle mesure les discours du web social peuvent compléter les discours institutionnels. Nous y développons une méthodologie de collecte et d’analyse adaptée aux spécificités des discours natifs du numérique (massivité, anonymat, volatilité, caractéristiques structurelles, etc.). Nous portons notre attention sur les forums de discussion comme environnements d’élaboration de ces discours et appliquons la méthodologie développée à une problématique sociale définie : celle de l’épidémie du VIH/SIDA au Viêt Nam. Ce terrain applicatif recouvre plusieurs enjeux de société : sanitaire et social, évolutions des moeurs, concurrence des discours. L’étude est complétée par l’analyse d’un corpus comparable de langue française, relevant des mêmes thématique, genre et discours que le corpus vietnamien, de manière à mettre en évidence les spécificités de contextes socioculturels distincts. / The standard discourse produced by official organisations is confronted with the unofficial or informal discourse of the social web. Empowering people to express themselves results in a new balance of authority, when it comes to knowledge and changes the way people learn. Social web discourse is available to each and everyone and its size is growing fast, which opens up new fields for both humanities and social sciences to investigate. The latter, however, are not equipped to engage with such complex and little-analysed data. The aim of this dissertation is to investigate how far social web discourse can help supplement official discourse. In it we set out a method to collect and analyse data that is in line with the characteristics of a digital environment, namely data size, anonymity, transience, structure. We focus on forums, where such discourse is built, and test our method on a specific social issue, ie the HIV/AIDS epidemic in Vietnam. This field of investigation encompasses several related questions that have to do with health, society, the evolution of morals, the mismatch between different kinds of discourse. Our study is also grounded in the analysis of a comparable French corpus dealing with the same topic, whose genre and discourse characteristics are equivalent to those of the Vietnamese one: this two-pronged research highlights the specific features of different socio-cultural environments.

