Automatic text summarization of French judicial data with pre-trained language models, evaluated by content and factuality metrics

Adler, Malo January 2024 (has links)
During an investigation carried out by a police officer or a gendarme, audition reports are written, the length of which can be up to several pages. The high-level goal of this thesis is to study various automatic and reliable text summarization methods to help with this time-consuming task. One challenge comes from the specific, French and judicial data that we wish to summarize; and another challenge comes from the need for reliable and factual models. First, this thesis focuses on automatic summarization evaluation, in terms of both content (how well the summary captures essential information of the source text) and factuality (to what extent the summary only includes information from or coherent with the source text). Factuality evaluation, in particular, is of crucial interest when using LLMs for judicial purposes, because of their hallucination risks. Notably, we propose a light variation of SelfCheckGPT, which has a stronger correlation with human judgment (0.743) than the wide-spread BARTScore (0.542), or our study dataset. Other paradigms, such as Question-Answering, are studied in this thesis, which however underperform compared to these. Then, extractive summarization methods are explored and compared, including one based on graphs via the TextRank algorithm, and one based on greedy optimization. The latter (overlap rate: 0.190, semantic similarity: 0.513) clearly outperforms the base TextRank (overlap rate: 0.172, semantic similarity: 0.506). An improvement of the TextRank with a threshold mechanism is also proposed, leading to a non-negligible improvement (overlap rate: 0.180, semantic similarity: 0.513). Finally, abstractive summarization, with pre-trained LLMs based on a Transformer architecture, is studied. In particular, several general-purpose and multilingual models (Llama-2, Mistral and Mixtral) were objectively compared on a summarization dataset of judicial procedures from the French police. Results show that the performances of these models are highly related to their size: Llama-2 7B struggles to adapt to uncommon data (overlap rate: 0.083, BARTScore: -3.099), while Llama-2 13B (overlap rate: 0.159, BARTScore: -2.718) and Llama-2 70B (overlap rate: 0.191, BARTScore: -2.479) have proven quite versatile and efficient. To improve the performances of the smallest models, empirical prompt-engineering and parameter-efficient fine-tuning are explored. Notably, our fine-tuned version of Mistral 7B reaches performances comparable to those of much larger models (overlap rate: 0.185, BARTScore: -2.060), without the need for empirical prompt-engineering, and with a linguistic style closer to what is expected. / Under en utredning som görs av en polis eller en gendarm skrivs förhörsprotokoll vars längd kan vara upp till flera sidor. Målet på hög nivå med denna rapport är att studera olika automatiska och tillförlitliga textsammanfattningsmetoder för att hjälpa till med denna tidskrävande uppgift. En utmaning kommer från de specifika franska och rättsliga uppgifter som vi vill sammanfatta; och en annan utmaning kommer från behovet av pålitliga, sakliga och uppfinningsfria modeller. För det första fokuserar denna rapport på automatisk sammanfattningsutvärdering, både vad gäller innehåll (hur väl sammanfattningen fångar väsentlig information i källtexten) och fakta (i vilken utsträckning sammanfattningen endast innehåller information från eller överensstämmer med källtexten). Faktautvärdering, i synnerhet, är av avgörande intresse när man använder LLM för rättsliga ändamål, på grund av deras hallucinationsrisker. Vi föreslår särskilt en lätt variant av SelfCheckGPT, som har en starkare korrelation med mänskligt omdöme (0,743) än den utbredda BARTScore (0,542), eller vår studiedatauppsättning. Andra paradigm, såsom Question-Answering, studeras i denna rapport, som dock underpresterar jämfört med dessa. Sedan utforskas och jämförs extraktiva sammanfattningsmetoder, inklusive en baserad på grafer via TextRank-algoritmen och en baserad på girig optimering. Den senare (överlappning: 0,190, semantisk likhet: 0,513) överträffar klart basen TextRank (överlappning: 0,172, semantisk likhet: 0,506). En förbättring av TextRank med en tröskelmekanism föreslås också, vilket leder till en icke försumbar förbättring (överlappning: 0,180, semantisk likhet: 0,513). Slutligen studeras abstrakt sammanfattning, med förutbildade LLM baserade på en transformatorarkitektur. I synnerhet jämfördes flera allmänna och flerspråkiga modeller (Llama-2, Mistral och Mixtral) objektivt på en sammanfattningsdatauppsättning av rättsliga förfaranden från den franska polisen. Resultaten visar att prestandan för dessa modeller är starkt relaterade till deras storlek: Llama-2 7B kämpar för att anpassa sig till ovanliga data (överlappning: 0,083, BARTScore: -3,099), medan Llama-2 13B (överlappning: 0,159, BARTScore: -2,718) och Llama-2 70B (överlappning: 0,191, BARTScore: -2,479) har visat sig vara ganska mångsidiga och effektiva. För att förbättra prestandan för de minsta modellerna utforskas empirisk prompt-teknik och parametereffektiv finjustering. Noterbart är att vår finjusterade version av Mistral 7B når prestanda som är jämförbara med de för mycket större modeller (överlappning: 0,185, BARTScore: -2,060), utan behov av empirisk prompt-teknik och med en språklig stil som ligger närmare vad som förväntas.

Efficacité et processus thérapeutiques de la Thérapie basée sur la réalité virtuelle pour le traitement de la schizophrénie réfractaire aux traitements

Dellazizzo, Laura 04 1900 (has links)
La schizophrénie est considérée comme l'un des troubles psychiatriques les plus invalidants. L'une des principales raisons de ce fardeau élevé est qu'une grande partie des patients atteints de schizophrénie ne répondent pas adéquatement aux traitements pharmacologiques de première ligne et continueront de souffrir d’hallucinations auditives. La présence de celles-ci peut avoir un effet dévastateur sur le bien-être émotionnel des patients ainsi que sur leur qualité de vie. Les alternatives non-pharmacologiques (ex., Thérapie cognitivo-comportementale (TCC)) demeurent aussi limitées. Ainsi, pour plusieurs patients, les traitements actuellement recommandés ne sont pas suffisants. À cet égard, le traitement de la schizophrénie peut être perfectionné si, en plus du traitement des symptômes, l'accent thérapeutique est mis sur d’autres sphères importantes pour les patients (ex., améliorer l’estime de soi, réguler les émotions). Les efforts visant à accroître l'efficacité et les bénéfices des psychothérapies fondées sur des preuves ont mené à l'émergence d'interventions basées sur la réalité virtuelle (RV). Avec ces progrès technologiques, AVATAR Therapy et l’adaptation faite par notre équipe, la Thérapie assistée par la Réalité Virtuelle (TRV) (ou communément nommé la Thérapie Avatar (TA)), permettent aux patients d’entrer en dialogue en temps réel avec un avatar, animé entièrement par le thérapeute, qui représente leur voix la plus persécutrice. Cette approche, à la fois relationnelle et expérientielle, offre une occasion unique d’aider les patients à prendre le contrôle de leur voix. Cette thèse a pour objectif principal d’évaluer l’efficacité de cette psychothérapie basée sur la RV ainsi que les thèmes abordés durant et après la thérapie. Pour arriver à cette fin, divers objectifs ont été mis à l’avant : (i) résumer l'état des preuves sur l'efficacité des interventions basées sur la RV pour les troubles psychiatriques, (ii) évaluer l'efficacité de la TA/TRV par rapport à la TCC, (iii) illustrer l’efficacité de la thérapie à travers la perspective de patients ayant montré des effets bénéfiques, et (iv) explorer les thèmes émergeants ainsi que les processus thérapeutiques de la TA/TRV. Dans la première section, deux recensions des écritsdans diverses bases de données ont été effectuées pour examiner l’efficacité des psychothérapies basées sur la RV. Notre méta-revue (c’est-à-dire revue de méta-analyse) incluant 11 méta-analyses et 41 tailles d'effet a montré des résultats positifs de la RV dans le traitement des troubles psychiatriques, principalement des troubles anxieux. Les interventions basées sur la RV sont meilleures que le traitement usuel et montrent généralement des effets similaires par rapport aux approches fondées sur des preuves. Les résultats préliminaires suggèrent également que les effets de la RV se maintiennent dans le temps. Par contre, de nombreux symptômes et troubles psychiatriques qui peuvent être traités par des interventions utilisant RV n'ont pu être examinés par une analyse méta-analytique, en particulier les symptômes psychotiques (ex., hallucinations auditives) et les comportements liés à l'agressivité (ex., régulation émotionnelle). Ainsi, notre seconde revue a montré qu’il existe un nombre limité de paradigmes basés sur la RV pour traiter les individus atteints de troubles psychotiques et autres troubles mentaux à risque de comportements agressifs. Les études préliminaires dans des populations autres que la schizophrénie ont montré des réductions de la colère et de l'impulsivité, des améliorations des capacités de résolution des conflits ainsi que des niveaux d'empathie et des diminutions de l'agressivité. En ce qui a trait aux interventions basées sur la RV pour la schizophrénie, des réductions par rapport aux délires et aux hallucinations auditives ont été trouvées. Dans la seconde section, deux essais cliniques ont été menés pour évaluer l’efficacité de la TA/TRV seule en comparaison avec la TCC et en combinaison avec la TCC (TCC+TA/TRV). Notre essai randomisé comparant la TA/TRV à la TCC a compris 37 participants de plus de 18 ans entendant des voix persécutives et souffrant de schizophrénie résistante aux traitements dans chacun des groupes. Les résultats principaux ont montré que les deux interventions ont produit des améliorations significatives sur la sévérité des symptômes hallucinatoires avec des effets plus prononcés pour la TA/TRV. De plus, les résultats suggèrent une supériorité de la TA/TRV par rapport à la TCC sur les symptômes affectifs. La TA/TRV a également montré des effets positifs sur la qualité de vie. Les effets ont été maintenus à long terme, soit jusqu'à un an de suivi. Notre preuve de concept sur 10 patients ayant suivi la TCC de notre essai clinique comparatif qui souhaitaient continuer à obtenir des améliorations avec la TA/TRV a montré que les effets de la TCC+TA/TRV sur les symptômes dépressifs et les symptômes de la schizophrénie étaient plus larges que ceux trouvés pour l'une ou l'autre des interventions uniques. La troisième section a pour but de détailler les cas de 2 patients ayant suivi la TA/TRV. D’abord, nous avons décrit un partenariat entre un utilisateur de services en santé mentale et des chercheurs cliniciens en mettant en vedette M. X, le premier patient à suivre la thérapie. Nous avons ainsi montré l’apport de monsieur X quant à ses suggestions d’amélioration de la thérapie et ensuite en tant que notre pair aidant pour les futurs patients, dans son cheminement vers le rétablissement. Ensuite, nous avions rapporté le cas d'un patient atteint d’une schizophrénie ultra-résistante, soit M. Smith, qui n'a pas répondu à plusieurs traitements antipsychotiques, à la stimulation magnétique transcrânienne répétitive et à la thérapie par électrochocs avant de participer à notre essai. De plus, le patient a terminé notre TCC avant de se voir proposer notre TA/TRV. Cette dernière intervention a montré les effets les plus positifs. Or, ces deux cas ont montré que la thérapie a aidé non seulement à diminuer leurs symptômes, mais aussi à améliorer leur qualité de vie. La quatrième section a pour objectif d’explorer les thèmes émergents de la TA/TRV suite à des analyses de contenu. Ainsi, suite à une analyse qualitative découlant du discours spontané de 10 patients ayant bien répondu à la TA/TRV, quatre thèmes généraux ont émergé : impact de la thérapie sur les voix, relations interpersonnelles, bien-être psychologique et mode de vie. Cette analyse de contenu a permis d’identifier plusieurs sphères de vie qui sont davantage améliorées chez les patients ayant une schizophrénie résistante aux traitements à l’aide de la TA/TRV. Deux autres analyses qualitatives ont été conduites pour approfondir nos connaissances sur les processus thérapeutiques de la TA/TRV. Celles-ci ont permis de montrer que les patients répondent au propos de l’avatar en utilisant des mécanismes d'adaptation ou en exprimant des émotions, des croyances, des perceptions de soi ou des aspirations. Le discours de l'avatar a pu être catégorisé en techniques de confrontation (ex., provocation) et en techniques positives (ex., renforcement). Grâce à l'identification de changements mutuels dans l'interaction entre le patient et son avatar, un changement a été observé au fil des séances de la confrontation vers un dialogue constructif. L'affirmation de soi, les réponses émotionnelles et les stratégies de prévention semblaient être au cœur du processus thérapeutique, et celles-ci se produisent généralement en réponse à des techniques positives. Cette thèse contribue à la validation d’une nouvelle approche thérapeutique répondant à un besoin clinique fondamental. Ainsi, la TA/TRV met en lumière l'avenir des approches adaptées aux patients qui peuvent présenter des avantages par rapport aux traitements conventionnels. Ces types d’interventions holistiques utilisant la RV pourraient aussi présenter des avenues prometteuses dans plusieurs autres troubles psychiatriques. / Schizophrenia is considered one of the most debilitating psychiatric disorders. One of the main reasons for this high burden is that a large proportion of patients with schizophrenia do not respond adequately to first-line pharmacological treatments and will continue to suffer from auditory hallucinations. The presence of these symptoms can have a devastating effect on the emotional well-being of patients as well as their quality of life. Non-pharmacological alternatives (e.g., Cognitive Behavioral Therapy (CBT)) also remain limited. Thus, for many patients, the treatments currently recommended are not sufficient. In this regard, the treatment of schizophrenia may be improved if, in addition to the treatment of symptoms, therapeutic emphasis is placed on other areas of importance to patients (e.g., improving self-esteem, emotion regulation). Efforts to increase the effectiveness and benefits of evidence-based psychotherapies have led to the emergence of virtual reality (VR)-based interventions. With these technological advances, AVATAR Therapy and its related innovative form from our team, Virtual Reality Assisted Therapy (VRT) (or commonly Avatar Therapy (AT)), allow patients to enter a real-time dialogue with an avatar, animated entirely by the therapist, who represents their most persecutory voice. This approach, both relational and experiential, offers a unique opportunity to help patients take control of their voice. The main objective of this thesis is to evaluate the effectiveness of this psychotherapy based on VR as well as the themes addressed during and after the therapy. To achieve this end, various objectives have been put forward: (i) summarize the state of the evidence on the effectiveness of VR-based interventions for psychiatric disorders, (ii) assess the effectiveness of AT/VRT versus CBT, (iii) obtain the perspective of patients who have undergone AT/TRV, (iv) explore the therapeutic processes of AT/VRT. In the first section, two literature reviews in various databases were performed to examine the effectiveness of VR-based psychotherapies. Our meta-review including 11 meta-analyzes and 41 effect sizes showed positive results of VR in the treatment of psychiatric disorders, mainly anxiety disorders. VR-based interventions appear better than inactive controls and generally show similar effects compared to evidence-based approaches. Preliminary results also suggest that the effects of VR are sustained over time. On the other hand, many psychiatric symptoms and disorders that can be treated with interventions using VR have not been examined by a meta-analytical analysis, including psychotic symptoms (e.g., auditory hallucinations) and related behaviors. aggression (e.g., emotional regulation). Thus, our second review showed that there are a limited number of VR-based paradigms for treating individuals with psychotic disorders and other mental disorders at risk for aggressive behavior. Preliminary studies in populations other than schizophrenia have shown reductions in anger and impulsivity, improvements in conflict resolution skills as well as levels of empathy and decreases in aggression. Particularly related to VR interventions for schizophrenia, reductions in delusions and auditory hallucinations were found. In the second section, two clinical trials were conducted to evaluate the efficacy of AT/VRT alone in comparison with CBT and in combination with CBT (CBT+TA/VRT). Our randomized trial comparing AT/VRT to CBT included 37 participants over 18 years of age hearing persecutory voices and suffering from treatment-resistant schizophrenia in each group. The main results showed that the two interventions produced significant improvements in the severity of hallucinatory symptoms with more pronounced effects for AT/VRT. In addition, the results suggest that AT/VRT is superior to CBT on affective symptoms. AT/VRT has also shown positive effects on quality of life. The effects were maintained for up to one year of follow-up. Our proof of concept on 10 patients having followed CBT from our comparative clinical trial who wanted to continue to achieve improvements with AT/VRT showed that the effects of CBT+AT/VRT on depressive symptoms and symptoms of schizophrenia were broader than those found for either intervention alone. The third section details the cases of 2 patients who had followed AT/VRT. First, we described a partnership between a mental health service user and clinical researchers by featuring Mr. X, the first to follow therapy for his suggestions and our peer helper for future patients, on his journey to the recovery. Next, we reported the case of a patient with ultra-resistant schizophrenia, Mr. Smith, who failed to respond to multiple antipsychotic treatments, repetitive transcranial magnetic stimulation, and electroconvulsive therapy before participating in our trial. In addition, this patient completed our CBT before being offered AT/VRT. The latter intervention showed the most positive effects. These two cases showed that AT/VRT not only helped to decrease their symptoms, but also to improve their quality of life. The fourth section aimed to explore emerging themes of AT/VRT following content analyses. Thus, following a qualitative analysis resulting from the spontaneous speech of 10 patients who responded well to AT/VRT, four general themes emerged: impact of therapy on voices, interpersonal relationships, psychological well-being and lifestyle. This content analysis identified several areas of life that are further improved in patients with treatment resistant schizophrenia after having followed AT/VRT. Two other qualitative analyses were carried out to deepen our knowledge of the therapeutic processes of AT/VRT. These have shown that patients respond to the avatar's words by using a coping mechanism or by expressing emotions, beliefs, self-perceptions or aspirations. The avatar's discourse could be categorized into confrontational techniques (e.g., provocation) and positive techniques (e.g., reinforcement). With the identification of mutual changes in the interaction between the patient and their avatar, a shift was observed over therapy sessions from confrontation towards a constructive dialogue. Assertiveness, emotional responses, and prevention strategies seemed to be central to the therapeutic process, and these usually occurred in response to positive techniques. This thesis contributes to the validation of a new therapeutic approach responding to a fundamental clinical need. Thus, AT/VRT shines a light on the future of patient-oriented approaches that may have advantages over conventional treatments. These types of holistic interventions using VR may have notable applications in several other psychiatric disorders.

Introducing Generative Artificial Intelligence in Tech Organizations : Developing and Evaluating a Proof of Concept for Data Management powered by a Retrieval Augmented Generation Model in a Large Language Model for Small and Medium-sized Enterprises in Tech / Introducering av Generativ Artificiell Intelligens i Tech Organisationer : Utveckling och utvärdering av ett Proof of Concept för datahantering förstärkt av en Retrieval Augmented Generation Model tillsammans med en Large Language Model för små och medelstora företag inom Tech

Lithman, Harald, Nilsson, Anders January 2024 (has links)
In recent years, generative AI has made significant strides, likely leaving an irreversible mark on contemporary society. The launch of OpenAI's ChatGPT 3.5 in 2022 manifested the greatness of the innovative technology, highlighting its performance and accessibility. This has led to a demand for implementation solutions across various industries and companies eager to leverage these new opportunities generative AI brings. This thesis explores the common operational challenges faced by a small-scale Tech Enterprise and, with these challenges identified, examines the opportunities that contemporary generative AI solutions may offer. Furthermore, the thesis investigates what type of generative technology is suitable for adoption and how it can be implemented responsibly and sustainably. The authors approach this topic through 14 interviews involving several AI researchers and the employees and executives of a small-scale Tech Enterprise, which served as a case company, combined with a literature review.  The information was processed using multiple inductive thematic analyses to establish a solid foundation for the investigation, which led to the development of a Proof of Concept. The findings and conclusions of the authors emphasize the high relevance of having a clear purpose for the implementation of generative technology. Moreover, the authors predict that a sustainable and responsible implementation can create the conditions necessary for the specified small-scale company to grow.  When the authors investigated potential operational challenges at the case company it was made clear that the most significant issue arose from unstructured and partially absent documentation. The conclusion reached by the authors is that a data management system powered by a Retrieval model in a LLM presents a potential path forward for significant value creation, as this solution enables data retrieval functionality from unstructured project data and also mitigates a major inherent issue with the technology, namely, hallucinations. Furthermore, in terms of implementation circumstances, both empirical and theoretical findings suggest that responsible use of generative technology requires training; hence, the authors have developed an educational framework named "KLART".  Moving forward, the authors describe that sustainable implementation necessitates transparent systems, as this increases understanding, which in turn affects trust and secure use. The findings also indicate that sustainability is strongly linked to the user-friendliness of the AI service, leading the authors to emphasize the importance of HCD while developing and maintaining AI services. Finally, the authors argue for the value of automation, as it allows for continuous data and system updates that potentially can reduce maintenance.  In summary, this thesis aims to contribute to an understanding of how small-scale Tech Enterprises can implement generative AI technology sustainably to enhance their competitive edge through innovation and data-driven decision-making.

