Reliable General Purpose Sentiment Analysis of the Public Twitter Stream

Haldenwang, Nils 27 September 2017 (has links)
General purpose Twitter sentiment analysis is a novel field that is closely related to traditional Twitter sentiment analysis but slightly differs in some key aspects. The main difference lies in the fact that the novel approach considers the unfiltered public Twitter stream while most of the previous approaches often applied various filtering steps which are not feasible for many applications. Another goal is to yield more reliable results by only classifying a tweet as positive or negative if it distinctly consists of the respective sentiment and mark the remaining messages as uncertain. Traditional approaches are often not that strict. Within the course of this thesis it could be verified that the novel approach differs significantly from the traditional approach. Moreover, the experimental results indicated that the archetypical approaches could be transferred to the new domain but the related domain data is consistently sub par when compared to high quality in-domain data. Finally, the viability of the best classification algorithm could be qualitatively verified in a real-world setting that was also developed within the course of this thesis.

"Jag är helt enkelt en parasit som ska utrotas!" : En retorisk analys av Paolo Robertos kriskommunikation efter Insats torsk / ”I'm simply a parasite to be eradicated!” : A rhetorical text analysisof Paolo Roberto’s crisis communication after Insats torsk

Löfstedt, Matilda, Windell, Maja January 2022 (has links)
Studien “Jag är helt enkelt en parasit som ska utrotas!” ämnar analysera TV-profilen och entreprenören Paolo Robertos kriskommunikation i samband med den förtroendekris som uppstod när han greps för sexköp i polisoperationen Insats torsk våren 2020. Syftet med studien är att undersöka hur en offentlig svensk person hanterar och kommunicerar en kris som drabbar det personliga varumärket och personens image. Undersökningen är en kvalitativ retorisk textanalys och utgår från teorier som image repair theory och retorikens appellformer ethos, pathos och logos. I studien analyseras totalt sex uttalanden av Paolo Roberto som berör krisen. Fem av dessa uttalanden gjordes i direkt anslutning till krisen och ett uttalande skedde ett år efter händelsen.  Resultatet av studien visar att Paolo Roberto tillämpar flera olika försvarsstrategier och retoriska övertalningsmedel i sin kriskommunikation. Analysen visar att Roberto använder fem av totalt 14 image repair-strategier: ta på sig hela skulden, tillrättaläggande, provokation, hänvisa till ett högre syfte och minimering. Ta på sig hela skulden är den strategi som förekommer oftast i Robertos uttalanden men det är endast i ett uttalande som han faktiskt ber om ursäkt. Strategierna provokation och tillrättaläggande används också frekvent i kriskommunikationen. Studien visar också att Roberto tillämpar retorikens appellformer i syfte att stärka sin argumentation och återfå förtroende och anseende. Alla uttalanden präglas starkt av pathos och Roberto försöker väcka känslor av sympati och framställer sig själv som ett offer i situationen. Det finns även inslag av ethos i kommunikationen. Logos förekommer endast i ett uttalande. Utifrån analysen går det dessutom att konstatera att kriskommunikationen, till viss del, förändrats över tid. Strategin minimering används exempelvis enbart i det sista analyserade uttalandet som ägde rum ett år efter händelsen . / The study ”I am simply a parasite to be eradicated!” aims to analyze the television personality and entrepreneur Paolo Roberto´s crisis communication in relation to the crisis of confidence that occurred when he was arrested for purchasing sexual services in the police operation Insats Torsk in the spring of 2020. The purpose of the study is to investigate how a public Swedish profile handles and communicates a crisis that affects the personal brand and the image of the person. This study uses a qualitative rhetorical text analysis and emanates from theories like image repair theory and the rhetorical appeals ethos, pathos and logos. In the study, six statements made by Paolo Roberto in relation to the crisis are analyzed. Five of the statements were directly issued in relation to the crisis and one of the statements was made one year after the incident. The result of the study shows that Paolo Roberto applies several different defensive strategies and rhetorical persuasion methods in his crisis communication. The analysis shows that Roberto uses five out of 14 in total image repair-strategies: mortification, corrective action, provocation, transcendence and minimization. The strategy that is used the most in Roberto´s statements is mortification, but it is only in one statement he actually apologizes for his actions. The strategies provocation and corrective action are also frequently used in the crisis communication. The study shows that Roberto uses rhetorical appeals with the aim to strengthen his argumentation to be able to regain trust and reputation. All statements that were made are strongly influenced by pathos and Roberto tries to induce emotion of sympathy and draws a picture of himself where he is the victim of the situation. There are also some elements of ethos used in the communication. Logos only occurs in one of the statements. From the analysis it can also be ascertained that some parts of the crisis communication have changed over time. The strategy minimization is for example only used in the last statement that was analyzed, which occurred a year after the incident.

Feelings of Enlightenment: A Hermeneutic Interpretation of Latent Enlightenment Assumptions in Greenberg's Emotion-Focused Therapy

Gomez, Alex A. 17 August 2018 (has links)
No description available.

Propuesta de un sistema de gestión de reclamaciones del cliente para reducir los tiempos de atención en una empresa retail utilizando teoría de colas y análisis automático de textos / Proposal for a customer complaints management system to reduce service times in a retail company using queueing theory and automatic text analysis

Agustin Melendez, Jhonattan Job, Zuñiga Vilca, Alcibiades 16 December 2021 (has links)
En los últimos años el sector retail tuvo un crecimiento debido a la pandemia por coronavirus (COVID-19) que inició en marzo de 2019, esta trajo consigo restricciones de ciertas actividades económicas y sociales, dando lugar a un incremento de compras en la forma tradicional y más aún en la digital. Sin embargo, este incremento de compras vino acompañado de un aumento en las reclamaciones de los clientes. La empresa retail, la cual es objeto de estudio en esta tesis, también fue alcanzada por este incremento de las reclamaciones, el cual no fue soportado por los procesos internos de la empresa para poder brindar una atención y solución en el tiempo oportuno ante una reclamación del cliente. A partir de este problema se planteó brindar una propuesta de solución tecnológica, usando teoría de colas y análisis automático de textos, la cual a través de un sistema web en la nube los analistas del área de experiencia al cliente podrán atender con mayor rapidez y equitativamente las reclamaciones, esto contribuye a la empresa en la mejora de la gestión de reclamaciones del cliente y con el objetivo principal que es la reducción de los tiempos de atención de las reclamaciones. El impacto de esta solución con el cliente es reforzar el vínculo con la empresa y afianzar la confianza para su permanencia en el retail. / In the last years, the sector retail had growth due to the Coronavirus pandemic (COVID 19) that this had started in march of 2019. It brought a lot restrictions on certain activities economic and social giving an increase in purchases in the traditional way and even more in the digital one. Nevertheless this increase in the purchases was accompanied by an increase in customer complaints. The retail company, which is the object of study in this thesis it was reached by this increase in claims too. This was not supported by the internal process of the company to be able to provide an attention and solution at the right time before a customer claim. From that problem, it was proposed to provide a proposal for a technology solution using queuing theory and automatic text analysis. which, through a web system in the cloud the analyst of the customer experience area will be able to attend to claims more quickly and fairly. This contributes to the company in improving the management of customer claims and with the main objective of reducing the time it takes to attend to claims The impact of this solution with the client is to reinforce the bond with the company and strengthen the trust for its permanence in the retail. / Tesis

”Därför är det viktigt att ta bort en fästing.” : Förkunskaper och behov av information som förutsätts hos modelläsare i två versioner av en webbtext om fästingbett. / “Therefore, it is important to remove a tick.” : The model readers prior knowledge and information need in two versions of one web text about tick bites.

Fjertorp, Emelie January 2022 (has links)
This study analyzes the semiotic resources in two versions of Vårdguiden's web text about tick bites: one longer version and one in easy Swedish. The aim is to identify and compare the prior knowledge and information need of each versions' model reader. This study is theoretically grounded in social semiotics and health literacy. The method consists of three multimodal text analyzes with ideational, interpersonal and textual sub-analyses.  Both versions presupposing several actual, practical and mental prior knowledge of the model reader. The information need of the versions' model reader is both common and separate. Both versions also presupposing that the model reader needs informing, explanatory, instructive and reassuring messages with a multimodal and multi-sequential presentation. The longer version presupposes more comprehensive prior knowledge and larger information needs. The version in easy Swedish though presupposes some prior knowledge which is not assumed in the longer version. For example, it is prior knowledge of how a tick bite looks like and the prior knowledges which is required when photographic close-ups should be interpreted. The version in easy Swedish also and presupposes larger needs for explanations and instructions. The results hinting what the versions presuppose of the empirical reader and prompting a discussion about how the versions high demands for health literacy can impede the reader friendliness. However, the results show that the versions' design creates possibilities for broad groups to assimilate the content. The study highlights some important challenges which are relevant when texts should be adapted to broad groups. / I studien analyseras två versioner av 1177 Vårdguidens text om fästingbett: en längre version och en version på lätt svenska. Syftet är att identifiera och jämföra de förkunskaper och behov av information som förutsätts hos versionernas modelläsare. Studien är teoretiskt grundad i sociosemiotik och hälsolitteracitet. Metoden består av tre multimodala textanalyser med ideationella, interpersonella och textuella delanalyser. Båda versionerna förutsätter flera faktiska, praktiska och mentala förkunskaper hos modelläsaren. Behoven av information hos versionernas modelläsare är dels gemensamma, dels skilda. Båda versionerna förutsätter att modelläsaren behöver informerande, förklarande, instruerande och lugnande budskap som presenteras multimodalt och multisekventiellt. Den längre versionen förutsätter mer omfattande förkunskaper och större behov av information. Versionen på lätt svenska förutsätter dock några förkunskaper som inte förutsätts i den längre versionen. Det är till exempel förkunskaper om hur ett fästingbett ser ut och de förkunskaper som krävs för att kunna tolka fotografiska närbilder. Versionen på lätt svenska förutsätter även att modelläsaren behöver fler förklaringar och instruerande budskap. Resultaten antyder vad versionerna förutsätter hos de empiriska mottagarna och föranleder en diskussion om hur versionernas höga krav på hälsolitteracitet kan hindra brukarvänligheten. Resultaten visar dock att versionernas utformning ger möjligheter för breda grupper att tillgodogöra sig innehållet. Studien belyser några viktiga utmaningar som är relevanta när texter ska mottagaranpassas till breda grupper. / <p>Uppsatsen ingår i kursen språkrådgivning och textvård magisterkurs, 30 hp.</p>

Hållfasthetslära i teknikläroböcker : En jämförande innehållsanalys av läroböcker i teknik för grundskolan årskurs 7-9 samt gymnasiet årskurs 1 / Strength of materials and solid mechanics as content in school books in technology

Östh, Michael, Strandberg, Hans January 2019 (has links)
Hållfasthetslära är ett viktigt och centralt område inom ingenjörsutbildningar. Men att ha grundläggande kunskap om vad som gör konstruktioner hållfasta är dock något som inte enbart bör vara förbehållet ingenjörer, utan det är även ett område som tillhör allmänbildningen. Det är av den anledningen området hållfasthet tas upp redan i grundskolans lägre åldrar i skolämnet Teknik och fördjupas successivt upp till gymnasiets tekniska program. I denna studie har fem läroböcker för ämnet Teknik för grundskolans årskurs 7-9 samt två läroböcker för kursen Teknik 1 i gymnasieskolans årskurs 1, studerats för att utreda hur området hållfasthetslära beskrivs. Metoden som används i analysen är textanalys i form av en kvantitativ innehållsanalys av förekomsten av hållfasthetsrelaterade begrepp samt en kvalitativ analys av hur begreppen beskrivs. Därtill görs en analys av hur läromedlen uppfyller styrdokumentens krav och riktlinjer. Studien visar att böckerna har stor variation i hur området hållfasthetslära framställs, dock med generaliseringar att högstadieboken beskriver området med text och gymnasieboken med formler. De studerade läroböckerna tar visserligen upp många ämnesspecifika begrepp men det är en markant skillnad mellan böckerna hur dessa begrepp beskrivs. Den fördjupade analysen som studerar om läroböckerna uppfyller styrdokumentens kursplaner i Teknik för grundskolan och Teknik 1 för gymnasieskolan påvisar även den en stor spridning mellan läroböckerna. Av studiens valda bedömningskriterier kan utläsas att området behandlas utförligt endast av två av böckerna: grundskolans Teknik Direkt (2018) från förlaget Sanoma Utbildning samt gymnasiets Teknik (2011) från förlaget Liber. Gemensamt för de valda gymnasieböckerna är att området hållfasthet behandlas mycket mer matematiskt än i högstadieböckerna och stort fokus ligger på olika former av spänningsberäkningar. Dock är det ett markant språng i abstraktionsnivå från de enklare textbaserade högstadieböckerna till gymnasieböckerna med matematiska beräkningar. Slutsatsen av detta är att varken högstadieböckerna eller gymnasieböckerna ger en heltäckande bild av viktiga grundläggande begrepp inom området hållfasthet. Studien visar att de bästa av böckerna kan i viss mån komplettera varandra, men med ogrundade val av läromedel riskerar det att bli osammanhängande. Det är därmed viktigt att läraren noggrant utvärderar lämpliga läromedel så de uppfyller det tänkta syftet i undervisningen. / Strength of materials and solid mechanics theory is an important and central area in engineering education. But having a basic knowledge of what makes structures durable, however, is not only reserved for engineers, but is also an area that belongs to general education. For this reason, the area of strength is already taken up in the elementary school's lower age in the subject of technology and is gradually expanded up to the high school's technical program. In this study, five textbooks for the subject of Technology for comprehensive school upper stage, grade 7-9, and two textbooks for the course Technology 1 in high school year 1 were studied to investigate how the field of strength theory is described. The method used in the analysis is text analysis in the form of a quantitative content analysis of the presence of strength-related concepts as well as a qualitative analysis of how the concepts are described. In addition, an analysis is made of how the teaching materials meet the requirements and guidelines of the steering documents. The study shows that the books have a great variety in how the field of strength theory is presented, however with generalizations that the upper stage textbook describes the area with text and the high school describes with formulas. Although the textbooks studied have many subject-specific concepts, it is markedly different between the books how these concepts are described. The in-depth analysis that studies whether the textbooks meet the syllabus of the steering documents in Teknik for the elementary school and Teknik 1 for the upper secondary school also shows a large distribution between the textbooks. From the chosen assessment criteria in the study, it can be seen that the area is in depth covered by only two of the books: Teknik Direkt (2018) from publisher Sanoma Utbildning (for the elementary school) and Teknik (2011) from publisher Liber (from upper secondary school). Common to all the selected high school books is that the area of strength is treated much more mathematically than for the upper stage books and great focus is placed on various forms of stress calculations. However, there is a significant leap in abstraction level from the simpler text-based upper stage books to the high school books with mathematical calculations. The conclusion of this is that neither the upper stage school books nor the high school books provide a comprehensive picture of important basic concepts in the area of strength. The study shows that the best of the books can to some extent complement each other, but with unfounded choice of study material it risks becoming incoherent. It is therefore important that the teacher carefully evaluates appropriate teaching material so that they fulfill the intended purpose of the teaching.

Категориально-текстовая идентификация эквивалентности русских переводов сборника «Ariel» С. Плат : магистерская диссертация / Categorical-textual equivalence identification of Russian translations of the poetry collection «Ariel» by S. Plath

Бородина, Н. В., Borodina, N. V. January 2020 (has links)
This MA thesis aims at identifying the equivalence of the Russian translations of Sylvia Plath’s poems from the collection “Ariel” (1965) on the basis of the comparative and categorical text analysis. The author studies the peculiarities of manifestation of text categories of theme, chronotope (locality and temporality) and tonality in the original poetic texts as compared to their Russian translations by V. P. Betaki. The identification of categorical markers and their equivalence is proved to be able to define the quantitative degree of translation equivalence to the original. Moreover, the chosen linguistic method contributes to singling out the typological characteristics, which, on their turn, make it possible to describe even more specific divergences between the original and translated texts, as well as the translator’s strategies in general. The results of the research paper can be used as a material for the further categorical method application in the sphere of translation studies. / Настоящая магистерская диссертация посвящена выявлению степени эквивалентности русских переводных вариантов стихотворений из сборника «Ariel» (1965) Сильвии Плат на базе сопоставительно-категориального анализа текстов (СКАТ). В работе рассматривается специфика проявления полевых текстовых категории темы, хронотопа (локальности и темпоральности) и тональности в исходных поэтических текстах на английском языке и их русских переводах, выполненных В. П. Бетаки. Доказано, что вычленение маркеров каждой из указанных категорий и их переводческих соответствий позволяет установить количественный уровень эквивалентности варианта художественного текста оригиналу; более того, выбранный лингвистический метод способствует выявлению типологических черт, на основании которых можно описать более частные расхождения переводных вариантов и общие стратегии переводчика. Результаты данной работы могут быть использованы в качестве материала для дальнейшего применения СКАТ в области переводоведения.

Coalition Governments and Political Communication / A Quantitative Text Analysis of Strategy Choice

Alberto, Anthea 09 May 2022 (has links)
Welche Kommunikationsstrategien benutzen Koalitionsparteien während ihrer Zeit im Amt? Koalitionsparteien stehen vor einem Dilemma, dass sie zwar nach aussen Einheit demonstrieren sollen, sich aber gleichzeitig von ihren Partnern differenzieren müssen. Ich argumentiere, dass politische Kommunikation eine wichtige Rolle dabei spielt, wie Parteien versuchen, ihr individuelles Profil zu erhalten. Dazu habe ich drei Hauptstrategien definiert, die Parteien benutzen können. Basierend auf einem Datensatz von über 35'000 deutschen und niederländischen Pressemitteilungen von Koalitionsparteien analysiere ich, was Parteien in ihrer Strategiewahl beeinflusst. Meine Resultate zeigen, dass Personalisierung, definiert als ein verstärkter Fokus auf Individuen, davon beeinflusst wird, wie stark sich Koalitionsparteien ideologisch unterscheiden. Ich benutze einen supervised classification algorithm, um die deutschen Pressemitteilungen in verschiedene thematische Kategorien zu klassifizieren. Ich nutze diese Klassifizierung um zu analysieren, ob Parteien während dem Wahlkampf einen besonderen Fokus auf die Themen legen, die ihnen wichtig sind. Dies ist nicht der Fall, und meine Analysen zeigen, dass Parteien kurz vor einer Wahl sogar einen geringeren Schwerpunkt auf diese Themen legen, ungeachtet ideologischer Differenzen zwischen ihnen und ihren Koalitionspartnern. Schließlich analysiere ich die Präsenz von negativem Campaigning in deutschen Pressemitteilungen und in einer Auswahl von Episoden einer politischen Talkshow. Im Falle der Pressemitteilungen stelle ich fest, dass die Parteien mit zunehmender Wahrscheinlichkeit "feindlich gesinnte" Politiker erwähnen, je näher die Wahl rückt, und dass diese Erwähnungen mit einem generell negativerem sentiment der betreffenden Pressemitteilungen korrelieren. / What communication strategies do coalition parties use during their time in office? Coalition parties face a dilemma between unity and differentiation, because while they need to keep relations with their partners stable, they also have to keep up constant efforts to differentiate themselves sufficiently from them. I argue that political communication plays a key role in how parties try to maintain a strong individual profile. I have defined three main strategies that parties can use to achieve this. Based on a dataset that contains over 35'000 press releases by German and Dutch coalition parties, I analyze what influences the usage of the three strategies in question. I find that the usage personalization, which is defined as focusing on individual politicians, is affected by the ideological distance between coalition partners. I use a supervised classiffication algorithm to classify the press releases issued by German coalition parties into issue areas to analyze whether parties use election campaigns to emphasize issues that are already important to them. I find that this is not the case, and that parties actually de-emphasize these issues as an election approaches, regardless of ideological distance between them and their partners. Lastly, I analyze the presence of negative campaigning in German press releases and in a selection of episodes from a political talk show. In the case of press releases, I find that parties are more likely to specifically mention hostile politicians as an election approaches, and that these mentions correlate with a more negative sentiment of the press releases in question.

Känsloladdade kommentarsfält – de nya offentligheterna : En kvalitativ fallstudie av nöjesparken Gröna Lunds kriskommunikation på Instagram efter Jetlinolyckan 2023 / Emotional comment sections – the new publics : A qualitative case study of Gröna Lund amusement parks crisis communication on Instagram after the Jetline accident in 2023

Johansson, André, Richardson, Clara January 2024 (has links)
Sociala medier är en plattform som kantas av känslor. Samtidigt vänder sig människor dit under kriser för att dela känslor och prata med varandra. I kommentarsfältet på Gröna Lunds Instagraminlägg, där de kommunicerar efter Jetlineolyckan, 2023, händer detta. Genom en kvalitativ socialsemiotisk multimodal textanalys erbjuder fallstudien en tolkning, och bidrar till en förståelse för vilka meningsbärande element som konstruerar vilka känslor i kommentarsfältet. En teoretisk och hypotetisk diskussion förs om känslornas möjliga betydelse för organisationens legitimitet. Först och främst analyseras Gröna Lunds Instagraminlägg kvalitativt med en innehållsanalys för att belysa kontexten, och de kriskommunikationsstrategier som används. Fallstudien visar på att Gröna Lund kommunicerar under krisfasen, tar på sig hela ansvaret och latent kommunicerar känslor av skam och skuld. Med hjälp av kriskommunikationsstrategier erkänner och bekänner nöjesparken krisen, och kommunicerar därefter åtgärdande handlingar. Den vanligaste känslan som konstrueras i kommentarsfältet är känslan av ilska och sorg. Ilska tar sig i uttryck både mot Gröna Lund och mot andra Instagramanvändare. Skuld konstrueras latent i konstruktionen av ilska. Det finns även en liten mängd kommentarer som konstruerar känslan lycka. Känslan av ångest uttrycks framför allt i form av frågor och en stor ovisshet. Fallstudien visar att känslorna många gånger konstrueras av liknande lexikala val, och att olika emojis förstärker vissa konstruktioner. En mycket liten mängd emotikoner har påvisats. Den teoretiska och hypotetiska diskussionen visar att känslor som ilska, skuld och ångest potentiellt försämrar Gröna Lunds tre former av organisatorisk legitimitet. Kommentarer med känslor av lycka och hopp visar motsatsen. Ilska kan däremot både förbättra och försämra legitimiteten, beroende på vem ilskan riktas mot. Det samma gäller för legitimitetsstrategier. Känslor av lycka hopp kan ge en teoretisk fingervisning på att strategierna stärker legitimiteten. Slutligen är det av stor vikt för samhället såväl yrkeslivet att förstå hur känslor tar form, i framför allt i medier med öppna kommentarsfält, då dessa potentiellt påverkar organisationens legitimitet. / Social media is an emotional platform. At the same time, people turn to it during crises to share emotions and talk to each other. In the comments section of Gröna Lund's Instagram post, where they communicate after the Jetline accident in 2023, this happens. Through a qualitative social semiotic multimodal text analysis, the case study offers an interpretation and contributes to an understanding of which meaningful elements construct which emotions in the comment field. A theoretical and hypothetical discussion is conducted on the possible importance of emotions for organizational legitimacy. First of all, Gröna Lund's Instagram posts are analyzed qualitatively with a content analysis to highlight the context and the crisis communication strategies used. This case study shows that Gröna Lund communicates during the crisis phase, taking full responsibility and latently communicating feelings of shame and guilt. Using crisis communication strategies, the amusement park acknowledges and confesses the crisis, and then communicates remedial actions. The most common emotion constructed in the comment section is the emotion of anger and sadness. Anger is expressed both towards Gröna Lund and towards other Instagram users. Guilt is constructed latently in the construction of anger. There is also a small number of comments that construct the feeling of happiness. The feeling of anxiety is mainly expressed in the form of questions and great uncertainty. The case study shows that the emotions are often constructed by similar lexical choices, and that different emojis reinforce certain constructions. A very small number of emoticons have been detected. The theoretical and hypothetical discussion shows that emotions such as anger, guilt and anxiety potentially impair Green Lund's three forms of organizational legitimacy. Comments with feelings of happiness and hope show the opposite. Anger, on the other hand, can both enhance and detract from legitimacy, depending on who the anger is directed at. The same applies to legitimacy strategies. Feelings of happiness and hope can provide a theoretical indication that the strategies strengthen legitimacy. Finally, it is of great importance for society as well as the professional world to understand how emotions take shape, especially in media with open comment sections, as these potentially affect the legitimacy of the organization.

<b>Forensic Analysis of Images and Documents</b>

Ruiting Shao (18018187) 23 February 2024 (has links)
<p dir="ltr">This thesis involves three topics related to forensic analysis of media data. The first topic is the analysis of images and documents that have been created with a scanner. The goal is to detect and identify scanner model from the scanned images/documents. We propose a deep learning system that can automatically learn the inherent features of the scanned images. This system will produce a scanner model identification and a reliability map for a scanned image. The proposed system has shown promising results in the forensic analysis of scanned images. The second topic is related to forensic integrity of scientific papers. The project is divided into multiple tasks, data collection, image extraction, and manipulation detection. We have constructed a dataset of retracted scientific papers that have been verified to have issues with integrity. We design and maintain a web-based Scientific Integrity System for forensic analysis of the images within scientific publications. The third topic is related to media document analysis. Our goal is to identify the publication style for media document, aiding in the potential document manipulation. We are mainly focusing on image-text consistency check, and synthetic tweets analysis. For image-text inconsistency check, we describe a system that can examine an image in document and the corresponding text caption (or other associated text with the image) to check the image/text consistency. For synthetic tweets analysis, we propose a system to detect and identify the text generation models and paraphrase attack models.</p>

