• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 38
  • 3
  • Tagged with
  • 41
  • 9
  • 9
  • 9
  • 9
  • 7
  • 7
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.

Användarvänlig färgsättning på webben

Amin, Miran, Chanyalew, Dina January 2019 (has links)
Med utvecklingen av webben, har konkurrensen mellan företagen ökat det senaste seklet. Tidigare låg fokus på funktionaliteten vid utvecklandet av webbsidor. Nu ligger fokus även på användarvänligheten. Principerna för användbarhet ger utvecklare nya perspektiv för form, struktur och färgsättning av en webbsida. Färger runt om i världen har olika betydelser. Det människor inte tänker på är hur färger påverkar deras känslor och undermedvetna. Syftet med denna studien är att undersöka vilka känslor som inges från en webbsidas färgsättning och hur färgsättningen påverkar användbarheten. Med hjälp av litteraturstudie som datainsamlingsmetod kan detta besvaras. Även ett experiment används som innehåller en enkät. Syftet med enkäten är att undersöka vilka känslor som inges vid användandet av en röd respektive blå webbsida. Resultatet av denna studien identifierar och diskuterar vilka känslor som inges och hur användbarheten påverkas av en webbsidas färgsättning. / With the development of the web, the competition between companies has occurred the last century. Websites, what used to mostly be about the functionality has changed and is more user friendly centric. Web Usability are involved in this process and gives the developers a new perspective to shape, color and structure a website. Colors world wide has different meanings. What people don’t think about is how the colors affect their subconscious. The purpose with this study is to examine which feelings the that invokes by the coloring of a website and how the coloring affects the web usability. The methods encompasses both search and reviews from literature as data collection regarding web usability and the meaning of colors. Apart from literature study an experiment containing a survey is also used. The purpose of the survey is aimed at examining which feelings that are evoked in people while using a red respective blue website. The result of this study identifies and discusses which feelings that invokes from people and how web usability is affected by websites coloring scheme

Tillit och beslutsprocesser i en digitaliserad värld : Hur resebyråernas hemsidor påverkar kunders tillit i deras beslutsprocesser

Yusof-Ioannidis, Darren Constantine, Nilfouroushan, Shayan January 2019 (has links)
Customers today use travel agencies that exist on the internet more frequently. However, what makes the customer trust a specific website? The purpose of this study is to examine if a customers’ trust towards a travel agency is affected by the agency’s website and the role trust plays in customers’ decision-making process. To examine this purpose a web survey and interviews were carried out. The web survey totals 110 responses and 15 people were selected through snowball sampling for the interviews. Results demonstrate that customers are affected by the design of the website in a way that it decides whether or not the customer will invest time and use the website. Furthermore, after getting past the first stage customers then decide whether or not a website is trustworthy depending on a set of factors including but not limited to security, information and navigation. The customers’ decision-making process is affected by trust in a later stage when the customer evaluates the possible alternatives. However when it comes to choosing a website, a customer might choose to buy a product from a website he/she has previously used due to already having built a trust towards the website and therefore refrains from using an unknown website. In that sense, trust is present from previous experiences and affects the customer in an earlier stage of the decision-making process. / Användningen av internet i vardagen har ökat under de senaste två decennierna. Som en form av marknadsföring är internet rätt ny och kan därmed medföra utmaningar för marknadsförare. För att kunna locka till sig kunder via internet samt behålla dem måste ett företags hemsida kunna tillfredsställa kunderna på olika sätt. Om en hemsida misslyckas med detta kan resultatet bli att kunderna avstår från att använda sig av en hemsida och använda andra företags hemsidor. Kunder använder idag resebyråer som finns på internet oftare. Men vad får kunden att ge sitt förtroende till en viss hemsida? Syftet med denna studie är att undersöka om kunders förtroende mot en resebyrå påverkas av resebyråns hemsida och vilken roll förtroendet spelar för kundernas beslutsprocess. För att undersöka detta syfte genomfördes en websurvey och intervjuer. Websurvey uppgick till 110 svar och 15 personer valdes genom snöbollsurval för intervjuerna. Resultatet visar att kunderna påverkas av designen på ett sätt som avgör om kunden kommer investera tid och använda hemsidan eller inte. Efter att ha tagit sig förbi det första steget bestämmer kunderna huruvida en hemsida är pålitlig eller inte beroende på en uppsättning faktorer, inklusive men inte begränsat till säkerhet, information och navigering. Kundernas beslutsprocess påverkas av förtroende i ett senare skede när kunden utvärderar möjliga alternativ. Men när det gäller att välja en hemsida kan en kund välja att köpa en produkt från en webbplats som hen tidigare använt på grund av att hen redan har byggt upp tillit till hemsidan och därför avstår från att använda en okänd hemsida. På så sätt är förtroendet närvarande från tidigare erfarenheter och påverkar kunden i ett tidigare skede av beslutsprocessen.

Framtoning av exklusivitet i gränssnittet på hemsidan : En undersökning om hur exklusivitet kan framtonas på hemsidans gränssnittsdesign, samt vilka tillvägagångssätt som är passande för ett exklusivt uttryck.

Månsson, Helena January 2018 (has links)
This study carried out because there is no concrete advices on web design, interaction design and strategies for how a website can create an exclusive feeling today. The purpose of the study is to gather more knowledge on how a brand can create an exclusive feel through the website but also to find more knowledge to advice existing and future brands on how to increase the exclusive feeling through design and strategies. The methods of the study consist of a literary study for basic knowledge, a quantitative content analysis examining 20 web pages interface design and a qualitative interview’s where two designers in web design participated and advises on interface designs and strategies for exclusive websites.   The methods have contributed to the results for the following questions: Which design factors can be used to show exclusivity on websites?What factors does secret or exclusive bars use? What approaches or strategies are appropriate to showcase the exclusivity of a brand on a website? The results show that new knowledge has been found to show exclusivity on websites. The discovery is that it is important to make preliminary work in the structure and amount of content. Trends like using large or full presentations at the beginning of the interface are not defined as exclusive appearance. The number of colors is important to increase an exclusive feeling, but which colors are not of great importance. White and black, however, can be good colors to convey minimalism. The same applies to fonts, where the number of total fonts in an interface plays a bigger role, but how text layouts are a great advantage in exclusive design. Moving images and animations can enhance the user experience and also exclusivity. Minimalism is a major part of exclusive design and 60 percent empty space is recommended to use on the website has been discovered.   The strategies that have been shown to affect the appearance of exclusivity are invitation-only systems and memberships. By letting the visitor see what the brand is and why it should be interested is extremely important for creating an interest and not an excluding feeling, rather to bring excitement and attraction. However, much of the discovery was that the communication to the target group and how it is performed is an important role in expressing exclusivity.   To accommodate the duration of the study, the study has limited the interviews to interviewing only two designers and the quantitative content analysis only reviewed 20 web pages in total, with the statements and questions planned for the size of the study.

Konsthallar och gallerier på nätet : En retorisk analys om konsten att övertyga om (samtids)konst / Art galleries on the Internet : A rhetorical analysis about the art to convince about (contemporary) art

Lindholm, Viktoria January 2008 (has links)
Uppsatsen undersöker retoriken runt konst på fyra konstverksamheters hemsidor. Konsthallarna och gallerierna som undersöks är alla belägna på landsbygden eller i mindre samhällen i Sverige. Dessa är Bjurbäcks konsthall, Virserums konsthall, Neon Gallery samt Galleri Astley. De frågor som ställs till materialet är: Vilken konst är det som presenteras och hur lyfts den fram? Vilka retoriska medel använder man sig av, och vem vänder man sig till? I vilka sammanhang presenteras konst? Vilken relation och vilket synsätt till konst förmedlas? Vilken relation till platsen och miljön där konsthallen och galleriet är belägen förmedlas? För att undersöka hur konstverksamheternas retorik är upplagd på hemsidorna har framförallt de klassiska begreppen ethos, logos och pathos fungerat som analysverktyg så som de används i metoden retorikanalys. Retorikanalys menar Brigitte Mral är en användbar metod som kan hjälpa oss att försöka förstå och tolka budskap. Hur bilder och design på olika sätt samspelar med texten har också varit viktigt att undersöka. Den redovisade analystexten i uppsatsen visar på samband mellan bild- och textretorik och hur dessa tillsammans bildar en gemensam retorik. Teorier som används i uppsatsen ger perspektiv på begreppet konst. Förutom filosofiska definitionsförsök av vad konst är eller kan vara, presenteras här föreställningar om konst i relation till tre områden: företag, teknologi och media. Ytterligare en teoretisk ingång som tolkats som relevant i uppsatsen, är att se på den lokala platsen i relation till nationen, EU och den globala världen. Resultatet i uppsatsen visar att de fyra konstverksamheterna valt olika sätt att marknadsföra konst på sina respektive hemsidor, men trots detta är retoriken för samtidskonst ofta ganska traditionell. Hemsidan kan uppfattas som en kombinerad informations- och marknadsföringskanal. Den måste kunna fungera för olika målgrupper, såsom samarbetspartners, finansiärer, skolor, med mera. Detta är något som problematiseras i uppsatsen. / The essay examines the rhetoric around art on four art galleries´ homepages. The art galleries that are examined are all located on the countryside or in smaller towns in Sweden. With their Swedish names the examined objects are the following: Bjurbäcks konsthall, Virserums konsthall, Neon Gallery and Galleri Astley. The questions that are set to the material are: What kind of art is presented and how is it conveyed? Which rhetorical instruments are used and which target groups do they aim at? In which context is art presented? Which relation to art and which perspective on art is mediated? Which relation to the site and the environment where the art galleries are located is conveyed? The classical concepts ethos, logos and pathos - as they are used in Rhetorical analysis - have been used as instruments to investigate how the rhetoric about art is applied. Brigitte Mral means that Rhetorical analysis is a useful method to help us understand and interpret messages. How pictures and design in different ways interplay with the text, has also been important to investigate. The presented analysis in the essay shows the connections between text- and visual rhetoric, and how these elements together form a common rhetoric. Theories that are used in the essay give perspectives on the concept of art. Definitions about what art can be are presented mainly from a philosophical perspective. But the idea of art is also presented in relation to three other spheres such as companies, technology and the media. Another theoretical input interpreted as relevant in the essay, is the perspective on the local place in relation to the nation, EU and the global world. The result in the essay shows that the four art galleries have chosen different ways to market art on their respective homepages. Despite this is the rhetoric on contemporary art mainly traditional. The homepage can be considered as a combined information- and marketing channel. It must function for different target groups such as collaborative partners, financiers, schools, etc. This is examined and discussed in the essay.

Konsthallar och gallerier på nätet : En retorisk analys om konsten att övertyga om (samtids)konst / Art galleries on the Internet : A rhetorical analysis about the art to convince about (contemporary) art

Lindholm, Viktoria January 2008 (has links)
<p>Uppsatsen undersöker retoriken runt konst på fyra konstverksamheters hemsidor. Konsthallarna och gallerierna som undersöks är alla belägna på landsbygden eller i mindre samhällen i Sverige. Dessa är Bjurbäcks konsthall, Virserums konsthall, Neon Gallery samt Galleri Astley. De frågor som ställs till materialet är: Vilken konst är det som presenteras och hur lyfts den fram? Vilka retoriska medel använder man sig av, och vem vänder man sig till? I vilka sammanhang presenteras konst? Vilken relation och vilket synsätt till konst förmedlas? Vilken relation till platsen och miljön där konsthallen och galleriet är belägen förmedlas?</p><p>För att undersöka hur konstverksamheternas retorik är upplagd på hemsidorna har framförallt de klassiska begreppen ethos, logos och pathos fungerat som analysverktyg så som de används i metoden retorikanalys. Retorikanalys menar Brigitte Mral är en användbar metod som kan hjälpa oss att försöka förstå och tolka budskap. Hur bilder och design på olika sätt samspelar med texten har också varit viktigt att undersöka. Den redovisade analystexten i uppsatsen visar på samband mellan bild- och textretorik och hur dessa tillsammans bildar en gemensam retorik.</p><p>Teorier som används i uppsatsen ger perspektiv på begreppet konst. Förutom filosofiska definitionsförsök av vad konst är eller kan vara, presenteras här föreställningar om konst i relation till tre områden: företag, teknologi och media.</p><p>Ytterligare en teoretisk ingång som tolkats som relevant i uppsatsen, är att se på den lokala platsen i relation till nationen, EU och den globala världen.</p><p>Resultatet i uppsatsen visar att de fyra konstverksamheterna valt olika sätt att marknadsföra konst på sina respektive hemsidor, men trots detta är retoriken för samtidskonst ofta ganska traditionell. Hemsidan kan uppfattas som en kombinerad informations- och marknadsföringskanal. Den måste kunna fungera för olika målgrupper, såsom samarbetspartners, finansiärer, skolor, med mera. Detta är något som problematiseras i uppsatsen.</p> / <p>The essay examines the rhetoric around art on four art galleries´ homepages. The art galleries that are examined are all located on the countryside or in smaller towns in Sweden. With their Swedish names the examined objects are the following: Bjurbäcks konsthall, Virserums konsthall, Neon Gallery and Galleri Astley. The questions that are set to the material are: What kind of art is presented and how is it conveyed? Which rhetorical instruments are used and which target groups do they aim at? In which context is art presented? Which relation to art and which perspective on art is mediated? Which relation to the site and the environment where the art galleries are located is conveyed?</p><p>The classical concepts ethos, logos and pathos - as they are used in Rhetorical analysis - have been used as instruments to investigate how the rhetoric about art is applied. Brigitte Mral means that Rhetorical analysis is a useful method to help us understand and interpret messages. How pictures and design in different ways interplay with the text, has also been important to investigate. The presented analysis in the essay shows the connections between text- and visual rhetoric, and how these elements together form a common rhetoric.</p><p>Theories that are used in the essay give perspectives on the concept of art. Definitions about what art can be are presented mainly from a philosophical perspective. But the idea of art is also presented in relation to three other spheres such as companies, technology and the media.</p><p>Another theoretical input interpreted as relevant in the essay, is the perspective on the local place in relation to the nation, EU and the global world.</p><p>The result in the essay shows that the four art galleries have chosen different ways to market art on their respective homepages. Despite this is the rhetoric on contemporary art mainly traditional. The homepage can be considered as a combined information- and marketing channel. It must function for different target groups such as collaborative partners, financiers, schools, etc. This is examined and discussed in the essay.</p>

Employer branding som ett verktyg för att bryta könsstrukturer i organisationer : En kvalitativ studie av tre svenska kommuner / Employer Branding as a tool to break gender patterns in organizations : A qualitative study of three Swedish municipalities

Lundqvist, Elin, Ström, Lisa January 2014 (has links)
In this thesis we present a qualitative study of Employer Branding through a perspective of gender. We examine the awareness of Employer Branding as a tool to break gender patterns in female and male dominated administrations in three Swedish municipalities. Six recruiters people were interviewed, including three pre-school managers and three managers of technical administrations, to see if there are any differences or similarities between the organizations’ Employer Branding to break gender patterns. In addition to the interviews, the Web pages of these three municipalities were investigated through a contextual perspective. We found that our interviewees do use Employer Branding, but that they were not necessarily aware of its’ meaning. The study does also show that the awareness of gender patterns differentiated between the female and male dominated administrations. Our investigation of the Web pages shows that only one of the municipalities used their Web site in their Employer Branding process.

The Recipe for Cookies : A studies about cookies &amp; the GDPR-law

Bader, Caroline, Castefelt, Eva-Louise, Gunnarsson, Louise January 2018 (has links)
The term cookie regarding IT is still a relatively new term. It is rarely discussed among internet users. The name cookie is fairly known but the concept not as much. Cookies are well established by different companies and organizations that in some way offer online services. Today visitors of the internet meet cookies almost every time they go online. For the users who choose not to accept cookies the online experience becomes highly limited. Cookies store information of the visitors in order to improve their experience but also to help the organization. The majority of webpages online that uses electronic commerce or in any way can benefit from storing the customers information uses cookies. Cookies can be sold or exchanged between organizations to increase their profit and range. In 2011 a provision regarding all organizations using cookies were implemented. Every internet user visiting these pages had to be notified about their use of cookies immediately. New laws are established in order to control or regulate the exertion of other people’s personal information at the same pace as cookies are further developed. The next law to be established is GDPR, General Data Protection Regulation, which will be focused on in this thesis. The purpose of this study is to explore the phenomenon of cookie-use and how it affects internet users and organizations in synergy with the GDPR-law. To achieve the desired result a mixed method has been applied involving both interviews and a survey. The interviews consisted of pre-determined questions and dynamic follow-up questions. Three different organizations participated in the interviews, an university, an organization using e-business and a media agency. The survey consisted of a few mandatory closed questions. The distribution of the survey led to right above 130 respondents. The gained results from the use of a quantitative methods hinted that barely half of the respondents knew what a cookie actually was. Several of the participants were curious about learning more about the phenomenon while a lower percentage did not consider it important. Knowledge or ignorance regarding cookies turned out to have a great impact on the respondent’s comfortableness and behavior online. The results from the qualitative method showed that the organizations working with cookies will be affected by GDPR. Following thesis will contribute to the field of informatics by consequently process the empiric data collected with support from theoretic competences. It will contribute as a source of information regarding cookies within information technology. / Termen cookie är fortfarande en relativt ny term och är inte särskilt debatterad bland internetanvändare. Begreppet cookie är någorlunda känt men innebörden inte lika så. Cookies är väl etablerat av olika företag och organisationer som på något sätt använder sig av internet. Idag stöter användare på cookies nästan överallt när de rör sig på internet. För den som bestämmer sig för att avstå från allt som har med cookies att göra blir internet vistelsen mycket begränsad. Cookies arbetar för att lagra information om besökarna dels för att gynna besökarnas vistelse men även för att hjälpa företagen. Majoriteten av alla hemsidor som idag använder sig av e-handel samt kan gynnas av att kundens data sparas använder sig av cookies. Cookies kan även säljas eller utbytas mellan företag och organisationer för att öka deras försäljning och vidd. År 2011 implementerades en bestämmelse gällande alla företag och organisationer som då använde sig av cookies. Alla besökare skulle upplysas om att just de använde cookies när de besöker deras hemsida. Nya lagar etableras för att kunna kontrollera och reglera användandet av besökares personliga information online i takt med att användandet av cookie utvecklas. Den nästkommande lagen att implementeras är GDRP, General Data Protection Regulation, som kommer att ha stort fokus i denna uppsats. Syftet med denna uppsats är att granska fenomenet cookie, dess användningsområden samt hur det påverkar internetanvändare och de olika företagen och organisationerna i synergi med GDPR-lagen. För att uppnå önskat resultat har en mixad metod använts i form av intervjuer och en enkät. Intervjuerna bestod av förutbestämda frågor och dynamiska följdfrågor under samtalets gång. Tre företag ställde upp som intervjuobjekt. En högskola, ett företag med försäljning online samt en mediebyrå. Enkäten bestod av obligatoriska frågor med förutbestämda svarsalternativ. Distributionen av enkäten ledde till strax över 130 respondenter. Resultatet efter användningen av den kvantitativa metoden antydde att knappt hälften av respondenterna inte visste vad en cookie var. Många var nyfikna och ville lära sig mer medan en lägre procent av respondenterna inte ansåg att de inte ville veta mer. Vetskapen samt ovetskapen gällande cookies påvisade sig ha stor inverkan på respondenternas bekvämlighet samt beteende online. Resultatet av den kvalitativa metoden visade att organisationer som arbetar med cookies kommer bli påverkade av GDPR. Följande uppsats kommer bidra till området informatik genom att följaktligen bearbeta empiriinsamling med stöd av teoretiska kompetenser. Den kommer att bidra som en informationskälla gällande cookies inom informationsteknologi.

En analys av tillgängligheten på Osby kommuns hemsida / An analyze of the accessibility on the homepage of Osby Municipality

Ridbäck, Petra January 2007 (has links)
Frågan om en tillgänglig hemsida har fått en allt större betydelse i offentliga verksamheter. Genom att följa riktlinjerna i Vägledningen 24-timmarswebben, utgiven av Verva (Verket För Förvaltningsutveckling), kan man få en tillgänglig hemsida. En rapport från FunkaNu som gjordes 2006 visade att Osby kommuns hemsida hade tillgänglighetsproblem och kommunen bestämde sig för att förbättra tillgängligheten. Ett första steg i detta arbete var att uppgradera till ny version av sitt publiceringssystem och att utbilda webbredaktörerna i webbtillgänglighet. Vilket resultat har dessa satsningar gett? Syftet med denna rapport är att undersöka i vilken omfattning Osby kommuns hemsida följer riktlinjerna i Vägledningen 24-timmarswebben och därigenom se hur tillgänglig Osby kommuns hemsida är. Genom att utföra teoretiska och praktiska tester har webbplatsen www.osby.se undersökts för att se vilka riktlinjer som följs. Totalt har 77 riktlinjer granskats. Resultatet av undersökningen visar att Osby kommuns hemsida följer 47st (cirka 60%) av de undersökta riktlinjerna. I samband med att publiceringssystemet uppgraderades minskade valideringsfelen med 90% på startsidan. Hemsidan använder sig av en stilmall för att styra merparten av presentation och layout samt är den uppbyggd med en kombination av fasta och flexibla mått. Navigation, struktur och utformning är konsekvent. Hemsidan har en rubrikstruktur, tabbordning och det fungerar att navigera med tangentbordet. Det finns fortfarande en hel del saker webbplatsen behöver förbättra för att bli mer tillgänglig. Det finns 30 riktlinjer som inte följs. Genom att de inte följs har hemsidan brister i sin tillgänglighet av allvarligare och mindre allvarlig karaktär. Till exempel visar resultatet att information på teckenspråk saknas och uppgifter om informationsansvarig likaså. Webbplatsens html-kod och även koden för stilmallen följer inte någon standard. Om användaren använder webbläsarens inbyggda funktion för utskrift får den inte hela sidan utskriven. För att öka tillgängligheten bör kommunen arbeta vidare med att öka andelen av riktlinjerna som följs. Då får de med automatik en mer tillgänglig hemsida.

Towards Realistic Datasets forClassification of VPN Traffic : The Effects of Background Noise on Website Fingerprinting Attacks / Mot realistiska dataset för klassificering av VPN trafik : Effekten av bakgrundsoljud på website fingerprint attacker

Sandquist, Christoffer, Ersson, Jon-Erik January 2023 (has links)
Virtual Private Networks (VPNs) is a booming business with significant margins once a solid user base has been established and big VPN providers are putting considerable amounts of money into marketing. However, there exists Website Fingerprinting (WF) attacks that are able to correctly predict which website a user is visiting based on web traffic even though it is going through a VPN tunnel. These attacks are fairly accurate when it comes to closed world scenarios but a problem is that these scenarios are still far away from capturing typical user behaviour.In this thesis, we explore and build tools that can collect VPN traffic from different sources. This traffic can then be combined into more realistic datasets that we evaluate the accuracy of WF attacks on. We hope that these datasets will help us and others better simulate more realistic scenarios.Over the course of the project we developed automation scripts and data processing tools using Bash and Python. Traffic was collected on a server provided by our university using a combination of containerisation, the scripts we developed, Unix tools and Wireshark. After some manual data cleaning we combined our captured traffic together with a provided dataset of web traffic and created a new dataset that we used in order to evaluate the accuracy of three WF attacks.By the end we had collected 1345 capture files of VPN traffic. All of the traffic were collected from the popular livestreaming website twitch.tv. Livestreaming channels were picked from the twitch.tv frontpage and we ended up with 245 unique channels in our dataset. Using our dataset we managed to decrease the accuracy of all three tested WF attacks from 90% down to 47% with a WF attack confidence threshold of0.0 and from 74% down to 17% with a confidence threshold of 0.99. Even though this is a significant decrease in accuracy it comes with a roughly tenfold increase in the number of captured packets for the WF attacker.Thesis artifacts are available at github.com/C-Sand/rds-collect. / Virtual Private Network (VPN) marknaden har växt kraftigt och det finns stora marginaler när en solid användarbas väl har etablerats. Stora VPN-leverantörer lägger dessutom avsevärda summor pengar på marknadsföring. Det finns dock WF-attacker som kan korrekt gissa vilken webbplats en användare besöker baserat på webbtrafik, även om den går genom en VPN-tunnel.Dessa attacker har rätt bra precision när det kommer till scenarier i sluten värld, men problemet är att dessa fortfarande är långt borta från att simulera typiskt användarbeteende.I det här examensarbetet utforskar och bygger vi verktyg som kan samla in VPNtrafik från olika källor. Trafiken kan användas för att kombineras till mera realistiska dataset och sedan användas för att utvärdera träffsäkerheten av WF-attacker. Vi hoppas att dessa dataset kommer att hjälpa oss och andra att bättre simulera verkliga scenarier.Under projektets gång utvecklade vi ett par automatiserings skript och verktyg för databearbetning med hjälp av Bash och Python. Trafik samlades in på en server från vårt universitet med en kombination av containeriseringen, skripten vi utvecklade, Unix-verktyg och Wireshark. Efter en del manuell datarensning kombinerade vi vår infångade trafik tillsammans med det tillhandahållna datasetet med webbtrafik och skapade ett nytt dataset som vi använde för att utvärdera riktigheten av tre WF attacker.Vid slutet hade vi samlat in 1345 filer med VPN-trafik. All trafik samlades in från den populära livestream plattformen twitch.tv. Livestreamingkanaler plockades ut från twitchs förstasida och vi slutade med 245 unika kanaler i vårat dataset. Med hjälp av vårat dataset lyckades vi minska noggrannheten för alla tre testade WF-attacker från 90% ner till 47% med tröskeln på 0,0 och från 74% ner till 17% med en tröskel på 0,99. Även om detta är en betydande minskning av noggrannheten kommer det med en ungefär tiofaldig ökning av antalet paket. I slutändan samlade vi bara trafik från twitch.tv men fick ändå några intressanta resultat och skulle gärna se fortsatt forskning inom detta område.Kod, instruktioner, dataset och andra artefakter finns tillgängliga via github.com/CSand/rds-collect.

Generic Data Harvester

Asp, William, Valck, Johannes January 2022 (has links)
This report goes through the process of developing a generic article scraper which shall extract relevant information from an arbitrary web article. The extraction is implemented by searching and examining the HTML of the article, by using Python and XPath. The data that shall be extracted is the title, summary, publishing date and body text of the article. As there is no standard way that websites, and in particular news articles, is built, the extraction needs to be adapted for every different structure and language of articles. The resulting program should provide a proof of concept method of extracting the data showing that future development is possible. The thesis host company Acuminor is working with financial crime intelligence and are collecting information through articles and reports. To scale up the data collection and minimize the maintenance of the scraping programs, a general article scraper is needed. There exist an open source alternative called Newspaper, but since this is no longer being maintained and it can be argued is not properly designed, an internal implementation for the company could be beneficial. The program consists of a main class that imports extractor classes that have an API for extracting the data. Each extractor are decoupled from the rest in order to keep the program as modular as possible. The extraction for title, summary and date are similar, with the extractors looking for specific HTML tags that contain some common attribute that most websites implement. The text extraction is implemented using a tree that is built up from the existing text on the page and then searching the tree for the most likely node containing only the body text, using attributes such as amount of text, depth and number of text nodes. The resulting program does not match the performance of Newspaper, but shows promising results on every part of the extraction. The text extraction is very slow and often takes too much text of the article but provides a great blueprint for further improvement at the company. Acuminor will be able to have their in-house article extraction that suits their wants and needs. / Den här rapporten går igenom processen av att utveckla en generisk artikelskrapare som ska extrahera reöevamt information från en godtycklig artikelhemsida. Extraheringen kommer bli implementerad genom att söka igenom och undersöka HTML-en i artikeln, genom att använda Python och XPath. Datan som skall extraheras är titeln, summering, publiceringsdatum och brödtexten i artikeln. Eftersom det inte finns något standard sätt som hemsidor, och mer specifikt nyhetsartiklar är uppbyggda, extraheringen måste anpassas för varje olika struktur och språk av artiklar. Det resulterande programmed skall visa på ett bevis för ett koncept sätt att extrahera datan som visar på att framtida utveckling är möjlig. Projektets värdföretag Acuminor jobbar inom finansiell brottsintelligens och samlar ihop information genom artiklar och rapporter. För att skala upp insamlingen av data och minimera underhåll av skrapningsprogrammen, behövs en generell artikelskrapare. Det existerar ett öppen källkodsalternativ kallad Newspaper, men eftersom denna inte länge är underhållen och det kan argumenteras att den inte är så bra designad, är en intern implementation för företaget fördelaktigt. Programmet består av en huvudklass som importerar extraheringsklasser som har ett API för att extrahera datan. Varje extraherare är bortkopplad från resten av programmet för att hålla programmet så moodulärt som möjligt. Extraheringen för titel, summering och datum är liknande, där extragherarna tittar efter specifika HTML taggar som innehåller något gemensamt attribut som de flesta hemsidor implementerar. Textextraheringen är implementerad med ett träd som byggs upp från grunden från den existerande texten på sidan och sen söks igenom för att hitta den mest troliga noden som innehåller brödtexten, där den använder attribut såsom text, djup och antal textnoder. Det resulterande programmet matchar inte prestandan av Newspaper, men visar på lovande resultat vid varje del av extraheringen. Textextraheringen är väldigt långsam och hämtar ofta för mycket text från artikeln men lämnar ett bra underlag för vidare förbättring hos företaget. Allt som allt kommer Acuminor kunna bygga vidare på deras egna artikel extraherare som passar deras behov.

Page generated in 0.0387 seconds