• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 7
  • 1
  • Tagged with
  • 8
  • 8
  • 8
  • 5
  • 4
  • 3
  • 3
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

A Comparative Analysis of Database Management Systems for Time Series Data / En jämförelse av databashanteringssystem för tidsseriedata

Verner-Carlsson, Tove, Lomanto, Valerio January 2023 (has links)
Time series data refers to data recorded over time, often periodically, and can rapidly accumulate into vast quantities. To effectively present, analyse, or conduct research on such data it must be stored in an accessible manner. For convenient storage, database management systems (DBMSs) are employed. There are numerous types of such systems, each with their own advantages and disadvantages, making different trade-offs between desired qualities. In this study we conduct a performance comparison between two contrasting DBMSs for time series data. The first system evaluated is PostgreSQL, a popular relational DBMS, equipped with the time series-specific extension TimescaleDB. The second comparand is MongoDB, one of the most well-known and widely used NoSQL systems, with out-of-the-box time series tailoring. We address the question of which out of these DBMSs is better suited for time series data by comparing their query execution times. This involves setting up two databases populated with sample time series data — in our case, publicly available weather data from the Swedish Meteorological and Hydrological Institute. Subsequently, a set of trial queries designed to mimic real-world use cases are executed against each database, while measuring their runtimes. The benchmark results are compared and analysed query-by-query, to identify relative performance differences. Our study finds considerable variation in the relative performance of the two systems, with PostgreSQL outperforming MongoDB in some queries (by up to more than two orders of magnitude) and MongoDB resulting in faster execution in others (by a factor of over 30 in one case). Based on these findings, we conclude that certain queries, and their corresponding real-world use cases, may be better suited for one of the two DBMSs due to the alignment between query structure and the strengths of that system. We further explore other possible explanations for our results, elaborating on factors impacting the efficiency with which each DBMS can execute the provided queries, and consider potential improvements. / I takt med att mängden data världen över växer exponentiellt, ökar också behovet av effektiva lagringsmetoder. En ofta förekommande typ av data är tidsseriedata, där varje värde är associerat med en tidpunkt. Det kan till exempel vara något som mäts en gång om dagen, en gång i timmen, eller med någon annan periodicitet. Ett exempel på sådan data är klimat- och väderdata. Sveriges meteorologiska och hydrologiska institut samlar varje minut in mätvärden från tusentals mätstationer runt om i landet, så som lufttemperatur, vindhastighet och nederbördsmängd. Det leder snabbt till oerhört stora datamängder, som måste lagras för att effektivt kunna analyseras, förmedlas vidare, och bevaras för eftervärlden. Sådan lagring sker i databaser. Det finns många olika typer av databaser, där de vanligaste är relationella databaser och så kallande NoSQL-databaser. I den här uppsatsen undersöker vi två olika databashanteringssystem, och deras lämplighet för lagring av tidsseriedata. Specifikt jämför vi prestandan för det relationella databashanteringssystemet PostgreSQL, utökat med tillägget TimescaleDB som optimerar systemet för användande med tidsseriedata, och NoSQL-systemet MongoDB som har inbyggd tidsserieanpassning. Vi utför jämförelsen genom att implementera två databasinstanser, en per komparand, fyllda med SMHI:s väderdata och därefter mäta exekveringstiderna för ett antal utvalda uppgifter som relaterar till behandling av tidsseriedata. Studien konstaterar att inget av systemen genomgående överträffar det andra, utan det varierar beroende på uppgift. Resultaten indikerar att TimescaleDB är bättre på komplexa uppgifter och uppgifter som involverar att plocka ut all data inom ett visst tidsintervall, emedan MongoDB presterar bättre när endast data från en delmängd av mätstationerna efterfrågas.
2

Security vs performance in a real-time separation kernel : An analysis for multicore RISC-V architecture / Säkerhet vs prestanda i en realtidsseparationskärna : En analys för multicore RISC-V arkitektur

Kultala, Henrik January 2022 (has links)
In this thesis, we explored the possibility of introducing a few vulnerabilities to a separation kernel to increase its performance. We made modifications to S3K, an open-source separation kernel that is in the final stages of being designed. To test the viability of our modifications we benchmarked both the unmodified and the modified versions and compared the results. We changed the scheduler and the inter-process communication used for time sharing: we introduced side-channel vulnerabilities to allow the modified functionalities to complete their work faster. The changes to the scheduler increased performance notably when having a high scheduling overhead, but not so much with low overhead. The changes to the inter-process communication proved to have limited usefulness, as the default version was already rather quick, and the new version had the drawback of increasing the time needed for scheduling. We also tested our scheduler modifications in the inter-process communication benchmarks. This greatly improved performance in all scenarios, and it made our modifications to the inter-process communication slightly more viable. To see how our results held up in a scenario closer to a real use case we also implemented a simple cryptographic application and designed tests based on it. When we ran the tests with different combinations of including or excluding our modifications we got similar results to our previous benchmarks. Overall, our modifications to the scheduler seem like a promising change to the separation kernel, given that one is willing to introduce the side-channels that come with the changes. The modifications to the inter-process communication on the other hand are more questionable and are likely only useful in specific scenarios. / I detta arbete utforskade vi möjligheten att introducera några sårbarheter till en separationskärna för att öka dess prestanda. Vi modifierade S3K, en separationskärna med öppen källkod som är i slutstadiet av att designas. För att testa hur praktiskt användbara våra modifikationer var så körde vi benchmarks på både den ursprungliga versionen och den modifierade versionen och jämförde resultaten. Vi ändrade schemaläggaren och interprocesskommunikationen som används för att dela tid: sidokanalssårbarheter introducerades för att tillåta de ändrade funktionerna att göra färdigt sina arbeten snabbare. Ändringarna till schemaläggaren visade sig öka prestandan noterbart när man hade en hög schemaläggnings-overhead, men skillnaden var inte så stor med låg overhead. Ändringarna till interprocesskommunikationen visade sig ha begränsad användbarhet, då standardversionen redan var ganska snabb och den nya versionen hade nackdelen att den ökade schemaläggningstiden. Vi testade också våra schemaläggningsmodifikationer i våra benchmarks för interprocesskommunikationen. Detta ökade prestandan mycket i alla scenarion, och gjorde våra modifikationer till interprocesskommunikationen något mer praktiskt användbara. För att se hur våra resultat stod sig i ett mer verkligt scenario så implementerade vi också en simpel kryptografisk applikation, och utformade test runt den. När vi testade olika kombinationer av att inkludera eller exkludera våra modifikationer fick vi liknande resultat som vi fick i tidigare benchmarks. Överlag så verkar våra modifikationer till schemaläggaren lovande, givet att man är villig att introducera de sidokanalssårbarheter som kommer med ändringarna. Modifikationerna till interprocesskommunikationen är dock mer tveksamma, och är sannolikt bara användbara i specifika scenarion.
3

Performance and feature support of Progressive Web Applications : A performance and available feature comparison between Progressive Web Applications, React Native applications and native iOS applications. / Prestanda och funktionsstöd för Progressiva Webbapplikationer : En prestanda och tillgänglig funktionsjämförelse mellan progressiva webbapplikationer, React Native applikationer och Native iOS.

Nilsson, Anders January 2022 (has links)
Mobile platform fragmentation is one of the main challenges of mobile development today, forcing developers to develop one application for each targeted platform, which significantly impacts time and cost for application development and maintenance. The fragmentation has given rise to cross-platform application development tools and frameworks, making it possible to develop one single application compatible with several platforms. This thesis focuses on the web-based approach Progressive Web Applications (PWAs), which, in contrast to previous approaches, targets both mobile and desktop devices. We aim to point out the supported features, evaluate their suitability for QR code scanning, and their performance compared to alternative approaches on iOS. We specifically cover a feature set of 33 features and measure response times, CPU and memory utilization, geolocation accuracy, and QR code scanning correctness. We developed three benchmark artifacts for the performance analysis: a PWA, a React Native application, and a native iOS application, and conducted automated run-time experiments using the tools Xcode and XCUITest. The performance evaluation shows that native applications performed best in memory and CPU utilization, whereas React Native achieved the shortest response times. The feature evaluation shows that the majority of the features are supported or partially supported for PWAs, and that the support continues to grow. Still, PWAs lack support for crucial mobile features such as push notifications and background synchronization, making PWAs insufficient for advanced mobile application development on iOS. Nevertheless, this study shows that PWAs are well worth considering for applications with low requirements. / Fragmentering av mobilplattformar är en av de största utmaningarna inom mobilutveckling, vilket tvingar utvecklare att utveckla en applikation för varje specific plattform, vilket avsevärt påverkar tid och kostnad för applikationsutveckling och underhåll. Fragmenteringen har gett upphov till plattformsoberoende applikationsutvecklingsverktyg och ramverk, vilka möjliggör utveckling av en enda applikation kompatibel med flertalet plattformar. Det här examensarbetet fokuserar på det webbaserade tillvägagångssättet Progressiva Webb Applikationers (PWAs), som till skillnad från tidigare tillvägagångssätt, riktar sig till både mobila och stationära enheter. Den här studien syftar till att reda ut vilka funktioner som stöds av PWAs, utvärdera PWAs lämplighet för QR-kodskanning och deras prestanda jämfört med alternativa tillvägagångssätt på iOS. Mer specifikt täcker den här stiduen en evaluering av 33 essentiella mobilfunktioner samt en prestandaanalys genom mätning av svarstid, CPU- och minnesanvändning, geolokaliseringsnoggrannhet och QR-kodsskanning korrekthet. Vi utvecklade tre benchmark-artefakter för prestandaanalysen: en PWA, en React Native-applikation och en inbyggd iOS-applikation, och genomförde automatiserade experiment med verktygen Xcode och XCUITest. Prestandautvärderingen visar att inbyggda applikationer presterade bäst i minne och CPU-användning, medan React Native uppnådde de kortaste svarstiderna. Funktionsutvärderingen visar att majoriteten av funktionerna stöds eller delvis stöds för PWAs, och att stödet fortsätter att växa. Ändå saknar PWAs stöd för viktiga mobila funktioner som push-meddelanden och bakgrundssynkronisering, vilket gör PWAs otillräckliga för utveckling av avancerade iOS mobilapplikationer. Däremot är PWAs väl värda att överväga för applikationer med lägre krav.
4

Study case: The water-cooling effect on floating photovoltaic plants performance / Studiefall: Den vattenkylande effekten på flytande solcellsanläggningars prestanda

Dragon, Alice January 2024 (has links)
Floating solar technology is relatively new, and it comes with its own set of challenges and opportunities. This master thesis focuses on understanding how Floating Photovoltaic (FPV) projects perform compared to Ground-Based Photovoltaic (GPV) projects, in specific weather conditions. The following work is based on a case study: a floating power plant run by Akuo Energy, where sensors have been installed in order to measure the evolution of relevant physical and weather parameters on-site. Akuo Energy is a French independent renewable energy producer and developer founded in 2007. The company specializes in the development, financing, construction, and operation of renewable energy projects, including wind, solar and storage power plants. It is committed to producing clean, affordable, and reliable energy while promoting sustainable development and supporting local communities. The thesis is conducted within the Solar Technology Team, which centralizes the solar expertise of the company and implements innovative technologies to improve their Photovoltaic (PV) projects’ performances. As the number of FPV projects increases, the team raised the need for better evaluation of their performance compared to a standard GPV project, in terms of output power and energy yield. As it appears in the literature, FPV installations can differ from GPV, due to different operating conditions: power plant designs, module cooling, weather conditions, or degradation rates. These parameters need to be taken into account in the expected energy yield analysis, especially module cooling, since operating temperature has a proved impact on module efficiency. Today, technological and economic considerations on FPV specific design are therefore essential. However, the main solar projects development software PVsyst used at Akuo Energy does not include a default floating solar library. Experimental measurements are a good starting point for understanding how the numerical model needs to evolve to adapt to the FPV system. By examining a practical case and processing historical data, insights on FPV systems and how weather affects their efficiency can be provided. The objective of this thesis is then to better model the FPV array thermal losses due to the cooling effect and better estimate the yield for future Akuo Energy FPV projects during the development phase. / Flytande solteknik är relativt ny och kommer med sina egna utmaningar och möjligheter. Denna masteruppsats fokuserar på att förstå hur FPV-projekt presterar jämfört med GPV-projekt, under specifika väderförhållanden. Följande arbete är baserat på en fallstudie: ett flytande kraftverk som drivs av Akuo Energy, där sensorer har installerats för att mäta utvecklingen av relevanta fysiska parametrar och väderparametrar på plats. Akuo Energy är en fransk oberoende producent och utvecklare av förnybar energi som grundades 2007. Företaget är specialiserat på utveckling, finansiering, konstruktion och drift av projekt för förnybar energi, inklusive vind-, sol- och lagringskraftverk. Det är engagerat i att producera ren, prisvärd och pålitlig energi samtidigt som man främjar hållbar utveckling och stödjer lokala samhällen. Examensarbetet genomförs inom Solar Technology Team, som centraliserar företagets solexpertis och implementerar innovativa teknologier för att förbättraderas PV-projekts prestanda. När antalet FPV-projekt ökar, tog teamet upp behovet av bättre utvärdering av deras prestanda jämfört med ett standard GPV-projekt, vad gäller uteffekt och energiutbyte. Som det framgår av litteraturen kan FPV-installationer skilja sig från GPV på grund av olika driftsförhållanden: kraftverkskonstruktioner, modulkylning, väderförhållanden, eller nedbrytningshastigheter. Dessa parametrar måste beaktas ta hänsyn till den förväntade energiutbytesanalysen, särskilt modulkylning, eftersom driftstemperaturen har en bevisad inverkan på modulens effektivitet. Idag är därför tekniska och ekonomiska överväganden om FPV specifik design viktiga. Emellertid innehåller den huvudsakliga utvecklingsmjukvaran PVsyst för solenergiprojekt som används på Akuo Energy inte ett flytande solcellsbibliotek som standard. Experimentella mätningar är en bra utgångspunkt för att förstå hur den numeriska modellen behöver utvecklas för att anpassa sig till FPV-systemet. Genom att undersöka ett praktiskt fall och bearbeta historiska data kan insikter om FPV-system och hur vädret påverkar deras effektivitet ges. Syftet med denna avhandling är sedan att bättre modellera FPV-matrisens termiska förluster på grund av kyleffekten och bättre uppskatta avkastningen för framtida Akuo Energy FPV-projekt under utvecklingsfasen.
5

Prestandajämförelse mellan krypterade och okrypterade tidsseriedatabaser med IoT-baserad temperatur- och geopositionsdata / Performance Comparison between Encrypted and Unencrypted Time Series Databases with IoT-Based Temperature and Geolocation Data

Uzunel, Sinem, Xu, Joanna January 2024 (has links)
Internet of Things (IoT) är en växande teknologi som spelar en allt större roll i samhället. Den innefattar ett nätverk av internetanslutna enheter som samlar in och utbyter data. Samtidigt som IoT växer uppstår utmaningar kring hantering av stora datamängder och säkerhetsaspekter. Företaget Softhouse står inför utmaningen att välja en effektiv tidsseriedatabas för hantering av temperatur- och geopositionsdata från värmesystem i privata bostäder, där både prestanda och dataintegritet via kryptering är av stor vikt. Detta examensarbete har därför utfört en prestandajämförelse mellan AWSTimestream och InfluxDB, där olika tester har använts för att mäta exekveringstiden för inskrivning av sensordata och databasfrågor. Jämförelsen inkluderar AWS Timestream i krypterad form mot InfluxDB i dess AWS-molnversion i krypterad form, samt InfluxDB AWS i krypterad form mot InfluxDB i okrypterad form. Syftet med studien var att ge riktlinjer för valet av tidsseriedatabaser med fokus på prestanda och säkerhetsaspekter, inklusivekryptering. Studien undersökte även hur valet av rätt databas påverkar företag som Softhouse, både i termer av kvantitativa och kvalitativa fördelar, samt att ge en bedömning av kostnaderna. Resultatet visade att InfluxDB i dess AWS-molnversion generellt presterade bättre än AWS Timestream och InfluxDB i dess standardversion. Det fanns tydliga skillnader i prestanda mellan AWS Timestream och InfluxDB i dess AWS-molnversion, men inte lika tydliga skillnader i prestanda mellan InfluxDB i dess AWS-molnversion och standardversionen. Med hänsyn till både prestanda och säkerhet framstår InfluxDB i dess AWS-molnversion som det mest lämpliga alternativet. Det är emellertid av stor vikt att ta kostnadaspekten i beaktande, då AWS Timestream visar sig vara avsevärt mer kostnadseffektivt än InfluxDB. / The Internet of Things (IoT) is a growing technology that plays an increasingly significant role in society. It encompasses a network of internet-connected devices that collect and exchange data. As IoT continues to expand, challenges arise regarding the management of large volumes of data and security aspects. The company Softhouse faces the challenge of choosing an efficient time-series database for handling temperature and geoposition data from heating systems in homes, where both performance and data integrity through encryption are of great importance. Therefore, this thesis has conducted a performance comparison between AWS Timestream and InfluxDB, using various tests to measure the execution times for data ingestion of sensor data and database queries. The comparison includes AWS Timestream in encrypted form versus InfluxDB in its AWS cloud version in encrypted form, as well as InfluxDB AWS in encrypted form versus InfluxDB in unencrypted form. The aim of the study was to provide guidelines for the selection of time-series databases with a focus on performance and security aspects, including encryption. The study also explored how the choice of the right database affects companies like Softhouse, both in terms of quantitative and qualitative benefits, and provided an assessment of costs. The results showed that InfluxDB in its AWS cloud version generally outperformed AWS Timestream and InfluxDB in its standard version. There were clear performance differences between AWS Timestream and InfluxDB in its AWS cloud version, but not as pronounced differences in performance between InfluxDB in itsAWS cloud version and the standard version. Considering both performance and security, InfluxDB in its AWS cloud version appears to be the most suitable option. However, it is crucial to consider the cost aspect, as AWS Timestream proves to be significantly more cost-effective than InfluxDB.
6

Quotation for Customer Proposal and Performance Analysis for aircraft maintenance / Offert för Kundförslag Och prestanda Analys för flygplan underhåll

Bezier, Antoine January 2022 (has links)
By working as an intern with the Quotation Officer of Sabena Technics Nîmes facility,an aircraft maintenance company, this degree project highlights the different factors totake into account in a quotation of civil planes (B737/B767/A320/A330) by analysingwork packages from airline company, applying a process to estimate the importantdata as the man hours or tools, and using my technical knowledge to understandmaintenance tasks. Management knowledge for commercial sale reviews was usefulas well, this job is in the middle of the commercial team and and the technicalteam. Finally, a critical opinion of the process has been made in order to propose animprovement of the next quotations. / Genom att arbeta som praktikant hos offerterbetaren på Sabena Technics anläggningi Nîmes, ett underhållsföretag för flygplan, belyser detta examensarbete de olikafaktorersom ska beaktas i en underhållsoffert för civila flygplan (B737/B767/A320/A330).Detta gjordes genom att analysera arbetspaket från flygbolag, tillämpa en process föratt uppskatta viktiga uppgifter som arbetstimmar eller verktyg, och använda minatekniska kunskaper för att förstå underhållsuppgifter. Kunskaper om förvaltning avkommersiella försäljningsöversikter var också användbara, eftersom det här jobbetligger mitt emellan det kommersiella teamet och det tekniska teamet. Slutligen harjag gjort en kritisk bedömning av processen för att föreslå en förbättring av framtidaofferter.
7

Evaluation of Using the WebRTC Protocol as a Fully Distributed System : Measure, benchmark, and evaluate the performance of the WebRTC protocol

Suyum, Mryam Teklya January 2023 (has links)
Syftet med detta examensarbete är att och utvärdera undersöka analysera och utvärdera prestandan hos WebRTC-protokollet, samt att utveckla en webbaserad klient med hjälp av JavaScript för distribuerade system och demonstrera protokollets användbarhet i ett verkligt scenario. Studien inkluderade användning av olika verktyg och bibliotek, såsom Socket.IO, Node.js, Express.js och PeerJS. De viktigaste prestandaindikatorerna som utvärderades var latens/tur- och returtid (RTT), jitter och paketförlust. Implementationen testades både lokalt och på distans. Prestandatestningen av applikationen utfördes med hjälp av webbplatserna "Chrome webrtc-internals" och "TestRTC", vilka erbjöd detaljerade insikter och statistik om WebRTC-prestanda. Resultaten indikerade att WebRTC erbjuder högpresterande och kostnadseffektiv realtidskommunikation som är kompatibel med andra applikationer som stöder protokollet. Protokollet visade sig ha robusta säkerhetsåtgärder, vara kompatibelt med distribuerade system och erbjuda stark prestanda när det gäller latens, jitter och paketförlust. Studien drog slutsatsen att WebRTC, med sin skalbarhet och förmåga att erbjuda kommunikation i realtid, är ett fördelaktigt val för distribuerade system och webbaserade videochattapplikationer. Resultaten uppmanar till ytterligare undersökningar inom områden som end-to-end-kryptering och integration av artificiell intelligens för att förbättra systemets prestanda och säkerhet. / The aim of this thesis is to analyse and evaluate the performance of the WebRTC protocol, develop a web-based client using JavaScript for distributed systems, and demonstrate the utility of the protocol in a real-world scenario. The study involved the use of various tools and libraries, including Socket.IO, Node.js, Express.js, and PeerJS. Key performance indicators evaluated were latency/round-trip time (RTT), jitter, and packet loss. The implementation was tested both locally and remotely. Performance testing of the application was conducted using the "Chrome webrtc-internals" and "TestRTC" websites, which provided detailed insights and statistics on WebRTC performance. The results indicated that WebRTC offers high-performance and cost-effective real-time communication that is compatible with other applications supporting the protocol. The protocol demonstrated robust security measures, compatibility with distributed systems, and strong performance in terms of latency, jitter, and packet loss. The study concluded that WebRTC, with its scalability and ability to provide real-time communication, is a beneficial choice for distributed systems and webbased video chat applications. The findings encourage further investigations in areas such as end-to-end encryption and the integration of artificial intelligence to enhance system performance and security.
8

PDF document search within a very large database

Wang, Lizhong January 2017 (has links)
Digital search engine, taking a search request from user and then returning a result responded to the request to the user, is indispensable for modern humans who are used to surfing the Internet. On the other hand, the digital document PDF is accepted by more and more people and becomes widely used in this day and age due to the convenience and effectiveness. It follows that, the traditional library has already started to be replaced by the digital one. Combining these two factors, a document based search engine that is able to query a digital document database with an input file is urgently needed. This thesis is a software development that aims to design and implement a prototype of such search engine, and propose latent optimization methods for Loredge. This research can be mainly divided into two categories: Prototype Development and Optimization Analysis. It involves an analytical research on sample documents provided by Loredge and a multi-perspective performance analysis. The prototype contains reading, preprocessing and similarity measurement. The reading part reads in a PDF file by using an imported Java library Apache PDFBox. The preprocessing processes the in-reading document and generates document fingerprint. The similarity measurement is the final stage that measures the similarity between the input fingerprint with all the document fingerprints in the database. The optimization analysis is to balance resource consumptions involving response time, accuracy rate and memory consumption. According to the performance analysis, the shorter the document fingerprint is, the better performance the search program presents. Moreover, a permanent feature database and a similarity based filtration mechanism are proposed to further optimize the program. This project has laid a solid foundation for further study in the document based search engine by providing a feasible prototype and enough relevant experimental data. This study figures out that the following study should mainly focuses on improving the effectiveness of the database access, which involves data entry labeling and search algorithm optimization. / Digital sökmotor, som tar en sökfråga från användaren och sedan returnerar ett resultat som svarar på den begäran tillbaka till användaren, är oumbärligt för moderna människor som brukar surfa på Internet. Å andra sidan, det digitala dokumentets format PDF accepteras av fler och fler människor, och det används i stor utsträckning i denna tidsålder på grund av bekvämlighet och effektivitet. Det följer att det traditionella biblioteket redan har börjat bytas ut av det digitala biblioteket. När dessa två faktorer kombineras, framgår det att det brådskande behövs en dokumentbaserad sökmotor, som har förmåga att fråga en digital databas om en viss fil. Den här uppsatsen är en mjukvaruutveckling som syftar till att designa och implementera en prototyp av en sådan sökmotor, och föreslå relevant optimeringsmetod för Loredge. Den här undersökningen kan huvudsakligen delas in i två kategorier, prototyputveckling och optimeringsanalys. Arbeten involverar en analytisk forskning om exempeldokument som kommer från Loredge och en prestandaanalys utifrån flera perspektiv. Prototypen innehåller läsning, förbehandling och likhetsmätning. Läsningsdelen läser in en PDF-fil med hjälp av en importerad Java bibliotek, Apache PDFBox. Förbehandlingsdelen bearbetar det inlästa dokumentet och genererar ett dokumentfingeravtryck. Likhetsmätningen är det sista steget, som mäter likheten mellan det inlästa fingeravtrycket och fingeravtryck av alla dokument i Loredge databas. Målet med optimeringsanalysen är att balansera resursförbrukningen, som involverar responstid, noggrannhet och minnesförbrukning. Ju kortare ett dokuments fingeravtryck är, desto bättre prestanda visar sökprogram enligt resultat av prestandaanalysen. Dessutom föreslås en permanent databas med fingeravtryck, och en likhetsbaserad filtreringsmekanism för att ytterligare optimera sökprogrammet. Det här projektet har lagt en solid grund för vidare studier om dokumentbaserad sökmotorn, genom att tillhandahålla en genomförbar prototyp och tillräckligt relevanta experimentella data. Den här studie visar att kommande forskning bör huvudsakligen inriktas på att förbättra effektivitet i databasåtkomsten, vilken innefattar data märkning och optimering av sökalgoritm.

Page generated in 0.454 seconds