Spelling suggestions: "subject:"datavetenskap"" "subject:"datvetenskap""
891 |
A comparison study of Kd-tree, Vp-tree and Octree for storing neuronal morphology data with respect to performanceAdamsson, Marcus, Vorkapic, Aleksandar January 2016 (has links)
In this thesis we investigated performance of Kdtree, Vptree and Octree for storing neuronal morphology data. Two naive list structures were implemented to compare with the space partition data structures. The performance was measured with different sizes of neuronal networks and different types of test cases. A comparison with focus on cache misses, average search time and memory usage was made. Furthermore, measurements gathered quantitative data about each data structure. The results showed significant difference in performance of each data structure. It was concluded that Vptree is more suitable for searches in smaller populations of neurons and for specific nodes in larger populations, while Kdtree is better for volume searches in larger populations. Octree had highest average search time and memory requirement. / I denna rapport har vi undersökt prestanda av tre datastrukturer, Vptree, Kdtree och Octree, för lagring av neurala morfologidata. Två naiva liststrukturer implementerades, för att kunna jämföras med tre datastrukturer. Prestanda mättes med olika storlekar av neurala nätverket och med olika typer av testfall. En jämförelse med fokus på cachemissar, genomsnittlig söktid och minnesanvändning utfördes. Dessutom, samlade mätningarna kvantitativ data om varje datastruktur. Resultatet visade signifikant skillnad i prestanda mellan de implementerade datastrukturerna. Det konstaterades att Vptree är bättre för sökning i mindre populationer av neuroner samt för sökning av specifika noder i större populationer, medan Kdtree är bättre för volymsökning i större populationer. Octree hade högst medelsöktid och minnesanvändning.
|
892 |
Förbättras kognitiva färdigheter varaktigt av datorspelande? : Ett axplock ur forskningens resultat och metoder / Are cognitive abilities enhanced permanently by playing computer games? : A selection of results and methods of the research areaDecker, Peter January 2016 (has links)
Datorspelande har under de senaste decennierna ökat oavbrutet. Med det har ett intresse vuxit fram om hur spelande kan påverka vår hjärna. Ett nytt forskningsområde har etablerats. I början studerades mest möjliga negativa kognitiva effekter. Numera jagas även svaren på om dessa så engagerande spel kan förbättra kognitiva färdigheter och vilka som i så fall är de effektgivande detaljerna i spelen. Denna litteraturstudie försöker ur detta breda forskningsområde finna positiva effekter på kognitiva egenskaper och färdigheter, utvecklade som följd av spelande av kommersiella datorspel i olika former, och analysera om det i något eller flera fall kan anses säkert att någon bestående kognitiv förbättring uppnås. Ett urval av de senaste sammanställande och undersökande vetenskapliga artiklarna används som underlag. Resultaten ger en blandad bild av läget. En rad potentiellt förbättringsbara förmågor presenteras. Enstaka kausala samband påstås vara funna men forskningsmetodik och brist på långtidsstudier försvårar för att kunna svara på effekternas varaktighet. Flera positiva effekter verkar faktiskt kunna nås men forskningen hänvisar till framtida studier med vidareutvecklade undersöknings- och mätmetoder.
|
893 |
A comparative study of regression analysis with and without search query data as arepresentation of public opinion / En undersökande studie av regressions analys med och utan sökdata som en representation av folkopinionLarsson, Mattias, Kirichenko, Dan January 2016 (has links)
Stock prediction models using search query data is a modern phenomena and arelatively unexplored subject which potentially yields improvements to currentlyestablished prediction algorithms. This thesis will strive to improve an autoregressiveprediction model by analyzing concurrent search query data to conclude whether ornot taking such data into account will improve the prediction model. Multiplealternatives for sources of search query data has been analyzed and Google Trendswas concluded as the most suitable candidate. The thesis found no strong indicatorthat amplifying the autoregressive algorithm with Google Trends data would producebetter stock predictions. There remains to be found an elegant solution to improvingprediction models using Google Trends data.
|
894 |
Natural image distortions and optical character recognition accuracy / Förvrängningar av naturliga bilder ochträffsäkerhet hos optiskteckenigenkänningLundqvist, Filip, Wallberg, Olle January 2016 (has links)
Current state of the art optical character recognition tools are trained using high quality image datasets. In practical applications, natural images used for character recognition willnot always be of high quality. This report examines the accuracy of a state of the art optical character recognition tool using three distorted natural image datasets. The performed distortions were lossy JPEG compression, contrast reduction and white gaussian noise injection. The accuracy is presented as an average percentage of correct and located text using the Levenshtein distance algorithm. The results indicate that white gaussian noise injection significantly reduced OCR accuracy. On the other hand, lossy JPEG compressionand contrast reduction had a similar, but less of an effect. / Nuvarande moderna verktyg för optisk teckenigenkänning tränas med bilder av hög kvalité. I praktiska situationer kommer naturliga bilder som används för optisk teckenigenkänning inte alltid vara av hög kvalité. Denna rapport använder tre förvrängda datauppsättningar av naturliga bilder för att utvärdera träffsäkerheten hos ett modernt verktyg för optiskteckenigenkänning. De utförda förvrängningarna var förstörande JPEG komprimering, kontrastreducering och injektion av vitt gaussiskt brus. Träffsäkerheten presenteras som en genomsnittlig procentenhet av korrekt och lokaliserad text genom användning av algoritmen Levenshteinavstånd. Resultaten indikerar att injektion av vitt gaussiskt brus försämrade träffsäkerheten hos optisk teckenigenkänning avsevärt. Vidare hade förstörande JPEG komprimering och kontrastreducering en liknande, men mindre, effekt.
|
895 |
Comparing ALS And SGD Over A Variable Number Of Latent Features Using Graphlab Create’s Factorization Machine / Jämförelse Mellan ALS Och SGD Med Avseende På Antalet Latentfaktorer Genom Graphlab Create’s Factorization MachineLillthors, Christopher, Philipson, Samuel January 2016 (has links)
Recommendation Systems applies Information retrieval to filter necessary information from unnecessary information. Collaborative Filtering (CF) is a widely used technique to build Recommendation Engines. There are major challenges, which includes both data sparsity and growing data, for todays CF algorithms. An attempt on solving these challenges involves using Matrix Factorization (MF). In this paper we attempt to present a comparison between two highly used and well known MF algorithms called ALS and SGD, which can be served as a roadmap for future research. / Rekommendationssystem använder sig av informationssökning för att filtrera nödvändig information från onödig information. Samarbetesfiltrering (SF) är en välanvänd teknik för att bygga Rekommendations- system. Det finns stora utmaningar gällande data- densitet och den faktiska mängden data för dagens SF-algoritmer. I ett försök att lösa dessa utmaningar ligger användningen av Matris Faktorisering (MF). I denna rapport presenterar vi en jämförelse mellan två välkända MF-algoritmer som kallas ALS och SGD. Denna jämförelse kan komma att användas som underlag för framtida forskning.
|
896 |
Estimating Query Containment by querying a single database instanceRagnesand, Simon January 2016 (has links)
This paper examines the possibility of simply querying a database as a fast approximation for the query containment problem and measures its accuracy compared with a proper solver. The algorithm for a Correct Query Containment solver, which is used for comparisons sake, as well as the approximative algorithm is laid out. The database that was used to approximate query containment is also discussed. The results are discussed as well as the areas that this method can be applied to. Further ways to increase the accuracy is discussed. The results show that while the method has some potential the accuracy can be poor. A genetic algorithm is used to increase the accuracy for one set of queries, but the results failed to carry over to other sets of queries.
|
897 |
Method performance difference of sentiment analysis on social media databases : Sentiment classification in social media / Skillnad i prestanda för sentimentanalysmetoder på data från sociala medier : Sentimentklassifikation i sociala medierJohansson, Henrik, Lilja, Anton January 2016 (has links)
As the amount of available data have exploded with the in- crease in use of social media the interest of doing sentiment anlysis have increased. However as the source and nature of the data have changed it is possible that the known meth- ods will not perform as before. The purpose of this paper is to examine if such a di erence exist and if the methods can be improved through preprocessing the data. The results show that there is a di erence and that on this new type of data a lexicon approach may be a better choice than a machine learning based one. Preprocessing the data give some but no large improvements. / Den explosion av tillgänglig data i och med den ökade an- vändningen av sociala medier har ökat intresset för att göra sentimentsanalys. Men eftersom källan och innehållet för den data som analyseras har förändrats är det möjligt att de metoder som används kommer att prestera annorlunda. Syftet med denna studie är att undersöka om en sådan skill- nad finns och om metodernas trä säkerhet kan ökas genom att förarbeta data. Resultatet visar att det finns en skillnad och att en lexikal analys kan vara ett bättre tillvägagångs- sätt än en metod baserad på maskininlärning. Att förarbeta data visar viss men inte i sammanhanget stor förbättring av resultatet.
|
898 |
Intersection Control for Autonomous Cars through a Reservation Scheme / Bokningsbaserad vägkorsningsstyrning för autonoma fordonKarlsson, Henrik, Josefsson, André January 2016 (has links)
Intersection control is a difficult but important part in the design of a road network. Today, a lot of time is wasted at intersections due to the large margins used. With the introduction of autonomous vehicles, smaller margins may be possible, opening for new intersection control methods. This study proposes a new efficient intersection control system for populations entirely consisting of autonomous vehicles. The control system works by keeping an space-time booking scheme and relies on having wireless communication with nearby vehicles to schedule passage through the intersection. The purpose of this study was to investigate if the proposed control system can be used to reduce control delay when the entire vehicle population is autonomous. The proposed intersection control system was tested against dynamic signal control in terms of mean squared control delay. The testing was done in a microscopic traffic simulator implemented specifically for this study. Testing showed that the proposed control system had a considerably lower mean squared control delay than dynamic signal control did. A higher throughput was also achieved with the proposed system. These performance gains were believed to be due to a higher usage of the space in the intersection centre. The study was considered successful but has several limitations making it difficult to generalise the findings. The proposed intersection control system was therefore considered promising, but in need of further investigation.
|
899 |
The effects of Deep Belief Network pre-training of a Multilayered perceptron under varied labeled data conditions / Effekterna av att initialisera en MLP med en tränad DBN givet olika begränsningar av märkt dataLarsson, Marcus, Möckelind, Christoffer January 2016 (has links)
Sometimes finding labeled data for machine learning tasks is difficult. This is a problem for purely supervised models like the Multilayered perceptron(MLP). A Discriminative Deep Belief Network(DDBN) is a semi-supervised model that is able to use both labeled and unlabeled data. This research aimed to move towards a rule of thumb of when it is beneficial to use a DDBN instead of an MLP, given the proportions of labeled and unlabeled data. Several trials with different amount of labels, from the MNIST and Rectangles-Images datasets, were conducted to compare the two models. It was found that for these datasets, the DDBNs had better accuracy when few labels were available. With 50% or more labels available, the DDBNs and MLPs had comparable accuracies. It is concluded that a rule of thumb of using a DDBN when less than 50% of labels are available for training, would be in line with the results. However, more research is needed to make any general conclusions. / Märkt data kan ibland vara svårt att hitta för maskininlärningsuppgifter. Detta är ett problem för modeller som bygger på övervakad inlärning, exem- pelvis Multilayerd Perceptron(MLP). Ett Discriminative Deep Belief Network (DDBN) är en semi-övervakad modell som kan använda både märkt och omärkt data. Denna forskning syftar till att närma sig en tumregel om när det är för- delaktigt att använda en DDBN i stället för en MLP, vid olika proportioner av märkt och omärkt data. Flera försök med olika mängd märkt data, från MNIST och Rectangle-Images datamängderna, genomfördes för att jämföra de två mo- dellerna. Det konstaterades att för dessa datamängder hade DDBNerna bättre precision när ett fåtal märkt data fanns tillgängligt. När 50% eller mer av datan var märkt, hade DDBNerna och MLPerna jämförbar noggrannhet. Slutsatsen är att en tumregel att använda en DDBN när mindre än 50% av av träningsdatan är märkt, skulle vara i linje med resultaten. Det behövs dock mer forskning för att göra några generella slutsatser.
|
900 |
Rekommendationssystem med begränsad data : Påverkan av gles data och cold start på rekommendationsalgoritmen Slope One / Limited Data in Recommender Systems : The Impact of Sparse Data and Cold Start on the Recommendation Algorithm Slope OneEvert, Anna-Karin, Mattisson, Alfrida January 2016 (has links)
I dagens överflöd av information och produkter på nätet, har rekommendationssystem blivit viktiga för att kunna presentera sådant som är intressant och relevant för varje enskild användare. Rekommendationssystem kan både förutsäga produktbetyg och ta fram ett urval av rekommenderade produkter för en användare. Ett vanligt problem för rekommendationssystem är begränsad data, vilket kan försämra korrektheten i systemets rekommendationer och förutsägelser avsevärt. De vanligaste typerna av begränsad data är gles data och cold start. Gles data innebär att det finns en liten mängd produktbetyg i förhållande till antalet användare och produkter i systemet. Cold start är i stället då en ny användare eller produkt ska läggas till i systemet, och därmed saknar betyg. Denna rapport har som syfte att studera hur korrektheten i rekommendationsalgoritmen Slope Ones förutsägelser påverkas av begränsad data. De situationer som undersöks är gles data samt cold start-situationerna ny användare och ny produkt. Rapporten undersöker även om situationen ny användare kan avhjälpas genom att låta nya användare betygsätta ett litet antal produkter direkt när de läggs till i systemet. Sammanfattningsvis, visar rapportens resultat att Slope One är olika känslig för de olika typerna av begränsad data. I enlighet med tidigare forskning, kan slutsatsen dras att Slope One är okänslig för gles data. Vad gäller cold start, blir korrektheten avsevärt sämre, och dessa situationer kan således sägas vara problematiska för Slope One. / In today’s abundance of online information and products, recommender systems have become essential in finding what is interesting and relevant for each user. Recommender systems both predict product ratings and produce a selection of recommended products for a user. Limited data is a common issue for recommender systems and can greatly impair their ability to produce accurate predictions and recommendations. The most prevailing types of limited data are sparse data and cold start. The data in a dataset is said to be sparse if the number of ratings is small compared to the number of users and products. Cold start, on the other hand, is when a new user or product is added to the system and therefore completely lacks ratings. The objective of this report is to study the impact of limited data on the accuracy of predictions produced by the recommendation algorithm Slope One. More specifically, this report examines the impact of sparse data and the two cold start situations new user and new product. The report also investigates whether asking new users to rate a small number of products, instantly after being added to the system, is a successful strategy in order to cope with the problem of making accurate predictions for new users. In summary, it can be deduced from the results of this report that the sensitivity of Slope One varies between the types of limited data. In accordance with previous studies, Slope One appears insensitive to sparse data. On the other hand, for cold start, the accuracy is seriously affected and cold start can thus be said to be problematic for Slope One.
|
Page generated in 0.0606 seconds