Implikat : A System for Categorizing Products using Implicit Feedback on a Website / Implikat : Ett system för kategorisering av produkter med hjälp av implicit feedback på en webbsidaCarlquist, Olle, Boström Leijon, Santos January 2014 (has links)
Implicit feedback is a form a relevance feedback that is inferred from how users interact with an information retrieval system such as an online search engine. This degree project report describes a method of using implicit feedback to establish relevance judgments and rank products based on their relevance to a specified attribute. The report contains an overview of the benefits and limitations of implicit feedback, as well as a description on how those limitations can be mitigated. A prototype that interpreted user actions as relevance votes and calculat-ed a fair relevance score based on these votes with the help of an algo-rithm was developed. This system was then tested on a website with real users during a limited period of time. The results from the test period were evaluated and the system was concluded to be far from perfect, but that improvements could be made by making adjustments to the algo-rithm. The system performed better when looking at the algorithm’s pre-cision rather than its sensitivity. / Implicit feedback är en sorts relevansfeedback som sammanställs utifrån användares interaktion med ett informationsökningsssystem. Denna examensarbetesrapport beskriver ett sätt att använda implicit feedback för att skapa en bedömning av en produkts relevans till ett angivet attribut. Rapporten innehåller också en överblick av fördelarna och nackdelarna med implicit feedback, samt en beskrivning av hur dessa nackdelar kan hanteras. En prototyp som översatte användarbeteende till olika relevansröster och beräknade ett relevansvärde baserat på dessa relevansröster med hjälp av en algoritm, utvecklades. Denna prototyp testades sedan på en hemsida med verkliga användare under en begränsad tid. Resultatet från denna testperiod analyserades och gav slutsatsen att prototypen inte var perfekt, men att resultaten kunde förbättras med hjälp av finjusteringar av algoritmen. Prototypens precision, med avseende på vilka produkter algoritmen valde ut som relevanta, var dock bättre än dess sensitivitet.
On the ranking property and underlying dynamics of complex systems / Sur la propriété classement et dynamique sous-jacente des systèmes complexesDeng, Weibing 21 June 2013 (has links)
Des procédures de classement sont largement utilisées pour décrire les phénomènes observés dans de nombreux domaines des sciences sociales et naturelles, par exemple la sociologie, l’économie, la linguistique, la démographie, la physique, la biologie, etc.Dans cette thèse, nous nous sommes attachés à l’étude des propriétés de classement et des dynamiques sous-jacentes intégrées dans les systèmes complexes. En particulier,nous nous sommes concentrés sur les classements par score ou par prix dans les systèmes sportifs et les classements d’utilisation des mots ou caractères dans les langues humaines. Le but est de comprendre les mécanismes sous-jacents à ces questions en utilisant les méthodes de la physique statistique, de la statistique bayésienne et de la modélisation multi-agents. Les résultats concrets concernent les aspects suivants.Nous avons tout d’abord traité une étude sur les classements par score/prix dans les systèmes sportifs et analysé 40 échantillons de données dans 12 disciplines sportives différentes. Nous avons trouvé des similitudes frappantes dans différents sports, à savoir le fait que la répartition des résultats/prix suit les lois puissance universelles.Nous avons également montré que le principe de Pareto est largement respecté dans de nombreux systèmes sociaux: ainsi 20% des joueurs accumulent 80% des scores et de l’argent. Les données concernant les matchs de tennis en individuels nous ont révélé que lorsque deux joueurs s’affrontent, la probabilité que le joueur de rang supérieur gagne est liée à la différence de rang des deux adversaires. Afin de comprendre les origines de la mise à l’échelle universelle, nous avons proposé un modèle multi-agents,qui peut simuler les matchs de joueurs à travers différentes compétitions. Les résultats de nos simulations sont cohérents avec les résultats empiriques. L’extension du domaine d’étude de la simulation indique que le modèle est assez robuste par rapport aux modifications de certains paramètres. La loi de Zipf est le comportement le plus régulièrement observé dans la linguistique statistique. Elle a dès lors servi de prototype pour les relations entre rang d’apparitions et fréquence d’apparitions (relations rang-fréquence dans la suite du texte) et les lois d’échelle dans les sciences naturelles. Nous avons étudié plusieurs textes, précisé le domaine de validité de la loi de Zipf, et trouvé que la plage de validité augmente lors du mélange de différents textes. Basé sur l’analyse sémantique latente, nous avons proposé un modèle probabiliste, dans lequel nous avons supposé que les mots sont ajoutés au texte avec des probabilités aléatoires, tandis que leur densité a priori est liée, via la statistique bayésienne, aux caractéristiques générales du lexique mental de l’auteur de ce même texte. Notre modèle explique la loi de Zipf ainsi que ses limites de validité, et la généralise aux hautes et basses fréquences et au hapax legomena.Dans une autre étude, nous avons précisé les relations rang-fréquence pour les caractères chinois. Nous avons choisi d’étudier des textes courts en premier, car pour le bien de l’analyse rang fréquence, les longs textes ne sont que des mélanges de textes plus courts, thématiquement homogènes. Nos résultats ont montré que la loi de Zipf appliqués aux caractères chinois tient parfaitement pour des textes assez courts (quelques milliers de caractères différents). Le même domaine de validité est observé pour les textes courts anglais. Nous avons soutenu que les longs textes chinois montrent une structure hiérarchique à deux couches: des caractères dont la fréquence d’apparition suit une loi puissance (première couche) et des caractères dont l’apparition suit une loi exponentielle (deuxième couche)... / Ranking procedures are widely used to describe the phenomena in many differentfields of social and natural sciences, e.g., sociology, economics, linguistics, demography,physics, biology, etc. In this dissertation, we dedicated to study the ranking propertiesand underlying dynamics embedded in complex systems. In particular, we focused onthe scores/prizes ranking in sports systems and the words/characters usage ranking inhuman languages. The aim is to understand the mechanisms behind these issues byusing the methods of statistical physics, Bayesian statistics and agent-based modeling.The concrete results concern the following aspects.We took up an interesting topic on the scores/prizes ranking in sports systems, andanalyzed 40 data samples in 12 different sports fields. We found the striking similaritiesin different sports, i.e., the distributions of scores/prizes follow the universal powerlaws. We also showed that the data yielded the Pareto principle extensively observedin many social systems: 20% of the players accumulate 80% of the scores and money.For the tennis head-to-head data, we revealed that when two players compete, theprobability that the higher-ranked player will win is related to the rank difference ofthe two opponents. In order to understand the origins of the universal scaling, weproposed an agent-based model, which can simulate the competitions of players indifferent matches, and results from our simulations are consistent with the empiricalfindings. Extensive simulation studies indicate that the model is quite robust withrespect to the modifications of some parameters.Zipf’s law is the major regularity of statistical linguistics that served as a prototypefor the rank-frequency relations and scaling laws in natural sciences. We investigatedseveral English texts, clarified the valid range of Zipf’s law, and found this valid rangeincreases upon mixing different texts. Based on the latent semantic analysis, we proposeda probabilistic model, in which we assumed that the words are drawn into thetext with random probabilities, while their apriori density relates, via Bayesian statistics,to the general features of mental lexicon of the author who produced the text. Ourmodel explained the Zipf’s law together with the limits of its validity, its generalizationto high and low frequencies and hapax legomena. In another work, we specified the rank-frequency relations for Chinese characters. We chose to study the short texts first, since for the sake of the rank-frequency analysis,long texts are just mixtures of shorter, thematically homogenous pieces. Our resultsshowed that the Zipf’s law for Chinese characters perfectly holds for sufficiently shorttexts (few thousand different characters), and the scenario of its validity is similar tothat for short English texts. We argued long Chinese texts display a two-layer, hierarchicstructure: power-law rank-frequency characters (first layer) and the exponentialones (second layer). The previous results on the invalidity of the Zipf’s law for longtexts are accounted for by showing that in between of the Zipfian range and the regionof very rare characters (hapax legomena) there emerges a range of ranks, wherethe rank-frequency relation is approximately exponential. From comparative analysisof rank-frequency relations for Chinese and English, we suggested the characters playfor Chinese writers the same role as the words for those writing within alphabeticalsystems.
Flight Sorting Algorithm Based on Users’ BehaviourBen, Qingyan January 2021 (has links)
The model predicts the best flight order and recommend best flight to users. The thesis could be divided into the following three parts: Feature choosing, data-preprocessing, and various algorithms experiment. For feature choosing, besides the original information of flight itself, we add the user’s selection status into our model, which the flight class is, together with children or not. In the data preprocessing stage, data cleaning is used to process incomplete and repeated data. Then a normalization method removes the noise in the data. After various balancing processing, the class-imbalance data is corrected best with SMOTE method. Based on our existing data, I choose the classification model and Sequential ranking algorithm. Use price, direct flight or not, travel time, etc. as features, and click or not as label. The classification algorithms I used includes Logistic Regression, Gradient Boosting, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. In addition, we also adopted Sequential ranking algorithm. The results show that Random Forest-SMOTE performs best with AUC of ROC=0.94, accuracy=0.8998. / Modellen förutsäger den bästa flygordern och rekommenderar bästa flyg till användarna. Avhandlingen kan delas in i följande tre delar: Funktionsval, databehandling och olika algoritms experiment. För funktionsval, förutom den ursprungliga informationen om själva flygningen, lägger vi till användarens urvalsstatus i vår modell, vilken flygklassen är , tillsammans med barn eller inte. Datarengöring används för att hantera dubbletter och ofullständiga data. Därefter tar en normaliserings metod bort bruset i data. Efter olika balanserings behandlingar är SMOTE-metoden mest lämplig för att korrigera klassobalans flyg data. Baserat på våra befintliga data väljer jag klassificerings modell och sekventiell ranknings algoritm. Använd pris, direktflyg eller inte, restid etc. som funktioner, och klicka eller inte som etikett. Klassificerings algoritmerna som jag använde inkluderar Logistic Regression, Gradient Boost, KNN, Decision Tree, Random Forest, Gaussian Process Classifier, Gaussian NB Bayesian and Quadratic Discriminant Analysis. Dessutom antog vi också Sequential ranking algoritm. Resultaten visar att Random Forest-SMOTE presterar bäst med AUC för ROC = 0.94, noggrannhet = 0.8998.
Étude de la médiane de permutations sous la distance de Kendall-TauMilosz, Robin 12 1900 (has links)
La distance de Kendall-τ compte le nombre de paires en désaccord entre deux permuta-
tions. La distance d’une permutation à un ensemble est simplement la somme des dis-
tances entre cette permutation et les permutations de l’ensemble. À partir d’un ensemble
donné de permutations, notre but est de trouver la permutation, appelée médiane, qui
minimise cette distance à l’ensemble.
Le problème de la médiane de permutations sous la distance de Kendall-τ, trouve
son application en bio-informatique, en science politique, en télécommunication et en
Ce problème d’apparence simple est prouvé difficile à résoudre. Dans ce mémoire,
nous présentons plusieurs approches pour résoudre le problème, pour trouver une bonne
solution approximative, pour le séparer en classes caractéristiques, pour mieux com-
prendre sa compléxité, pour réduire l’espace de recheche et pour accélérer les calculs.
Nous présentons aussi, vers la fin du mémoire, une généralisation de ce problème et nous
l’étudions avec ces mêmes approches.
La majorité du travail de ce mémoire se situe dans les trois articles qui le composent
et est complémenté par deux chapitres servant à les lier. / The Kendall-τ distance counts the number of pairwise disagreements between two
permutations. The distance between a permutation and a set is simply the sum of the
distances between the considered permutation and the permutations of the set. Given a
set of permutations, we want to find the permutation, called median, that minimise that
distance to the set.
The problem of finding a median of permutations under the Kendall-τ distance, finds
applications in bioinformatics, political science, telecommunications and optimization.
This simple appearing problem is proven difficult to solve. In this master thesis, we
present a few approaches to solve the problem, to find a good approximate solution, to
separate it into caracteristic classes, to deepen our understanding of its complexity, to
reduce the search space and to accelerate calculations. We also present, at the end of this
thesis, a generalization of this problem and we study it with the same approaches.
The majority of the work in this thesis is located in the three papers which compose
it and is complemented by two chapters, that bound them all together.
Σχεδόν πλήρως αναλυόμενα στοχαστικά συστήματα και εφαρμογές / Nearly completely decomposable stochastic systems and applicationsΝικολακόπουλος, Αθανάσιος Ν. 11 June 2013 (has links)
Το θέμα της παρούσας μεταπτυχιακής διπλωματικής εργασίας είναι η εφαρμογή της θεωρίας των Σχεδόν Πλήρως Αναλυόμενων Στοχαστικών Συστημάτων (Nearly Completely Decomposable) σε μία σειρά προβλημάτων στα οποία παραδοσιακές προσεγγίσεις αποδεικνύονται ερμηνευτικά στείρες και υπολογιστικά κοστοβόρες. Στο πρώτο μέρος της διπλωματικής αφού κάνουμε μία διαισθητικού τύπου παρουσίαση της ιδέας της decomposability και συνοψίσουμε τα απαραίτητα στοιχεία του θεωρητικού υποβάθρου που χρησιμοποιούμε στα πλαίσια της εργασίας, παραθέτουμε τονπυρήνα της θεωρίας της decomposability, όπως αυτή θεμελιώνεται μαθηματικά από τον Courtois στην κλασική του μονογραφία. Τέλος, παραθέτουμε και μία υλοποίηση του KMS αλγορίθμου Συσσωμάτωσης/Αποσυσσωμάτωσης, για τη λύση NCD συστημάτων.
Το δεύτερο μέρος του συγγράμματος, είναι αφιερωμένο στην εφαρμογή της NCD σε δύο ενδιαφέροντα προβλήματα εκτίμησης απόδοσης υπολογιστικών συστημάτων. Συγκεκριμένα, μελετούμε μία ιδιότυπη ουρά που εξυπηρετεί πελάτες διαφορετικών κλάσεων, με τις ανά κλάση αφίξεις να χαρακτηρίζονται από εναλλαγές μεταξύ περιόδων ηρεμίας και κινητικότητας και την εξυπηρέτηση να γίνεται σε δέσμες πελατών της ίδιας κλάσης. Το κίνητρο για τη μελέτη αυτής της ουράς εντοπίζεται στη bursty φύση της μεταγωγής πακέτων στα σύγχρονα δίκτυα αλλά και στους reassembly buffers των multicluster πολυεπεξεργαστικών συστημάτων. Η ανάλυση της ουράς με παραδοσιακές τεχνικές οδηγεί αναπόφευκτα σε μαρκοβιανή αλυσίδα πολύ μεγάλου χώρου κατάστασης. Εμείς, ξεκινάμε από το πλήρες στοχαστικό μητρώο και αφού διαμερίσουμε κατάλληλα το χώρο καταστάσεων, αποδεικνύουμε ικανές συνθήκες υπό τις οποίες το αρχικό σύστημα είναι δυνατόν να αναλυθεί σε πολλαπλά επίπεδα υποσυστημάτων, η αυτόνομη ανάλυση των οποίων δίνει μία πολύ καλή προσέγγιση της στάσιμης κατανομής του αρχικού συστήματος. Επίσης, παραθέτουμε και αποδεικνύουμε μία ικανή συνθήκη για μηδενικό σφάλμα προσέγγισης και την ερμηνεύουμε σε όρους προδιαγραφών του προβλήματος. Τέλος, θεωρούμε μία ειδική συμμετρική εκδοχή για την οποία καταφέρνουμε να δώσουμε μία κλειστή έκφραση της κατανομής πληρότητας της ουράς συναρτήσει της λύσης των υποσυστημάτων.
Για να δείξουμε την απλοποίηση της ανάλυσης που επιφέρει η χρήση του NCD μοντέλου θεωρούμε ένα σενάριο για το οποίο προχωρούμε την ανάλυση σε βάθος και καταφέρνουμε να εξάγουμε χρήσιμες μετρικές στις οποίες, σε αντίθετη περίπτωση, θα ήταν ιδιαίτερα επίπονο να καταλήξει κανείς. Συγκεκριμένα, υπολογίζουμε την πιθανότητα blocking και δείχνουμε πως αυτή μειώνεται σχεδόν εκθετικά με το μέγεθος της ουράς. Βλέπουμε τελικά πως η εκμετάλλευση της NCD ιδιότητας από τη μία διευκολύνει την ανάλυση και από την άλλη παρέχει ανεκτίμητη διαίσθηση σχετικά με τη μεταβατική συμπεριφορά του συστήματος προς την κατάσταση στατιστικής ισορροπίας.
Το δεύτερο μέρος της διπλωματικής κλείνει με τη μελέτη κριτηρίων υπό τα οποία, πολυεπεξεργαστικά συστήματα που χωρίζονται σε ομάδες ισχυρά αλληλεπιδρώντων επεξεργαστών, μπορούν να αναλυθούν με χρήση της θεωρίας NCD. Είναι γνωστό πως στα δίκτυα ουρών αναμονής συγκρίσιμων ρυθμών εξυπηρέτησης, η NCD του μητρώου πιθανοτήτων δρομολόγησης συνεπάγεται την NCD του δικτύου. Εμείς, θεωρούμε μία ειδική περίπτωση τέτοιων συστημάτων για την οποία δείχνουμε ένα, εύκολο να ελεγχθεί, κριτήριο για NCD. Τέλος, εξετάζουμε βαθύτερα το σφάλμα της προσέγγισης, και χρησιμοποιώντας ένα πρόσφατο αποτέλεσμα της θεωρίας των σχεδόν ασύζευκτων μαρκοβιανών αλυσίδων δίνουμε έναν επιπλέον ποιοτικό περιορισμό που πρέπει να ικανοποιούν τα εν λόγω συστήματα για να πάρει κανείς ικανοποιητική προσέγγιση από την ανάλυσή τους σε ανεξάρτητα block.
Στο τρίτο μέρος της παρούσας εργασίας, εξετάζουμε την εφαρμογή της NCD στο πρόβλημα της κατάταξης ιστοσελίδων. Η πρόσφατη έρευνα έχει σχολιάσει την ειδική δομή του στοχαστικού μητρώου που προκύπτει από το γράφο του διαδικτύου· συγκεκριμένα, οι τοπολογικές ιδιότητες της αυτοoργάνωσης του Ιστού φαίνεται να παράγουν ένα στοχαστικό μητρώο με NCD δομή. Εμείς, αφού παραθέσουμε μία σύνοψη των μαθηματικών πίσω από τον αλγόριθμο PageRank, σχολιάζουμε και δικαιολογούμε διαισθητικά την NCD δομή του Ιστού αλλά και τη φύση των υποσυστημάτων. Τέλος, προτείνουμε έναν νέο αλγόριθμο κατάταξης με το όνομα NCDawareRank, o οποίος εκμεταλλεύεται την NCD ιδιότητα για να πετύχει ποιοτικότερο και ταχύτερο ranking. Μάλιστα, δίνουμε δύο εκδοχές του αλγορίθμου, μία σειριακή και μία παράλληλη, η οποία εκμεταλλεύεται την NCD του Ιστού και υπολογιστικά. Τα οφέλη που υπόσχεται ο NCDawareRank τα επιβεβαιώνουμε και πειραματικά εκτελώντας μία σειρά από πειράματα τόσο σε τεχνητά όσο και σε πραγματικά δεδομένα, αντιπαραβάλλοντας τα αποτελέσματα μας με αυτά του αλγορίθμου PageRank. O NCDawareRank φαίνεται μάλιστα να δίνει λύση σε ένα γνωστό πρόβλημα του PageRank: αυτό της μεροληψίας εναντίον νεοεισερχομένων σελίδων. Άλλο ένα, τέλος, παράπλευρο όφελος του αλγορίθμου NCDawareRank είναι αυτό της Levelwise κατάταξης, η οποία εκτός της σημασίας που έχει αφεαυτής, μπορεί να υποδείξει εξυπνότερο crawling ή ακόμα και αποδοτικότερα σχήματα ευρετηριοποίησης του Ιστού.
Στο τέταρτο και τελευταίο μέρος της διπλωματικής εφαρμόζουμε την NCD στην εύρεση των στοχαστικά ευσταθών καταστάσεων μίας κατηγορίας εξελικτικών παιγνίων στα οποία εμφανίζονται πολυεπίπεδες στρατηγικές δυναμικές. Αφού παραθέσουμε κάποιες πρόσφατες παρατηρήσεις από τη βιβλιογραφία της οικονομετρίας σχετικά με την αξιοποίηση της NCD στην προσεγγιστική ανάλυσή τους, αποδεικνύουμε συνθήκες υπό τις οποίες είναι δυνατόν να πετύχει κανείς ακριβή ανάλυση. / The purpose of this master’s thesis is the application of the theory of Nearly Completelely
Decomposable stochastic systems to a number of interesting problems for which tra-
ditional techniques turn out to be both intuitively unappealing and computationally in-
In the first part of this work, after introducing, the concept of decomposability in
an intuitive way and summarizing the essential elements of the theoretical background
that is necessary to follow the rest of the text, we present the fundamental mathematical
principles of NCD as established by Courtois in his classic monograph. Finally, we give
an implementation of the KMS iterative aggregation/disaggregation algorithm which is
commonly used for the solution of NCD systems.
The second part of the dissertation is devoted to the application of NCD to two inter-
esting problems of Computer Systems Performance Evaluation. Specifically, we study an
uncommon discrete time queue that serves customers from different classes, with the ar-
rivals of each class characterized by alternating busy and idle periods. The service is done
in batches of customers of the same class. The motivation behind the study of this queue,
lies in the bursty nature of packet switching, as well as in the modern reassembly buffers
of multicluster multiprocessor systems. The traditional analysis techniques of this queue
inevitably lead to Markov chains with very large state space. We begin with the complete
stochastic matrix and after careful partitioning of the state space, we give sufficient condi-
tions under which the original system can be analysed through multi level decomposition
into subsystems, the autonomous analysis of which results in a very good approximation
to the stationary distribution of the original system. Furthermore, we present and prove a
sufficient condition for an error-free approximation and we give an interpretation of this
condition in terms of the specifications of the problem. Finally, we consider a special sym-
metric version of the problem, for which we manage to derive a closed-form expression
for the queue’s occupancy distribution as a function of the steady state probabilities of the
To demonstrate the simplification of the analysis brought by the NCD model, we con-
sider a scenario in which we proceed to an in depth analysis and we manage to extract
useful metrics the derivation of which, would be considerably harder without exploiting
NCD. Specifically, we calculate the blocking probability and we show that it decreases
almost exponentially with the size of the queue. From our analysis, it is clear that the
exploitation of the NCD model increases significantly our ability to understand the dy-
namics of our system and to interpret aspects of its transient behaviour towards statistical
The second part of this work ends with the study of criteria under which multipro-
cessing systems, that can be divided into groups of strongly interacting processors, can be
analysed using the theory of NCD. It is known that in queueing networks with servers of
comparable service rates, the NCD of the routing probability matrix implies the NCD of
the network. We consider a special case of such systems and we derive an easy to check
criterion for NCD. Finally, we look deeper into the error analysis of this approach, and
using a recent result from the theory of nearly uncoupled Markov chains, we give an addi-
tional qualitative constrain to be met by these systems in order to get a good approximation
of their analysis into independent blocks.
In the third part of this paper, we examine the application of NCD to the problem of
ranking websites. Recent research has commented on the special structure of the stochastic
matrix which corresponds to the web-graph. In particular, the topological properties of the
Web seems to produce a NCD stochastic matrix. Here, after presenting briefly the mathe-
matical basis of PageRank, we give a linear algebraic as well as an intuitive justification of
the NCD Web structure and we discuss the nature of the subsystems. Finally, we propose
a new ranking algorithm named NCDawareRank, which exploits NCD in order to achieve
a fairer and faster ranking. Indeed, we give two versions of the algorithm, one serial and
one parallel, in which we take advantage of the computational benefits of NCD as well.
The advantages of NCDawareRank are then confirmed experimentally through a series of
tests on both, artificial and real data. NCDawareRank seems to solve a known problem of
PageRank: the bias against new websites. Finally, another side benefit of our algorithm is
that it makes it easy to extract a level-wise ranking, which besides its importance in itself,
may indicate smarter crawling or even more sophisticated and efficient indexing schemes
of the Web.
Finally, in the fourth part of this work we apply NCD to the problem of finding
the stochastically stable states of a class of evolutionary games which involve multilevel
strategic dynamics. After presenting some interesting recent results coming from the lit-
erature of econometrics, we give conditions under which it is possible to get the exact
stochastically stable states through the use of NCD.
Attitudes, habits, norms and policies regarding co-authorship among forest scientists in BrazilSenna da Costa, Mariano 06 July 2018 (has links)
This research is a result of a continuous and systematic investigation of collaborative practices in science over the last ten years, which started through the elaboration of my master thesis (Scientific information on environmental issues in the age of digital media, ISNM - Lübeck Universität / 2006) / Um Kernfragen zur Mehrautorenschaft in einer bestimmten Zielgruppe zu klären, konzentriert sich diese Arbeit auf Aspekte von technologischer Kompetenz, menschlicher Interaktion und institutioneller Leitlinien. Zuerst werden interdisziplinäre Argumente in Bezug zu Mehrautorenschaft aus den Sozialwissenschaften, Naturwissenschaften, Informatik und Geisteswissenschaften präsentiert.
Die Literaturübersicht enthält Statistiken zu Informationsnutzung, Beschreibung von Strategien des Wissensmanagements, Erforschung von Verhaltensmustern und Trends in der Kommunikationstechnologie, sowie Diskussionen einiger historischer, politischer und inhaltlicher Aspekte, welche die Anwendung des Internet als kollaboratives Werkzeug im akademischen Kontext beeinflussen können.
Die Arbeit beschäftigt sich auch mit einigen Kontroversen zur Konzeption von Wissenschaft und wissenschaftlicher Praktiken, welche indirekt mit der Problematik von wissenschaftlicher Kommunikation und Zusammenarbeit, sowie Wissensproduktion in Zusammenhang stehen, insofern sie die Produktion Texten mit mehreren Autoren betreffen.
Ein besonderer Schwerpunkt der Arbeit befasst sich mir dem zur Zeit vorherrschenden System zur Evaluation akademischer Publikationen (Bibliometrie oder Scientometrie; QUALIS und SCIELO Systeme). Das vorhandene System für die Evaluation von Autoren ist in der Regel unfair /voreingenommen. Das liegt daran, das Statistiken leicht manipuliert werden können um einer bürokratischen und unternehmerischen Agenda zu folgen oder individuelle Interessen darzustellen, anstatt die wirklichen Verdienste eines Autors widerzuspiegeln.
Die Untersuchung wurde anhand von semi-strukturierten Interviews durchgeführt, in Kombination mit einer quantitativen Erhebung, welche drei miteinander verbundene Aspekte (technologische, institutionelle und kulturelle), die bei der in Mehrautorenschaft eine Rolle spielen, innerhalb des Graduiertenprogramms in 'Forest Engineering' an der Universidade Federal do Paraná (Brasilien) hervorheben sollte. / In order to verify core issues for co-authorship in a specific audience, the current work focus on technological literacy, human interaction, and institutional policy. It first presents an interdisciplinary collection of arguments from social sciences, natural sciences, computer sciences, and humanities about scientific collaboration, especially regarding co-authorship activities.
This literature review includes statistics on information usage, description of knowledge management strategies, exploration of behavioral patterns, communication technology trends, and discussions of some historical, political and contextual elements that may be influencing the application of the Internet as a collaborative tool within academic contexts.
It also draws back few controversies about the concept of science and its practices, which are indirectly related to the problematic of scholarly communication, scientific collaboration, and knowledge production. The investigation targets these activities in what they concern the production of co-authored texts.
A special focus of this work targets the current mainstream system of academic publishing ranking and evaluation (Bibliometrics or Scientometrics; QUALIS and SCIELO systems). The existing measurement system for the ranking of authors is generally an unfair/biased system, as statistics can easily be manipulated by a bureaucratic and corporate agenda, or by individual interests, rather than representing the real merit of an author.
The inquiry applies a semi-structured in-depth interview combined with a quantitative survey intending to reveal three interrelated aspects (Technological, Institutional, and Cultural) involved in co-authorship activities within the Graduate Program in Forest Engineering at the Federal University of Paraná/Brazil.
