Spelling suggestions: "subject:"nurse"" "subject:"curse""
141 |
Sources of Errors and Biases in Traffic Forecasts for Toll Road ConcessionsNúñez, Antonio 05 December 2007 (has links) (PDF)
The objective of this thesis is to study the sources of discrepancy between the actual traffic in motorways under concession schemes and the traffic forecast ex-ante. The demand forecast for a specific project is the main variable influencing its realization. From a public sector perspective, socio-economic evaluations are driven by demand forecasts, which gives the basis for choose and hierarchy public projects in order to maximise social welfare. From a private sector perspective, traffic forecasts are the base of financial evaluation and toll setting.Despite its importance and the numerous and important developments in the field, the differences of forecast and ex-post traffic are usually very high. Some recent studies show that differences as big as 20% are much more the rule than the exception.A huge amount of uncertainty is associated with the forecasting exercise. First because transport is a derived demand and depends on many exogenous variables, also uncertain; because modelling is and simplification exercise, implies many assumptions and rely on field data, many times incomplete or of low quality; moreover, modelling human (in this case users) behaviour is always a dangerous enterprise.Although these arguments could explain at least the larger part of errors associated with forecasts, one can wonder whether the agents implicated in the forecast would or could use this uncertainty strategically in their favour. In a competition for the field scheme (bids), the bidder may overestimate the demand in order to reduce the toll included in the bid. This strategic behaviour can introduce a high bias in forecasts. Also, overoptimistic (or overpessimistic) forecasters may introduce a bias in the forecast.We propose to focus in turn on the three main groups of agents involved in the demand forecast process. The forecasters, the project promoters and the users. Study all the issues related to them would be a too ambitious (or more concretely impossible) task. We then focus on some particular issues related to the modelling of the actors' behaviour in the context of the demand forecast for toll roads.Regarding the forecaster behaviour, we present the results of the first large sample survey on forecasters' perceptions and opinions about forecasting demand for transport projects, based on an on-line survey. We first describe the main characteristics of forecasters. We then describe the last forecast forecasters prepared. We turn to the models forecasters apply, the errors they declare on past forecasts and the main sources of errors according to them. We then describe the forecast environment in terms of pressure forecasters receive. These unique results provide a picture of the world of forecasters and forecasts, allowing for a better understanding of them. We turn then to the study of the optimism and overconfidence in transport forecasts. Optimism and overconfidence in general are recognized human traits. We analyze the overoptimistic bias by comparing the distribution of stated errors with actual errors found in literature; we also compare the own skilful of subjects in doing forecasts with studies showing self-evaluations of a common skill - driving. We finally propose a regression of the competence, quality and errors on the main forecasters' and projects' specific variables.Results show that the distribution of errors transport forecasters state has a smaller average magnitude and a smaller variance than those found in literature. Comparing forecasters perception of their own competence with the results found in literature about drivers skill self-evaluation, however, we could not find a significant difference, meaning that the forecasters' overconfidence is in line with what could be viewed as a normal human overconfidence level.The pressure for results forecasters receive and the strategic manipulation they affirm exist merit a special attention. They imply that while forecasters' behavioural biases may exist and should be take in account when evaluation forecasts, the project promoter may influence forecasts by pressuring the forecasters to produce results which better fit his expectancies.We then study the bidders' strategic behaviour in auctions for road concessions. We address three questions in turn. First, we investigate the overall effects of the winner's curse on bidding behaviour in such auctions. Second, we examine the effects of the winner's curse on contract auctions with differing levels of common-value components. Third, we investigate how the winner's curse affects bidding behaviour in such auctions when we account for the possibility for bidders to renegotiate. Using a unique, self-constructed, dataset of 49 worldwide road concessions, we show that the winner's curse effect is particularly strong in toll road concession contract auctions. Thus, we show that bidders bid less aggressively in toll road concession auctions when they expect more competition. We observe that this winner's curse effect is even larger for projects where the common uncertainty is greater. Moreover, we show that the winner's curse effect is weaker when the likelihood of renegotiation is higher. While the traditional implication would be that more competition is not always desirable when the winner's curse is particularly strong, we show that, in toll road concession contract auctions, more competition may be always desirable. Modelling aggregated users' behaviour, we study the long term traffic maturity. We argue that traffic maturity results from decreasing marginal utility of transport. The elasticity of individual mobility with respect to the revenue decreases after a certain level of mobility is reached. In order to find evidences of decreasing elasticity we analyse a cross-section time-series sample including 40 French motorways' sections. This analysis shows that decreasing elasticity can be observed in the long term. We then propose a decreasing function for the traffic elasticity with respect to the economic growth, which depends on the traffic level on the road. Although “unconditional” decreasing elasticities were already proposed in the literature, this is the first work, as far as we know, putting this idea in evidence and giving it a functional form. This model provides better interpretation of the coupling between traffic and economic growth, and a better long-term forecast. From the disaggregate perspective, we study the main individual modal choice variable, the value of time. The value of travel time savings is a fundamental concept in transport economics and its size strongly affects the socio-economic evaluation of transport schemes. Financial assessment of tolled roads rely upon the value of time as the main (or even the unique) willingness to pay measure. Values of time estimates, which primarily represent behavioural values, as then increasingly been used as measures of out-of-pocket money. In this setting, one of the main issues regarding the value of time is its distribution over the population. We apply the Logit, the Mixed Logit and the Bayesian Mixed Logit models to estimate the value of time in freight transport in France. Estimations with mixed logit faced many difficulties, as expected. These difficulties could be avoided using the Bayesian procedures, providing also the opportunity of properly integrating a priori beliefs. Results show that 1) using a single constant value of time, representative of an average, can lead to demand overestimation, 2) the estimated average value of time of freight transport in France is about 45 Euro, depending on the load/empty and hire/own account variables, which implies that 3) the standard value recommended in France should be reviewed upwards.
|
142 |
Die Methode von Smolyak bei der multivariaten Interpolation / Smolyak's method for multivariate interpolationSchreiber, Anja 22 June 2000 (has links)
No description available.
|
143 |
Breaking the Weak Governance Curse: Global Regulation and Governance Reform in Resource-rich Developing CountriesFerreira, Patricia 11 December 2012 (has links)
There is growing consensus that unless resource-rich developing countries improve their domestic governance systems, rising exploitation of mineral, oil and gas resources may result in long-term adverse developmental outcomes associated with the “resource curse”. Despite the consensus, reforms do not abound. This dissertation investigates the obstacles to such reforms, and the mechanisms and strategies that can possibly overcome these obstacles.
I argue that two trapping mechanisms are binding these countries to a “weak governance curse”. One mechanism is the phenomenon of path dependence, which makes a dysfunctional governance path initiated at a past historical juncture resistant to change over time. The other mechanism is rent-seeking behaviour associated with high resource rents, which creates perverse incentives for political and economic actors to resist reforms.
The Law and Development literature has recently produced a rich body of knowledge on governance reform in developing countries, yet it has largely neglected the potential role of innovative global regulatory mechanisms, beyond development assistance, in this process. I argue that this evolving literature ought to draw from global regulation studies to investigate the interaction between unconventional global regulatory mechanisms and domestic governance reform. In this thesis I analyze whether extraterritorial home country regulations, such as anti-bribery, anti-money laundering and securities disclosure regulations, and transnational public-private partnerships, such as the Extractive Industries Transparency Initiative, may offer institutional opportunities for external and internal actors to facilitate policy reforms in resource-rich and governance-poor countries.
My conclusion is twofold. First, there is reason for cautious optimism regarding the potential for unconventional global regulatory mechanisms to provoke positive feedback effects in domestic governance reform. These mechanisms can open innovative institutional pathways of influence to outsiders and insiders promoting governance reform. Second, instead of searching for a regulatory silver bullet, the most promising way to promote reforms in resilient dysfunctional governance systems is to make use of the wide range of conventional and unconventional mechanisms available. A constellation of regulatory instruments opens up the possibility for outside and inside reformers to benefit from a different policy mix of available mechanisms, depending on the specific circumstances of a given country at a particular time.
|
144 |
Breaking the Weak Governance Curse: Global Regulation and Governance Reform in Resource-rich Developing CountriesFerreira, Patricia 11 December 2012 (has links)
There is growing consensus that unless resource-rich developing countries improve their domestic governance systems, rising exploitation of mineral, oil and gas resources may result in long-term adverse developmental outcomes associated with the “resource curse”. Despite the consensus, reforms do not abound. This dissertation investigates the obstacles to such reforms, and the mechanisms and strategies that can possibly overcome these obstacles.
I argue that two trapping mechanisms are binding these countries to a “weak governance curse”. One mechanism is the phenomenon of path dependence, which makes a dysfunctional governance path initiated at a past historical juncture resistant to change over time. The other mechanism is rent-seeking behaviour associated with high resource rents, which creates perverse incentives for political and economic actors to resist reforms.
The Law and Development literature has recently produced a rich body of knowledge on governance reform in developing countries, yet it has largely neglected the potential role of innovative global regulatory mechanisms, beyond development assistance, in this process. I argue that this evolving literature ought to draw from global regulation studies to investigate the interaction between unconventional global regulatory mechanisms and domestic governance reform. In this thesis I analyze whether extraterritorial home country regulations, such as anti-bribery, anti-money laundering and securities disclosure regulations, and transnational public-private partnerships, such as the Extractive Industries Transparency Initiative, may offer institutional opportunities for external and internal actors to facilitate policy reforms in resource-rich and governance-poor countries.
My conclusion is twofold. First, there is reason for cautious optimism regarding the potential for unconventional global regulatory mechanisms to provoke positive feedback effects in domestic governance reform. These mechanisms can open innovative institutional pathways of influence to outsiders and insiders promoting governance reform. Second, instead of searching for a regulatory silver bullet, the most promising way to promote reforms in resilient dysfunctional governance systems is to make use of the wide range of conventional and unconventional mechanisms available. A constellation of regulatory instruments opens up the possibility for outside and inside reformers to benefit from a different policy mix of available mechanisms, depending on the specific circumstances of a given country at a particular time.
|
145 |
Impact of a Large Scale Mine Development on the National Economy of Fiji -Issues raised by the proposed Namosi mine-Yoshitaka Hosoi Unknown Date (has links)
Minerals are important natural resources and their development is a historically old, yet new, idea for creating economic prosperity in developing countries. Various researchers have evolved several arguments regarding the impact of mineral resources on development and growth, but they have yet to furnish a practical method of economic evaluation of mineral resources development. This thesis focuses on the economic impact of mineral resource development in a small developing country in the South Pacific Region, namely Fiji. Fiji has expectations and faces challenges in its natural resources development. The Namosi project, a large copper-gold mine development, has been proposed and is under consideration by the Fijian government, who is deliberating on whether mining resources should be developed as a means to add to its prosperity and economic growth or alternatively conserved from the standpoint of the environment and stability. In this study, four significant issues are analyzed viz.: 1) Whether the Namosi mine development project gives a positive net private return. 2) Whether the predicted amount of revenue flowing to the Fijian government from the Namosi mine development exceeds the estimated external cost (in this case, environmental cost) from its development. 3) The impacts of the project on various levels of the Fijian economy, and whether the mine development in Fiji results in an enclave industry; and whether mining has strong or weak backward and forward production linkages with the rest of the Fijian economy. 4) Whether “Dutch disease” will ensue from mining development in Fiji and its level of severity. Regarding issue 1) above, Private Cost-Benefit Analysis (CBA) is conducted by applying the Discounted Cash Flow (DCF) method to evaluate the Namosi mining project based on financial projections. Furthermore, sensitivity analysis is conducted in order to allow for possible variations in copper and gold prices. This analysis indicates that given the anticipated metal prices, private returns from this mining development are likely to be positive. Indeed, the current high metal prices would lead to high private returns. Regarding issue 2) above, Social Cost-Benefit Analyses are attempted. Under the given circumstances, the results show that the benefits of the mine project, as a whole for its 29-year life, substantially outweigh the environmental costs of the project to Fiji. However, due to a lack of available data on the economic magnitude of environmental spillovers, only estimates of environmental costs of the Namosi mining development could be made. Regarding issue 3) above, Input-Output model analysis is performed. Fiji’s total output (without production from the Namosi mine) is found to be F$5,529.917 million. It is estimated that the Namosi project will increase the output of Fiji directly by F$465.574 million (which includes the production inducement effect) and will result in an increase of F$543.788 million in overall Fijian output (GDP). This increase will also be followed by an increased output of about F$10-30 million in related industries, such as in the commerce, transport, and insurance sectors. Based on this Input-Output analysis, it is found that Fiji’s mining sector is an export-oriented enclave industry and that the mining industry itself has very little influence on economic activity in other sectors of the economy. Regarding issue 4) above, the Computable General Equilibrium (CGE) model analysis is applied. Evidence of the likely occurrence of Dutch disease can be detected from output indicators of each industry, consumer prices and exports. Examples of Dutch disease are as follows: a decrease in output of agricultural industries and in export-oriented domestic industries; an increase in consumer prices (inflation); a decrease of exports both in exportable agricultural products and in manufactured products oriented to exports. However, several macro-variables improve, such as employees’ income, trade (exports and imports), tax revenue, tariff revenue, VAT revenue, government account (savings and expenditure) and GDP etc. These results suggest that there could be a major increase in national welfare. Thus, from an economics point of view, it has been found (by comparing gains in Fijian government revenue with potential Fijian environmental costs) that it is very likely that development of the Namosi mine will result in a net social gain to Fiji. These results are based on the application of principles of social cost-benefit analysis and indicate that a Kaldor-Hicks improvement (a potential Pareto improvement) is likely for Fiji as a result of the mining development. This means that from the predicted net revenue gains of the Fijian government from mining, those who suffer environmental losses would be compensated and the government would still have some extra revenue left over. An actual Paretian improvement is also possible.
|
146 |
Αποδοτική οργάνωση και διαχείριση πολυδιάστατων αντικειμένων για την ανακάλυψη γνώσηςΚροτοπούλου, Αικατερίνη 11 January 2011 (has links)
Ο σκοπός αυτής της διατριβής είναι η ανεύρεση μεθόδων αποδοτικής οργάνωσης και διαχείρισης πολυδιάστατων αντικειμένων (multi-dimensional objects) προκειμένου να ανακαλυφθεί χρήσιμη γνώση. Αρχική αφορμή για αυτή τη μελέτη αποτέλεσαν οι ανάγκες μιας απαιτητικής εφαρμογής με σκοπό τη χαρτογράφηση του ανθρώπινου εγκεφάλου προκειμένου να εντοπιστούν επιληπτικές εστίες. Οι απαιτήσεις Αναπαράστασης και Διαχείρισης των Δεδομένων του Εγκεφάλου, έφεραν στην επιφάνεια δύο κεντρικά ερευνητικά προβλήματα:
- Τις ιδιαιτερότητες των πολύπλοκων, μη-ομοιογενών, δικτυακών μερικές φορές, τρισδιάστατων αντικειμένων (τμημάτων του εγκεφάλου – brain objects).
- Την ανάγκη για αποτελεσματική διαχείριση-χρήση γνωστών αλλά και παραγόμενων εξαρτήσεων δεδομένων και γνώσης (data and knowledge dependencies), η οποία μπορεί να αναβαθμίσει την απόδοση και τη δυναμική της εφαρμογής. Το μεγαλύτερο μέρος της μελέτης που αφορούσε αυτό το πρόβλημα, οδήγησε σε :
- Διερεύνηση θεμάτων ανεύρεσης ομοιοτήτων (similarity search). Καθώς η συγκεκριμένη περιοχή διαθέτει μεγάλο εύρος εφαρμογών αλλά και ανοικτών προβλημάτων, αποτέλεσε τελικά μεγάλο μέρος της παρούσας διατριβής.
Δεδομένου ότι πολλά από τα γεωμετρικά χαρακτηριστικά των δεδομένων αλλά και από τις εξαρτήσεις γνώσης που αφορούν τον ανθρώπινο εγκέφαλο, συναντώνται – καθ’ολοκληρία ή τμηματικά – σε πλήθος σύγχρονων πολυμεσικών (multimedia) εφαρμογών, τα παραπάνω προβλήματα εντάσσονται στα βασικά προβλήματα της έρευνας του τομέα των Βάσεων Δεδομένων.
Επικεντρώνοντας την έρευνά στα παραπάνω προβλήματα, καταλήξαμε:
• στον ορισμό νέων ευέλικτων τύπων δεδομένων, εννοιών και μοντέλων καθώς και εργαλείων και μεθόδων ταξινόμησης δεδομένων και γνώσης (βάση δεδομένων BDB και μοντέλα 3D-IFO και MITOS) οι οποίες οργανώνουν πιο ευέλικτα και αποδοτικά τα δεδομένα μας, με τρόπους που όχι μόνο κάνουν την πρόσβασή τους ευκολότερη αλλά αξιοποιούν παράλληλα τις ‘κρυμμένες’ μεταξύ τους σχέσεις για την άντληση επιπλέον γνώσης.
• στον ορισμό νέων μεθόδων και δέντρων αναζήτησης, για :
o τον αποδοτικό εντοπισμό τμηματικών ομοιοτήτων (partial similarity) ανάμεσα σε πολυδιάστατα αντικείμενα (Lui k-n-match και INTESIS)
o την εξάλειψη της μεγάλης πτώσης της απόδοσης των δέντρων με την αύξηση των διαστάσεων των αντικειμένων (‘dimensionality curse’) (δομή Digenis).
o την ανεύρεση χαρακτηριστικών/διαστάσεων με παρόμοια εξέλιξη στην πορεία του χρόνου – για πολυδιάστατα κυρίως αντικείμενα – με σκοπό τη μελέτη πιθανής αλληλεπίδρασής τους.
Γενικά, η παρούσα μελέτη αποτελείται από δύο βασικά μέρη, τα οποία αναφέρονται σε δύο περιοχές με μεγάλη αλληλεπίδραση:
Τη Μοντελοποίηση σε Πολυμεσικές Βάσεις Δεδομένων
Την Αναζήτηση Ομοιοτήτων ανάμεσα σε Πολυδιάστατα Αντικείμενα
Στο πρώτο κεφάλαιο αρχικά παρουσιάζεται το πρόβλημα της χαρτογράφησης του ανθρώπινου εγκεφάλου για τον εντοπισμό επιληπτικών εστιών, απ’όπου εγείρονται τα πρώτα προβλήματα αναπαράστασης και οργάνωσης τριδιάστατων αντικειμένων πολύπλοκης δομής και λειτουργικών σχέσεων και εξαρτήσεων μεταξύ τους. Σε μια πρώτη προσέγγιση προτείνεται το λογικό μοντέλο BDB (Brain Data Base) όπου εισάγονται νέοι τύποι οντοτήτων. Εδώ, ιδιαίτερο ενδιαφέρον παρουσιάζει η προσθήκη της ιεραρχικής διάταξης στο Σχεσιακό Μοντέλο, προκειμένου οι περιοχές του εγκεφάλου να οργανωθούν με βάση την πιθανότητα εμφάνισης επιληπτικής εστίας έτσι ώστε να βελτιώνονται στατιστικά οι χρόνοι ανάκτησής τους. Στη συνέχεια, η μελέτη επεκτείνεται σε άλλα – επόμενης γενιάς - είδη μοντέλων. Πιο συγκεκριμένα, οι ανάγκες της εφαρμογής μελετώνται με βάση ένα Σημαντικό (semantic model) - το μοντέλο IFO - και ένα Αντικειμενοστραφές Μοντέλο (object oriented model), με αποτέλεσμα τη δημιουργία των μοντέλων 3D-IFO και MITOS αντίστοιχα. Στο 3D-IFO εισήχθησαν νέοι τύποι δεδομένων προκειμένου να υποστηριχθούν αποδοτικά τα ιδιαίτερα δεδομένα μας καθώς και νέοι τελεστές για την καλύτερη διαχείριση των σύνθετων δεδομένων. Επιπλέον, εισήχθη ένας νέος constructor και ένα κατάλληλο πεδίο για την υποστήριξή του, προκειμένου να υποστηριχτεί η αναπαράσταση της διάταξης των μερών του εγκεφάλου με βάση κάποιο κριτήριο έτσι ώστε να διευκολυνθεί η μελλοντική απλή και συνδυαστική ανάκτηση πληροφορίας. Τέλος το αντικειμενοστραφές μοντέλο MITOS, εισάγει πάλι ένα νέο μοντέλο δεδομένων (MITOS Data Model - MDM) το οποίο συνεργάζεται με μία νέα γλώσσα ερωτημάτων (MITOS Query Language - MQL). Το μοντέλο MITOS εισάγει διάφορες καινοτομίες οι οποίες εξυπηρετούν μια περισσότερο εκφραστική και έξυπνη αναπαράσταση και διαχείριση πολυδιάστατων δεδομένων και γνώσης. Η μία από αυτές τις καινοτομίες είναι ο ορισμός ενός ακόμη βασικού χαρακτηριστικού των αντικειμένων (object characteristic), της σχέσης τους με το περιβάλλον, απεγκλωβίζοντάς την από την κατάσταση ή τη συμπεριφορά, όπου αποδυναμώνεται σαν έννοια. Η δεύτερη καινοτομία του MITOS η οποία αφορά την MQL σχετίζεται με την εισαγωγή ‘κλειδιού’ στους κανόνες (rules). Η διερεύνηση αυτής της δυνατότητας – η ιδέα προέρχεται από το χώρο των Βάσεων Δεδομένων – οδηγεί πράγματι σε ένα είδος κλειδιού, κατά την έννοια που θα μπορούσε να έχει στις Βάσεις Γνώσης και η οποία δεν μπορεί να είναι ακριβώς ίδια με την αντίστοιχη των Βάσεων Δεδομένων, λόγω των ειδοποιών διαφορών των δύο Βάσεων.
Στο δεύτερο κεφάλαιο μελετάται η αναζήτηση ενός ελάχιστα διερευνημένου είδους ομοιότητας ανάμεσα σε πολυδιάστατα κυρίως αντικείμενα, της τμηματικής ομοιότητας (partial similarity). Η τμηματική ομοιότητα σε αντίθεση με τον ιδιαίτερα διερευνημένο τύπο της πλήρους ομοιότητας (full similarity), αναφέρεται σε πραγματικές ομοιότητες οι οποίες δεν είναι πλήρεις. Κι αυτό συμβαίνει γιατί ένα πολύ συνηθισμένο σενάριο κατά τη διερεύνηση ομοιοτήτων είναι το ακόλουθο: Συνήθως η ανεύρεση πλήρους ομοιότητας βασίζεται σε υπολογισμό αποστάσεων, όπως η Ευκλείδεια απόσταση, οι οποίες είναι συνάρτηση όλων των διαστάσεων των εμπλεκομένων αντικειμένων. Όταν λοιπόν υπάρχουν διαστάσεις με μεγάλες διαφορές, ακόμη κι αν είναι λίγες, αυξάνουν αρκετά την υπολογιζόμενη απόσταση έτσι ώστε οι αποστάσεις τέτοιων αντικειμένων που στην πραγματικότητα μπορεί να είναι όμοια, να καταλήγουν να έχουν μεγάλες τιμές και συνεπώς να μην ανιχνεύεται η ομοιότητά τους (π.χ. όμοια αντικείμενα με πολύ διαφορετικό χρώμα). Από την άλλη πλευρά, για αντικείμενα τα οποία διαφέρουν λίγο σε κάθε διάσταση (π.χ. λίγο διαφορετικό χρώμα, σχήμα, προσανατολισμό κ.λ.π.) και καταλήγουν να είναι στην πραγματικότητα συνολικά πολύ διαφορετικά, η υπολογιζόμενη μεταξύ τους απόσταση έχει μικρή τιμή, οπότε ανιχνεύονται σαν όμοια, χωρίς να είναι.
Οι περισσότερες εργασίες οι οποίες έχουν μελετήσει την τμηματική ομοιότητα, έχουν εστιάσει σε γεωμετρικά δεδομένα. Η εργασία που επεκτείνεται σε πολυδιάστατα αντικείμενα γενικά, είναι η εργασία των Koudas et al., (VLDB 2006) και έχει οδηγήσει σε αξιόλογα αποτελέσματα στο θέμα της τμηματικής ομοιότητας. Εισάγει τις αποδοτικές μεθόδους k-n-match και frequent k-n-match, οι οποίες επιστρέφουν k αντικείμενα, όμοια με τα δοθέντα όχι σε όλες αλλά σε n διαστάσεις, αποφεύγοντας έτσι εκείνες τις λίγες διαστάσεις με τις μεγάλες διαφορές, οι οποίες οδηγούν σε παραπλανητικά αποτελέσματα. Παρόλ’αυτά αυτές οι μέθοδοι κρύβουν κάποιες αδυναμίες οι οποίες τελικά οδηγούν είτε σε ανεύρεση πλήρους ομοιότητας (όταν τελικά ληφθούν υπ’όψιν όλα τα n), είτε σε μία κατά περίπτωση μόνο (και σχεδόν τυχαία) ανίχνευση τμηματικής ομοιότητας (με τα κατάλληλα n’s τα οποία δεν πρέπει να είναι ούτε πολύ μεγάλα ούτε πολύ μικρά, αλλά δεν ορίζονται από κάποιο τύπο ή μέθοδο). Βασιζόμενοι σ’ αυτές τις μεθόδους, προτείνουμε δύο νέες τεχνικές οι οποίες όπως αποδεικνύεται μπορούν να εντοπίσουν πραγματικές τμηματικές ομοιότητες. Η πρώτη, η Lui k-n-match, επιτυγχάνει τον κατά προσέγγιση εντοπισμό των κατάλληλων n’s για τα k-n-matches, με τη βοήθεια της αλληλεπίδρασης με το χρήστη και του ελέγχου των αποδεκτών προτάσεων των k-n-matches. Πιο συγκεκριμένα, μέσω της μεθόδου k-n-match, προτείνεται για κάθε n ένα σύνολο αντικειμένων πιθανά όμοιων με το δεδομένο αντικείμενο του ερωτήματος (query object) . Ο χρήστης φιλτράρει αυτό το σύνολο, επιλέγοντας εκείνα τα αντικείμενα που θεωρεί πραγματικά όμοια με το δεδομένο. Αυτή η διαδικασία συνεχίζεται μέχρι αφού το n γίνει μεγαλύτερο από το ήμισυ των διαστάσεων των αντικειμένων, υπάρξει σύνολο προτεινόμενων αντικειμένων από το οποίο ο χρήστης δεν επιλέγει κανένα ως όμοιο . Μ’αυτόν τον τρόπο επιτυγχάνεται μεγαλύτερη εγκυρότητα των αποτελεσμάτων (λόγω της εμπλοκής του χρήστη) με περιορισμένο ταυτόχρονα αριθμό εκτελούμενων k-n-matches.
Η δεύτερη μέθοδος (INTESIS) βασίζεται στην εξής παρατήρηση: στην ουσία όταν δύο αντικείμενα μοιάζουν αυτό συνήθως σημαίνει ότι μοιάζουν στα περισσότερα χαρακτηριστικά τους, καθένα από τα οποία αναπαριστάται και αντιπροσωπεύεται από ένα σύνολο (μικρό συνήθως) διαστάσεων-πεδίων του αντικειμένου. Εάν λοιπόν οριστεί από τους ειδικούς κάθε εφαρμογής αυτή η αντιστοιχία χαρακτηριστικών και διαστάσεων - δημιουργώντας υποσύνολα διαστάσεων - τότε μπορούν να συμβούν διαδοχικά τα παρακάτω:
α) Να γίνει έλεγχος πλήρους ομοιότητας σε κάθε τέτοιο υποσύνολο διαστάσεων
β) Να οργανωθούν αυτά τα υποσύνολα σε ισάριθμα ιεραρχικά δέντρα για την εύκολη και αποδοτική διαχείρισή τους. Η επιπλέον απλούστευση αυτής της επιλογής έγκειται στο ότι δεδομένου ότι τα εν λόγω υποσύνολα διαστάσεων θα είναι μικρά, είναι πολύ εύκολη η επιλογή δέντρου γι’ αυτά, αφού σχεδόν όλα τα ιεραρχικά δέντρα έχουν μεγάλη απόδοση όταν πρόκειται για μικρό αριθμό διαστάσεων. Συνεπώς ο αναλυτής της κάθε εφαρμογής μπορεί να χρησιμοποιήσει όποιο τέτοιο δέντρο κρίνει εκείνος σαν καλύτερο ( Το R*-tree είναι η δική μας πρόταση).
Τελικά, για να ολοκληρωθεί η διαδικασία πρέπει να έχει οριστεί ένας ελάχιστος αριθμός απαιτούμενων όμοιων χαρακτηριστικών προκειμένου να θεωρηθούν δύο αντικείμενα όμοια.
Για την αξιολόγηση αυτής της μεθόδου, πρέπει αρχικά να σημειωθεί ότι αναφέρεται σε συνολικό αριθμό διαστάσεων μικρότερο του 100 και συνεπώς σε σχετικά μικρό αριθμό δέντρων. Όπως είναι φανερό, σε μονο-επεξεργαστικό σύστημα οι τελικοί χρόνοι απόκρισης είναι το άθροισμα των χρόνων κάθε δέντρου. Λαμβάνοντας υπ’όψιν το ότι τα δέντρα λόγω του μικρού αριθμού διαστάσεων που αντιστοιχούν στο καθένα έχουν πολύ καλές αποδόσεις, βγαίνει εύκολα το συμπέρασμα ότι ο εκάστοτε τελικός χρόνος απόκρισης της μεθόδου - όντας ένα μικρό πολλαπλάσιο των πολύ μικρών χρόνων προσπέλασης των δέντρων - είναι αρκετά χαμηλός. Με δεδομένο ότι η χρήση κάθε δέντρου δεν προϋποθέτει την χρήση κάποιου άλλου πριν ή μετά, οι αναζητήσεις σε κάθε δέντρο μπορούν να γίνονται παράλληλα. Συνεπώς σε πολυεπεξεργαστικό σύστημα, ο συνολικός χρόνος απόδοσης μπορεί να μειωθεί σημαντικά, φτάνοντας μέχρι και το χρόνο που απαιτείται μόνο για αναζήτηση σε ένα δέντρο (όταν υπάρχουν τόσοι επεξεργαστές όσα και δέντρα). Φυσικά, εάν λάβει κανείς υπ’όψιν του ότι η τμηματική ομοιότητα αποτελεί ένα ιδιαίτερα απαιτητικό είδος τότε όχι μόνο οι χρόνοι απόκρισης σε πολυεπεξεργαστικό σύστημα αλλά και εκείνοι του συστήματος ενός επεξεργαστή, αποτελούν ικανοποιητικές αποδόσεις.
Το τρίτο κεφάλαιο μελετά τη δυνατότητα δημιουργίας μιας νέας δομής η οποία δε θα ‘υποφέρει’ από τη μεγάλη πτώση της απόδοσης των δέντρων με την αύξηση των διαστάσεων των αντικειμένων (‘dimensionality curse’) ενώ ταυτόχρονα θα εξασφαλίζει καλή απόδοση και σε μικρό αριθμό διαστάσεων. Οι μέχρι τώρα μελέτες έχουν καταλήξει στο εξής συμπέρασμα: Τα γνωστά διαδεδομένα δέντρα αναζήτησης (είτε πρόκειται για δέντρα οργανωμένα βάση κατανομής χώρου (space partitioning) είτε για δέντρα βάση κατανομής δεδομένων (data partitioning)) αποδίδουν πολύ καλύτερα σε μικρό αριθμό διαστάσεων ενώ όσο αυτός ο αριθμός αυξάνει - ειδικά από 10 και πάνω – η απόδοση χειροτερεύει δραματικά. Το VA-File (σχήμα προσέγγισης διανύσματος) από την άλλη πλευρά - το οποίο είναι ένας απλός πίνακας-αρχείο γεωμετρικών προσεγγίσεων των αντικειμένων - με την αύξηση των διαστάσεων αποδίδει καλύτερα στην αναζήτηση ομοιοτήτων αλλά παρουσιάζει χαμηλή απόδοση σε μικρό αριθμό διαστάσεων.
Προκειμένου να ξεπεραστεί αυτή η καθοριστική εξάρτηση της απόδοσης από το πλήθος των διαστάσεων των προς διαχείριση αντικειμένων, προτείνουμε τη νέα υβριδική δομή Digenis, η οποία παντρεύει τη λογική των δέντρων αναζήτησης με κείνη των VA αρχείων. Πιο συγκεκριμένα, ορίζεται και χρησιμοποιείται ένα στατικό παραμετροποιημένο δέντρο (δέντρο Digenis) σε εννοιολογικό επίπεδο ενώ σε φυσικό επίπεδο χρησιμοποιείται το αρχείο Digenis το οποίο κατασκευάζεται με βάση το δέντρο. Με αυτή τη συσχέτιση επιτυγχάνεται αναζήτηση σε μικρό μόνο μέρος του αρχείου κατά τη διαδικασία ανεύρεσης ομοιοτήτων ανάμεσα σε αντικείμενα πολλών αλλά και λίγων διαστάσεων, γεγονός που δίνει γενικότητα και ευελιξία στη μέθοδο.
Πιο συγκεκριμένα, για το σχηματισμό του δέντρου, αρχικά ορίζονται οι οικογένειες αντικειμένων, οι οποίες αποτελούνται από αντικείμενα με μικρή απόσταση (βάση ενός προκαθορισμένου από τον εκάστοτε αναλυτή ορίου fl) και αντιπροσωπεύονται από το ‘μέσο’ αντικείμενο της οικογένειας (εάν δεν υπάρχει δημιουργείται για αυτό το ρόλο και μόνο). Κάθε κόμβος του δέντρου αντιπροσωπεύει-φιλοξενεί μία τέτοια οικογένεια. Το είδος των αποστάσεων που χρησιμοποιείται είναι η πλέον διαδεδομένη απόσταση, η Ευκλείδεια απόσταση, για την οποία ισχύει και η τριγωνική ανισότητα στην οποία θα βασιστεί μεγάλο μέρος της μεθόδου. Επίσης ένα δεύτερο όριο απόστασης (Lt) ορίζεται – από τον αναλυτή πάλι - σαν όριο με βάση το οποίο δύο αντικείμενα μπορούν να θεωρηθούν όμοια. Το δέντρο Digenis τελικά χτίζεται έχοντας ρίζα την πιο ‘κεντρική’ οικογένεια της περιοχής των αντικειμένων και κόμβους-παιδιά της τις ch πιο γειτονικές της οικογένειες, κάθε μία από αυτές έχει παιδιά της τις ch πιο γειτονικές της οικογένειες κ.ο.κ. Η δεδομένη ισχύ της τριγωνικής ανισότητας ανάμεσα στις Ευκλείδειες αποστάσεις των αντικειμένων-οικογενειών, αποδεικνύεται ένα χρήσιμο θεώρημα βάση του οποίου καθιστάται εφικτή η ασφαλής εξαίρεση μεγάλου μέρους του δέντρου από τους ελέγχους ομοιότητας, κατευθύνοντας τον τελικό έλεγχο σε μία μικρή περιοχή του. Αυτή η ανάλυση της αναζήτησης μέσα στο δέντρο είναι πολύ χρήσιμη σε ό,τι αφορά τη χρήση του αρχείου Digenis, όπου εκεί πραγματοποιείται η πραγματική αναζήτηση (φυσικό επίπεδο).
Το αντίστοιχο αρχείο Digenis στο φυσικό επίπεδο σχηματίζεται εάν αντιστοιχίσουμε σε κάθε του εγγραφή έναν κόμβο του δέντρου, ξεκινώντας από τη ρίζα του δέντρου και περνώντας από κάθε επίπεδο, από αριστερά προς τα δεξιά. Με αυτή την αντιστοίχηση, μπορούν πολύ εύκολα να χρησιμοποιηθούν οι τεκμηριωμένες τεχνικές εύκολου, ασφαλούς και γρήγορου αποκλεισμού περιοχών.
Ο απολογισμός της μεθόδου (θεωρητικά αλλά και πειραματικά) περιλαμβάνει θετικές και αρνητικές όψεις.
Θετικές όψεις:
• Το αρχείο έχει πολύ καλή απόδοση όταν διαχειριζόμαστε αντικείμενα πολλών διαστάσεων. Αυτό ήταν αναμενόμενο αφού το αρχείο λειτούργησε σαν ένα είδος VA αρχείου, όπου το ζητούμενο ήταν η δημιουργία συμπαγών γεωμετρικών προσεγγίσεων. Κι αυτό γιατί και η χρήση των οικογενειών επέφερε μία πρώτη ‘συμπίεση’ των δεδομένων αλλά και η προ-τακτοποίηση των αντικειμένων μέσω της εννοιολογικής χρήσης του δέντρου οδήγησε σε ένα είδος ομαδοποίησης γειτονικών αντικειμένων σε γειτονικές περιοχές.
• Το αρχείο έχει επίσης καλές επιδόσεις και όταν διαχειριζόμαστε αντικείμενα λίγων διαστάσεων. Αυτό συμβαίνει γιατί σε σχέση με το αρχείο VA είναι αναμενόμενα καλύτερο αφού βασίζεται σε δενδρική διάταξη, ενώ για τον ίδιο λόγο είναι ανταγωνιστικό και των παραδοσιακών ιεραρχικών δέντρων.
Αρνητικές όψεις:
• Η στατικότητα στον ορισμό του αριθμού(ch) των παιδιών ανά κόμβο του δέντρου, δημιουργεί προβλήματα στην κατασκευή του, γιατί συνήθως οι πραγματικά όμοιες οικογένειες μπορεί είναι περισσότερες ή λιγότερες από ch.
Αντιμετώπιση: Αν είναι περισσότερες, τοποθετούνται στο σύνολο των παιδιών οι ch κοντινότερες (με μικρότερες αποστάσεις από τον γονέα). Αν είναι λιγότερες, τότε ορίζεται ένα σχετικό όριο παιδιών και γεμάτων κόμβων στο δέντρο, πάνω από το οποίο τα παιδιά τοποθετούνται κανονικά στο δέντρο και οι υπόλοιποι κόμβοι μέχρι να συμπληρωθεί ο αριθμός παιδιών ch, συμπληρώνεται με κενούς κόμβους. Όταν όμως ο αριθμός των παιδιών μιας οικογένειας και οι υπόλοιποι γεμάτοι κόμβοι στο δέντρο είναι κάτω από αυτό το όριο, το αντίστοιχο προς δημιουργία δέντρο αποκόπτεται και δημιουργείται νέο μικρότερο δέντρο - με μικρότερο ch – ενώ το αρχικό δέντρο αναδιατάσσεται. Συνεπώς η τελική εφαρμογή μπορεί να περιλαμβάνει περισσότερα του ενός αρχεία Digenis, τα οποία κατά την αναζήτηση προσπελαύνονται από το μεγαλύτερο προς το μικρότερο, μέχρι να βρεθεί ομοιότητα (εάν υπάρχει).
• Μπορεί να υπάρχουν απομακρυσμένες οικογένειες – να μη συνδέονται με καμία άλλη – οι οποίες δεν μπορούν να ενταχθούν σε κανένα δέντρο.
Αντιμετώπιση: Δημιουργείται ένα Αρχείο Απομακρυσμένων (‘remote’ αρχείο) στο οποίο τοποθετούνται σειριακά οι απομακρυσμένες οικογένειες. Κατά την αναζήτηση αυτό το αρχείο προσπελαύνεται πρώτο, γιατί εφόσον εν γένει θα φιλοξενεί λίγες οικογένειες, η αναζήτηση σ’ αυτό θα είναι γρήγορη. Εάν υπάρχει ομοιότητα μεταξύ του αντικειμένου του ερωτήματος (query) και κάποιας οικογένειας του αρχείου, τότε έχει αποφευχθεί όλη η αναζήτηση στα δέντρα ενώ εάν πάλι δεν υπάρχει τέτοια ομοιότητα, λόγω του μικρού μεγέθους του αρχείου, η χρονική επιβάρυνση είναι σχεδόν αμελητέα.
Στο τελευταίο κεφάλαιο εξετάζεται ένα είδος δυναμικής αναζήτησης ομοιότητας, το οποίο ασχολείται με τις χρονικές ακολουθίες όχι των ίδιων των αντικειμένων αλλά των πεδίων (χαρακτηριστικών) τους. Δηλαδή αυτό που ανιχνεύεται είναι το κατά πόσο μοιάζει η εξέλιξη δύο χαρακτηριστικών στο χρόνο, πληροφορία που μπορεί να σταθεί πολύ χρήσιμη σε πολλά είδη εφαρμογών (ιατρικές, οικονομικές, επιστημονικές γενικά, κλπ). Χρησιμοποιώντας ένα παράδειγμα ιατρικών δεδομένων που αφορούν ορμόνες, με τη βοήθεια της προτεινόμενης μεθόδου (Chiron) εντοπίζονται με αποδοτικό τρόπο όμοια ε / The subject of this dissertation is the invention of methods which assure effective organization and management of multi-dimensional objects in order to achieve knowledge discovery. The initial target behind this study was the needs of a demanding application intending to map the human brain in order to help the localization of epileptic foci. During the corresponding research, the Representation and Management needs of human brain data raised two core research problems:
The representation peculiarity of the composite, non-uniform, network structured three-dimensional objects(brain objects), and
The needs for effective management-use of known and derived data and knowledge dependencies, which can upgrade the application performance and dynamics. The most important part of our relative research, leaded to the:
o Investigation of similarity search aspects. As this research area has great application and open problem width, it constitutes a great part of this dissertation.
Taking into account that the certain geometrical and knowledge dependency features of human brain data are common – all or part of them - in many modern multimedia applications, the above problems are included in the basic Data Base research problems.
Focusing our research in the above problems, we lead up to the:
Definition of new flexible data types, concepts, models, tools and data and knowledge ordering methods (Data Base BDB and models 3D-IFO and MITOS) which organize our data more flexibly and effectively, using methods that not only assure easier data access but also exploit their ‘hidden’ relationships and dependencies for more knowledge discovery.
Definition of new search trees and methods for:
o Effective detection of partial similarity among multi-dimensional objects ( Lui k-n-match και INTESIS).
o Obliteration of the high performance fall which occurs in similarity trees as dimensionality increases (‘dimensionality curse’) (Digenis structure ).
o Detection of object features/attributes/properties (dimensions) which have similar course in the time course – for multi-dimensional objects mostly – aiming at the study and detection of possible interaction among them (Chiron proposal ).
Generally, this dissertation consists of two basic parts, which refer to two research areas with great interaction:
• The Multi-Dimensional Data Base Modelling
• The Similarity Search among Multi-Dimensional objects.
Ιn the first chapter, the problem of human brain mapping for the localization of epileptic foci is discussed. This problem raises issues related to the peculiarities of the representation and the organization of three dimensional objects with complex structures/shapes and functional dependencies and relationships among them (brain objects). In the beginning, the logical model BDB (Brain Data Base) is proposed as a first approach, introducing new entity types. In the corresponding study, a very interesting proposal is the introduction of hierarchical ordering in the Relational Model in order to organize the brain areas according to their frequencies of epileptic foci presence, improving statistically the corresponding response times. In the following, the needs of the application are studied in the basis of a Semantic – IFO model - and of an Object-oriented Model, resulting in the definition of the 3D-IFO and the MITOS (Model for the Intelligent Three-dimensional Object Support) model, respectively. In the framework of 3D-IFO model, new data types and new operators have been introduced, in order to achieve effective representation and better management of the complex brain objects. Additionally, a new constructor and the suitable attribute for its support have been introduced, in order to effectively represent the ordering among brain parts, based on a certain criterion, thus facilitating combined data retrieval. In the end, the object-oriented model MITOS, introduces a new data model (MITOS Data Model – MDM) which cooperates with an intelligent knowledge base approach (MITOS Query Language – MQL). MITOS model introduces many novelties which serve a more expressive and intelligent representation and management of multi-dimensional data and knowledge. One of these novelties constitutes the definition of one more basic object characteristic (in object-oriented theory), the relationship with the environment, releasing it from the situation or the behaviour, where its concept and representation weakens. The second MITOS novelty concerns MQL and is related to the introduction of the concept of ‘key’ in the rules area. The extension of this potentiality – the idea comes from Data Base area – leads in fact to a kind of a key, with a meaning that it could have in Knowledge Bases and can not be exactly the same with that in Data Bases, because of the specific distinctions of these two Bases.
The subject of the second chapter is the detection of a least investigated similarity kind among multi-dimensional objects, the partial similarity. Partial similarity refers to similarities which are not full but they really exist. It is difficult to capture them using common techniques based on similarity functions (e.g. Euclidian distance) because these functions are affected by the whole set of object dimensions. Thus, when the objects are similar but ‘very different’ in few dimensions (e.g. very different colour and size) then the corresponding calculated functions (distances) will have very high values because of these few high dissimilarities and the similarity result will be negative while the objects will actually be similar. On the other hand, when between two objects there are low dissimilarities in most dimensions, they are actually dissimilar but the resultant function will have low value, so the dissimilar objects will be discerned as similar. In both cases, the common full similarity detection methods are not reliable.
The few studies that have investigated partial similarity, have mostly focused on geometric data. The study which is extended to multi-dimensional objects in general and has led to significant results in partial similarity, is presented in a paper of Koudas and al., in VLDB 2006. It introduces the effective methods k-n-match and frequent k-n-match, which result in k objects being similar to the given ones not in all their dimensions but at least in n ones, avoiding in this way those few very dissimilar dimensions –if any- which lead to false results. Nonetheless, these methods have some weaknesses which finally result either in full similarity (when finally, in frequent k-n-match, all n’s are taken into account) or in an occasional partial similarity detection (with the suitable n’s, which should not be very high or very low, without having however any type or method to calculate the ‘best’ n’s). Based on these methods, we propose two techniques which can provably detect real partial similarities. The first of them, Lui k-n-match, succeeds in the approximate specification of the suitable n’s for the k-n-matches, based on human-computer interaction and on the suitable checks of the similar objects that k-n-matches propose. More precisely, using k-n-match, for each n a set with objects possibly similar to the given one (query object), is proposed. The user filters this set and decides which objects of the proposed set are really similar to the given one. This procedure continues until the point where, while n has become larger than d/2* , the user does not select any object as similar from the proposed object set. In this way, the results are more reliable and valid (because of human-computer interaction) while in parallel the number of the executed k-n-matches are remarkably reduced.
The second partial similarity detection method (INTESIS) is based on the following observation: when two objects are similar, it usually means that they are similar in most of their characteristics. In data bases, each of object characteristic is represented by a set (usually small) of features-attributes(dimensions). Thus, if this correspondence between a characteristic and a set of attributes is defined by the developer of each application - creating dimension subsets – then the following can be successively done:
a) A full similarity detection for each dimension subset
b) Organization of these subsets in the corresponding hierarchical trees for their easy and effective management. The additional simplification of this choice derives from the fact that as long as the dimension subsets are small, the selection of the corresponding tree will be a very easy task, while almost all hierarchical trees have high performance for low dimensionalities. Consequently, the developer of each application can use the hierarchical tree that he/she considers as best (our proposition is R*-tree).
Finally, in order to complete the procedure, the application developer has to define which is the minimum number of the requisite similar characteristics that indicate partial similarity, for the particular application.
For the evaluation of the method, first of all, it is necessary to mention that it refers to a total number of dimensions less than 100 and consequently to a relatively small number of trees. As it is obvious, the final response time in a uniprocessor system is the sum of the response times of each tree. Taking into account that the number of dimensions which correspond to each tree is small, these trees have very good response times and consequently the total response time is low enough. While the use of each tree does not presuppose the use of another tree before or after it, the search in each tree can be performed in parallel. Therefore, in a multi-processing system, the total response time can be considerably reduced, achieving to reach the time needed for only one tree (when the number of processors is equal to the number of trees). Furthermore, bearing in mind that partial similarity forms a very demanding similarity search kind, not only the response times in multi-processing systems but those times in a uniprocessor system constitute satisfying performances.
The third chapter studies the potentiality of defining a new structure which does not ‘suffer’ from ‘dimensional curse’, while it assures good performance for low dimensionalities too. The latest studies have resulted in the following: Although the known similarity trees (either based on space partitioning or on data partitioning perform effectively in cases of low dimensionality, their performance generally degrades as dimensionality increases (especially for more than 10 dimensions). On the other hand, VA-File constitutes a simple approximate method (it is a simple array-file of object geometric approximations) which manages to outperform any other similarity search method at high dimensionality but it has low performance for low dimensionality. In order to overcome this determinant dependence between the performance and the dimensionality of a data-object set, we propose the new hybrid structure called Digenis, which marries the logic of similarity trees with VA-Files logic. More precisely, a static parametric tree (Digenis tree) is defined in conceptual level while the Digenis file, based on Digenis tree, is used in physical level. Using this correlation, a) the similarity search procedure is located in a small part of the file, excluding most dissimilar objects from the search and b) the method is used effectively for both low and high dimensional objects, preserving generality and flexibility.
The first necessary definition for Digenis proposal is related to the object families. They consist of objects having a small distance among them (based on a certain limit fl defined from the analyst, in each case) and they are represented by the ‘mean’ object of the family (if it does not exist, it is created just for this role). Each object family is hosted in a node of Digenis tree. The distance which is used is the most spread one, the Euclidian distance, for which the triangle inequality – where the method is mainly based - stands. Additionally, a second distance limit (Lt) is defined – from the analyst- which forms the limit used to conclude if two objects are similar or not. Finally, the root of the Digenis tree is the most ‘centered’ family in the total object area and the nodes being the children of it are its ch nearest families-nodes. The children of each of them are its ch nearest families, and so on. The triangle inequality which stands among the Euclidian distances of the object-families, is proved to be a very useful Theorem for the safe check exclusion of a great part of the tree , leading to a final check in a small tree area. The search analysis of the tree is very helpful for the use of Digenis file, where the real search is performed (physical level).
The corresponding Digenis file in the physical level is created if each tree node composes a record of the file, beginning from the tree root and passing from each level, from left to right. Using this correspondence, the proved Digenis tree techniques of easy, safe and quick exclusion of Digenis record areas can be used.
The (theoretical and experimental) evaluation of the method results in the detection of certain advantages and disadvantages of it.
Advantages:
The file has very good performance for high dimensionalities. This was expected because the file works as a kind of VA-File, where the records are compact geometric approximations. This matters because both the use of object families achieves a first data ‘compression’ and the pre-arrangement of the objects via the conceptual use of the tree lead to a kind of grouping of neighboring objects in neighboring areas.
The file has also good performance for low dimensionality, because in comparison to VA-File, it is expectably better while it is based on a tree structure. For the same reason, Digenis file is competitive to the classic hierarchical similarity trees.
Drawbacks:
The fact that the number of children for each node is statically defined as ch in each application is a disadvantage for the construction of the tree, because usually the really similar families may be more or less than ch.
Confrontation: If the similar families of a node are more than ch, then only the ch closest to the family are placed as its children, in the next level. If they are less than ch, then a limit of children and full nodes in the tree is defined. When this limit is overcome, the nodes-children are normally placed in the tree and the rest nodes –until ch-th one – remain empty. When however the number of the children of a family and of the full nodes in the tree, are less than this limit, the corresponding subtree is separated, creating a new smaller tree – with smaller ch – while the initial tree is reorganized. Consequently, the final application may include more than one Digenis tree, which are accessed from the bigger to the smaller, until the similarity is found (if any).
Perhaps there are remote areas of object families – without any connection with other families – which can not be included in any other tree.
Confrontation: A file including sequentially the remote families (called ‘remote’ file’) is created. During the similarity search, this file is the first which is accessed because while it usually hosts a few families, the search will be quick enough. If a similarity is detected (among the query object and a family in the file), then the search in the trees will be avoided while if no similarity exists, the time overhead of the file search is almost negligible, because of its size.
In the last chapter, a new kind of dynamic similarity search is investigated. It is related with the time streams not of the objects themselves but of their properties/attributes/dimensions. In other words, what is detected is whether the courses of two or more properties resemble. This kind of information can be very useful for several kinds of applications (medical, financial, scientific in general, e.t.c). Using medical data related to hormonal tests as an example, we prove that, based on our method Chiron, the hormones which are developed in the same way are accurately and effectively detected. More precisely, new objects (property course objects or Chiron objects) which encode the variations of each property in certain time intervals, are defined and organized in a tree (Chiron tree). The way these objects are defined, their differences and the Chiron tree itself make its navigation and the detection of similar Chiron objects – and consequently of properties which are developed in a similar way - a quick and easy procedure. This is achieved via the distribution of the Chiron objects in the Chiron tree according to the number of the different digits that exist among them. In this way, when we search in the Chiron tree for objects similar to a given one, a simple and compact algorithm is used, which avoids a vast amount of useless checks among very different objects. Generally, the method is promising enough because it poses new problems for investigation, like the statistical analysis of its results, the search for objects that are developed in a reverse way, the management of time shifts among the property course objects and the Chiron tree optimization.
|
147 |
Impact of mitochondrial genetic variation and immunity costs on life-history traits in Drosophila melanogasterBashir-Tanoli, Sumayia January 2014 (has links)
Immune activation is generally acknowledged to be costly. These costs are frequently assumed to result from trade-offs arising due to the reallocation of resources from other life-history traits to be invested in immunity. Here, I investigated the energetic basis of the costs associated with immune activation in Drosophila melanogaster. I found that immune activation significantly reduced fly fecundity (45%) and also caused a decline in metabolic rate (6%) but had no effect on body weight. To understand the factors behind reduced fecundity and metabolic rate I measured feeding and found that food intake was reduced by almost 31% in immune-challenged D. melanogaster. These findings suggest that fecundity costs of immune activation result not from the commonly accepted resource reallocation hypothesis but probably because resource acquisition is impaired during immune responses. The individuals of any animal population generally vary greatly in their ability to resist infectious disease. This variation arises due to both environmental heterogeneity and genetic diversity. Genetic variation in disease susceptibility has generally been considered to lie in the nuclear genome. Here, for the first time, I explored the influence of mitochondrial genetic (mtDNA) variation on disease susceptibility. I crossed 22 mitochondrial haplotypes onto a single nuclear genome and also studied epistasis interactions between mitochondrial and nuclear genomes (mitonuclear epistasis) by crossing five haplotypes onto five different genetic backgrounds. I found that fly susceptibility to Serratia marcescens was influenced significantly by mtDNA allelic variation. Furthermore, the effect of mitonuclear epistasis on fly susceptibility to S. marcescens was twice as great as the individual effects of either mitochondrial or nuclear genome. However, susceptibility to Beauveria bassiana was not affected by mtDNA allelic variation. These findings suggest the mitochondrial genome may play an important role in host-parasite coevolution. The Mother’s Curse hypothesis suggests that sex-specific selection due to maternal mitochondrial inheritance means that mitochondria are poorly adapted to function in males, resulting in impaired male fitness. Mother’s Curse effects have previously only been studied for two phenotypic traits (sperm-infertility and ageing) and their generality for broader life-history has not been explored. I investigated the impact of mtDNA allelic variation on 10 phenotypic traits and tested whether the patterns of phenotypic variation in males and females conformed to the expectations of the Mother’s Curse hypothesis. I found that seven of the 10 traits were significantly influenced by mtDNA allelic variation. However, there was no evidence that the effects of this variation differed between males and females. I therefore concluded that Mother’s Curse is unlikely to be a general phenomenon, nor to provide a general explanation for sexual dimorphism in life-history traits. Overall, this thesis explored the impacts of immunity costs, mitochondrial genetic variation, mitonuclear epistasis and sex-specific mitochondrial selection on D. melanogaster life-history.
|
148 |
Share bidding auctions, sliding scale royalty rates and the new brazilian regulatory framework for the pre-salt areasDamé, Otávio Menezes 11 December 2014 (has links)
Submitted by Otávio Menezes Damé (omenezes@fgvmail.br) on 2015-03-25T16:46:08Z
No. of bitstreams: 1
tese-otavio.pdf: 1370659 bytes, checksum: 924be04b7a6bae788714a583878c9ce3 (MD5) / Approved for entry into archive by BRUNA BARROS (bruna.barros@fgv.br) on 2015-03-31T14:12:14Z (GMT) No. of bitstreams: 1
tese-otavio.pdf: 1370659 bytes, checksum: 924be04b7a6bae788714a583878c9ce3 (MD5) / Approved for entry into archive by Marcia Bacha (marcia.bacha@fgv.br) on 2015-04-14T11:47:19Z (GMT) No. of bitstreams: 1
tese-otavio.pdf: 1370659 bytes, checksum: 924be04b7a6bae788714a583878c9ce3 (MD5) / Made available in DSpace on 2015-04-14T11:47:31Z (GMT). No. of bitstreams: 1
tese-otavio.pdf: 1370659 bytes, checksum: 924be04b7a6bae788714a583878c9ce3 (MD5)
Previous issue date: 2014-12-11 / Brazilian government recently passed legislation instituting a new regulatory framework for the pre-salt reserves. These areas should be negotiated through a profit-share bidding auction. Motivated by this new rules, we present a model of share bidding auction under affiliation, demonstrating the existence of a monotone pure-strategy equilibrium in this structure and characterize its equilibrium bidding function. In addition, we prove that it generates an expected revenue at least as large as the usual fee bidding auction. Next, we introduce in the models a function representing a royalty rate that is contingent to the value of the object. This instrument permits an improvement of expected revenue of both models, making the gap between them shrink. Finally, analyzing this new regulatory framework from the viewpoint of the theoretical and numerical results obtained, we conclude that the former oil regime was more appropriate and lucrative to Brazilian government. / O governo brasileiro recentemente aprovou uma legislação instituindo um novo marco regulatório para as reservas petrolíferas do pré-sal. Segundo as novas regras, estas áreas deverão ser licitadas mediante um leilão de partilha de lucro. Motivado por esta mudança, apresentamos um modelo de leilão de partilha sob afiliação, demonstrando a existência de um equilíbrio monótono em estratégias puras e caracterizando a solução. Alem disso, provamos que este mecanismo gera receita esperada maior ou igual a um leilão de primeiro preço usual. Em seguida, introduzimos no modelo uma função representando taxas de royalties que dependem do valor do objeto. Este instrumento permite uma elevação na receita esperada de ambos os modelos, fazendo com que a diferença entre eles encolha. Finalmente, analisando o novo marco regulatório sob o ponto de vista dos resultados obtidos, concluímos que o antigo modelo de concessão utilizado pelo governo brasileiro é mais adequado e lucrativo.
|
149 |
Essays on the economics of corruption / Essais sur l'économie de la corruptionWadho, Waqar ahmed 22 June 2011 (has links)
Cette thèse est composée de trois essais; dans le premier essai je traite les questions de la détermination, de la variance et des répercussions de la corruption. J’ai montré que la corruption est déterminée par la part des travailleurs non qualifiés sur la population. Si cette part est large alors il existe une corruption, si elle est faible la corruption est inexistante, et pour des niveaux intermédiaires, il existe une multiplicité d’équilibres. La corruption augmente les inégalités salariales entre travailleurs qualifiés et non qualifiés, et une perte de bien-être. Dans le deuxième essai je traite la question de lutte contre la corruption à travers l’incitation salariale. Avec une technologie de contrôle endogène, je montre que le gouvernement peut mieux accepter la corruption lorsqu’il est coûteux de contrôler. Lorsqu’il est optimal de combattre alors le gouvernement peut le faire soit à travers des salaires d’efficience ou soit par le contrôle. Néanmoins le rôle des salaires d’efficience dans la lutte contre la corruption est moindre dans les sociétés avec un niveau de malhonnêteté élevé. Le troisième essai traite la malédiction des ressources naturelles. Je montre que l'éducation et la corruption sont déterminées conjointement ; les ressources naturelles affectent l’incitation à investir en éducation et en ‘rent-seeking’ ce qui en retour affecte la croissance. En outre, la relation entre une abondance et la malédiction des ressources naturelles n’est pas monotone. Pour un niveau d’inégalité d’accès à l’éducation faible et un coût élevé de participation dans la vie politique, un niveau de croissance élevé et la trappe à la pauvreté coexistent. / This dissertation consists of three essays. The topics cover determination, variance and repercussions of corruption (essay one), corruption deterrence through wage incentives (essay two), and natural resource curse (essay three). In the first essay, I show that for a larger population of unskilled labor, there is a widespread corruption and for a smaller population there is no corruption. For the intermediate levels there are multiple equilibria. On its consequences, corruption increases wage inequality between skilled and unskilled workers, and results in output and welfare losses. In the second essay, I argue that deterring corruption through efficiency wage may become prohibitively expensive. With endogenous monitoring technology that allows capturing the dual role of auditing, as a complement with and as a substitute for wage incentives, I find that the government is better-off accepting corruption when it is costly to monitor. When it is optimal to deter bribery, the government can do it either through efficiency wages or monitoring. The role of efficiency wages decreases in societies with higher level of dishonesty. In the third essay, I build a theory explaining a resource curse. In contrast to the existing literature which generally considers low education, corruption and natural resources separately, I combine three strands of literature. Natural resources affect incentives to invest in education and rent seeking that in turn affects growth. Second, the relationship between resource-abundance and resource-curse is non-monotonic. For low inequality in access to education and high cost of political participation, high-growth and poverty-trap equilibria co-exist.
|
150 |
Impacto de la riqueza del sector extractivo minero y la calidad institucional sobre el crecimiento económico en el Perú / Impact of the wealth of the mining extractive sector and institutional quality on economic growth in PeruCastañeda Rosales, Sarah Elizabeth 31 October 2020 (has links)
La literatura ha documentado que los países más abundantes en recursos naturales tienden a registrar menores tasas de crecimiento que los países con menos recursos. Este fenómeno se conoce como la maldición de los recursos naturales. No obstante, diversos estudios sugieren que esta maldición no es provocada por la afluencia de recursos, sino que podría estar condicionada a la calidad de las instituciones del país. La presente investigación busca determinar el impacto de la abundancia del sector extractivo minero y la calidad institucional sobre el crecimiento económico en el Perú. Para ello, se utiliza un set de datos de series de tiempo para el periodo 1996T1-2018T4. Siguiendo la metodología de Johansen y Juselius (1990), se estima un modelo basado en la ecuación planteada por Sachs y Warner (1995) a la que se incorpora una variable que mide el componente institucional. Los resultados muestran que la riqueza del sector minero no presenta un impacto negativo per se sobre el crecimiento económico en el largo plazo, rechazándose así la hipótesis de la maldición de recursos para el caso peruano. Sin embargo, cuando se incluye el concepto de calidad institucional al análisis, los resultados varían a favor de la validación de la hipótesis, demostrando que, no es la abundancia de recursos la condición que obra en detrimento del desempeño final del crecimiento económico sino la existencia de instituciones de mala calidad en el Perú. / The literature has documented that countries with more natural resources tend to have lower growth rates than countries with fewer resources. This phenomenon is known as the Resource Curse. However, various studies suggest that this curse is not caused by the influx of resources, but could be conditioned by the quality of the country's institutions. This paper seeks to determine the impact of the abundance of the mining extractive sector and institutional quality on economic growth in Peru. To do this, a set of time series data is used for the period 1996Q1-2018Q4. Following the methodology of Johansen and Juselius (1990), a model based on the equation proposed by Sachs and Warner (1995) is estimated, incorporating a variable that measures the institutional component. The results show that the wealth of the mining sector does not present a negative impact per se on economic growth in the long term, thus rejecting the hypothesis of the resource curse for the Peruvian case. However, when the concept of institutional quality is included in the analysis, the results vary in favor of the validation of the hypothesis, showing that it is not the abundance of resources that is detrimental to the final performance of economic growth, but rather the existence of poor quality institutions in Peru. / Trabajo de investigación
|
Page generated in 0.045 seconds