Il campionamento a valanga è considerato un tipo di campionamento non probabilistico, la cui rappresentatività può essere valutata solo sulla base di considerazioni soggettive. D’altro canto esso risulta spesso il solo praticamente utilizzabile nel caso di popolazioni senza lista di campionamento.
La tesi si divide in due parti. La prima, teorica, descrive alcuni tentativi proposti in letteratura di ricondurre le forme di campionamento a valanga nell’alveo dei campionamenti probabilistici; tra questi è degno di nota il Respondent Driven Sampling, un disegno campionario che dovrebbe combinare il campionamento a valanga con un modello matematico che pesa le unità estratte in modo da compensare la non casualità dell’estrazione e permettere così l’inferenza statistica.
La seconda, empirica, indaga le prestazioni del RDS sia attraverso simulazioni sia con una web-survey su una comunità virtuale in Internet, di cui si conoscono la struttura delle relazioni e alcune caratteristiche demografiche per ogni individuo.
Le stime RDS, calcolate a partire dai dati delle simulazioni e della web-survey, sono confrontate con i valori veri della popolazione e le potenziali fonti di distorsione (in particolare quelle relative all’assunzione di reclutamento casuale) sono analizzate. / Populations without sampling frame are inherently hard to sample by conventional sampling designs. Often the only practical methods of obtaining the sample involve following social links from some initially identified respondents to add more research participants to the sample. These kinds of link-tracing designs make the sample liable to various forms of bias and make extremely difficult to generalize the results to the population studied. This thesis is divided into two parts. The first part of the thesis describes some attempts to build a statistical theory of link-tracing designs and illustrates, deeply, the Respondent-Driven Sampling, a link-tracing sampling design that should allow researchers to make, in populations without sampling frame, asymptotically unbiased estimates under certain conditions. The second part of the thesis investigates the performance of RDS by simulating sampling from a virtual community on the Internet, which are available in both the network structure of the population and demographic traits for each individual. In addition to simulations, this thesis tests the RDS by making a web-survey of the same population. RDS estimates from simulations and web-survey are compared to true population values and potential sources of bias (in particular those related to the random recruitment assumption) are discussed.
Identifer | oai:union.ndltd.org:DocTA/oai:tesionline.unicatt.it:10280/984 |
Date | 04 March 2011 |
Creators | VITALINI, ALBERTO |
Contributors | BOVONE, LAURA, LANZETTI, CLEMENTE, CASELLI, MARCO |
Publisher | Università Cattolica del Sacro Cuore, MILANO |
Source Sets | Universita Cattolica del Sacro Cuore. DocTA |
Language | Italian |
Detected Language | Italian |
Type | Doctoral Thesis |
Format | Adobe PDF |
Rights | open |
Page generated in 0.0019 seconds