• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 66
  • 11
  • Tagged with
  • 77
  • 40
  • 27
  • 16
  • 15
  • 14
  • 11
  • 10
  • 10
  • 9
  • 8
  • 8
  • 7
  • 7
  • 7
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
51

Det elektroniska universalverktyget Easy Angle kan ersätta Myrinmätare vid mätning av cervikal rörlighet hos patienter med spondartrit. : En validitet- och reliabilitetsstudie.

Karlström, Julia January 2018 (has links)
Bakgrund: Mätning av rörlighet är en elementär del i fysioterapeutiska bedömningar. Spondartrit är en kronisk inflammatorisk sjukdom som framför allt drabbar ryggraden och kan medföra kyfotisk hållning. Mätning av cervikal rörlighet är en del i den kliniska undersökningen av denna patientgrupp och utförs idag med Myrinmätare. Easy Angle är ett nylanserat digitalt mätinstrument som mäter rörlighet i kroppens alla leder. Den behöver dock utvärderas för att kunna användas i klinik.   Syfte: Undersöka mätegenskaper för Easy Angle avseende samtidig validitet samt att undersöka inter- och intrabedömarreliabilitet för Easy Angle och Myrinmätare hos personer med spondartrit.   Metod: Den samtidiga validiteten utvärderades genom att jämföra Easy Angle mot Myrinmätaren. Intra- och interbedömarreliabiliteten utvärderades genom test-retest-förfarande mellan samma mätare och två olika mätare för båda mätinstrumenten. Nitton personer med diagnosen spondartrit genomförde studien. Mätningarna utfördes från höger till vänster sida i given ordning: rotation, lateralflexion, flexion, extension. Den samtidiga validiteten beräknades med Spearmans korrelation (rs) och intra- och interbedömarreliabiliteten beräknades med Interclass correlation (ICC).   Resultat: Resultaten från denna studie påvisar en hög till mycket hög samtidig validitet (rs 0,86–0,95) samt nästintill perfekt intrabedömarreliabilitet för både Easy Angle (ICC 0,90–98) och Myrin (ICC 0,95–0,98) samt mycket hög interbedömarreliabilitet för Easy Angle (ICC 0,95–0,98) och Myrin (ICC 0,92–0,98).    Slutsats: Det förelåg en hög samtidig validitet hos EasyAngle när den jämfördes mot Myrinmätare och en näst intill perfekt intra- och interbedömarreliabilitet för både EasyAngle och Myrinmätaren. Slutsatsen är att Myrinmätare och Easy Angle är utbytbara. Fördelarna med Easy Angle är att fler leder kan mätas med samma instrument, att den inte är känslig för lägesändringar och mer hygienisk. / Background: Measurement of range of motion is an elementary part of physiotherapeutic assessments. Spondarthritis is a chronic inflammatory disease that primarily affects the spine and can lead to a kyfotic stance. Measurement of cervical range of motion is part of the clinical examination for this patient group. Easy Angle is a newly launched digital measuring instrument that measures joint range of motion. However, it needs to be validated to be used in clinics.   Objective: This study examined the current validity, inter-tester and intra-tester reliability of Easy Angle and Myrin for the measurement of active cervical range of motion among patients with spondarthritis.   Method: Nineteen individuals with spondarthritis participated in this study. The examiners measured cervical range of motion of each participant. The concurrent validity was evaluated by comparing Easy Angle to the Myrin. Intra- and inter-tester reliability was evaluated by test-retest procedure. Estimates of validity and reliability were then established using the Spearman correlation coefficient and Interclass correlation coefficient. The concurrent validity was concluded with Spearman's correlation (rs) and intra- and inter-tester reliability was calculated using Interclass correlation (ICC).   Results: This study found high to very high concurrent validity (rs 0.86–0.95), almost perfect intra-tester reliability in both Easy Angle (ICC 0,90–0,98) and Myrin (ICC 0,95–0,98) and a very high inter-tester reliability for Easy Angle (ICC 0,95–0,98) and Myrin (ICC 0,92–0,98).   Conclusion: The study found no significant differences between the Myrin and Easy Angle, indicating that Myrin and Easy Angle are interchangeable. However, the benefit of Easy Angle is that more joints can be measured with the same instrument, that it is not sensitive to movement and that it is more hygienic.
52

Likvärdighet vid bedömning av elevtexter : orsaker och konsekvenser, en stickprovsstudie i en svensk gymnasieskola / Equality in assessments of student texts : reasons and consequences, a sample study in a Swedish high school

Haglund, Pontus, Berggren, Wallentin January 2012 (has links)
Detta är en stickprovsstudie med målsättningen att jämföra hur fyra lärare från en gymnasieskola bedömde en elevtext och diskutera detta med hänsyn till validitet vid bedömning av elevtexter. Resultaten av denna undersökning visar att lärarnas bedömning av elevtexten var liknande både i tillvägagångssätt, värdering av innehållet och betyget de gav texten. Dock visar denna undersökning att validiteten i dessa bedömningar var låg då skillnaderna i de slutgiltiga bedömningarna var så pass stora att de inte kunde förbises. Resultaten visar också på vissa allmänna faktorer vid bedömning som är problematiska med hänsyn till bedömningarnas validitet och att vidare forskning bör bedrivas så att validiteten av lärares bedömningar och därmed betygens validitet kan fastställas
53

Validitet och reliabilitet av ett arbetsbelastningsindex (AI) i en FHV enkät

Englund-Lehmann, Lena January 2014 (has links)
Abstract   The purpose of this work was to scientifically evaluate the sustainability of parts of  a company-specific survey within the Occupational Health Services (FHV). The service is called HALU which is an abbreviation of the “Work Health and Lifestyle” survey and provided by Feelgood AB. HALU is a questionnaire that is used frequently towards the customer and answered on an individual level with subsequent health interviews and a statement regarding the organization's performance in order to identify the health, lifestyle and working situation of the organization. In this work, questions regarding workloads were evaluated. There were six different workload questions, and the question in this paper were whether these issues had an internal consistency, validity and reliability, and if these issues’ correlation to questions about health during the past year. These analyzes were designed as cross-sectional studies The work also included a longitudinal study in which survey responses from the same individual on two occasions analyzed to see if the responses of workload and health has correlation at two different response times. The material used is a selection from Feelgood database from which includes total includes 130,422 HALU surveys. This sample includes 17,513 surveys from 201007. The study was performed in three steps: Step 1 was a reliability study in which the internal consistency analysis regarding workload questions in the questionnaire . A workload index was created (AI) Stage 2 was a validity study where the correlation coefficient analyzed for correlation between the AI which was calculated in step 1 and the in -depth study of health issues. Step 3 was also a validity study where the correlation coefficient was analyzed in terms of relationships between different survey occasions in the same individual, in order to see if the change in workload results in change in self-perceived health . The result showed that there was strong internal consistency regarding workload issues and that there was correlation between workload and health in a cross section . There were also correlation between survey responses occasions but this was low. / Syftet med detta arbete var att på ett vetenskapligt sätt utvärdera hållbarheten i delar av enföretagsspecifik tjänst inom Företagshälsovården FHV. Tjänsten heter HALU vilket är en förkortning av Hälso Arbetsmiljö och Livsstilsundersökning och tillhandahålls av Feelgood AB. HALU är en enkät som används frekvent ut mot kund och besvaras på individnivå med efterföljande hälsosamtal och en sammanställning beträffande organisationens resultat i syfte att kartlägga hälsa, livsstil och arbetsmiljöläget för organisationen. I detta arbete har frågor gällande arbetsbelastning utvärderats. Validiteten och reliabiliteten i detta index har analyserats. Indexet består av 6 frågor. Arbetet innefattar dels en tvärsnittstudie men även en longitudinell studie där enkätsvar från samma individ vid två tillfällen analyserades i syfte att se om svaren från arbetsbelastning och hälsa hade korrelation vid två olika svarstillfällen. Materialet som användes var ett urval  från Feelgoods databas vilken innefattar totalt 130.422  HALU enkäter. I detta urval ingick 17.513 enkäter från juli 2010 Studien gjordes i tre steg: Steg 1 är en reliabilitetsstudie där den interna konsistensen analyseras vad beträffar arbetsbelastningsfrågorna i enkäten. Ett arbetsbelastningsindex skapades (AI). Steg 2 är en validitetsstudie där korrelationskoefficienten analyserades beträffande samband mellan AI som räknades fram i steg 1 och de i studien ingående hälsofrågorna. Steg 3 är även det en validitetsstudie där korrelationskoefficienten analyserades vad gäller samband mellan olika enkättillfällen hos samma individ, i syfte att se om förändring i arbetsbelastning resulterade i förändring i självupplevd hälsa. I både steg 2 och 3 är det Begreppsvaliditet (construct validity) som mäts. Resultatet visar att det finns stark internkonsistens beträffande arbetsbelastningsfrågorna, det vill säga att dessa frågor mäter arbetsbelastning. Det finns även en korrelation mellan arbetsbelastning och hälsa vid ett tvärsnitt, om skattningen av arbetsbelastningen ökar påverkas svaren på hälsofrågorna negativt. Det rådde även svag korrelation mellan de olika enkätsvarstillfällena.
54

Spela med sinnet : Stress och prestation hos semi-professionella esportatleter / Playing with the mind : Stress and performance in semi-professional esport athletes

Hultgren, Philip January 2021 (has links)
Syftet med undersökningen är att undersöka mentala påverkningar hos esportatleter i tävlingssammanhang. Esport och prestation är inte ett utforskat område inom idrottsvetenskapen vilket gör den här undersökningen unik. En del i undersökningen är att analysera reliabiliteten och validiteten för den kvantitativa undersökningsmetoden Sport Anxiety Scale-2 för esportatleter. Vidare så analyseras resultaten i prestation relaterat till svaren i den utskickade enkäten kring Sport Anxiety Scale-2. Resultatet visar att esporatleters svar i Sport Anxiety Scale-2 följer samma mönster som för traditionella idrottsatleter dock med lägre totala värden i två av tre subskalor och högre värde i kategorin koncentrationssvårigheter. Vad det betyder är att esportatleter känner större oro kring koncentrationssvårigheter men mindre kognitiv och somatisk oro vid tävlingssammanhang. I valideringssyfte för Sport Anxiety Scale-2 som metod för esportatleter så uppvisades inte tillräckligt höga värden för att dra slutsatsen att det är ett funktionellt formulär för esportatleter. Vidare forskning kring Sport Anxiety Scale-2s relevans för esportatleter rekommenderas. Angående undersökningssyftet att jämföra prestation med resultaten i Sport Anxiety Scale-2 så dras slutsatsen att resultaten uppvisar motsägande resultat vilket gör att arbetshypotesen med säkerhet inte kan bli bekräftad. Det går att diskutera om det beror på SAS-2 som metod eller på grund av antalet deltagande respondenter i undersökningen. Undersökningen bidrar till att förstå vilka mentala svårigheter esportatleter står inför i tävlingssammanhang jämfört med traditionella idrottsatleter och undersökningen går att bygga vidare på för vidare, mer djupgående, undersökningar kring psykologiska mätverktyg inom esport och det idrottsvetenskapliga fältet. / The purpose of this study was to evaluate the level and impact of anxiety in semi-professional esport athletes before competitions. To analyze this, a quantitative analysis was conducted using the tool Sport Anxiety Scale-2. The results of the Sport Anxiety Scale-2 were analyzed together with the competitive performance of the respondents. The results show that esport athletes show higher concentration disruption and lower somatic stress and worry before competitions than the standardized data for traditional sport athletes. As for the impact on performance, the results are inconclusive as there is not a strong enough correlation to confirm the working hypothesis that there is a relation between levels of stress and performance. This is a possible indicator that the research tool Sport Anxiety Scale-2, while useful for evaluating stress in traditional sport athletes, has significant deficiencies when used with esport athletes due to the reliance on physical activity indicators. Future research into the mental health of esport athletes should consider the differences in measuring the stress of less physical sports and could benefit from a broader study with a larger sample size.
55

Orthodontic diagnostics and measurements on digital study models made with an intraoral scanner

Konakovic, Damir January 2013 (has links)
Introduktion:Modellanalys har traditionellt gjorts på fysiska gipsmodeller. Idag finns ny teknik som möjliggör framställning av digitala modeller utan behov av konventionella avtryck. Syftet med den här studien är att undersöka tillförlitligheten hos digitala modeller framställda med en intraoral scanner, patientupplevelsen och olika tidsaspekter förenade med tekniken.Metod:På ett urval av 20 vuxna personer gjordes både konventionell avtryckstagning och en intraoral scanning (TRIOS, 3Shape) av bettet för framställning av gipsmodeller och digitala modeller. Den kliniska tidsåtgången mättes och personerna besvarade ett frågeformulär gällande sin upplevelse av metoderna. Fyra observatörer diagnostiserade bettrelationer och utförde ortodontiska mätningar på gipsmodeller med ett skjutmått och digitala modeller med OrthoAnalyzer Orthodontics (3Shape, Danmark). Tidsåtgången mättes för digital- respektive konventionell modellanalys. Statistiska analyser gjordes utifrån Paired samples t test, korstabeller och frekvensanalys.Resultat:Diagnostik av horisontella-, vertikala- och transversella bettrelationer på digitala modeller har hög tillförlitlighet. Få statistiskt signifikanta skillnader fanns för linjära mätningar på digitala modeller jämfört med gipsmodeller. För majoriteten av observatörerna tog digital modellanalys längre tid än konventionell modellanalys. Likaså var den kliniska tidsåtgången för intraoral scanning signifikant längre än för konventionell avtryckstagning och metoden prioriterades lägre av försökspersonerna.Konklusion:Digitala modeller framställda med en intraoral scanner är en tillförlitlig metod för ortodontisk diagnostik och terapiplanering. Tekniken har en rad fördelar och förbättras ständigt men dess acceptans för den enskilde klinikern blir i slutändan en kostnadsfråga. / Introduction:Model analysis has traditionally been carried out on physical plaster models. New technology allows the production of digital models without the need for conventional impressions. The purpose of this study was to evaluate the validity of digital models made with an intraoral scanner, patient experience and different time aspects associated with this technology.Methods:A sample of 20 adults was selected. Plaster models and digital models were obtained from conventional impressions and an intraoral scanning (TRIOS, 3Shape) respectively. The clinical time required for impression taking and intraoral scanning was recorded and the subjects were asked to answer a questionnaire regarding their experience of both methods. Four independent examiners diagnosed malocclusions and performed measurements with a digital caliper on plaster models and by using OrthoAnalyzer Orthodontics (3Shape, Denmark) for digital models. Time required for digital- and conventional model analysis respectively, was recorded. Statistical analysis was performed by using Paired samples t test, crosstabs and frequency analysis.Results:Diagnostics of horizontal-, vertical- and transversal malocclusions with digital models showed high validity. Few statistically significant differences were found for measurements made on digital models compared to direct measurements on plaster models. For a majority of the examiners, digital model analysis was more time consuming than conventional model analysis. Also, clinical time required for intraoral scanning was significantly greater than for conventional impression taking. The subjects preferred conventional impression taking.Conclusions:Digital models made with an intraoral scanner are a reliable method for orthodontic diagnostics and treatment planning. The technique has a number of advantages and is constantly improving but its acceptance depends ultimately on the cost-effectiveness ratio to the individual practitioner.
56

Urvalskriteriernas prognostiska validitet för studieresultatet vid officersprogrammet / The importance of selection criteria to the cadet achievement at the Swedish Officers’ Programme

Niclason, Philip January 2013 (has links)
Undersökningen syftar till att jämföra två olika urvalssystem för officersprogrammet. För detta syfte ställs det gamla respektive det nya urvalssystemet mot kadetternas studieresultat. Urvalskriterierna till dessa urvalssystem korreleras mot studieresultatet i en korrelationsmatris. Därefter undersöks de uppmätta sambanden medelst semi-partiala korrelationsmått och konfidensintervall. Detta skapar belägg för att det föregående urvalssystemet var effektivare än den nya för att välja ut kadetter med förmåga att tillgodogöra sig utbildningen. Det urvalskriterium med starkast samband med studieresultatet är gymnasiebetyget, vilket även är beprövat i civila sammanhang. Vill Försvarsmakten premiera individer som har bättre förutsättningar för att tillgodogöra sig den gemensamma teoretiska utbildningen vid officersprogrammet bör den nuvarande viktningen av urvalssystemet ändras för att premiera gymnasiebetyget. / The aim of this study was to compare two different systems for selection criteria for the Swedish officers’ programme. In order to compare the old respectively the new system for cadet selection, the cadets’ achievements were compared to their selection criteria. The systems selection criteria were correlated to the cadets’ achievements in a correlation matrix. Thenceforth the connections were further investigated by semi-partial correlations and confidence intervals. In the study, there is evidence which indicates the previous system’s superior effectiveness compared to the new system; for example, regarding selection of cadets likely to benefit from the Programme. The selection criterion with the strongest connection to the cadet achievement was the cadets’ high school grades, which also seems to be a good indicator for predicting student achievement in civilian schools. If the Swedish Armed Forces want to enhance future cadets’ study capabilities, an advised method of achieving this would be to augment the significance of high school grades for the selection criteria.
57

Licence to drive : the importance of reliability for the validity of the Swedish driving licence test

Alger, Susanne January 2019 (has links)
Background: The Swedish driving licence test is a criterion-referenced test resulting in a pass or fail. It currently consists of two parts - a theory test with 65 multiple-choice items and a practical driving test where at least 25 minutes are spent driving in traffic. It is a high-stakes test in the sense that the results are used to determine whether the test-taker should be allowed to drive a car without supervision. As the only other requirements for obtaining a licence is a few hours of hazard education (and a short introduction if you intend to drive with a lay instructor) it is important that the test result, in terms of pass or fail, is reliable and valid. If this is not the case it could have detrimental effects on traffic safety. Examining all relevant aspects is beyond the scope of this licentiate thesis so I have focused on reliability. Methods Reliability for both the theoretical and practical test results was examined. As these are very different types of tests the types of reliability examined also differed. In order to examine inter-rater reliability of the driving test 83 examiners were accompanied by one of five selected supervising examiners for a day of tests. All in all 535 tests were conducted with two examiners assessing the same performance. At the end of the day the examiners compared notes and tried to determine the reason for any inconsistencies. Both examiners and students also filled in questionnaires with questions about background and preparation. As for studying decision consistency and decision accuracy of the theory test, three test versions (a total of around 12,000 tests) were examined with the help of methods devised by Subkoviak (Subkoviak, 1976, 1988) and Hanson & Brennan (Brennan, 2004; Hanson & Brennan, 1990). Results The results from two research studies concerning reliability were presented. Study I focused on inter-rater reliability in the driving test and in 93 per cent of cases the examiners made the same assessment. For the tests where their opinions differed there was no correlation to any of the background variables or other variables examined except for three, which had logical explanations and did not constitute a problem. Although there were cases where the differences were due to different stances on matters of interpretation the most common suggested cause was the placement in the car (back seat vs. front seat). Although the supervising examiners gave both praise and criticism as to how the test was carried out the study does not answer the question whether the tests were equal in terms of composition and difficulty. In Study II the focus was on decision consistency and decision accuracy in the theory test. Three versions of the theory tests were examined and, on the whole, found to be fairly similar in terms of item difficulty and score distribution, but the mean was so close to the cut-score (i.e. the score required to pass) that the pass rate differed somewhat between versions. Agreement coefficients were around .80 for all test versions (between .79 and .82 depending on method). Classification accuracy indicated an .87 probability of a correct classification. Conclusion It is important to examine the reliability and validity of the driving licence test since a misclassification can have serious consequences in terms of traffic safety. In the studies included here the rate of agreement between examiners is deemed as satisfactory. It would be preferable if the classification consistency and classification accuracy, as estimated by the methods used, were higher for the theory test, given its importance. While reliability in terms of agreement between raters/examiners or consistency and accuracy of classification are routinely examined in other contexts, such as large-scale educational testing, this is not often done for the driving licence tests. At the same time, the methods used here can be transferred to contexts where such properties are generally not examined. Collecting information about test-takers and examiners, like in Study I, can provide evidence concerning possible bias. Examining to what extent decisions are consistent is one important aspect of collecting evidence that shows that test results can be used to draw conclusions about driver competence. Still, regardless of outcome, validation is a process that never ends. There is always reason to examine various aspects and make further improvements. There are also many other relevant aspects to examine. A prerequisite for the validity of the score interpretation of a criterion-referenced test like this one is that the cut-score is appropriate and the content relevant. This should therefore be the subject of further research as the validation process continues.
58

Reliabilitets- och validitetsprövning av Modifierad Self-efficacy Scale för patienter med långvarig smärta

Adelsköld, Signe, Thalin, Hanna January 2010 (has links)
<p><strong>Syfte:</strong> Studiens syfte var att reliabilitetspröva stabiliteten för M-SES för patienter med långvarig smärta genom test-retest metoden. Syftet var även att undersöka samtidig validitet för M-SES, genom att utföra M-SES och SES mätt vid samma tillfälle.</p><p><strong>Metod:</strong> I studien undersöktes self-efficacy instrumentet M-SES på Uppsala Akademiska sjukhus, på avdelningarna för Smärtcentrum och Smärtrehabilitering. Frågeställningarna berörde vilken stabilitets reliabilitet mätt med test-retest som förelåg hos M-SES, samt vilken grad av samtidig validitet som förelåg för M-SES korrelerat med SES. Den slutliga undersökningsgruppen bestod i frågeställningen om stabilitets reliabilitet av 29 patienter (23 kvinnor, sex män), och i frågeställning om samtidig validitet av 22 patienter (17 kvinnor, fem män).</p><p><strong>Resultat: </strong>Vid prövning av stabilitets reliabilitet för M-SES visade resultatet en stark korrelation, med korrelationskoefficient 0,92 och p<0,05. Det förelåg även en god överrensstämmelse för test-retest undersökningen. Prövningen av samtidig validitet för M-SES visade en stark korrelation, med koefficienten 0,88 och p<0,05.</p><p><strong>Konklusion:</strong> Studiens resultat visade att det förelåg en stark stabilitets reliabilitet och samtidig validitet för M-SES för patienter med långvarig smärta. Då studien genomfördes med få deltagare bör resultatet tolkas med försiktighet.</p>
59

Reliabilitets- och validitetsprövning av Modifierad Self-efficacy Scale för patienter med långvarig smärta

Adelsköld, Signe, Thalin, Hanna January 2010 (has links)
Syfte: Studiens syfte var att reliabilitetspröva stabiliteten för M-SES för patienter med långvarig smärta genom test-retest metoden. Syftet var även att undersöka samtidig validitet för M-SES, genom att utföra M-SES och SES mätt vid samma tillfälle. Metod: I studien undersöktes self-efficacy instrumentet M-SES på Uppsala Akademiska sjukhus, på avdelningarna för Smärtcentrum och Smärtrehabilitering. Frågeställningarna berörde vilken stabilitets reliabilitet mätt med test-retest som förelåg hos M-SES, samt vilken grad av samtidig validitet som förelåg för M-SES korrelerat med SES. Den slutliga undersökningsgruppen bestod i frågeställningen om stabilitets reliabilitet av 29 patienter (23 kvinnor, sex män), och i frågeställning om samtidig validitet av 22 patienter (17 kvinnor, fem män). Resultat: Vid prövning av stabilitets reliabilitet för M-SES visade resultatet en stark korrelation, med korrelationskoefficient 0,92 och p&lt;0,05. Det förelåg även en god överrensstämmelse för test-retest undersökningen. Prövningen av samtidig validitet för M-SES visade en stark korrelation, med koefficienten 0,88 och p&lt;0,05. Konklusion: Studiens resultat visade att det förelåg en stark stabilitets reliabilitet och samtidig validitet för M-SES för patienter med långvarig smärta. Då studien genomfördes med få deltagare bör resultatet tolkas med försiktighet.
60

Theory and validity evidence for a large-scale test for selection to higher education

Wedman, Jonathan January 2017 (has links)
Validity is a crucial part of all forms of measurement, and especially in instruments that are high-stakes to the test takers. The aim of this thesis was to examine theory and validity evidence for a recently revised large-scale instrument used for selection to higher education in Sweden, the Swedish Scholastic Assessment Test (SweSAT), as well as identify threats to its validity. Previous versions of the SweSAT have been intensely studied but when it was revised in 2011, further research was needed to strengthen the validity arguments for the test. The validity approach suggested in the most recent version of the Standards for education and psychological testing, in which the theoretical basis and five sources of validity evidence are the key aspects of validity, was adopted in this thesis. The four studies that are presented in this thesis focus on different aspects of the SweSAT, including theory, score reporting, item functioning and linking of test forms. These studies examine validity evidence from four of the five sources of validity: evidence based on test content, response processes, internal structure and consequences of testing. The results from the thesis as a whole show that there is validity evidence that supports some of the validity arguments for the intended interpretations and uses of SweSAT scores, and that there are potential threats to validity that require further attention. Empirical evidence supports the two-dimensional structure of the construct scholastic proficiency, but the construct requires a more thorough definition in order to better examine validity evidence based on content and consequences for test takers. Section scores provide more information about test takers' strengths and weaknesses than what is already provided by the total score and can therefore be reported, but subtest scores do not provide additional information and should not be reported. All four quantitative subtests, as well as the Swedish reading comprehension subtest, are essentially free of differential item functioning (DIF) but there is moderate DIF that could be bias in two of the four verbal subtests. Finally, the equating procedure, although it appears to be appropriate, needs to be examined further in order to determine whether it is the best practice available or not for the SweSAT. Some of the results in this thesis are specific to the SweSAT because only SweSAT data was used but the design of the studies and the methods that were applied serve as practical examples of validating a test and are therefore likely useful to different populations of people involved in test development, test use and psychometric research. Suggestions for further research include: (1) a study to create a more clear and elaborate definition of the construct, scholastic proficiency; (2) a large and empirically focused study of subscore value in the SweSAT using repeat test takers and applying Haberman’s method along with recently proposed effect size measures; (3) a cross-validation DIF-study using more recently administered test forms; (4) a study that examines the causes for the recurring score differences between women and men on the SweSAT; and (5) a study that re-examines the best practice for equating the current version of the SweSAT, using simulated data in addition to empirical data.

Page generated in 0.0493 seconds