81 |
Análise de questionários com itens constrangedores / Analysis of questionnaire with embarrassing itemsMariana Cúri 11 August 2006 (has links)
As pesquisas científicas na área da Psiquiatria freqüentemente avaliam características subjetivas de indivíduos como, por exemplo, depressão, ansiedade e fobias. Os dados são coletados através de questionários, cujos itens tentam identificar a presença ou ausência de certos sintomas associados à morbidade psiquiátrica de interesse. Alguns desses itens, entretanto, podem provocar constrangimento em parte dos indivíduos respondedores por abordarem características ou comportamentos socialmente questionáveis ou, até, ilegais. Um modelo da teoria de resposta ao item é proposto neste trabalho visando diferenciar a relação entre a probabilidade de presença do sintoma e a gravidade da morbidade de indivíduos constrangidos e não constrangidos. Itens que necessitam dessa diferenciação são chamados \\textbf{itens com comportamento diferencial}. Adicionalmente, o modelo permite assumir que indivíduos constrangidos em responder um item possam vir a mentir em suas respostas, no sentido de omitir a presença de um sintoma. Aplicações do modelo proposto a dados simulados para questionários com 20 itens mostraram que as estimativas dos parâmetros são próximas aos seus verdadeiros valores. A qualidade das estimativas piora com a diminuição da amostra de indivíduos, com o aumento do número de itens com comportamento diferencial e, principalmente, com o aumento do número de itens com comportamento diferencial suscetíveis à mentira. A aplicação do modelo a um conjunto de dados reais, coletados para avaliar depressão em adolescentes, ilustra a diferença do padrão de resposta do item ``crises de choro\" entre homens e mulheres. / Psychiatric scientific research often evaluate subjective characteristics of the individual such as depression, anxiety and phobias. Data are collected through questionnaires with items that try to identify the presence or absence of certain symptoms associated with the psychiatric disease. Some of these items though could make some people embarrassed since they are related to questionable or even illegal social behaviors. The item response theory model proposed within this work envisions to differentiate the relationship between the probability of the symptom presence and the gravity of the disease of embarrassed and non-embarrassed individuals. Items that need this differentiation are called differential item functioning (dif). Additionally, the model has the assumption that individuals embarrassed with one particular item could lie across other answers to omit a possible condition. Applications of the proposed model to simulated data for a 20-item questionnaire have showed that parameter estimates of the proposed model are close to their real values. The estimate accuracy gets worse as the number of individuals decreases, the number of dif increases, and especially as the number of dif susceptible to lying increases. The application of the model to a group of real data, collected to evaluate teenager depression, shows the difference in the probability of \"crying crisis\" presence between men and women.
|
82 |
Elaboração da prova do Enade no modelo do banco nacional de itensCampos, Fernanda Cristina dos Santos 15 August 2013 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-02-29T12:41:57Z
No. of bitstreams: 1
fernandacristinadossantoscampos.pdf: 893214 bytes, checksum: 79cd56323f56a5f94cc5bba53322462d (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-03-03T14:15:42Z (GMT) No. of bitstreams: 1
fernandacristinadossantoscampos.pdf: 893214 bytes, checksum: 79cd56323f56a5f94cc5bba53322462d (MD5) / Made available in DSpace on 2016-03-03T14:15:42Z (GMT). No. of bitstreams: 1
fernandacristinadossantoscampos.pdf: 893214 bytes, checksum: 79cd56323f56a5f94cc5bba53322462d (MD5)
Previous issue date: 2013-08-15 / Esta dissertação consistiu em um estudo de caso de gestão para a Coordenação-Geral do Enade que compõe a Diretoria de Avaliação da Educação Superior do INEP. O objetivo foi avaliar a gestão do Banco Nacional de Itens para elaboração da prova do Enade.A escolha deste caso se justificou pela necessidade de refinamento nas ações que compõem o processo de elaboração da prova, devido à importância do exame para a Avaliação da Educação Superior Brasileira. Para esse fimfoi realizada uma pesquisa qualitativacomparando o atual modelo de avaliação baseado na Teoria Clássica de testes com um modelo baseado na Teoria de Resposta ao Item. Como resultado elaborou-se um Plano de Ação Educacional para aprimorar o processo deproduçãodos itens que compõem o Banco Nacional de Itensdo Enade. / This is essay is a case study of management to general coordination of National StudentPerformance Exam (Enade), that is part ofEvaluationof Higher Education Directory (DAES) at Inep. The aim is to evaluate the National Bank of Items management for Enade in order to improve the actions that are part of the test development, due to the importance of this exam. We develop a qualitative research comparing the current evaluation model based on the Classical Test Theory and Item Response Theory. As a result, an Education Action plan was created to improve the process of items production in the Enade National Bank of Items.
|
83 |
Eficácia dos processos de linkagem na avaliação educacional em larga escalaSilva, Wellington 14 September 2010 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-09-20T13:47:56Z
No. of bitstreams: 1
wellingtonsilva.pdf: 6130109 bytes, checksum: 639bf4b28ab59af38731c1e34562bfcc (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-10-04T15:48:34Z (GMT) No. of bitstreams: 1
wellingtonsilva.pdf: 6130109 bytes, checksum: 639bf4b28ab59af38731c1e34562bfcc (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-10-04T15:48:47Z (GMT) No. of bitstreams: 1
wellingtonsilva.pdf: 6130109 bytes, checksum: 639bf4b28ab59af38731c1e34562bfcc (MD5) / Made available in DSpace on 2016-10-04T15:48:47Z (GMT). No. of bitstreams: 1
wellingtonsilva.pdf: 6130109 bytes, checksum: 639bf4b28ab59af38731c1e34562bfcc (MD5)
Previous issue date: 2010-09-14 / Em 1997, através do Sistema Nacional de Avaliação da Educação Básica – SAEB,
definiu-se a escala de proficiência para o Brasil. A partir de então, praticamente todas as
avaliações em larga escala realizadas por diversos estados brasileiros têm procurado manter
uma comparabilidade de resultados com essa escala, por meio da Metodologia da Teoria da
Resposta ao Item – TRI. Entretanto observa-se uma diversidade de situações ao se analisar as
diferentes avaliações realizadas pelos Estados brasileiro e até mesmo no próprio SAEB. Nesse
trabalho, apresentaremos alguns aspectos técnicos necessários para se garantir a
comparabilidade nos procedimentos de linkagem de avaliações, bem como as características
das avaliações do SAEB e de alguns estados brasileiros ao longo do tempo. / In 1997, through the National System of Basic Education Evaluation ( SAEB ), the
proficiency scale for Brazil was defined. From that time on, almost all the assessment
realized by several Brazilian states have tried to keep a result comparability with this scale
through Item Response Theory Methodology ( IRT ). However, a variety of situations is
observed when different assessments realized in Brazilian states or even at SAEB are
analyzed.In this article, some technical aspects needed for ensuring the comparability in the
assessment linking procedures are presented, as well as the characteristic of SAEB´s
assessment and some Brazilian states´ assessment throughout time.
|
84 |
Mini Exame do Estado Mental e escolarização: propriedades psicométricas para amostras de idososMelo, Denise Mendonça de 07 December 2016 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-04-10T14:24:23Z
No. of bitstreams: 1
denisemendoncademelo.pdf: 507802 bytes, checksum: c3b5542230bfc09c6418bdaf6d4288e2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-04-11T11:35:29Z (GMT) No. of bitstreams: 1
denisemendoncademelo.pdf: 507802 bytes, checksum: c3b5542230bfc09c6418bdaf6d4288e2 (MD5) / Made available in DSpace on 2017-04-11T11:35:29Z (GMT). No. of bitstreams: 1
denisemendoncademelo.pdf: 507802 bytes, checksum: c3b5542230bfc09c6418bdaf6d4288e2 (MD5)
Previous issue date: 2016-12-07 / O Mini Exame do Estado Mental (MEEM) é o instrumento de rastreio do status cognitivo mais utilizado no mundo. Apesar de sua relevância, suas propriedades psicométricas não têm sido suficientemente analisadas no Brasil. O objetivo principal desta tese foi analisar as propriedades psicométricas da versão brasileira dessa medida proposta por Brucki et al (2003) com Teoria Clássica dos Testes e com Teoria de Resposta ao Item (TRI), enfatizando a escolaridade. Para tanto, foram desenvolvidos dois estudos. Antes, porém, realizou-se uma revisão sistemática das pesquisas empíricas indexadas na base de dados SciELO que utilizaram o MEEM com idosos no Brasil (N=74), que identificou 11 versões do MEEM. Mais da metade desses estudos adotou a escolaridade para estabelecer pontos de corte. Constatou-se que as propriedades psicométricas dessa medida têm sido pouco investigadas no país e, consequentemente, faltam padronização e evidências de validade. O segundo estudo teve como objetivo obter evidências de validade baseadas na estrutura interna para essa medida por meio de análise de componentes principais (ACP) e de análise fatorial confirmatória (AFC). Uma amostra de 2734 idosos participantes do estudo FIBRA Unicamp foi pesquisada. Na ACP, uma solução com cinco componentes foi a mais adequada. Quatro modelos de estrutura interna foram testados com AFC. Dois modelos com estrutura multidimensional de cinco fatores e um fator de segunda ordem apresentaram índices de ajuste satisfatórios, o que não ocorreu com o modelo unidimensional. Assim, há evidências de que se trata de uma medida multidimensional. O terceiro estudo apresentou uma análise com TRI para avaliar o funcionamento diferencial dos itens (DIF), a dificuldade e a discriminação dos itens. Constatou-se que quatro itens do sete seriado foram os mais difíceis e os itens nove, 13, 22 e 23, os mais fáceis. O nível de habilidade das pessoas foi maior do que o nível de dificuldade dos itens. Observou-se DIF para escolaridade (27 itens), sexo (18 itens) e idade (16 itens). Conclui-se que o uso do MEEM com idosos da comunidade deve ser cauteloso devido ao grande número de itens enviesados, principalmente pela escolaridade. Em suma, a versão do MEEM analisada apresentou evidências de validade baseadas na estrutura interna, e é fortemente influenciada pela escolaridade. / The Mini Mental State Examination (MMSE) is the screening tool of cognitive status most used in the world. Despite its relevance, its psychometric properties have not been sufficiently analyzed in Brazil. The main purpose of this thesis was to analyze the psychometric properties of a Brazilian version of this measure suggested by Brucki et al (2003) with Classical Theory of Tests and Item Response Theory (IRT), emphasizing education. For this, two studies were developed. First, however, there was a systematic review of empirical research indexed in SciELO database that used the MMSE with elderly (N = 74), which identified 11 versions of the MMSE. More than half of these studies adopted the school to establish cutoffs. It was found that the psychometric properties of this measure have been little investigated in the country and, consequently, lack standardization and evidence of validity. The second study aimed to obtain evidence of validity based on the internal structure for this measure by principal component analysis (PCA) and confirmatory factor analysis (CFA). A sample of 2734 elderly participants of the FIBRA Unicamp study was researched. In the PCA, a solution with five components was the most appropriate. Four internal structure models were tested with CFA. Two models with multidimensional structure of five factors and a factor of second order showed satisfactory fit indices, which did not happen with the unidimensional model. Therefore, there is evidence that it is a multidimensional measurement. The third study presents an analysis with IRT to evaluate the differential item functioning (DIF), difficulty and discrimination of the items. It was found that four items of serial seven were the most difficult and the items 9, 13, 22 and 23 were the easiest ones. The skill level of the people was higher than the level of difficulty of the items. There was DIF for education (27 items), sex (18 items) and age (16 items). We conclude that the use of MMSE with community dwelling elderly should be cautious due to the large number of biased items, especially for education. In conclusion, the version of the MMSE analyzed the version of MMSE analyzed obtained validity evidences regarding the internal structure, and is strongly influenced by education.
|
85 |
MODELO DE PLANEJAMENTO ECONÔMICO COMO SUPORTE AO PLANEJAMENTO ESTRATÉGICO PESSOAL / MODEL OF ECONOMIC PLANNING HOW TO SUPPORT PERSONAL STRATEGIC PLANNINGFrazzon, Lorenzo Sanfelice 25 January 2013 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Nowadays, the personal planning is a very important tool for individuals who seek a better quality of life, when planning the economic field becomes a large array of successful planning. For in addition to measuring personal success, supports the search for new goals, as well as enables ensure tranquility that reflects the financial well-being. In this context, the present study is to develop a Model of Economic Planning, to optimize the management of personal wealth, protecting and enhancing the heritage accumulated return on investment, according to the objectives, constraints and needs of the individual. The study was based on the model of Strategic Planning (ESTRADA, 2007), the model of Personal Planning (ESTRADA, 2011), the Modern Theory of Finance and Investment Management Models that address the key aspects for the development and maintenance s personal assets. The methodology consisted in a qualitative research with exploratory objective and descriptive. For the study design was used for literature review and survey. A description and critical analysis of the literature review allowed us to establish the essential elements for the development of the Model Economic Planning. The model consists of four steps that must be developed sequentially, the steps of the model are: Assessment, Formulation, Implementation and Monitoring, and their respective phases. It was also performed to evaluate the profile of the investor using the Item Response Theory (IRT), which proved to be possible calibrate the items to measure the degree of risk tolerance. / Atualmente, o planejamento pessoal é uma ferramenta de suma importância para os indivíduos que buscam uma melhor qualidade de vida, ao se planejar, o campo econômico torna-se um grande vetor de sucesso do planejamento. Pois além de medir o sucesso pessoal, dá suporte na busca de novos objetivos, assim como possibilita garantir uma tranqüilidade financeira que reflete no bem-estar pessoal. Neste contexto, o presente estudo consiste em desenvolver um Modelo de Planejamento Econômico, para otimizar a gestão da riqueza pessoal, protegendo o patrimônio acumulado e potencializando a rentabilidade dos investimentos, conforme os objetivos, restrições e necessidades do indivíduo. Este estudo tomou como base o modelo de modelo de Planejamento Estratégico Pessoal (ESTRADA, 2011), a Teoria das Finanças Modernas e os Modelos de Gestão de Investimentos, que abordam os aspectos determinantes para o desenvolvimento e manutenção do patrimônio pessoal. A metodologia constituiu-se em uma pesquisa de natureza qualitativa, com objetivo exploratório e descritivo. Para o delineamento do estudo, foi utilizada à pesquisa bibliográfica e o levantamento (Survey). A descrição e análise crítica da revisão bibliográfica permitiu estabelecer os elementos essenciais para a elaboração do Modelo de Planejamento Econômico. O modelo desenvolvido é composto de quatro etapas que devem ser desenvolvidas de forma sequencial, as etapas do modelo são: Avaliação, Formulação, Implementação e Monitoramento, além de suas respectivas fases. Também foi realizado a avaliação do perfil do investidor com o uso da Teoria da Resposta ao Item (TRI), que demonstrou ser possível calibrar os itens para medir o grau de tolerância ao risco.
|
86 |
Validação de um instrumento de avaliação de desempenho de coordenadores de curso pela teoria da resposta ao item / Validation of an instrument performance evaluation of engineers course by theory of response to itemMello, Luciany Abreu de 30 May 2014 (has links)
In recent decades, a new theory called Item Response Theory (IRT) has been progressively studied and successfully applied in the construction and analysis of tests. The IRT proposes a set of mathematical models that relate one or more latent traits of an individual with the probability of this to give right answer to an item, this relation is expressed in such a way that the higher the skill, the greater the probability of getting the item (ANDRADE et al. 2000). This bias, the present study aimed to construct and validate an instrument for evaluating the performance of undergraduate engineers, as perceived by the students, from the Item Response Theory. Data collection was conducted through a questionnaire consisting of twenty-six closed items based on Likert scale with responses ranging into four levels of agreement. The instrument assessed the technical and behavioral skills of the undergraduate program coordinator grouped into four dimensions: interpersonal / leadership, responsibility, communication and productivity / commitment for data analysis, we resorted to the exploratory factor analysis and factor analysis of full information . For the validation of the questionnaire used the Logistic Model Parameters 2 (ML2) proposed by TRI. The results indicate twenty items with good ability to discriminate the response of the individual, giving quality to items. The remaining six items, indicated as unsatisfactory should be reworked, retested and validated in future studies, as well as their dimensions. / Nas últimas décadas, uma nova teoria denominada Teoria de Resposta ao Item (TRI) vem sendo, progressivamente, estudada e aplicada com sucesso na construção e análise de testes. A TRI propõe um conjunto de modelos matemáticos que relacionam um ou mais traços latentes de um indivíduo com a probabilidade deste dar certa resposta a um item, sendo esta relação expressa de tal forma que, quanto maior a habilidade, maior a probabilidade de acerto no item (ANDRADE et al., 2000). Nesse viés, o presente estudo buscou construir e validar um instrumento de avaliação de desempenho de coordenadores de curso de graduação, segundo a percepção dos alunos, a partir da Teoria da Resposta ao Item. A coleta de dados foi realizada mediante questionário composto de vinte e seis itens fechados, baseado na escala Likert, com respostas variando em quatro níveis de concordância. O instrumento avaliou as competências técnicas e comportamentais do coordenador de curso de graduação agrupadas em quatro dimensões: relacionamento interpessoal/ liderança, responsabilidade, comunicação e produtividade/ compromisso Para análise dos dados, recorreu-se à análise fatorial exploratória e à análise fatorial de informação plena. Para a validação do questionário utilizou-se o Modelo Logístico de 2 Parâmetros (ML2) proposto pela TRI. Os resultados encontrados apontaram vinte itens com boa capacidade de discriminar a resposta do indivíduo, conferindo qualidade aos itens. Os seis itens restantes, apontados como insatisfatórios devem ser reformulados, testados novamente e validados em estudos futuros, bem como as respectivas dimensões.
|
87 |
Modelos da teoria de resposta ao item assimétricos de grupos múltiplos para respostas politômicas nominais e ordinais sob um enfoque bayesiano / Skew item response theory models for multiple groups and for nominal and ordinal polytomous responses under a Bayesian frameworkFerreira, Eduardo Vargas, 1987- 24 August 2018 (has links)
Orientador: Caio Lucidius Naberezny Azevedo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-08-24T12:51:18Z (GMT). No. of bitstreams: 1
Ferreira_EduardoVargas_M.pdf: 8131052 bytes, checksum: f344cd1f11e8d818f3aac90f48396cbc (MD5)
Previous issue date: 2014 / Resumo: No presente trabalho propõem-se novos modelos da Teoria de Resposta ao Item para respostas politômicas nominais e ordinais (graduais), via dados aumentados, para grupos múltiplos. Para a modelagem das distribuições dos traços latentes de cada grupo, considera-se normais assimétricas centradas. Tal abordagem, além de acomodar a característica de assimetria aos dados, ajuda a garantir a identificabilidade dos modelos estudados, a qual é tratada tanto sob a ótica frequentista quanto bayesiana. Com relação aos métodos de estimação, desenvolveu-se procedimentos bayesianos através de algoritmos de Monte Carlo via cadeias de Markov (MCMC), utilizando o algoritmo de Gibbs (DAGS), com a verossimilhança aumentada (dados aumentados) e Metropolis-Hastings, considerando a verossimilhança original. As implementações computacionais foram escritas em linguagem C++, integradas ao ambiente computacional, gráfico e estatístico R, viabilizando rotinas gratuitas, de código aberto e alta velocidade no processamento, essenciais à difusão de tais metodologias. Para a seleção de modelos, utilizou-se o critério de informação deviance (DIC), os valores esperados do critério de informação de Akaike (EAIC) e o critério de informação bayesiano (EBIC). Em relação à verificação da qualidade do ajuste de modelos, explorou-se a checagem preditiva a posteriori, que fornece meios concretos de se avaliar a qualidade do instrumento de medida (prova, questionário etc), qualidade do ajuste do modelo de um modo global, além de indícios de violações de suposições específicas. Estudos de simulação, considerando diversas situações de interesse prático, indicam que os modelos e métodos de estimação produzem resultados bastante satisfatórios, com superioridade dos modelos assimétricos com relação ao simétrico (o qual assume simetria das distribuições das variáveis latentes). A análise de um conjunto de dados reais, referente à primeira fase do vestibular da UNICAMP de 2013, ilustra o potencial da tríade: modelagem, métodos de estimação e ferramentas de diagnósticos, desenvolvida neste trabalho / Abstract: In this work, we propose new Item Response Theory models for nominal and ordinal (gradual) polytomous responses through augmented data schemes considering multiple groups. For the distribution of the latent traits of each group, we consider a skew-normal distribution under the centered parametrization. This approach will allow for accommodating a possible skewness of the latent trait distribution, but is also helpful to ensure the identifiability of the models, which is studied under frequentist and Bayesian paradigms. Concerning estimation methods, we developed Bayesian methods through Markov chain Monte Carlo (MCMC) algorithms by using the Gibbs algorithm (DAGS), with augmented likelihood (augmented data) and Metropolis-Hastings algorithms, considering the original
likelihood. The computational environment was written in the C++ language and integrated with the R program (a statistical computational and graphical environment), allowing for free, open source and high-speed routines which, in turn, are essential to the dissemination of the developed methodologies. In terms of model selection, we considered the deviance information criterion (DIC), the expected Akaike information criterion (EAIC) and expected Bayesian information criterion (EBIC). Regarding model-fit assessment tools, we explore the posterior predictive model- checking which allows for assessing the quality of measurement, instruments (tests, questionnaires, and others), the model fit in a global sense,
besides providing directions toward violations of specific assumptions. Simulation studies, considering different situations of practical interest, indicate that the models and estimation methods produced reasonable results, with outperformance of skew models when compared to symmetric ones (which assumes symmetry of the latent trait distribution). Analysis of a data set which corresponds to the first phase of the 2013 written examination of UNICAMP (State University of Campinas), illustrates the potential of the following triad: modelling; estimation methods; and diagnostic tools developed in this work. / Mestrado / Estatistica / Mestre em Estatística
|
88 |
Teste adaptativo computadorizado nas avaliações educacionais e psicológicas / Computerized adaptative test in educational and psychological evaluationThales Akira Matsumoto Ricarte 04 April 2013 (has links)
Testes Adaptativos Computadorizados (TAC) são aqueles que selecionam gradativamente as questões (itens) a serem apresentadas ao indivíduo de acordo com o seu nível de conhecimento (traco latente). Um TAC pode se basear em um modelo da Teoria da Resposta ao Item (TRI) para a estimação do traco latente e escolha do item a ser apresentado em cada passo do teste. Este trabalho apresenta modelos da TRI utilizados em TAC encontrados na literatura e descreve alguns métodos de calibração de itens para a formação e manutenção do banco de questões do teste sob o modelo de Samejima (1969), estimação do traço latente, seleção de itens com restrições utilizando a abordagem Shadow test e critérios de parada normalmente utilizados. Foram realizadas simulações com um banco grande (500 itens) e com um banco pequeno (21 itens) e avaliada a qualidade das estimativas dos traços latente (através do cálculos dos vícios e erros quadráticos médios) de TACs com diferentes números de itens. Foi aplicado o modelo de Samejima às respostas de estudantes do Exame ao proficiência em inglês (EPI) do ICMC - USP, que é aplicado semestralmente no formato lápis e papel, para a formação de um banco de itens e posterior construção de um TAC. Também foi aplicado o modelo às respostas de pacientes clínicos do Hospital das Clínicas da Medicina da USP, cedido pelo doutor Yuang-Pang Wang, ao Inventário de Depressão de Beck (BDI) para os mesmos propósitos. Comparações com a atual metodologia para avaliação da proficiência em língua inglesa do EPI (Medida de Probabilidade Admissível, MPA) e para o diagnóstico de depressão do BDI (critério sugerido por Kendall et al., 1987) foram realizadas demonstrando as vantagens e maior riqueza dos resultados obtidos com a TRI e com os TACs implementados. Adcionalmente foi desenvolvido um programa Same-CAT que armazena bancos de itens e possibilita a criação e aplicação de TACs com restrições, através da abordagem Shadow test / Computerized Adaptive Tests (CAT) are those that select questions (items) gradually to be presented to an individual according to their proficiency (latent trait level). A CAT can be based on an Item Response Theory (IRT) model for estimation of the latent trait and selection of the next item to be presented in each step of the test. This paper presents IRT models used in CATs found in literature and describes some methods of item calibration for creation and maintenance of a test items bank under the Samejima\'s model (Samejima; 1969), estimation of latent trait, item selection with constraints using the Shadow test approach and usuals stopping criteria. Simulations were conducted with a large bank (500 items) and a small bank (21 items) and the quality of the estimatives of latent traits were evaluated (through calculations of mean squared errors and bias) TACs with different item numbers. Samejima\'s model were applied for the responses of students to the English Proficiency Exam (EPE) of ICMC - USP, a test applied twice a year in paper and pencil format, to create an item bank and subsequent construction of a CAT. The model was also applied to the responses of clinical patients from the Hospital das Clnicas - USP, given by Dr. Yuang-Pang Wang, to the Beck Depression Inventory (BDI) for the same purposes. Comparisons using the current methodology to evaluate the English Language Proficiency of EPE (Measure of Probability Allowable, MPA) and the BDI (criterion suggested by Kendall et al., 1987) were performed, and the CATs provided better and richer results. Furthermore a program, Same-CAT, that stores item banks and allows CAT\'s applications with constraints was created
|
89 |
Teoria e a prática de um teste adaptativo informatizado / Theory and practice of computerized adaptive testingGilberto Pereira Sassi 10 April 2012 (has links)
O objetivo deste trabalho é apresentar os conceitos relacionados a Teste Adaptativo Informatizado, ou abreviadamente TAI, para o modelo logístico unidimensional da Teoria de Resposta ao Item. Utilizamos a abordagem bayesiana para a estimação do parâmetro de interesse, chamado de traço latente ou habilidade. Apresentamos os principais algoritmos de seleção de itens em TAI e realizamos estudos de simulação para comparar o desempenho deles. Para comparação, usamos aproximações numéricas para o Erro Quadrático Médio e para o Vício e também calculamos o tempo médio para o TAI selecionar um item. Além disso, apresentamos como instalar e usar a implementação de TAI desenvolvida neste projeto chamada de TAI2U, que foi desenvolvido no VBA-Excel usando uma interface com o R / The main of this work is to introduce the subjects related to Computerized Adaptive Testing, or breafly CAT, for the unidimensional three-parameter logistic model of Item Response Theory. We use bayesian approach to estimate the parameter of interest. We present several item selection algorithms and we perform simulations comparing them. The comparisons are made in terms of the mean square error, bias of the trait estimates, the average time for item selection and the average length of test. Furthermore, we show how to install e use the CAT implementation of this work called built in MIcrosoft Excel - VBA using interface with the statistical package R
|
90 |
Transposição da Teoria da Resposta ao Item: uma abordagem pedagógica / Transposition of Item Response Theory: a pedagogical approachSilva, Eder Alencar 23 June 2017 (has links)
Este trabalho tem por objetivo apresentar a Teoria da Resposta ao Item (TRI), por meio de uma abordagem pedagógica, aos professores da educação básica, que mencionaram esta necessidade por meio de pesquisa realizada pelo autor. Levar parte do conhecimento teórico que embasa esta teoria ao conhecimento do docente, principalmente a construção da curva de probabilidade de acerto do item, favorecerá a compreensão, a análise e o monitoramento do processo avaliativo educacional. Este material apresenta as principais definições e conceitos da avaliação externa em larga escala, além de fornecer insumos para a compreensão das suposições realizadas para aplicação da metodologia. Neste sentido, o texto foi estruturado de forma a apresentar didaticamente as etapas do processo de implementação de uma avaliação, desde a construção do item até a apuração e divulgação dos resultados. Todo enfoque será dado à construção do modelo da TRI com um parâmetro (dificuldade do item), também conhecido como modelo de Rasch, o que simplifica e facilita a compreensão da metodologia. O modelo utilizado nas avaliações externas em larga escala (modelo com três parâmetros) será introduzido a partir das considerações realizadas na abordagem que explicita o pensamento da construção do modelo de um parâmetro. Acredita-se que esta compreensão possa colaborar com o professor na exploração das habilidades/competências dos alunos durante os anos escolares. / This study aims to present the Item Response Theory (IRT), through a pedagogical approach, to teachers of basic education, which mentioned this necessity through research conducted by the author. To take part of the theoretical knowledge that supports this theory to the teacher\'s knowledge, especially the construction of probability curve of item correct response, it will favor for understanding, analysis and monitoring the evaluation educational process. This material presents the main definitions and concepts of the external evaluation in large scale, besides providing inputs for understanding the assumptions made to apply the methodology. In this sense, the text was structured in order to present the implementation process stages of a large scale assessment, from the item construction to the results calculation and dissemination. The focus will be given to the IRT model construction of one-parameter (difficulty of the item), also known as Rasch model, since it simplifies and facilitates the understanding of methodology. The model used in the external assessment on a large scale (three-parameter model) will be introduced from the considerations made in the approach that explicit the thought of one-parameter model construction. It is believed that understanding can collaborate with teacher in exploration of the students\' skills/competences during the school year.
|
Page generated in 0.0491 seconds