As linhas e as entrelinhas: um estudo das questões de língua espanhola no ENEM / The lines and between the lines: the Spanish language questions in ENEM.

Kanashiro, Daniela Sayuri Kawamoto 30 March 2012 (has links)
Considerando a valorização da língua espanhola no contexto educacional brasileiro nos últimos anos, seja por meio da publicação da Lei 11.161/2005 e dos documentos oficiais, seja pela inserção de questões desse idioma no Exame Nacional para o Ensino Médio (Enem), a partir de 2010; considerando também a importância desse exame que tem objetivos bastante amplos, como a avaliação do desempenho do aluno concluinte da educação básica, a seleção de candidatos para o ensino superior e, inclusive, a possibilidade de servir de base para a reestruturação dos currículos do ensino médio, conforme parecer de aprovação da matriz do novo Enem, emitido pelo Conselho Nacional de Secretários de Educação, em 2009, julgamos importante e procedente pesquisar o tema avaliação, focalizando os estudos sobre os instrumentos utilizados para medir as habilidades de língua espanhola no referido exame de abrangência nacional. Para levar a cabo tal propósito, inicialmente traçamos um breve panorama a respeito do ensino de espanhol no Brasil, a fim de percorrer a trajetória dessa língua e compreender as possíveis razões que motivaram sua inclusão no novo formato do Enem. Na sequência, apresentamos os pressupostos teóricos, discutindo aspectos relacionados à avaliação, à leitura e aos procedimentos de avaliação da compreensão leitora. Em seguida, comentamos a Matriz de Referência (2009), divulgada pelo Ministério de Educação e pelo Instituto Nacional de Estudos e Pesquisas Educacionais (Inep), e que apresenta as habilidades consideradas em cada área do conhecimento do ensino médio. Também discorremos sobre a Matriz de Questões, elaborada por Nery (2002) em sua tese doutoral e que, levando-se em conta alguns ajustes, permite analisar o nível de complexidade das perguntas propostas em provas de língua estrangeira como o Enem. No capítulo seguinte, fazemos um estudo dos textos, dos enunciados e das alternativas presentes nas versões das provas consideradas, conforme fundamentação teórica e metodologia expostas nos capítulos anteriores. Analisamos as questões de espanhol presentes nas três versões do exame: as provas de 2010 a primeira e a segunda aplicação; e a de 2011. De modo geral, constatamos que os itens solicitaram basicamente: a associação entre tema e título com base na compreensão global da mensagem proposta; a identificação de informações expressas; e o reconhecimento da 22 intenção do texto ou do gênero textual. Ao mesmo tempo em que não identificamos questões que privilegiassem o domínio de regras gramaticais e do léxico de forma descontextualizada, é preciso ressaltar que alguns itens puderam ser respondidos somente fundamentados na compreensão do enunciado redigido em português, ou no conhecimento prévio, isto é, sem que o leitor tivesse que revelar a compreensão do texto em língua estrangeira. Ao final do trabalho, apresentamos as referências bibliográficas e, nos anexos, constam as provas analisadas, além de outros textos aos quais nos referimos nas análises. / Considering firstly Spanish language value in Brazilian educational context in late years, not only because of the 11.161/2005 law publication, but also because of the presentation of Spanish language questions in Exame Nacional para o Ensino Médio (Enem) since 2010, and, secondly, the importance of this exam as a form to evaluate the students from the final period of basic education in Brazil; equally important the selection of candidates to the undergraduation courses, as well as the possibility of this exam to serve as the initial base to reconstruct Brazilian high school period curriculums in accordance with Enem syllabus approval established by Conselho Nacional de Secretários de Educação in 2009, we consider important and relevant to research the theme evaluation by focusing on the instrument used to measure Spanish language abilities in this referring Brazilian exam. To do so, initially we construct a brief panorama concerning the Spanish language teaching practice in Brazil in order to understand the ways of this language in the educational context and comprehend the possible reasons that motivate the Spanish language inclusion in Enem. In addition, we present the theoretical review by aiming at discussing the aspects related to evaluation, to reading and to the procedures of evaluating the students reading comprehension abilities. Moreover, we discuss specifically the Matriz de Referência (2009), published by Ministério de Educação and by Instituto Nacional de Estudos e Pesquisas Educacionais (Inep), which introduces the considered abilities in each area of Brazilian high school period as well as the Matriz de Questões based on Nerys Doctoral Dissertation (2002) which allows to analyze the complexity level of proposed tasks in foreign language questions in final exams like Enem. In the following chapter, we construct a study concerning the texts, the task commands and the alternatives presented in the considered exams versions based on the theoretical review and the methodology explained in the previous chapters. We analyze the Spanish language questions presented in three Enem exam versions: the exams from 2010 the first and the second appliances and from 2011, the third one. In a general view, we comprehend that the questions demanded basically: association between theme and title based on the global comprehension in the proposed message; the identification of expressed information; 22 and the recognition of text intention or the text genre. At the same time that we do not identify questions which are focused on grammar rules or vocabulary forms, it is necessary to reinforce that some items could be answered only based on the comprehension of the task commands written in Portuguese, or just based on the students previous knowledge. In the end of this investigation, we present the bibliographical references, Enem exams analyzed and the other texts referred in this present study.

Redações do ENEM/2012: réplicas ativas nas múltiplas vozes / Essays of Enem/2012: active responses in the multiple voices

Polachini, Nathália Rodrighero Salinas 16 December 2014 (has links)
Nesta dissertação, o objetivo é investigar um conjunto de redações do Exame Nacional do Ensino Médio (Enem)/2012, analisando as relações dialógicas estabelecidas pelos escreventes a partir da interação ativa com as vozes reportadas para a defesa de um ponto de vista sobre o tema: O movimento imigratório para o Brasil no século XXI. Desde 2009, o Enem seleciona candidatos para o ingresso no ensino superior e a redação é o instrumento que solicita a elaboração de um texto dissertativo-argumentativo. A partir do total de 2720 redações cedidas pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (Inep), o corpus foi constituído por 121 redações, segundo dois critérios: (a) a faixa de desempenho de 200 a 1000 pontos, respeitando a diversidade de notas, e (b) as cinco regiões brasileiras, marcando a representatividade regional. A fundamentação teórica deste trabalho centra-se na perspectiva dialógica da linguagem de Bakhtin e o Círculo, principalmente, nos conceitos de enunciado concreto e discurso citado, e na perspectiva ideológica dos estudos de letramento. Assumindo o trabalho com a escrita como um processo de compreensão responsiva, esta pesquisa buscou compreender cada texto como uma réplica ativa à proposta de redação e aos discursos oficiais que dela ecoam. No conjunto das redações, foram identificados quatro tipos de réplicas, que serviram como eixos norteadores para a análise dos modos heterogêneos de como os escreventes responderam às instruções objetivas da proposta e ao tema da imigração: (i) réplicas à exigência dissertativa; (ii) réplicas aos textos da coletânea, (iii) réplicas à imagem da identidade nacional e (iv) réplicas à história oficial do Brasil. Dentro de cada uma dessas réplicas, os resultados mostraram que os escreventes utilizaram procedimentos linguístico-discursivos para a construção do texto argumentativo, tais como: citações nos diferentes estágios composicionais da dissertação, paráfrases associadas à síntese, cópia e imitação dos textos da coletânea, construções referenciais para a caracterização do Brasil, como o uso de slogans, a mobilização de alusões históricas e narrativas da colonização. Tais procedimentos foram usados para assumir posicionamentos polêmicos e não polêmicos, alguns empregados com tendência à reprodução da palavra alheia e outros com vistas a sua reelaboração. Sob um olhar dialógico-axiológico, a análise da apreensão dos discursos de dentro e de fora da coletânea constatou não só o engendramento ativo dos sujeitos na produção de sentidos, mas os seus direcionamentos para os interlocutores presumidos e para as vozes institucionais dentro da rede de relações que envolve o projeto de escrita na avaliação do Enem. As réplicas puderam mostrar percursos discursivos construídos no diálogo com diferentes repertórios sociais, culturais e linguísticos, sinalizando que o trabalho com a escrita não está desvinculado dos contextos sócio-históricos das práticas letradas dos escreventes, refletindo e refratando os modelos normativos. / In this dissertation, the goal is to investigate a collection of essays from the National Secondary Brazilian Examination (Enem)/2012, analyzing the dialogic relations established by the writers from the active interaction with the reported voices to defend a point of view on the topic \"the immigration movement to Brazil in the 21st century\". Since 2009, Enem selects candidates for admission to higher education and the writing is the instrument that calls for the development of a dissertative-argumentative text. From the total of 2720 essays provided by the National Institute for Educational Studies Anísio Teixeira (INEP), the corpus was consisted of 121 essays, according to two criteria of selection: a) the performance range of 200-1000 points, respecting the diversity of scores, and b) the five Brazilian regions, marking the regional representation. The theoretical foundation of this work focuses on the dialogic language perspective of Bakhtin and the Circle, mainly, the concepts of \"utterance\" and \"quoted speech,\" and the ideological perspective of the literacy studies. Assuming the job with writing as a process of responsive understanding, this research sought to understand each text as an active response to the writing proposal and to the official discourses. In all the texts, four types of responses were identified, which served as a guide for the analysis of the heterogeneous modes of how the participants answered to the instructions of the proposal and to the issue of immigration: (i) responses to the dissertation requirement; (ii) responses to the texts of the collection, (iii) responses to the image of national identity and (iv) responses to the official history of Brazil. Within each of these responses, the results showed that the subjects used linguistic-discursive procedures for the construction of the argumentative text, such as: quotes in different compositional stages of the dissertation, paraphrases associated with synthesis, copy and imitation of the texts from the collection, characterization of Brazil as the use of slogans, the mobilization of historical allusions and narrative of colonization. These procedures were used to take controversial positions and not controversial ones, some employed with the tendency to reproduce the alien word and others with the tendency to remake them. Under a dialogical axiological perspective, the analysis of the comprehension of the inside and outside discourses of the collection found not only the active gendering of the subjects in the production of meanings, but their directions for the presumed actors and to the institutional voices within the network relationships of the writing project on the assessment of Enem. The responses could show discursive routes constructed in dialogue with different social, cultural and linguistic repertoires, signaling that the work with writing is not disconnected from the socio historical contexts of the student´s literate practices, reflecting and refracting the normative models.

Desenvolvimento de Competências e Habilidades apontadas no ENEM para a área de Química: ensino por meio de Situações-problema / Development of Competencies and Skills pointed out in the ENEM for the Chemistry area: teaching through Problem Situations

Luigi, Camila Alexandra Rodrigues 07 November 2018 (has links)
Considerando que o Exame Nacional do Ensino Médio influencia práticas de ensino, este trabalho tem como proposta verificar como Situações-problema (ZABALA e ARNAU, 2010) articuladas ao Ensino de Química podem promover o desenvolvimento de Competências e Habilidades exigidas pelo ENEM. Desenvolvemos e aplicamos uma sequência de atividades em um Cursinho Popular Comunitário. Os objetivos de trabalho consistiram em analisar as atividades procurando evidenciar as principais dificuldades conceituais e cognitivas dos alunos na resolução dos problemas, realizar um acompanhamento individual dos estudantes para verificar evoluções ou superações das dificuldades, contribuir com práticas pedagógicas no Ensino de Química, e desenvolver um estudo dos principais documentos oficiais. De forma contraditória as próprias questões do ENEM nem sempre desenvolvem Competências e Habilidades, apresentando um caráter conteudista. Assim, criamos e aplicamos situações que problematizaram o ensino. Os dados deste trabalho foram obtidos através da resolução de questões reelaboradas do próprio ENEM e outras criadas. Como análise de dados foi empregada a ferramenta Análise de Conteúdos proposta por Bardin (1977), apoiando-se em referenciais teóricos que investigam o desenvolvimento de habilidades cognitivas de alta e baixa ordem para a criação de categorias (MARCONDES E SUART (2008) e ZOLLER, (1993)). Os alunos apresentaram melhores rendimentos em questões de baixa ordem cognitiva que, segundo Zoller (1993), significa maior facilidade em recordar a informação, aplicar conhecimentos ou algoritmos memorizados. Quanto ao rendimento em questões que demandaram alta cognição, incialmente apresentou-se baixo, mas após a participação nas sequências de atividades, houve um aumento gradual e significativo. O que representou o domínio de investigação e resolução de problemas muitas vezes pouco familiares aos alunos e a tomada de decisões (ZOLLER, 1993). Acreditamos que conhecer o aluno de forma individualizada foi importante para que pudéssemos acompanhar suas dificuldades e avanços. Diversas foram as razões que comprometeram a resolução adequada dos problemas propostos, como o nível de envolvimento e compreensão dos alunos, a forma de aplicação dos conhecimentos adquiridos, e também, dificuldades conceituais e de raciocínios matemáticos. Apesar das dificuldades, ensinar por meio de competências e habilidades certamente correspondem à forma ideal de ensino. E como educadores temos a obrigação de enfrentar os desafios cotidianos da educação. / Considering that the National Examination of Secondary Education influences teaching practices, this work has as a proposal to verify as Problem Situations (ZABALA e ARNAU, 2010) articulated to the teaching of Chemistry can promote the development of Competences and Skills required by ENEM. We developed and aplied a sequence of activities in a Community Popular Course. The objectives of the study were to analyze the activities seeking to highlight the main conceptual and cognitive difficulties of the students in solving problems, to carry out an individual follow-up of the students to verify evolutions or overcome difficulties, to contribute with pedagogical practices in the teaching of Chemistry, and to develop a study of the main official documents. In a contradictory way the very issues of the E do not always develop Skills and Abilities, presenting a content character. Thus, we create and apply Situations that problematized the teaching. The data of this work were obtained through the resolution of reworked questions of the ENEM itself and other created ones. The data analysis tool was proposed by Bardin (1977), based on theoretical references that investigate the development of high and low order cognitive abilities for the creation of categories (MARCONDES AND SUART (2008) and ZOLLER, (1993)).According to Zoller (1993), the students presented better performance in questions of low order of cognition, which means that it is easier to remember the information, to apply memorized knowledge or algorithms. Concerning income in questions that demand high cognition, it was initially low, but after participation in the sequences of activities, there was a gradual and significant increase. What represented the domain of investigation and resolution of problems often unfamiliar to students and the decision-making (ZOLLER, 1993). We believe that knowing the student in an individualized way was important so that we could follow his difficulties and advances. There were several reasons that compromised the adequate resolution of the proposed problems, such as the level of student involvement and understanding, the application of acquired knowledge, and also conceptual difficulties and mathematical reasoning. Despite the difficulties, teaching through skills and abilities certainly correspond to the ideal form of teaching. And as educators we have an obligation to face the everyday challenges of education.


Sousa, Rosy-mary Magalhães de Oliveira 29 September 2010 (has links)
Made available in DSpace on 2016-07-27T13:52:24Z (GMT). No. of bitstreams: 1 ROSYMARY MAGALHAES DE OLIVEIRA SOUSA.pdf: 1798991 bytes, checksum: c0d18401e3927e8f6e15cc0cdae80600 (MD5) Previous issue date: 2010-09-29 / Now it has been made the use of the results of the student's acting in the Exame Nacional do Ensino Médio (ENEM) for entrance in degree courses. While the orientation of the State General office of Education is that the pedagogic projects of the schools are built starting from interests and local needs, suitable for teachers and students, the contents and objectives of evaluation of ENEM are delineated as a homogeneous proposal to the whole country. Like this, the subject that present is: what do teachers and students say concerning the relationship among the one what is taught at the school and the one what is evaluated in ENEM? In search of answering her he/she took place a research of qualitative nature, tends as general objective to analyze what students and teachers say concerning the relationship among what it is taught at the school and what is evaluated in ENEM. The research based on authors as Hoffman (2000), Esteban (2001), Vallejo (2006), Moretto (2005) Aquino, (1997), Saul (2000), among others. The specific objectives were: - to describe and to analyze the relationships that teachers establish among the content that you/they teach in the school and the appraised content in ENEM; - to describe and to analyze the relationships that students establish among the content that you/they learn in the school and the appraised content in ENEM; - to identify the contributions of pointed ENEM for the students and teachers. The subject of the research was teachers and students of a state public school in the metropolitan area of Goiania. The data were collected through semi-structured interviews. The analysis allowed the identification of three main categories: 1 Difficulty of interdisciplinarity; 2 - ENEM: opportunity, motivation; 3 School Educational Project and ENEM: tension between closeness and distance. It is waited that the results of this research can contribute for better understanding concerning ENEM and his role in the improvement of the school learning. / Atualmente vem sendo feito o aproveitamento dos resultados do desempenho do estudante no Exame Nacional do Ensino Médio (ENEM) para ingresso em cursos de graduação. Enquanto a orientação da Secretaria de Educação do Estado de Goiás é de que os projetos pedagógicos das escolas sejam construídos a partir de interesses e necessidades locais, indicadas por professores e alunos, os conteúdos e objetivos de avaliação do ENEM são delineados como uma proposta homogênea para todo o país. Assim, a questão que se apresenta é: o que dizem professores e alunos acerca da relação entre o que é ensinado na escola e o que é avaliado no ENEM? Em busca de respondê-la realizou-se uma pesquisa de natureza qualitativa, tendo como objetivo geral analisar o que dizem estudantes e professores acerca da relação entre o que é ensinado na escola e o que é avaliado no ENEM. A pesquisa baseou-se em autores como Hoffman (2000), Esteban (2001), Vallejo (2006), Moretto (2005) Aquino, (1997), Saul (2000), entre outros. Os objetivos específicos foram: - descrever e analisar as relações que professores estabelecem entre o conteúdo que ensinam na escola e o conteúdo avaliado no ENEM; - descrever e analisar as relações que alunos estabelecem entre o conteúdo que aprendem na escola e o conteúdo avaliado no ENEM; - identificar as contribuições do ENEM apontadas pelos estudantes e professores. Os sujeitos da pesquisa foram professores e estudantes de uma escola pública estadual na região metropolitana de Goiânia. Os dados foram coletados por meio de entrevistas semi-estruturadas. A análise permitiu a identificação de três categorias principais: 1 Dificuldade de interdisciplinaridade; 2 - ENEM: oportunidade, motivação; 3 Projeto Pedagógico da escola e o ENEM: tensão entre aproximação e distanciamento. Espera-se que os resultados desta pesquisa possam contribuir para melhor compreensão acerca do ENEM e seu papel na melhoria da aprendizagem escolar.

Enem e ensino de geografia interfaces que precisam ser discutidas

Andrade, Cristiane Maciel de Souza January 2016 (has links)
O presente trabalho está vinculado à linha de pesquisa de Ensino de Geografia do Programa de Pós-Graduação da Universidade Federal do Rio Grande do Sul (UFRGS). O trabalho tem como objetivo geral investigar os fundamentos, as concepções e as práticas dos professores do componente curricular de Geografia no Ensino Médio, para compreender as dificuldades apresentadas pelos estudantes na resolução de questões de Geografia da Prova de Ciências Humanas do ENEM. Metodologicamente configura-se como uma investigação de caráter qualitativo, empregando a técnica de análise de conteúdo. A investigação estruturou-se em etapas consecutivas e complementares a fim de, identificar quais ações têm sido implementadas a partir da Matriz de Referência do ENEM nas instituições de ensino da rede pública estadual de Porto Alegre. Buscamos compreender o quanto esta avaliação em larga escala vem influenciando as práticas pedagógicas no Ensino Médio, até o ponto de organização de um currículo estruturado por competências e habilidades constituído em três pilares teóricos que sustentam a reforma educacional: a interdisciplinaridade, a contextualização e resolução de problemas. A pesquisa buscou aportes teóricos e empíricos que nos permitissem refletir de maneira mais significativa os limites e as possibilidades que o ENEM, como política pública de avaliação da educação básica, apresenta diante da realidade das escolas. / The present study is attached to the research line of the Graduate Studies Program of Geography of the Universidade Federal do Rio Grande do Sul (UFRGS). The work aims to investigate the principles, the conceptions and the High School Geography teachers´ practices in order to understand the difficulties that students have when answering the Geography questions in the Human Sciences Exam of ENEM. It is, methodologically, an investigation of qualitative nature, using the contents analysis technique. The research was based in successive and complementary stages in order to identify which actions have been used according to the “Matriz de Referência do ENEM” in the public schools of Porto Alegre. It is important to understand how this large-scale evaluation has been influencing the pedagogic high school practices, including the organization of the educational curriculum planned in competences and abilities based in three pillars of the educational reform: the interdisciplinary approach, the contextualization and the problem resolution. It is aimed to find out during the process and at the end of the research, theoretical and empirical contributions that enable us to a further reflection on the limits and the possibilities that the ENEM, as a public education policy of the basic education evaluation system, presents to the reality of the schools.

Solving University entrance assessment using information retrieval / Resolvendo Vestibular utilizando recuperação de informação

Silveira, Igor Cataneo 05 July 2018 (has links)
Answering questions posed in natural language is a key task in Artificial Intelligence. However, producing a successful Question Answering (QA) system is challenging, since it requires text understanding, information retrieval, information extraction and text production. This task is made even harder by the difficulties in collecting reliable datasets and in evaluating techniques, two pivotal points for machine learning approaches. This has led many researchers to focus on Multiple-Choice Question Answering (MCQA), a special case of QA where systems must select the correct answers from a small set of alternatives. One particularly interesting type of MCQA is solving Standardized Tests, such as Foreign Language Proficiency exams, Elementary School Science exams and University Entrance exams. These exams provide easy-to-evaluate challenging multiple-choice questions of varying difficulties about large, but limited, domains. The Exame Nacional do Ensino Médio (ENEM) is a High School level exam taken every year by students all over Brazil. It is widely used by Brazilian universities as an entrance exam and is the world\'s second biggest university entrance examination in number of registered candidates. This exam consists in writing an essay and solving a multiple-choice test comprising questions on four major topics: Humanities, Language, Science and Mathematics. Questions inside each major topic are not segmented by standard scholar disciplines (e.g. Geography, Biology, etc.) and often require interdisciplinary reasoning. Moreover, the previous editions of the exam and their solutions are freely available online, making it a suitable benchmark for MCQA. In this work we automate solving the ENEM focusing, for simplicity, on purely textual questions that do not require mathematical thinking. We formulate the problem of answering multiple-choice questions as finding the candidate-answer most similar to the statement. We investigate two approaches for measuring textual similarity of candidate-answer and statement. The first approach addresses this as a Text Information Retrieval (IR) problem, that is, as a problem of finding in a database the most relevant document to a query. Our queries are made of statement plus candidate-answer and we use three different corpora as database: the first comprises plain-text articles extracted from a dump of the Wikipedia in Portuguese language; the second contains only the text given in the question\'s header and the third is composed by pairs of question and correct answer extracted from ENEM assessments. The second approach is based on Word Embedding (WE), a method to learn vectorial representation of words in a way such that semantically similar words have close vectors. WE is used in two manners: to augment IR\'s queries by adding related words to those on the query according to the WE model, and to create vectorial representations for statement and candidate-answers. Using these vectorial representations we answer questions either directly, by selecting the candidate-answer that maximizes the cosine similarity to the statement, or indirectly, by extracting features from the representations and then feeding them into a classifier that decides which alternative is the answer. Along with the two mentioned approaches we investigate how to enhance them using WordNet, a structured lexical database where words are connected according to some relations like synonymy and hypernymy. Finally, we combine different configurations of the two approaches and their WordNet variations by creating an ensemble of algorithms found by a greedy search. This ensemble chooses an answer by the majority voting of its components. The first approach achieved an average of 24% accuracy using the headers, 25% using the pairs database and 26.9% using Wikipedia. The second approach achieved 26.6% using WE indirectly and 28% directly. The ensemble achieved 29.3% accuracy. These results, slightly above random guessing (20%), suggest that these techniques can capture some of the necessary skills to solve standardized tests. However, more sophisticated techniques that perform text understanding and common sense reasoning might be required to achieve human-level performance. / Responder perguntas feitas em linguagem natural é uma capacidade há muito desejada pela Inteligência Artificial. Porém, produzir um sistema de Question Answering (QA) é uma tarefa desafiadora, uma vez que ela requer entendimento de texto, recuperação de informação, extração de informação e produção de texto. Além disso, a tarefa se torna ainda mais difícil dada a dificuldade em coletar datasets confiáveis e em avaliar as técnicas utilizadas, sendo estes pontos de suma importância para abordagens baseadas em aprendizado de máquina. Isto tem levado muitos pesquisadores a focar em Multiple-Choice Question Answering (MCQA), um caso especial de QA no qual os sistemas devem escolher a resposta correta dentro de um grupo de possíveis respostas. Um caso particularmente interessante de MCQA é o de resolver testes padronizados, tal como testes de proficiência linguística, teste de ciências para ensino fundamental e vestibulares. Estes exames fornecem perguntas de múltipla escolha de fácil avaliação sobre diferentes domínios e de diferentes dificuldades. O Exame Nacional do Ensino Médio (ENEM) é um exame realizado anualmente por estudantes de todo Brasil. Ele é utilizado amplamente por universidades brasileiras como vestibular e é o segundo maior vestibular do mundo em número de candidatos inscritos. Este exame consiste em escrever uma redação e resolver uma parte de múltipla escolha sobre questões de: Ciências Humanas, Linguagens, Matemática e Ciências Naturais. As questões nestes tópicos não são divididas por matérias escolares (Geografia, Biologia, etc.) e normalmente requerem raciocínio interdisciplinar. Ademais, edições passadas do exame e suas soluções estão disponíveis online, tornando-o um benchmark adequado para MCQA. Neste trabalho nós automatizamos a resolução do ENEM focando, por simplicidade, em questões puramente textuais que não requerem raciocínio matemático. Nós formulamos o problema de responder perguntas de múltipla escolha como um problema de identificar a alternativa mais similar à pergunta. Nós investigamos duas abordagens para medir a similaridade textual entre pergunta e alternativa. A primeira abordagem trata a tarefa como um problema de Recuperação de Informação Textual (IR), isto é, como um problema de identificar em uma base de dados qualquer qual é o documento mais relevante dado uma consulta. Nossas consultas são feitas utilizando a pergunta mais alternativa e utilizamos três diferentes conjuntos de texto como base de dados: o primeiro é um conjunto de artigos em texto simples extraídos da Wikipedia em português; o segundo contém apenas o texto dado no cabeçalho da pergunta e o terceiro é composto por pares de questão-alternativa correta extraídos de provas do ENEM. A segunda abordagem é baseada em Word Embedding (WE), um método para aprender representações vetoriais de palavras de tal modo que palavras semanticamente próximas possuam vetores próximos. WE é usado de dois modos: para aumentar o texto das consultas de IR e para criar representações vetoriais para a pergunta e alternativas. Usando essas representações vetoriais nós respondemos questões diretamente, selecionando a alternativa que maximiza a semelhança de cosseno em relação à pergunta, ou indiretamente, extraindo features das representações e dando como entrada para um classificador que decidirá qual alternativa é a correta. Junto com as duas abordagens nós investigamos como melhorá-las utilizando a WordNet, uma base estruturada de dados lexicais onde palavras são conectadas de acordo com algumas relações, tais como sinonímia e hiperonímia. Por fim, combinamos diferentes configurações das duas abordagens e suas variações usando WordNet através da criação de um comitê de resolvedores encontrado através de uma busca gulosa. O comitê escolhe uma alternativa através de voto majoritário de seus constituintes. A primeira abordagem teve 24% de acurácia utilizando o cabeçalho, 25% usando a base de dados de pares e 26.9% usando Wikipedia. A segunda abordagem conseguiu 26.6% de acurácia usando WE indiretamente e 28% diretamente. O comitê conseguiu 29.3%. Estes resultados, pouco acima do aleatório (20%), sugerem que essas técnicas conseguem captar algumas das habilidades necessárias para resolver testes padronizados. Entretanto, técnicas mais sofisticadas, capazes de entender texto e de executar raciocínio de senso comum talvez sejam necessárias para alcançar uma performance humana.

