• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 611
  • 146
  • 19
  • 14
  • 9
  • 9
  • 9
  • 8
  • 7
  • 5
  • 5
  • 4
  • 2
  • 1
  • Tagged with
  • 807
  • 178
  • 170
  • 156
  • 156
  • 120
  • 107
  • 98
  • 92
  • 84
  • 84
  • 84
  • 83
  • 79
  • 77
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
451

A organização textual de relatórios de estágio escritos por professores de Língua Portuguesa em formação inicial

Botelho, Jaciara Lemos January 2009 (has links)
BOTELHO, Jaciara Lemos. A organização textual de relatórios de estágio escritos por professores de Língua Portuguesa em formação inicial. 2009, 137 f. Dissertação (Mestrado em Linguística) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-Graduação em Linguística, Fortaleza-CE, 2009. / Submitted by nazareno mesquita (nazagon36@yahoo.com.br) on 2012-09-26T13:02:55Z No. of bitstreams: 1 2009_Diss_JLBotelho.pdf: 915252 bytes, checksum: c2735ac3305e2bb02530e93709fad98e (MD5) / Approved for entry into archive by Maria Josineide Góis(josineide@ufc.br) on 2013-10-10T13:58:05Z (GMT) No. of bitstreams: 1 2009_Diss_JLBotelho.pdf: 915252 bytes, checksum: c2735ac3305e2bb02530e93709fad98e (MD5) / Made available in DSpace on 2013-10-10T13:58:06Z (GMT). No. of bitstreams: 1 2009_Diss_JLBotelho.pdf: 915252 bytes, checksum: c2735ac3305e2bb02530e93709fad98e (MD5) Previous issue date: 2009 / Analisamos relatórios de estágio, escritos por professores de Língua Portuguesa em formação inicial, para investigar a organização textual desse gênero acadêmico. Para isso, procedemos à análise da organização do contexto de produção, da estrutura composicional e do conteúdo informacional (organização tópica) dos relatórios de estágio. Tal procedimento nos permitiu refletir sobre a questão da competência textual escrita do professor em formação. Ancoramonos em teorias da Linguística Textual e do Interacionismo Sociodiscursivo, considerando os estudos de Lakatos e Marconi (2003), no que diz respeito à estrutura composicional do gênero relatório; de Leurquin (2008) para tratar do conceito de relatório de estágio; de Bronckart (2007) para as questões relacionadas à situação de produção e de Jubran et al. (1992) para tratar da organização tópica. Selecionamos amostras de relatórios dos alunos do Curso de Letras da UFMA, inscritos na disciplina Prática de Ensino de Língua Portuguesa, referentes aos semestres 2007.2 e 2008.1, escolhidas aleatoriamente, correspondendo a 17 relatórios. A diversidade dos semestres serviu para mostrar que o problema de escrita detectado nos relatórios selecionados não é supremacia de apenas um período, mas de qualquer um. Os resultados finais mostraram que, embora tenham passado por toda uma formação ao longo de quatro anos no Curso de Letras, professores de Língua Portuguesa em formação demonstram problemas de competência textual escrita na produção e organização do gênero acadêmico relatório de estágio, tanto no aspecto discursivo (contexto de produção) e composicional (estrutura do gênero) quanto em relação à organização tópica (distribuição do conteúdo informacional), com possíveis prejuízos, para o interlocutor, em relação ao sentido do texto
452

A organização do trabalho pedagógico no contexto das atividades de leitura e escrita

Souza, Silvana Paulina de [UNESP] 29 September 2009 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:55Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-09-29Bitstream added on 2014-06-13T19:32:06Z : No. of bitstreams: 1 souza_sp_me_mar.pdf: 1100725 bytes, checksum: 9a0c592824efc22741c8b6f1dff36732 (MD5) / A presente pesquisa teórica e prática, tendo como sujeitos crianças de uma quarta série do ensino fundamental da rede municipal de ensino do interior paulista, objetivou estudar a influência do entorno, aí inclusa a organização das ações pedagógicas, no desenvolvimento humano, com ênfase na análise das capacidades discursivas na infância. Apresenta uma discussão sobre a necessidade de se repensarem os elementos que compõem as atividades pedagógicas, identificando os processos centrais da sua organização. A hipótese é a de que as relações ocorridas em situações pedagógicas, organizadas intencionalmente, podem ser propulsoras de aprendizagens humanizadoras. São consideradas, nesse sentido, a atividade da criança e sua capacidade de aprendizado; a escola como espaço de vivências, de escolhas, de mediações; e a ação do professor mediador como criador de elos mediadores para a apropriação da linguagem escrita. Com o intuito de que as discussões recorressem a suportes teóricos que coadunassem entre si, a Teoria histórico-cultural foi eleita como o sustentáculo para as demais proposições que tratam da sala de aula como espaço mediador de ensino e de aprendizagem colaborativos (via metodologia de projetos) e a garantia para a coparticipação do sujeito aprendiz em sua própria formação como leitor e produtor de texto. A aplicação das técnicas da pesquisa-ação, por sua vez, respaldou-se no enfoque materialista-histórico-dialético, fundamento filosófico da Teoria histórico-cultural. Assim, a análise dos dados coletados coerentemente com a teoria eleita e norteada por seus conceitos gerou considerações acerca do ensino e da aprendizagem mediada pela linguagem escrita em contextos significativos e as contribuições destes instrumentos mediadores ao desenvolvimento humano. Ao concluir este trabalho foi possível afirmar que ter o homem... / This theoretical and practice research, that have as participants children of a fourth grade education in municipal basic education from a small city in the state of São Paulo, aimed to study the influence of the environment, in which there is included the organization of pedagogical practices in human development with emphasis on discursive analysis capacity in childhood. It presents a discussion about the need to rethink the elements of the educational activities, identifying the central part processes of their organization. The hypothesis is that the relation occurred in organized intentionally pedagogical situations may be drivers of humanizing learning. About this respect, the child‟s activity and its learning ability; the school as a mediation, choice and experience place; and the mediator teacher‟s action as a creator of mediator links to the written language appropriation are considered. In order that, the discussions appeal to theoretical supporters which adequate among them, the cultural-historical Theory was chosen as the cornerstone for all other proposals that deal with the classroom as mediator teaching and collaborative learning space (via project methodology ) and the guarantee for the schoolchild‟s co-participation in his own formation as a reader and producer‟s text. The techniques application of action research, in turn, was supported on the historical materialist dialectical focus, the historical cultural theory philosophical foundation. Thus, the analysis of collected data in a consistent way with the chosen theory and guided by its concepts generated some discussion concerning to the teaching and learning mediated by the written language in meaningful contexts and the contributions of these mediator instruments to the human development. In conclusion of this study, we can say that having the man as a parameter so that the educational task provides ...(Complete abstract click electronic address below)
453

Anotação semântica baseada em ontologia: um estudo do português brasileiro em documentos históricos do final do século XIX

Pereira, Juliana Wolf 01 July 2014 (has links)
Made available in DSpace on 2016-06-02T19:06:12Z (GMT). No. of bitstreams: 1 5898.pdf: 11774674 bytes, checksum: 3cc87530008d9b42c105781f8a1068a3 (MD5) Previous issue date: 2014-07-01 / Financiadora de Estudos e Projetos / This dissertation presents an approach to proceed with semantic annotation in historical documents from the 19th century that discuss the constitution of the mother tongue, the Portuguese Language in Brazil. The objective is to generate a group of semantically annotated documents in agreement with a domain ontology. To provide this domain ontology, the IntrumentoLinguistico Ontology was built, and it supported the process of automatic semantic annotation. The results obtained with the annotation were analyzed in comparison with the Gold Standard and they presented an elevated level of coincidence, between 0.86 and 1.00 for the Fl-score measure. Besides that, it was possible to locate new documents about the discussed domain in a sample of the Revistas Brazileiras. These results prove the efficacy of the approach of automatic semantic annotation. / Esta dissertação apresenta uma abordagem de anotação semântica automática em documentos históricos do século XIX que discutem a constituição da língua pátria, a Língua Portuguesa no Brasil. O objetivo e gerar um conjunto de documentos semanticamente anotados em acordo com uma ontologia de domínio. Para prover essa ontologia de domínio, foi construída a Ontologia Instrumento Linguístico que apoiou o processo para a realização da anotação semântica automática. Os resultados obtidos com a anotação foram analisados em comparação com o Gold Standard e apresentaram alto grau de coincidência, entre 0.86 e 1.00 para a medida F1-Score. Além disso, foi possível localizar novos documentos sobre o domínio discutido em uma amostra das Revistas Brazileiras. Esses resultados comprovam a eficácia da abordagem de anotação semântica automática.
454

BOOKISH: Uma ferramenta para contextualização de documentos utilizando mineração de textos e expansão de consulta / BOOKISH: A tool for background documents using text mining and query expansion

SILVA, Luciana Oliveira e 14 August 2009 (has links)
Made available in DSpace on 2014-07-29T14:57:51Z (GMT). No. of bitstreams: 1 dissertacao Luciana Oliveira.pdf: 4515929 bytes, checksum: 79519bd2538c588dba8b9d903a04d8f4 (MD5) Previous issue date: 2009-08-14 / The continuous development of technology and its dissemination in all domains have caused significant changes in society and in education. The new global society demands new skills and provides an opportunity to introduce new technologies into the educational process, improving traditional education systems. The focus should be on the search for information, significant research, and on the development of projects, rather than on the pure transmission of content. When delivering a lecture about a given content, teachers often provide additional sources that will help students deepen their understanding of the subject and carry out activities. Furthermore, it is desirable to have proactive students, capable of interpreting and identifying other sources of information that complement and expand the subject being studied. However, one of the challenges today is information overload - there are many documents available and few effective ways to treat them. Every day, large numbers of documents are stored and made available. These documents contain a lot of relevant information. However finding that knowledge is a difficult task. The BOOKISH system, proposed in this work, assists students in their search activity. Analyzing PowerPoint slide presentations, the tool identifies contextually similar electronic documents, minimizing the time spent in searching for additional relevant material and directing the student to the content he needs. The tool presented in this document uses text mining techniques and automatic query expansion. / O contínuo desenvolvimento da tecnologia e sua disseminação em todas as áreas têm provocado mudanças significativas na sociedade e na educação. É preciso buscar a formação necessária às novas competências do mundo globalizado e considerar que o momento proporciona uma oportunidade de aproximar novas tecnologias ao processo educativo como possibilidade de melhorar os sistemas de ensino tradicionais. O foco deve ser a busca da informação significativa e da pesquisa, o desenvolvimento de projetos e não predominantemente a simples transmissão de conteúdo. Ao ministrar conteúdo de determinada disciplina, o professor muitas vezes disponibiliza fontes complementares que ajudam na compreensão do tema e auxiliam os alunos na execução de atividades. Já o aluno, dentro de uma abordagem pró-ativa, deve ser capaz de interpretar e identificar outras fontes que melhor complementem e expandam assunto. No entanto, um dos desafios atuais é a sobrecarga de informação - são muitos documentos à disposição e poucas formas eficientes de tratá-los. O sistema BOOKISH, proposto neste trabalho, busca auxiliar os alunos na atividade de identificar e filtrar informações relevantes e dentro do contexto que está sendo estudado em sala de aula. A partir de apresentações em forma de slides disponibilizados pelos professores, a ferramenta identifica documentos eletrônicos contextualmente semelhantes e os disponibiliza para os alunos. É objetivo minimizar o tempo gasto nas atividades de busca por material complementar relevante e direcionar o aluno para o conteúdo do qual necessita. A ferramenta apresentada neste trabalho utiliza técnicas de mineração de textos e expansão automática de consultas com esta finalidade.
455

TEXTOS ORIGINAIS DE CIENTISTAS E TEXTOS SOBRE HISTÓRIA DAS IDEIAS DA CIÊNCIA EM UMA PROPOSTA DIDÁTICA SOBRE ÓTICA NA FORMAÇÃO INICIAL DE PROFESSORES DE FÍSICA / SCIENTISTS ORIGINAL TEXTS AND HISTORY OF SCIENTIFIC IDEAS TEXTS IN A DIDACTIC APPROACH ON OPTICS IN THE INITIAL FORMATION OF PHYSICS TEACHERS

Schirmer, Saul Benhur 26 March 2012 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Science Teaching in Brazil has been increasingly acknowledged as a research field and has also been seeking for alternatives to improve scientific education in all levels. One of the research fields is the incorporation of History and Philosophy of Science (HFC) in education, which has received significant attention by government guidelines and researchers in the field. This work presents the results obtained by the implementation of a HFC related didactic module with undergraduate students from UFSM s course of Physics. The purpose of this work was to evaluate the use of Scientists Original Texts (TOC) and History of Scientific Ideas Texts (THIC) in Science Teaching, more specifically in Physics Teaching. In order to subsidize the elaboration of the module, we performed a research in the field magazines and events, trying to ascertain to what extent these publications concern class works and which are the resources used. The results were classified in classroom approaches or HFC subsidies. The results show that there is a low number of classroom approaches, and the main resources for HFC use in the classroom are texts. The results also show that there are almost no reports of the use of TOC and THIC in undergraduate courses. Optics was the chosen theme and conceptual aspects, nature of science aspects and the aspects concerning the requirements of teacher formation were considered. The results, obtained by the application of questionnaires during the length of classes, have indicated an advancement concerning students conceptions about science. They also have indicated that few students succeeded in using the discussions about Optics conceptual contents in the questions proposed. According to the research analysis, there was great acceptance about the texts, especially the ones concerning THIC. Based on the results, we propose didactic module changes and other possible research developments. / O Ensino de Ciências no Brasil tem se afirmado cada vez mais como campo de pesquisa e buscado incorporar os resultados das pesquisas ao longo dos anos para melhorar a educação científica em todos os níveis de Ensino. Uma das linhas de trabalho diz respeito à incorporação de História e Filosofia da Ciência (HFC) ao Ensino das Ciências, que tem ganhado significativa atenção por parte das orientações governamentais e também dos pesquisadores da área. O presente trabalho apresenta os resultados obtidos com a implementação de um módulo didático relacionado à HFC com alunos do curso de Licenciatura em Física da UFSM. O objetivo do trabalho foi avaliar a utilização de Textos Originais de Cientistas (TOC) e Textos sobre a História das Ideias da Ciência (THIC) no Ensino de Ciências, nesse caso, mais especificamente no Ensino de Física. Visando subsidiar a elaboração do módulo foi realizada uma pesquisa em periódicos e eventos da área que buscou verificar em que medida essas publicações contemplam o trabalho em sala de aula e quais são os recursos empregados para este trabalho. Esses resultados, que foram classificados em propostas para a sala de aula ou subsídios ao trabalho com HFC, mostraram que é reduzido o número de propostas para sala de aula sendo que os principais recursos utilizados no trabalho com HFC em sala de aula são textos. Os resultados também indicaram que praticamente não há relatos de utilização de TOC e THIC no Ensino Superior. O tema escolhido foi ótica e a proposta procurou associar aspectos conceituais desse assunto, aspectos sobre a natureza da ciência e aspectos relativos às necessidades formativas de professores. Os resultados, obtidos por meio da análise de questionários aplicados durante a execução das aulas indicaram um avanço em relação às concepções dos alunos sobre a Ciência. Também indicaram que poucos alunos conseguiram utilizar as discussões sobre os conteúdos conceituais de ótica nas questões propostas. Da análise realizada do trabalho desenvolvido constata-se uma grande aceitação dos alunos, principalmente em relação aos THIC. A partir dos resultados obtidos são propostas modificações no módulo didático e outros possíveis desdobramentos da pesquisa.
456

O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos / The semi-supervised learning algorithm co-training applied to label text documents

Edson Takashi Matsubara 26 May 2004 (has links)
Em Aprendizado de Máquina, a abordagem supervisionada normalmente necessita de um número significativo de exemplos de treinamento para a indução de classificadores precisos. Entretanto, a rotulação de dados é freqüentemente realizada manualmente, o que torna esse processo demorado e caro. Por outro lado, exemplos não-rotulados são facilmente obtidos se comparados a exemplos rotulados. Isso é particularmente verdade para tarefas de classificação de textos que envolvem fontes de dados on-line tais como páginas de internet, email e artigos científicos. A classificação de textos tem grande importância dado o grande volume de textos disponível on-line. Aprendizado semi-supervisionado, uma área de pesquisa relativamente nova em Aprendizado de Máquina, representa a junção do aprendizado supervisionado e não-supervisionado, e tem o potencial de reduzir a necessidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponível. Este trabalho descreve o algoritmo de aprendizado semi-supervisionado co-training, que necessita de duas descrições de cada exemplo. Deve ser observado que as duas descrições necessárias para co-training podem ser facilmente obtidas de documentos textuais por meio de pré-processamento. Neste trabalho, várias extensões do algoritmo co-training foram implementadas. Ainda mais, foi implementado um ambiente computacional para o pré-processamento de textos, denominado PreTexT, com o objetivo de utilizar co-training em problemas de classificação de textos. Os resultados experimentais foram obtidos utilizando três conjuntos de dados. Dois conjuntos de dados estão relacionados com classificação de textos e o outro com classificação de páginas de internet. Os resultados, que variam de excelentes a ruins, mostram que co-training, similarmente a outros algoritmos de aprendizado semi-supervisionado, é afetado de maneira bastante complexa pelos diferentes aspectos na indução dos modelos. / In Machine Learning, the supervised approach usually requires a large number of labeled training examples to learn accurately. However, labeling is often manually performed, making this process costly and time-consuming. By contrast, unlabeled examples are often inexpensive and easier to obtain than labeled examples. This is especially true for text classification tasks involving on-line data sources, such as web pages, email and scientific papers. Text classification is of great practical importance today given the massive volume of online text available. Semi-supervised learning, a relatively new area in Machine Learning, represents a blend of supervised and unsupervised learning, and has the potential of reducing the need of expensive labeled data whenever only a small set of labeled examples is available. This work describes the semi-supervised learning algorithm co-training, which requires a partitioned description of each example into two distinct views. It should be observed that the two different views required by co-training can be easily obtained from textual documents through pre-processing. In this works, several extensions of co-training algorithm have been implemented. Furthermore, we have also implemented a computational environment for text pre-processing, called PreTexT, in order to apply the co-training algorithm to text classification problems. Experimental results using co-training on three data sets are described. Two data sets are related to text classification and the other one to web-page classification. Results, which range from excellent to poor, show that co-training, similarly to other semi-supervised learning algorithms, is affected by modelling assumptions in a rather complicated way.
457

On Clustering and Evaluation of Narrow Domain Short-Test Corpora

Pinto Avendaño, David Eduardo 23 July 2008 (has links)
En este trabajo de tesis doctoral se investiga el problema del agrupamiento de conjuntos especiales de documentos llamados textos cortos de dominios restringidos. Para llevar a cabo esta tarea, se han analizados diversos corpora y métodos de agrupamiento. Mas aún, se han introducido algunas medidas de evaluación de corpus, técnicas de selección de términos y medidas para la validez de agrupamiento con la finalidad de estudiar los siguientes problemas: -Determinar la relativa dificultad de un corpus para ser agrupado y estudiar algunas de sus características como longitud de los textos, amplitud del dominio, estilometría, desequilibrio de clases y estructura. -Contribuir en el estado del arte sobre el agrupamiento de corpora compuesto de textos cortos de dominios restringidos El trabajo de investigación que se ha llevado a cabo se encuentra parcialmente enfocado en el "agrupamiento de textos cortos". Este tema se considera relevante dado el modo actual y futuro en que las personas tienden a usar un "lenguaje reducido" constituidos por textos cortos (por ejemplo, blogs, snippets, noticias y generación de mensajes de textos como el correo electrónico y el chat). Adicionalmente, se estudia la amplitud del dominio de corpora. En este sentido, un corpus puede ser considerado como restringido o amplio si el grado de traslape de vocabulario es alto o bajo, respectivamente. En la tarea de categorización, es bastante complejo lidiar con corpora de dominio restringido tales como artículos científicos, reportes técnicos, patentes, etc. El objetivo principal de este trabajo consiste en estudiar las posibles estrategias para tratar con los siguientes dos problemas: a) las bajas frecuencias de los términos del vocabulario en textos cortos, y b) el alto traslape de vocabulario asociado a dominios restringidos. Si bien, cada uno de los problemas anteriores es un reto suficientemente alto, cuando se trata con textos cortos de dominios restringidos, la complejidad del problema se incr / Pinto Avendaño, DE. (2008). On Clustering and Evaluation of Narrow Domain Short-Test Corpora [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/2641 / Palancia
458

[pt] EXTRAÇÃO DE INFORMAÇÕES DE SENTENÇAS JUDICIAIS EM PORTUGUÊS / [en] INFORMATION EXTRACTION FROM LEGAL OPINIONS IN BRAZILIAN PORTUGUESE

GUSTAVO MARTINS CAMPOS COELHO 03 October 2022 (has links)
[pt] A Extração de Informação é uma tarefa importante no domínio jurídico. Embora a presença de dados estruturados seja escassa, dados não estruturados na forma de documentos jurídicos, como sentenças, estão amplamente disponíveis. Se processados adequadamente, tais documentos podem fornecer informações valiosas sobre processos judiciais anteriores, permitindo uma melhor avaliação por profissionais do direito e apoiando aplicativos baseados em dados. Este estudo aborda a Extração de Informação no domínio jurídico, extraindo valor de sentenças relacionados a reclamações de consumidores. Mais especificamente, a extração de cláusulas categóricas é abordada através de classificação, onde seis modelos baseados em diferentes estruturas são analisados. Complementarmente, a extração de valores monetários relacionados a indenizações por danos morais é abordada por um modelo de Reconhecimento de Entidade Nomeada. Para avaliação, um conjunto de dados foi criado, contendo 964 sentenças anotados manualmente (escritas em português) emitidas por juízes de primeira instância. Os resultados mostram uma média de aproximadamente 97 por cento de acurácia na extração de cláusulas categóricas, e 98,9 por cento na aplicação de NER para a extração de indenizações por danos morais. / [en] Information Extraction is an important task in the legal domain. While the presence of structured and machine-processable data is scarce, unstructured data in the form of legal documents, such as legal opinions, is largely available. If properly processed, such documents can provide valuable information with regards to past lawsuits, allowing better assessment by legal professionals and supporting data-driven applications. This study addresses Information Extraction in the legal domain by extracting value from legal opinions related to consumer complaints. More specifically, the extraction of categorical provisions is addressed by classification, where six models based on different frameworks are analyzed. Moreover, the extraction of monetary values related to moral damage compensations is addressed by a Named Entity Recognition (NER) model. For evaluation, a dataset was constructed, containing 964 manually annotated legal opinions (written in Brazilian Portuguese) enacted by lower court judges. The results show an average of approximately 97 percent of accuracy when extracting categorical provisions, and 98.9 percent when applying NER for the extraction of moral damage compensations.
459

[en] AUTOMATIC TEXT CATEGORIZATION BASED ON TEXT MINING / [pt] CATEGORIZAÇÃO AUTOMÁTICA DE TEXTOS BASEADA EM MINERAÇÃO DE TEXTOS

FABIO DE AZEVEDO SOARES 15 July 2014 (has links)
[pt] A Categorização de Documentos, uma das tarefas desempenhadas em Mineração de Textos, pode ser descrita como a obtenção de uma função que seja capaz de atribuir a um documento uma categoria a que ele pertença. O principal objetivo de se construir uma taxonomia de documentos é tornar mais fácil a obtenção de informação relevante. Porém, a implementação e a execução de um processo de Categorização de Documentos não é uma tarefa trivial: as ferramentas de Mineração de Textos estão em processo de amadurecimento e ainda, demandam elevado conhecimento técnico para a sua utilização. Além disso, exercendo grande importância em um processo de Mineração de Textos, a linguagem em que os documentos se encontram escritas deve ser tratada com as particularidades do idioma. Contudo há grande carência de ferramentas que forneçam tratamento adequado ao Português do Brasil. Dessa forma, os objetivos principais deste trabalho são pesquisar, propor, implementar e avaliar um framework de Mineração de Textos para a Categorização Automática de Documentos, capaz de auxiliar a execução do processo de descoberta de conhecimento e que ofereça processamento linguístico para o Português do Brasil. / [en] Text Categorization, one of the tasks performed in Text Mining, can be described as the achievement of a function that is able to assign a document to the category, previously defined, to which it belongs. The main goal of building a taxonomy of documents is to make easier obtaining relevant information. However, the implementation and execution of Text Categorization is not a trivial task: Text Mining tools are under development and still require high technical expertise to be handled, also having great significance in a Text Mining process, the language of the documents should be treated with the peculiarities of each idiom. Yet there is great need for tools that provide proper handling to Portuguese of Brazil. Thus, the main aims of this work are to research, propose, implement and evaluate a Text Mining Framework for Automatic Text Categorization, capable of assisting the execution of knowledge discovery process and provides language processing for Brazilian Portuguese.
460

[en] METAPHORS FOR READING COMPREHENSION AND INTERPRETATION IN BRAZILIAN PORTUGUESE TEXTBOOKS / [pt] METÁFORAS PARA INTERPRETAÇÃO E COMPREENSÃO EM LIVROS DIDÁTICOS DE PORTUGUÊS

ALBERTO RODRIGUES PEREIRA 14 May 2007 (has links)
[pt] A partir da Teoria da metáfora Conceptual proposta por George Lakoff e Mark Johnson, este trabalho identifica e analisa metáforas para interpretação e compreensão de textos ocorrentes em quatro coleções de livros didáticos de português, amplamente utilizadas pela rede pública de ensino no Brasil. Parte-se das seguintes hipóteses: (a) as metáforas lingüísticas utilizadas pelos autores de tais manuais em torno das noções de interpretação e compreensão de textos fornecem pistas sobre a concepção subjacente de linguagem presente nesses livros; e (b) tais manuais ainda tomam implicitamente a língua como um instrumento de comunicação não problemático e capaz de funcionar com transparência e homogeneidade, como sistema claro, uniforme, desvinculado dos usuários, deslocado da realidade, semanticamente autônomo e a-histórico. Em conformidade com o quadro teórico escolhido, identificam- se e analisaram-se metáforas estruturais, orientacionais e ontológicas que tinham como domínio-alvo as noções de texto, sentido e leitura. Tomaram-se para análise, por um lado, os prefácios dos manuais e, por outro, as atividades de interpretação e compreensão de textos ali propostas. Os resultados da pesquisa, favoráveis às hipóteses de que ela partiu, revelam haver um descompasso entre a concepção de linguagem explícita ou insinuada nos prefácios dos manuais e aquela que comparece nas atividades propostas. / [en] Within the framework of Lakoff and Johnson´s Theory of Conceptual Metaphor, this thesis identifies and analyzes metaphors for reading comprehension and interpretation occurring in five widely adopted collections of Brazilian Portuguese textbooks. The work sets out from the following hypotheses: (a) linguistic metaphors employed in these textbooks around the notions of reading comprehension and interpretation provide valuable clues as to the underlying language conception followed by the authors; and (b) these textbooks still take language for granted as an unproblematic means of communication, capable of working in a transparent and homogeneous manner, as a clear uniform a-historic system that is semantically autonomous and abstracts users and contexts. According to the theoretical framework adopted, the work identifies and analyzes structural, orientational and ontological metaphors which have as their target-domain the notions of text, meaning, and reading. The analyzed data include textbook prefaces, on the one hand, and reading comprehension and interpretation activities, on the other. The results of this research bear out its initial hypotheses, and point to a mismatch between the conception of language suggested or made explicit in the prefaces and that occurring in the textbooks´ proposed activities.

Page generated in 0.0254 seconds