• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 611
  • 146
  • 18
  • 14
  • 9
  • 9
  • 9
  • 8
  • 7
  • 5
  • 5
  • 4
  • 2
  • 1
  • Tagged with
  • 806
  • 177
  • 170
  • 156
  • 156
  • 120
  • 107
  • 98
  • 92
  • 84
  • 84
  • 84
  • 83
  • 79
  • 77
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Categorização hierárquica de textos em um portal agregador de notícias

Borges, Hugo Lima January 2009 (has links)
Orientadora: Ana Carolina Lorena / Dissertação (mestrado) - Universidade Federal do ABC. Programa de Pós-Graduação em Engenharia da Informação, 2009
92

O processo de pontuação e estruturação do gênero narrativo escrito por crianças de 1.º e 2.º anos do ensino fundamental

Lima, Vanilda Gonçalves de [UNESP] 17 June 2013 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:55Z (GMT). No. of bitstreams: 0 Previous issue date: 2013-06-17Bitstream added on 2014-06-13T19:11:47Z : No. of bitstreams: 1 lima_vg_me_mar.pdf: 3684079 bytes, checksum: 24da981a44537172b5a9a39e3b03b6ad (MD5) / A Teoria Histórico-Cultural concebe a linguagem como instrumento complexo da cultura humana, ou seja, resultante da construção histórica e social e como instrumento no processo de interação social baseada na atividade da linguagem oral e escrita. Nesse sentido, quando a criança adentra o espaço escolar, ela já possui uma longa trajetória na construção histórica do desenvolvimento da linguagem, pois se constitui como sujeito histórico-cultural no uso concreto das enunciações discursivas. Nessa perspectiva, a abordagem discursiva de linguagem, bem como os postulados da linguística textual coadunam-se com tais princípios e propõem que, na educação escolar, o ensino da linguagem escrita aconteça de forma significativa, sendo a própria enunciação discursiva da criança, materializada nos diversos gêneros do discurso, o objeto e produto do processo de ensino e aprendizagem. O presente trabalho objetiva compreender como ocorre o processo de apropriação dos sinais de pontuação e sua utilização na estruturação textual do gênero narrativo escrito - conto clássico – pelas crianças como objeto e produto das atividades linguísticas, epilinguísticas e metalinguísticas, mediado pelo educador em sala de aula. O desenvolvimento da investigação baseou-se na epistemologia do método do materialismo-histórico dialético, concretizou-se por meio da metodologia da pesquisa-ação, na qual os dados foram gerados a partir do desenvolvimento do projeto de intervenção pedagógica aplicado pela educadora da turma que desempenhou, também, o papel de pesquisadora. A investigação foi desenvolvida em uma escola pública do Ensino Fundamental, e os sujeitos foram os mesmos educandos devidamente matriculados no 1º Ano em 2011 e no 2º Ano em 2012. Portanto, a educadora-pesquisadora acompanhou a mesma turma durante... / The Cultural-Historical Theory conceives language as a tool of complex human culture, that is, resulting from historical and social construction, and as a tool in the process of social interaction based on oral and written language activity. So, when the child enters the school, she/he already has a long trajectory in the historical construction of language development, for she/he constitutes her/himself as a cultural-historical subject in the use of specific discursive enunciations. In this perspective, the discursive approach to language, as well as the postulates of textual linguistics are consistent with such principles and propose that, in school education, the teaching of written language occurs significantly, being the discursive enunciation of the child, materialized in different genres of speech, the object and product of the process of teaching and learning. This paper aims to understand how the process of appropriation of the punctuation marks and their use in structuring narrative written genre - classic tale – is developed by the children as an object and product of linguistic, epilinguistic and metalinguistic activities, and mediated by the educator in the classroom. The development of research was based on the epistemology of the of dialectical and historical materialism method, and was put into practice through the methodology of action research, in which the data were generated from the development of a pedagogical intervention project implemented by the class teacher who performed, too, the role of the researcher. The research was conducted in a public elementary school, and the subjects were the same students properly enrolled in the 1st Year in 2011 and 2nd Year in 2012. Therefore, the teacher-researcher followed the same class during 2 (two) consecutive academic years, thus characterizing a longitudinal study. In the... (Complete abstract click electronic access below)
93

Avaliação dos textos escritos por surdos(as): reflexões para fundamentar o trabalho docente / Evaluation of texts written by deaf people: reflections to support the teaching work

MENDES, Tathiane Pereira. 11 January 2018 (has links)
Submitted by Michelle Barbosa (michelle.fonseca@ufcg.edu.br) on 2018-01-11T21:23:47Z No. of bitstreams: 1 TATHIANE PEREIRA MENDES - DISSERTAÇÃO PROLETRAS - 2016.docx: 5469647 bytes, checksum: 421587bfa60ae2160e3a7f75ed886720 (MD5) / Made available in DSpace on 2018-01-11T21:23:47Z (GMT). No. of bitstreams: 1 TATHIANE PEREIRA MENDES - DISSERTAÇÃO PROLETRAS - 2016.docx: 5469647 bytes, checksum: 421587bfa60ae2160e3a7f75ed886720 (MD5) Previous issue date: 2015-06-22 / A aquisição o desenvolvimento e o processamento da língua são condições que oportunizam de modo mais eficaz o ensino-aprendizagem dos alunos surdos. Esses alunos, geralmente, comunicam-se por meio da Língua Brasileira de Sinais (LIBRAS), uma língua completa, como qualquer idioma, que se processa por modalidade espaço-visual, diferenciada da língua portuguesa (LP), que é de modalidade oral-auditiva. Tais peculiaridades sobre o ensino para alunos surdos são desconhecidas pela maioria dos professores e isso ocasiona grandes dificuldades em sala de aula. Portanto a justificativa dessa pesquisa abrange o fato de que é necessária uma bibliografia mais objetiva, esclarecedora e eficaz, para que os professores de língua portuguesa, bem como de outras áreas, estejam preparados para receber os alunos surdos em suas salas de aula com a certeza de que estarão capacitados para fazer um trabalho mais técnico e menos empírico. Dessa forma o objetivo fundamental do trabalho foi elaborar reflexões que balizem o trabalho docente no âmbito da avaliação dos textos escritos pelos alunos surdos. A fundamentação teórica da pesquisa foi baseada nas principais obras de Quadros e Karnopp (2004), Brochado (2003) e Fernandes (2007) que versam sobre as principais nuances que envolvem a Libras. A pesquisa foi realizada nas escolas onde atuam os sujeitos da investigação: dez professores (as) de língua portuguesa que atuam no Ensino Fundamental no município de Petrolina-PE. Solicitamos que os participantes avaliassem produções textuais de alunos surdos conforme cinco descritores didáticos da Prova Brasil (2011). Após a leitura dos textos, os docentes escreveram um breve parecer sobre suas impressões acerca da produção avaliada. Considerando os resultados das avaliações, percebeu-se, nas ‘falas’ dos professores, que, mesmo com os avanços da educação inclusiva, as peculiaridades das relações interpessoais entre a escola e a comunidade surda precisam ser aprofundadas. Posteriormente aos dados, apresentamos as reflexões que direcionam o olhar dos educadores para as especificidades das produções escritas dos surdos (as). / The acquisition development and language processing are conditions more effectively nurture the teaching and learning of the deaf students. These students generally communicate through the Brazilian Sign Language (Libras), a complete language, like any language, which is processed by space-visual mode, differentiated from Portuguese (LP), which is orally mode hearing. Such peculiarities of education for deaf students are unknown to most teachers and this causes great difficulties in the classroom. Therefore the justification of this research includes the fact that a more objective bibliography, insightful and effective is needed so that the Portuguese-speaking teachers, as well as other areas, be prepared to receive deaf students in their classrooms with confidence that will be able to make a more technical and less empirical work. Thus the fundamental objective of this study was to develop teaching strategies that may benchmark the teaching work in the evaluation of the texts written by deaf students. The theoretical basis of the research was based on the major works of Tables and Karnopp (2004), Paperback (2003) and Fernandes (2007) which deal with the main nuances involving Pounds. The survey was conducted in schools where the subjects of the research work: ten teachers (as) of Portuguese working in Primary Education in Petrolina municipality. We ask participants to evaluate textual productions of deaf students as five teaching strategies Proof of Brazil (2011). After reading the texts, the teachers wrote a brief opinion on their impressions of the assessed production. Considering the results of the evaluation, it was noted, the 'speech' of teachers, that even with advances in inclusive education, the peculiarities of interpersonal relationships between the school and the deaf community need to be deepened. Later the data, we present the strategies that direct the gaze of educators to the specificities of the deaf written productions (as).
94

A semântica argumentativa como estratégia para compreensão de questões do ENEM

Silva, Larissa Pontes Hübner da January 2015 (has links)
Made available in DSpace on 2015-04-30T14:06:03Z (GMT). No. of bitstreams: 1 000466614-Texto+Completo-0.pdf: 944786 bytes, checksum: 5d180fe9f8319ffd0ce3284448a6ad12 (MD5) Previous issue date: 2015 / The ENEM has gained increasing prominence in the landscape of education in Brazil, not only for being the main assessment of high school, but also to create opportunities for students to entry in public and private universities. The main approach of the proof focuses on the process of reading comprehension, seeking to highlight reading and interpretation of texts. The proof questions are called problem-situations, that is, the student must mobilize all the resources they have and make decisions favorable to your objective. From this perspective, this research will make a reflection on the teaching of Portuguese language in high school, starting with an analysis of the questions of ENEM to test whether we can answered these questions simply by understanding their language, ie, if prior knowledge about the topic would not be needed. In order to find the meaning constructed by the linguistic aspect of the text, we used as the foundation Theory of Argumentation in Language by Oswald Ducrot and colleagues, especially with regard to the current stage, the Theory of Semantic Blocks, developed by Oswald Ducrot and Marion Carel. In this theory, the author postulates that is the discourse that carries meaning, ie, to describe the meaning we should rely on the language. For him the language is not informative, but argumentative. / O ENEM tem ganhado cada vez mais destaque no panorama da educação no Brasil, não só por ser a principal avaliação do Ensino Médio, como por oportunizar a entrada de estudantes em universidades públicas e privadas. A principal abordagem da prova tem como foco o processo de compreensão leitora, buscando, portanto, destacar a leitura e a interpretação de textos. Suas questões são chamadas, dessa forma, de situações-problema, isto é, o estudante deve mobilizar todos os recursos que tem e tomar decisões favoráveis ao seu objetivo. Nessa perspectiva, esta pesquisa fará uma reflexão acerca do ensino de Língua Portuguesa no Ensino Médio, partindo da análise de questões do ENEM com o propósito de testar se certas perguntas podem ser respondidas simplesmente por sua compreensão linguística, ou seja, se não seriam necessários conhecimentos prévios sobre o tema abordado.A fim de encontrar o sentido construído pelo linguístico do texto, foi utilizada como alicerce a Teoria da Argumentação na Língua, de Oswald Ducrot e colaboradores, principalmente no que diz respeito à fase atual, a Teoria dos Blocos Semânticos, desenvolvida por Oswald Ducrot e Marion Carel. Nessa teoria, o autor postula que é o discurso que porta sentido, ou seja, para descrever o sentido devemos nos apoiar no linguístico. Para ele, a língua não é informativa, mas sim argumentativa.
95

Metodologia para mapeamento de informações não estruturadas descritas em laudos médicos para uma representação atributo-valor / A methodology for mapping non-structured medical findings to the attribute-value table format

Daniel de Faveri Honorato 29 April 2008 (has links)
Devido à facilidade com que informações biomédicas em língua natural são registras e armazenadas no formato digital, a recuperação de informações a partir de registros de pacientes nesse formato não estruturado apresenta diversos problemas a serem solucionados. Assim, a extração de informações estruturadas (por exemplo, no formato atributo-valor) a partir de registros não estruturados é um importante problema de pesquisa. Além disso, a representação de registros médicos não estruturados no formato atributo-valor, permite a aplicação de uma grande variedade de métodos de extração de padrões. Para mapear registros médicos não estruturados no formato atributo-valor, propomos uma metodologia que pode ser utilizada para automaticamente (ou semi-automaticamente, com a ajuda de um especialista do domínio) mapear informações médicas de interesse armazenadas nos registros médicos e descritas em linguagem natural em um formato estruturado. Essa metodologia foi implementada em um sistema computacional chamado TP-DISCOVER, o qual gera uma tabela no formato atributo-valor a partir de um conjunto de registros de pacientes (documentos). De modo a identificar entidades importantes no conjunto de documentos, assim como relacionamentos significantes entre essas entidades, propomos uma abordagem de extração de terminologia híbrida (lingüística/estatística) a qual seleciona palavras e frases que aparecem com freqüência acima de um dado limiar por meio da aplicação de medidas estatísticas. A idéia geral dessa abordagem híbrida de extração de terminologia é que documentos especializados são caracterizados por repetir o uso de certas unidades léxicas ou construções morfo-sintáticas. Nosso objetivo é reduzir o esforço despendido na modelagem manual por meio da observação de regularidades no texto e o mapeamento dessas regularidades como nomes de atributos na representação atributo-valor. A metodologia proposta foi avaliada realizando a estruturação automática de uma coleção de 6000 documentos com informações de resultados de exames de Endoscopia Digestiva Alta descritos em língua natural. Os resultados experimentais, os quais podem ser considerados os piores resultados, uma vez que esses resultados poderiam ser muito melhores caso a metodologia for utilizada semi-automaticamente junto com um especialista do domínio, mostram que a metodologia proposta é adequada e permite reduzir o tempo usado pelo especialista para analisar grande quantidade de registros médicos / The information retrieval from text stored in computer-based patient records is an important open-ended research problem, as the ease in which biomedical information recorded and stored in digital form grows. Thus, means to extract structured information (for example, in the so-called attribute-value format) from free-text records is an important research endeavor. Furthermore, by representing the free-text records in the attribute-value format, available pattern extraction methods can be directly applied. To map free-text medical records into the attribute-value format, we propose a methodology that can be used to automatically (or semi-automatically, with the help of a medical expert) map the important medical information stored in patient records which are described in natural language into an structured format. This methodology has been implemented in a computational system called TP-DISCOVER, which generates a database in the attribute-value format from a set of patient records (documents). In order to identify important entities in the set of documents, as well as significant relations among these entities, we propose a hybrid linguistic/statistical terminology extraction approach which filters out words and phrases that appear with a frequency higher than a given threshold by applying statistical measures. The underlying assumption of this hybrid approach to terminology extraction is that specialized documents are characterized by repeated use of certain lexical units or morpho-syntactic constructions. Our goal is to reduce the effort spent in manual modelling by observing regularities in the texts and by mapping them into suitable attribute names in the attribute-value representation format. The proposed methodology was evaluated to automatically structure a collection of 6000 documents which contains High Digestive Endoscopies exams´ results described in natural language. The experimental results, all of which can be considered lower bound results as they would greatly improve in case the methodology is applied semi-automatically together with a medical expert, show that the proposed methodology is suitable to reduce the medical expert workload in analysing large amounts of medical records
96

Uso de termos hiperônimos em textos dissertativos-argumentativos de alunos do ensino fundamental da Educação de Jovens e Adultos (EJA)

CASTRO, Cristiane de Souza 16 December 2015 (has links)
Submitted by Fabio Sobreira Campos da Costa (fabio.sobreira@ufpe.br) on 2016-07-07T11:53:05Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO VERSÃO cristiane certo.pdf: 3626958 bytes, checksum: d854ce9d9d546c5c212f82b7ba5dd66d (MD5) / Made available in DSpace on 2016-07-07T11:53:05Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) DISSERTAÇÃO VERSÃO cristiane certo.pdf: 3626958 bytes, checksum: d854ce9d9d546c5c212f82b7ba5dd66d (MD5) Previous issue date: 2015-12-16 / CAPEs / O objetivo geral da pesquisa aqui apresentada é verificar, a partir de análises de produção de textos escritos, o domínio de estudantes do módulo final (oitavo e nono anos do ensino fundamental) da Educação de Jovens e Adultos (EJA) de uma escola municipal da cidade de Picuí, estado da Paraíba, em relação ao uso de hiperônimos como recurso de coesão por substituição no gênero dissertação escolar. Como objetivos específicos, pretendemos refletir sobre os motivos das possíveis dificuldades apresentadas nesses textos para ampliar o debate acerca da necessidade do trabalho com o léxico em sala de aula; possibilitar a reflexão dos estudantes no que diz respeito aos processos de coesão textual, em especial aos recursos de substituição, com o uso de hiperônimos; verificar, a partir das produções analisadas, o nível de proficiência dos voluntários no que diz respeito à argumentatividade, observando, assim, que sentidos são produzidos através de seus textos escritos; elaborar um protótipo de um livro – produto final de nossa pesquisa – que apresenta informações teóricas a respeito do tema recurso de coesão por hiperônimo, com o objetivo de ser um material que pode ser usado e processos de formação continuada de professores da EJA. Os voluntários da pesquisa são 11 estudantes da EJA com faixa etária maior de 18 anos. Nossa hipótese foi que muitos estudantes de séries finais do ensino básico apresentam dificuldade com o uso de hiperônimos como recurso de coesão. A nosso ver, isso ocorre pelo fato de eles não conhecerem explicitamente o fenômeno de coesão e por não terem acesso a diferentes meios para a ampliação de seu acervo lexical. Procedemos a uma análise dos dados do tipo quali-quantitativa, a fim de verificar a pertinência e a frequência do recurso coesivo investigado. A base teórica da pesquisa está assentada principalmente em Halliday; Hasan (1976), Beaugrande; Dressler (1981), Ungerer; Schmid (1996), Lyons (1980), Bidernam (1996), Menegassi; Fuza (2008), Menegassi (2005), Costa Val (1999), Marcuschi (2003, 2012), Antunes (1996, 2003, 2005, 2009, 2010 e 2012) e Koch (1999, 2002, 2005). Os resultados indicaram que a maioria dos voluntários fez recurso ao hiperônimo, mas ainda de uma maneira insatisfatória, fato que revela que, provavelmente, a escola ainda não trabalha suficientemente o léxico. / El objetivo general de la pesquisa aquí presentada es verificar, a partir de análisis de producción de textos escritos, el dominio de estudiantes de módulo final (octavo y nono años de la enseñanza fundamental) de la Educación de Jóvenes y Adultos (EJA) de una escuela municipal de la cuidad de Picuí, estado de Paraíba, en relación al uso de hiperónimos como recurso de cohesión por sustitución el en género disertación escolar. Como objetivos específicos, pretendemos reflexionar sobre los motivos de las posibles dificultades presentadas en esos textos para ampliar el debate acerca de la necesidad del trabajo con el léxico en clase; posibilitar la reflexión de los estudiantes en el que dice respeto a los procesos de cohesión textual, en especial a los recursos de sustitución, con el uso de hiperónimos; verificar, a partir de las producciones analizadas, el nivel de competencia de los voluntarios el no que dice respeto a la argumentatividad, con la observación de los sentidos producidos a través de sus textos escritos; elaborar un prototipo de libro – producto final de nuestra pesquisa – que presenta informaciones teóricas a respeto del tema recurso de cohesión por hiperónimo, con el objetivo de ser un material que puede ser usado en procesos de formación continuada de profesores de EJA. Los voluntarios de la pesquisa son 11 estudiantes de la EJA con faja de edad mayor de 18 años. Nuestra hipótesis fue que muchos estudiantes de series finales de la enseñanza básica presentan dificultad con el uso de hiperónimos como recurso de cohesión. En nuestra opinión, eso ocurre porque ellos no conocen explícitamente el fenómeno de cohesión y por no tener acceso a diferentes medios para la ampliación de su acervo lexical. Procederemos a un análisis de los datos de tipo cuali-cuantitativo, con la finalidad de verificar la pertinencia y la frecuencia del recurso cohesivo investigado. La base teórica de la pesquisa está asentada principalmente en Halliday; Hasan (1976), Beaugrande; Dressler (1981), Ungerer; Schmid (1996), Lyons (1980), Bidernam (1996), Menegassi; Fuza (2008), Menegassi (2005), Costa Val (1999), Marcuschi (2003, 2012), Antunes (1996, 2003, 2005, 2009, 2010 e 2012) e Koch (1999, 2002, 2005). Los resultados indicaron que la mayoría de los voluntarios hicieron recurso al hiperónimo, pero de una manera insatisfactoria, hecho que revela que, probablemente, la escuela todavía no trabaja suficientemente el léxico.
97

O texto argumentativo por crianças da 4ª serie do ensino fundamental

Correa, Ana Marisa de Campos Vallim 17 February 2004 (has links)
Orientador: Sergio Antonio da Silva Leite / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Educação / Made available in DSpace on 2018-08-03T19:52:00Z (GMT). No. of bitstreams: 1 Correa_AnaMarisadeCamposVallim_M.pdf: 11308555 bytes, checksum: de93aa8d95a158155b8847071de63ac9 (MD5) Previous issue date: 2004 / Resumo: Esta pesquisa investigou o desenvolvimento do texto argumentativo escrito de crianças da 4' série de uma escola pública, a partir de condições pedagógicas favoráveis no ambiente de sala de aula. O estudo justifica-se devido à escassez, em nosso meio, de trabalhos lingüísticos na área voltados às crianças das séries iniciais do Ensino Fundamental. Tal pesquisa insere-se num contexto de ensino do texto na Língua Portuguesa que valorize a dimensão discursiva e pragmática da língua escrita, ou seja, que considere os usos sociais - orais e escritos - da língua escrita na sociedade. O grupo de sujeitos produziu textos argumentativos em três momentos distintos de produção. Após a primeira produção escrita, os sujeitos foram submetidos a vinte sessões de lh30m cada, nas quais foram proporcionadas condições pedagógicas favoráveis à emergência do texto argumentativo com base em pesquisas anteriores. A análise dos resultados mostrou que as sessões de atividades pedagógicas proporcionaram um progresso significativo nos textos argumentativos das segunda e terceira produções escritas, com ênfase na justificação e em alguns recursos de negociação. Tais resultados confirmam estudos anteriores de que a produção textual está intrinsecamente relacionada com as condições pedagógicas oferecidas em sala de aula / Abstract: This research investigated the development of written argumentative text by fourth grade students from public schools, starting from favorable pedagogic conditions in the c1assroom atmosphere. Such a study justifies itself due to the lack, among us, of linguistic development work regarding children in their first years of formal education. Such research is inserted in the context of Portuguese teaching of text writing that values the discursive and pragmatic dimension of the written language, in other words, that it takes into account the social uses - orals and written - of the written language in the society. The focused group has produced argumentative texts in three different text writing moments. After the first written production, the group was submitted to twenty sessions of 1 h30m each, in which were provided favorable pedagogic conditions to the emergency of the argumentative text, based in previous researches. The analysis of the results showed that the sessions of pedagogic activities provided a significant progress in the argumentative texts during the second and third written productions, with emphasis in the justification and negotiation aspects. Such results confirm previous studies that the textual production is intrinsically related with tl1e pedagogic conditions offered at classroom / Mestrado / Mestre em Educação
98

Representação de coleções de documentos textuais por meio de regras de associação / Representation of textual document collections through association rules

Rossi, Rafael Geraldeli 16 August 2011 (has links)
O número de documentos textuais disponíveis em formato digital tem aumentado incessantemente. Técnicas de Mineração de Textos são cada vez mais utilizadas para organizar e extrair conhecimento de grandes coleções de documentos textuais. Para o uso dessas técnicas é necessário que os documentos textuais estejam representados em um formato apropriado. A maioria das pesquisas de Mineração de Textos utiliza a abordagem bag-of-words para representar os documentos da coleção. Essa representação usa cada palavra presente na coleção de documentos como possível atributo, ignorando a ordem das palavras, informa ções de pontuação ou estruturais, e é caracterizada pela alta dimensionalidade e por dados esparsos. Por outro lado, a maioria dos conceitos são compostos por mais de uma palavra, como Inteligência Articial, Rede Neural, e Mineração de Textos. As abordagens que geram atributos compostos por mais de uma palavra apresentam outros problemas além dos apresentados pela representação bag-of-words, como a geração de atributos com pouco signicado e uma dimensionalidade muito maior. Neste projeto de mestrado foi proposta uma abordagem para representar documentos textuais nomeada bag-of-related-words. A abordagem proposta gera atributos compostos por palavras relacionadas com o uso de regras de associação. Com as regras de associação, espera-se identicar relações entre palavras de um documento, além de reduzir a dimensionalidade, pois são consideradas apenas as palavras que ocorrem ou que coocorrem acima de uma determinada frequência para gerar as regras. Diferentes maneiras de mapear o documento em transações para possibilitar a geração de regras de associação são analisadas. Diversas medidas de interesse aplicadas às regras de associação para a extração de atributos mais signicativos e a redução do número de atributos também são analisadas. Para avaliar o quanto a representação bag-of-related-words pode auxiliar na organização e extração de conhecimento de coleções de documentos textuais, e na interpretabilidade dos resultados, foram realizados três grupos de experimentos: 1) classicação de documentos textuais para avaliar o quanto os atributos da representação bag-of-related-words são bons para distinguir as categorias dos documentos; 2) agrupamento de documentos textuais para avaliar a qualidade dos grupos obtidos com a bag-of-related-words e consequentemente auxiliar na obtenção da estrutura de uma hierarquia de tópicos; e 3) construção e avaliação de hierarquias de tópicos por especialistas de domínio. Todos os resultados e dimensionalidades foram comparados com a representação bag-of-words. Pelos resultados dos experimentos realizados, pode-se vericar que os atributos da representação bag-of-related-words possuem um poder preditivo tão bom quanto os da representação bag-of-words. A qualidade dos agrupamentos de documentos textuais utilizando a representação bag-of-related-words foi tão boa quanto utilizando a representação bag-of-words. Na avaliação de hierarquias de tópicos por especialistas de domínio, a utilização da representação bag-of-related-words apresentou melhores resultados em todos os quesitos analisados / The amount of textual documents available in digital format is incredibly large. Text Mining techniques are becoming essentials to manage and extract knowledge in big textual document collections. In order to use these techniques, the textual documents need to be represented in an appropriate format to allow the construction of a model that represents the embedded knowledge in these textual documents. Most of the researches on Text Mining uses the bag-of-words approach to represent textual document collections. This representation uses each word in a collection as feature, ignoring the order of the words, structural information, and it is characterized by the high dimensionality and data sparsity. On the other hand, most of the concepts are compounded by more than one word, such as Articial Intelligence, Neural Network, and Text Mining. The approaches which generate features compounded by more than one word to solve this problem, suer from other problems, as the generation of features without meaning and a dimensionality much higher than that of the bag-of-words. An approach to represent textual documents named bag-of-related-words was proposed in this master thesis. The proposed approach generates features compounded by related words using association rules. We hope to identify relationships among words and reduce the dimensionality with the use of association rules, since only the words that occur and cooccur over a frequency threshold will be used to generate rules. Dierent ways to map the document into transactions to allow the extraction of association rules are analyzed. Dierent objective interest measures applied to the association rules to generate more meaningful features and to the reduce the feature number are also analyzed. To evaluate how much the textual document representation proposed in this master project can aid the managing and knowledge extraction from textual document collections, and the understanding of the results, three experiments were carried out: 1) textual document classication to analyze the predictive power of the bag-of-related-words features, 2) textual document clustering to analyze the quality of the cluster using the bag-of-related-words representation 3) topic hierarchies building and evaluation by domain experts. All the results and dimensionalities were compared to the bag-of-words representation. The results presented that the features of the bag-of-related-words representation have a predictive power as good as the features of the bag-of-words representation. The quality of the textual document clustering also was as good as the bag-of-words. The evaluation of the topic hierarchies by domain specialists presented better results when using the bag-of-related-words representation in all the questions analyzed
99

Representação de coleções de documentos textuais por meio de regras de associação / Representation of textual document collections through association rules

Rafael Geraldeli Rossi 16 August 2011 (has links)
O número de documentos textuais disponíveis em formato digital tem aumentado incessantemente. Técnicas de Mineração de Textos são cada vez mais utilizadas para organizar e extrair conhecimento de grandes coleções de documentos textuais. Para o uso dessas técnicas é necessário que os documentos textuais estejam representados em um formato apropriado. A maioria das pesquisas de Mineração de Textos utiliza a abordagem bag-of-words para representar os documentos da coleção. Essa representação usa cada palavra presente na coleção de documentos como possível atributo, ignorando a ordem das palavras, informa ções de pontuação ou estruturais, e é caracterizada pela alta dimensionalidade e por dados esparsos. Por outro lado, a maioria dos conceitos são compostos por mais de uma palavra, como Inteligência Articial, Rede Neural, e Mineração de Textos. As abordagens que geram atributos compostos por mais de uma palavra apresentam outros problemas além dos apresentados pela representação bag-of-words, como a geração de atributos com pouco signicado e uma dimensionalidade muito maior. Neste projeto de mestrado foi proposta uma abordagem para representar documentos textuais nomeada bag-of-related-words. A abordagem proposta gera atributos compostos por palavras relacionadas com o uso de regras de associação. Com as regras de associação, espera-se identicar relações entre palavras de um documento, além de reduzir a dimensionalidade, pois são consideradas apenas as palavras que ocorrem ou que coocorrem acima de uma determinada frequência para gerar as regras. Diferentes maneiras de mapear o documento em transações para possibilitar a geração de regras de associação são analisadas. Diversas medidas de interesse aplicadas às regras de associação para a extração de atributos mais signicativos e a redução do número de atributos também são analisadas. Para avaliar o quanto a representação bag-of-related-words pode auxiliar na organização e extração de conhecimento de coleções de documentos textuais, e na interpretabilidade dos resultados, foram realizados três grupos de experimentos: 1) classicação de documentos textuais para avaliar o quanto os atributos da representação bag-of-related-words são bons para distinguir as categorias dos documentos; 2) agrupamento de documentos textuais para avaliar a qualidade dos grupos obtidos com a bag-of-related-words e consequentemente auxiliar na obtenção da estrutura de uma hierarquia de tópicos; e 3) construção e avaliação de hierarquias de tópicos por especialistas de domínio. Todos os resultados e dimensionalidades foram comparados com a representação bag-of-words. Pelos resultados dos experimentos realizados, pode-se vericar que os atributos da representação bag-of-related-words possuem um poder preditivo tão bom quanto os da representação bag-of-words. A qualidade dos agrupamentos de documentos textuais utilizando a representação bag-of-related-words foi tão boa quanto utilizando a representação bag-of-words. Na avaliação de hierarquias de tópicos por especialistas de domínio, a utilização da representação bag-of-related-words apresentou melhores resultados em todos os quesitos analisados / The amount of textual documents available in digital format is incredibly large. Text Mining techniques are becoming essentials to manage and extract knowledge in big textual document collections. In order to use these techniques, the textual documents need to be represented in an appropriate format to allow the construction of a model that represents the embedded knowledge in these textual documents. Most of the researches on Text Mining uses the bag-of-words approach to represent textual document collections. This representation uses each word in a collection as feature, ignoring the order of the words, structural information, and it is characterized by the high dimensionality and data sparsity. On the other hand, most of the concepts are compounded by more than one word, such as Articial Intelligence, Neural Network, and Text Mining. The approaches which generate features compounded by more than one word to solve this problem, suer from other problems, as the generation of features without meaning and a dimensionality much higher than that of the bag-of-words. An approach to represent textual documents named bag-of-related-words was proposed in this master thesis. The proposed approach generates features compounded by related words using association rules. We hope to identify relationships among words and reduce the dimensionality with the use of association rules, since only the words that occur and cooccur over a frequency threshold will be used to generate rules. Dierent ways to map the document into transactions to allow the extraction of association rules are analyzed. Dierent objective interest measures applied to the association rules to generate more meaningful features and to the reduce the feature number are also analyzed. To evaluate how much the textual document representation proposed in this master project can aid the managing and knowledge extraction from textual document collections, and the understanding of the results, three experiments were carried out: 1) textual document classication to analyze the predictive power of the bag-of-related-words features, 2) textual document clustering to analyze the quality of the cluster using the bag-of-related-words representation 3) topic hierarchies building and evaluation by domain experts. All the results and dimensionalities were compared to the bag-of-words representation. The results presented that the features of the bag-of-related-words representation have a predictive power as good as the features of the bag-of-words representation. The quality of the textual document clustering also was as good as the bag-of-words. The evaluation of the topic hierarchies by domain specialists presented better results when using the bag-of-related-words representation in all the questions analyzed
100

Análisis iconográfico del Colegio Apostólico. Representación del Apostolado del Credo en la Valencia Foral durante la época postrentina

Bernal Navarro, Juana Cristina 09 July 2010 (has links)
La Tesis Doctoral se fundamenta en el análisis iconográfico de la represenación figurativa del Colegio Apostólico-Coetus Apostolorum con una variante muy singular, las series del Apostolado del Credo. Consistente en la represenación de los doce discípulos de Cristo, con una característica específica: la manifestación en su plasmación pictórica de uno de los artículos del Credo o Símbolo de fe- Symbolum Apostolorum, en cada una de las figuras representadas, proporcionándoles un signo añadido de reconocimiento iconográfico, tanto individual como de conjunto. El eje principal de la investigación consiste en realacionar y determinar los paralelismos entre las fuentes escritas, relativas al texto específico del Credo y su representación pictórica en la plasmación de los artículos de fe, al ser asignados de forma sitemática a cada apóstol. El corpus empírico de la investigación ha consistido en localizar, recopilar, así como catalogar de forma razonada y analizar comparativamente una serie de representaciones artísticas determinadas por el contexto sociocultural y religioso de los siglos XVII y XVIII, en los límites de la geografía valenciana. La consecución de los resultados prácticos se ha manifestado a través de la realización de un catálogo razonado de las obras objeto de esta investigación, mediante la realización de unas fichas técnicas de cada obra, especificando su estudio icónico, formal, doctrinal, teológico y estilístico. / Bernal Navarro, JC. (2010). Análisis iconográfico del Colegio Apostólico. Representación del Apostolado del Credo en la Valencia Foral durante la época postrentina [Tesis doctoral]. Editorial Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8427 / Palancia

Page generated in 0.048 seconds