• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 611
  • 146
  • 19
  • 14
  • 9
  • 9
  • 9
  • 8
  • 7
  • 5
  • 5
  • 4
  • 2
  • 1
  • Tagged with
  • 807
  • 178
  • 170
  • 156
  • 156
  • 120
  • 107
  • 98
  • 92
  • 84
  • 84
  • 84
  • 83
  • 79
  • 77
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
441

Aplicación de estrategias metodológicas de comprensión de textos en el área de comunicación

Huayanay Guivin, Monica Victoria January 2018 (has links)
El presente Plan de acción: “aplicación de estrategias metodológicas de comprensión de textos en el área de Comunicación” es importante porque fortalece la práctica pedagógica de los docentes vinculados al uso de las estrategias metodológicas y dentro del marco de los enfoques comunicativo textual y por competencias; así mismo logramos los objetivos específicos como concientizar a los docentes para una capacitación y formación continua, fortalecer el desarrollo de estrategias metodológicas para la compresión de textos, lograr que los estudiantes cumplan los acuerdos de convivencia, fortalecer el monitoreo y acompañamiento pedagógico desde el enfoque democrático, participativo e inclusivo. Por otro lado, favorece a los estudiantes a desarrollar su expresión y comprensión oral; competencias que ayudará a incrementar el porcentaje en el nivel satisfactorio en los exámenes censales del segundo y cuarto grado (ECE). El marco teórico que sustenta este trabajo está relacionado con las categorías como: comprensión de textos, enfoque comunicativo textual, monitoreo y acompañamiento pedagógico y convivencia democrática; los mismos que tienen como sustento el enfoque por competencias, el enfoque territorial, el enfoque participativo y el liderazgo transformacional. Así mismo, se aplican diferentes instrumentos para el recojo de información como guías de observación, guía de entrevista, guía de preguntas de discusión; los mismos que ayudan a describir el diagnóstico y plantear la propuesta de solución a la deficiente aplicación de las estrategias metodológicas de comprensión de textos; finalmente, se concluye que solucionar este problema me permite fortalecer mis competencias en el manejo de estrategias e instrumentos para analizar las dificultades que se presentan en la Institución Educativa con la finalidad de darles solución para la mejora continua del aprendizaje en los estudiantes.
442

Estrategias de comprensión de textos escritos para mejorar el nivel de logro en los estudiantes de la Institución Educativa N° 15085 “Javier Pérez de Cuellar “del A.H. Villa Primavera- Sullana

Porras Seminario, Francisca January 2018 (has links)
Este diseño de plan de acción permite analizar las causas que origina el nivel insatisfactorio en comprensión de textos escritos y proponer alternativas de solución para mejorar los resultados en esta competencia. Para dar solución al problema planteo como objetivo general: mejorar el nivel de logro en comprensión de textos, además propongo como objetivos específicos: Fortalecer las capacidades docentes en la aplicación de estrategias metodológicas, desarrollar una cultura de aprendizaje y colaboración entre docentes e incrementar el porcentaje de lecturas con la familias y el docente. El marco teórico que sustenta el diseño del plan de acción está orientado a las categoría y subcategorías tales como: estrategias de comprensión lectora, cuya subcategoría , estrategias de metacomprensión, va a permitir que realicen predicción y verificación, revisión a vuelo de pájaro, establecimiento de propósitos y objetivos, autopreguntas, uso de conocimientos previos, resumen y aplicación de estrategias definidas; además la subcategoría: Monitoreo y acompañamiento a la práctica pedagógica, cuya aplicación permite al docente, reflexionar sobre su propia práctica para optimizarla y al directivo brindar la asistencia técnica para asesorar y tomar decisiones . En relación a la segunda categoría: Estrategias de selección de textos, cuya subcategoría es tipos de textos, tiene por finalidad sensibilizar y comprometer tanto a docentes como a la familia para acercar más a los estudiantes a la lectura. Una tercera categoría es estrategias de interaprendizaje entre docentes que permite intercambiar experiencias entre ellos, buscando que realicen una revisión permanente sobre sus logros y dificultades, aprendiendo con sus pares. Lo anteriormente expuesto permite concluir lo siguiente, la solución del problema identificado se va a evidenciar mediante el fortalecimiento de las capacidades docentes en estrategias metodológicas en comprensión de textos, el desarrollo de una cultura de colaboración entre docentes y el incremento de lecturas con la familia y el docente.
443

Análisis de las preguntas de nivel crítico de comprensión de lectura en los textos escolares y libros de actividades de IV y V ciclo

Sanabria Salazar, María Lisette 30 January 2020 (has links)
Esta investigación ha tenido como objetivo “Analizar la predominancia de las preguntas de nivel crítico de comprensión de lectura en los textos escolares y libros de actividades de IV y V ciclo, considerando dos categorías: la primera, llamada también “categorías según lo que se le solicita al estudiante”, y la segunda: los “tipos según foco y presuposición”. Para ello analizamos textos escolares y libros de actividades de Primaria, de Comunicación y Personal Social de 2016 y de la editorial que más vendió ese año. Nuestro estudio es de tipo descriptivo y tuvo un enfoque cualitativo, porque comprendió, describió y descubrió un fenómeno que en nuestro caso fue el estado de las preguntas de nivel crítico de los textos escolares y libros de actividades. Para recoger información usamos la técnica de análisis documental que corresponde al método documental. Este consistió en revisar las páginas de los textos escolares y libros de actividades, para identificar las categorías y los tipos de preguntas mencionados que se trasladaron a los instrumentos: “matrices de análisis” para comparar la información y así determinar la predominancia de las preguntas. Finalmente, el análisis y la discusión de resultados nos posibilitó concluir, con respecto a nuestra primera categoría, que, tanto en Comunicación como en Personal Social; así como en IV y en V ciclo, predominan las preguntas de nivel crítico relacionadas a la lectura crítica cognitiva y, específicamente, las de la categoría “el caso en que se solicita opinar acerca del contenido”; lo que resulta alentador para el desarrollo cognitivo de los estudiantes. Y, en relación a nuestra segunda categoría, concluimos que en Comunicación y Personal Social de IV y V ciclo predominan las preguntas compuestas, lo cual hará crecer a los estudiantes en la comprensión de textos y en su entendimiento sobre los hechos de la vida.
444

Análisis de la organización matemática relacionada a las concepciones de fracción que se presenta en el texto escolar matemática quinto grado de educación primaria.

Carrillo Yalán, Milagros Edith 21 September 2012 (has links)
El punto de partida de esta investigación ha sido la gran dificultad que muestran los alumnos en la compresión de las fracciones. Esta dificultad, presente tanto en su enseñanza como en su aprendizaje, se observa principalmente en los niveles básicos de educación. Para identificar uno de los posibles factores que influyen en tal problema se analizó la organización matemática (OM) relacionada con las concepciones de fracción presentes en el texto escolar Matemática Quinto grado de Educación Primaria, el cual tiene la relevancia de ser distribuido por el Ministerio de Educación del Perú a todas las escuelas públicas del país. El mencionado texto, en la parte correspondiente al tema de fracciones, enfatiza en la concepción de parte– todo utilizando, principalmente, la técnica del doble conteo de las partes. Por tanto, el análisis se fundamenta en el estudio de las OM vinculadas a las concepciones de fracción en el marco de la Teoría Antropológica de lo Didáctico (TAD). La TAD asume que el saber matemático se construye como respuesta a situaciones problemáticas y surge como producto de un proceso de estudio. Esta teoría supone que toda actividad humana, regularmente realizada, puede describirse como un modelo único que se resume con la palabra praxeología. Esta palabra se deriva de los términos praxis y logos. El término praxis hace referencia al saber hacer, es decir, a los tipos de problemas o tareas que se estudian y a las técnicas que se construyen para solucionarlos; el término logos, se identifica con el saber e incluye las descripciones y explicaciones que nos permiten entender las técnicas, esto es, el discurso tecnológico y la teoría que justifica a la tecnología (Bosch, Espinoza y Gascón, 2003). La presente investigación se ha estructurado de la siguiente manera: En el capitulo1, se presenta el problema de investigación, la presentación de la problemática, los antecedentes, la justificación del estudio, la formulación del problema y los objetivos de la investigación. En el capítulo 2, se presenta la diferencia entre las terminologías fracción, números fraccionarios y números racionales. En el capítulo 3, se presenta un estudio de la génesis de las fracciones, es decir el desenvolvimiento histórico. En el capítulo 4, se presenta el marco teórico, las organizaciones matemáticas (OM) y las concepciones de fracción. En el capítulo 5, se presenta la metodología de la investigación; la selección del texto escolar Matemática Quinto grado de Educación Primaria; se explica su relevancia y los criterios para el análisis del texto escolar en base a los objetivos propuestos; el análisis por secciones de la unidad 4 “la división de un todo en partes iguales” del citado libro escolar y se presentan los resultados obtenidos. Finalmente en el capítulo 6 se presenta las consideraciones finales y las sugerencias para futuras investigaciones.
445

Oportunidades de aprendizaje en textos escolares: análisis de dos cuadernos de trabajo de Comunicación

Vergara Pérez, Jorge Armando 12 July 2021 (has links)
La presente tesis es una investigación documental que analiza las Oportunidades de Aprendizaje (ODA) que proveen dos textos escolares de Comunicación de segundo grado de secundaria de Educación Básica regular del ámbito público y privado en el Perú. Este análisis se realiza a partir de las variables de ODA denominados cobertura curricular y demanda cognitiva, con relación a los desempeños propuestos en la competencia Lee diversos tipos de textos escritos en su lengua materna del Currículo Nacional (2016). El tema de investigación es significativo en tanto las normas del Observatorio Nacional de Textos Escolares exigen que estos materiales, considerados intermediarios del currículo (Gimeno, 2011; Moreira, 1998) se alineen al Currículo Nacional (Minedu, 2014). Esta alineación se corresponde también con la variable de cobertura curricular, fundamental en el estudio de las ODA (McDonell, 1995). Se ha empleado el método de la investigación documental desde un enfoque cualitativo. En ese marco, mediante el empleo de matrices se han operativizado los desempeños del Currículo Nacional (2016) para el análisis de la cobertura curricular y la demanda cognitiva de los textos escolares que son objeto de estudio. Como parte de los resultados identificados, se evidenció que el texto escolar para el ámbito privado proveía menores oportunidades de aprendizaje en torno a las variables cobertura curricular y demanda cognitiva, en comparación con el texto editado por el Estado.
446

O algoritmo de aprendizado semi-supervisionado co-training e sua aplicação na rotulação de documentos / The semi-supervised learning algorithm co-training applied to label text documents

Matsubara, Edson Takashi 26 May 2004 (has links)
Em Aprendizado de Máquina, a abordagem supervisionada normalmente necessita de um número significativo de exemplos de treinamento para a indução de classificadores precisos. Entretanto, a rotulação de dados é freqüentemente realizada manualmente, o que torna esse processo demorado e caro. Por outro lado, exemplos não-rotulados são facilmente obtidos se comparados a exemplos rotulados. Isso é particularmente verdade para tarefas de classificação de textos que envolvem fontes de dados on-line tais como páginas de internet, email e artigos científicos. A classificação de textos tem grande importância dado o grande volume de textos disponível on-line. Aprendizado semi-supervisionado, uma área de pesquisa relativamente nova em Aprendizado de Máquina, representa a junção do aprendizado supervisionado e não-supervisionado, e tem o potencial de reduzir a necessidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponível. Este trabalho descreve o algoritmo de aprendizado semi-supervisionado co-training, que necessita de duas descrições de cada exemplo. Deve ser observado que as duas descrições necessárias para co-training podem ser facilmente obtidas de documentos textuais por meio de pré-processamento. Neste trabalho, várias extensões do algoritmo co-training foram implementadas. Ainda mais, foi implementado um ambiente computacional para o pré-processamento de textos, denominado PreTexT, com o objetivo de utilizar co-training em problemas de classificação de textos. Os resultados experimentais foram obtidos utilizando três conjuntos de dados. Dois conjuntos de dados estão relacionados com classificação de textos e o outro com classificação de páginas de internet. Os resultados, que variam de excelentes a ruins, mostram que co-training, similarmente a outros algoritmos de aprendizado semi-supervisionado, é afetado de maneira bastante complexa pelos diferentes aspectos na indução dos modelos. / In Machine Learning, the supervised approach usually requires a large number of labeled training examples to learn accurately. However, labeling is often manually performed, making this process costly and time-consuming. By contrast, unlabeled examples are often inexpensive and easier to obtain than labeled examples. This is especially true for text classification tasks involving on-line data sources, such as web pages, email and scientific papers. Text classification is of great practical importance today given the massive volume of online text available. Semi-supervised learning, a relatively new area in Machine Learning, represents a blend of supervised and unsupervised learning, and has the potential of reducing the need of expensive labeled data whenever only a small set of labeled examples is available. This work describes the semi-supervised learning algorithm co-training, which requires a partitioned description of each example into two distinct views. It should be observed that the two different views required by co-training can be easily obtained from textual documents through pre-processing. In this works, several extensions of co-training algorithm have been implemented. Furthermore, we have also implemented a computational environment for text pre-processing, called PreTexT, in order to apply the co-training algorithm to text classification problems. Experimental results using co-training on three data sets are described. Two data sets are related to text classification and the other one to web-page classification. Results, which range from excellent to poor, show that co-training, similarly to other semi-supervised learning algorithms, is affected by modelling assumptions in a rather complicated way.
447

Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analytics

Salazar, Frizzi Alejandra San Roman 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided
448

O ensino de produção de textos para fins específicos. / Production of text writing for Specific Purposes. Area: Administration

Torres, Bernadeth Resende 14 February 2006 (has links)
Made available in DSpace on 2016-04-28T19:33:56Z (GMT). No. of bitstreams: 1 Dissertacao Bernadeth Resende Torres.pdf: 2179369 bytes, checksum: 8373fed7ef1fa146837d7e67584f06c4 (MD5) Previous issue date: 2006-02-14 / Fundação Educacional Comunitária de São Sebastião do Paraíso / This study was designed based on Writing and Reading Research guidelines namely text writing for Specific Purposes, which prioritize teaching a language in a given setting and context aiming at solving communication problems in specific areas. Such teaching is based on eliciting student s previous language knowledge. According to necessity analyses, the difficulties of the first year students enrolled in Business Management night courses at the Faculdade de Ciências Econômicas, Administrativas e Contábeis de São Sebastião do Paraíso were diagnosed. Based on the data collected, a proposal to improve student s communicative performance was devised, both for real text writing and text comprehension. For this work, text writing was elected as an integrating axis between teaching and learning and strategic proposals for text production in an in-class context were designed. All strategies were based on a Writing Project which combined qualitative and quantitative approaches. Results show that, as students gain more awareness of their own responsibility for learning, they also found it more significant, and began to write better quality texts, when compared to those written in college entrance exams. / Este trabalho situa-se na Linha de Pesquisa de Leitura, Escrita e Ensino de Língua Portuguesa, especificamente em Produção de Textos para Fins Específicos que prioriza um ensino de uma língua em funcionamento numa dada realidade, voltada para a solução de problemas de comunicação em áreas específicas, a partir de conhecimentos prévios dos aprendizes. Com base em Análise de Necessidades foram diagnosticadas dificuldades dos alunos do 1º ano noturno de Administração da Faculdade de Ciências Econômicas, Administrativas e Contábeis de São Sebastião do Paraíso, Minas Gerais. Com base nos dados obtidos e em função dos objetivos traçados, foi elaborada proposta de um trabalho destinado a melhorar o desempenho comunicativo dos usuários, em situações reais de análise e produção de texto. Para esse trabalho, foi eleito o texto como eixo integrador do ensino e da aprendizagem e construídas propostas estratégicas para a produção de textos em situação de aula, a partir de um Projeto de Escrita que combinou procedimentos qualitativos e quantitativos. Os resultados mostram que, na medida em que os alunos assumiram sua própria aprendizagem, ela se tornou significativa e eles passaram a produzir textos de melhor qualidade, quando comparados com a situação inicial do Processo Seletivo 2004.
449

A literatura infantil na Revista do Globo : a que leitor se destina?

Rodrigues, Sandra Tessler 10 January 2008 (has links)
Made available in DSpace on 2015-04-14T13:37:29Z (GMT). No. of bitstreams: 1 399936.pdf: 10970866 bytes, checksum: 4ea0297da31d24103e76dfb7069eab42 (MD5) Previous issue date: 2008-01-10 / Este trabalho dedica-se ao estudo dos textos de literatura infanto-juvenil publicados na Revista do Globo (1929 -1967), no per?odo compreendido entre 1930 e 1959, utilizando como aporte te?rico na an?lise dos textos selecionados, a Est?tica da Recep??o, tendo como foco o leitor impl?cito, categoria intratextual marcada, com o objetivo de identificar o leitor visado pela Revista no momento da sele??o e publica??o dos referidos textos. Como a produ??o liter?ria n?o ? um fato isolado, mas ocorre num determinado contexto, fez-se necess?rio a contextualiza??o hist?rica, pol?tica, social e cultural da ?poca das publica??es. ? importante ressaltar tamb?m a relev?ncia do papel desempenhado pelos peri?dicos - neste caso espec?fico, pela Revista do Globo - na divulga??o da literatura e dos autores nessa ?poca, permitindo assim, estabelecer as conex?es entre literatura infantil, hist?ria e cultura de massa. A pesquisa revelou que, ao disponibilizar um espa?o para a literatura infanto-juvenil, a Revista do Globo mostrou-se sens?vel ?s mudan?as culturais e educacionais ocorridas na ?poca, e buscou dialogar com a crian?a inserida nessa sociedade, facilitando o acesso ? leitura e publicando textos, de um lado moralizantes e de outro emancipat?rios, demonstrando a divis?o de rumos por que passava a literatura infantil naquele momento. Ao t?rmino da an?lise dos referidos textos, a partir da Est?tica da Recep??o, foi poss?vel constatar que o leitor visado pela Revista era a crian?a e o jovem em forma??o. A grande maioria dos textos caracteriza-se por seu car?ter moralizante e pedag?gico, com clara inten??o educativa e de transmiss?o dos valores vigentes na sociedade da ?poca, com autores e editores fazendo uso da literatura como instrumento de forma??o moral do leitor. Em menor n?mero, aparecem os textos que privilegiam a literariedade, que buscam enriquecer o imagin?rio do seu receptor e levar o leitor a enxergar as coisas sobre outro prisma, estimulando uma atitude aut?noma e cr?tica ao repensar sua inser??o social.
450

Um estudo sobre o papel de medidas de similaridade em visualização de coleções de documentos / A study on the role of similarity measures in visual text analytics

Frizzi Alejandra San Roman Salazar 27 September 2012 (has links)
Técnicas de visualização de informação, tais como as que utilizam posicionamento de pontos baseado na similaridade do conteúdo, são utilizadas para criar representações visuais de dados que evidenciem certos padrões. Essas técnicas são sensíveis à qualidade dos dados, a qual, por sua vez, depende de uma etapa de pré-processamento muito influente. Esta etapa envolve a limpeza do texto e, em alguns casos, a detecção de termos e seus pesos, bem como a definição de uma função de (dis)similaridade. Poucos são os estudos realizados sobre como esses cálculos de (dis)similaridade afetam a qualidade das representações visuais geradas para dados textuais. Este trabalho apresenta um estudo sobre o papel das diferentes medidas de (dis)similaridade entre pares de textos na geração de mapas visuais. Nos concentramos principalmente em dois tipos de funções de distância, aquelas computadas a partir da representação vetorial do texto (Vector Space Model (VSM)) e em medidas de comparação direta de strings textuais. Comparamos o efeito na geração de mapas visuais com técnicas de posicionamento de pontos, utilizando as duas abordagens. Para isso, foram utilizadas medidas objetivas para comparar a qualidade visual dos mapas, tais como Neighborhood Hit (NH) e Coeficiente de Silhueta (CS). Descobrimos que ambas as abordagens têm pontos a favor, mas de forma geral, o VSM apresentou melhores resultados quanto à discriminação de classes. Porém, a VSM convencional não é incremental, ou seja, novas adições à coleção forçam o recálculo do espaço de dados e das dissimilaridades anteriormente computadas. Nesse sentido, um novo modelo incremental baseado no VSM (Incremental Vector Space Model (iVSM)) foi considerado em nossos estudos comparativos. O iVSM apresentou os melhores resultados quantitativos e qualitativos em diversas configurações testadas. Os resultados da avaliação são apresentados e recomendações sobre a aplicação de diferentes medidas de similaridade de texto em tarefas de análise visual, são oferecidas / Information visualization techniques, such as similarity based point placement, are used for generating of visual data representation that evidence some patterns. These techniques are sensitive to data quality, which depends of a very influential preprocessing step. This step involves cleaning the text and in some cases, detecting terms and their weights, as well as definiting a (dis)similarity function. There are few studies on how these (dis)similarity calculations aect the quality of visual representations for textual data. This work presents a study on the role of the various (dis)similarity measures in generating visual maps. We focus primarily on two types of distance functions, those based on vector representations of the text (Vector Space Model (VSM)) and measures obtained from direct comparison of text strings, comparing the effect on the visual maps obtained with point placement techniques with the two approaches. For this, objective measures were employed to compare the visual quality of the generated maps, such as the Neighborhood Hit and Silhouette Coefficient. We found that both approaches have strengths, but in general, the VSM showed better results as far as class discrimination is concerned. However, the conventional VSM is not incremental, i.e., new additions to the collection force the recalculation of the data space and dissimilarities previously computed. Thus, a new model based on incremental VSM (Incremental Vector Space Model (iVSM)) has been also considered in our comparative studies. iVSM showed the best quantitative and qualitative results in several of the configurations considered. The evaluation results are presented and recommendations on the application of different similarity measures for text analysis tasks visually are provided

Page generated in 0.0762 seconds