• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 611
  • 146
  • 18
  • 14
  • 9
  • 9
  • 9
  • 8
  • 7
  • 5
  • 5
  • 4
  • 2
  • 1
  • Tagged with
  • 806
  • 177
  • 170
  • 156
  • 156
  • 120
  • 107
  • 98
  • 92
  • 84
  • 84
  • 84
  • 83
  • 79
  • 77
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
211

Literatura infantil no ensino fundamental: análise da recepção na articulação de textos imagéticos e escritos por crianças de 4. série

Campos, Mariana Garcia de Paula [UNESP] 30 March 2007 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:24:58Z (GMT). No. of bitstreams: 0 Previous issue date: 2007-03-30Bitstream added on 2014-06-13T20:13:30Z : No. of bitstreams: 1 campos_mgp_me_mar.pdf: 1060361 bytes, checksum: 68adace053fc702c34893ed9386cf5ea (MD5) / Esta pesquisa procurou registrar, descrever e analisar recortes das impressões de leitura relativas a imagens presentes em narrativas de ficção para crianças. Partindo da leitura das narrativas Algodão-doce, de José Cássio de Cerqueira César e ilustrações de Helena Alexandrino, e O papo da Cabra-cabriola, escrito por Regina Chamlian e ilustrado também por Alexandrino, por alunos da 4ª série do Ensino Fundamental de duas escolas públicas municipais em Assis-SP, atentou-se para o papel da imagem nessa leitura e para a percepção dos leitores acerca da articulação entre os textos verbal e não-verbal. Tais características foram observadas em três situações de leitura, que envolveram mais de cento e cinqüenta leitores: a) leitura individual, b) leitura em pequenos grupos e c) leitura coletiva. Os dados da pesquisa foram coletados nos anos de 2004 e 2005, por meio de entrevistas semiestruturadas, diálogos com os alunos e observações das atividades trabalhadas. Para o desenvolvimento dos trabalhos houve amparo em teóricos da leitura e da leitura da literatura como Kügler, Martins e Faria. Por meio de atividades práticas de leitura houve constatação que o texto escrito configura-se, para a maioria dos leitores aqui considerados, o mais importante ou o mais legitimado para a conferência de sentidos a uma leitura. Mesmo quando solicitadas a reconstituir a narrativa por meio do texto não-verbal, das ilustrações, as crianças costumavam buscar o texto escrito como apoio. O texto não-verbal por vezes teve leitura mais descritiva do que interpretativa, entretanto as crianças tendiam a se dirigir a uma leitura mais crítica deste se instigadas a tal. A leitura de imagens é essencial para a formação do leitor, e esta não se dá de maneira dissociada da leitura de textos escritos, tampouco de preparo para este exercício... / This research aimed to register, describe and analyze parts of the impressions related to images in narratives of fiction for children. Starting from the narratives Algodão doce, by José Cássio de Cerqueira César and pictures by Helena Alexandrino, and O papo da Cabracabriola, by Regina Chamlian and pictures by Alexandrino as well, read by 4th grade students of the Elementary School from two public schools in Assis-SP, we have focused on the role of the image in this reading and on the perception of the readers about the articulation between the verbal and non-verbal texts. These characteristics have been observed in three situations of reading, which involved more than a hundred and fifty readers: a) individual reading, b) reading in small groups and c) collective reading. The research data were collected in 2004 and 2005, through semi-structured interviews, dialogues with the students and observation of the activities done. To develop the work there was a theoretical support concerning reading and literature reading with Kügler, Martins and Faria. Through the practical reading activities, we noticed that the written text is, to most of the readers considered here, the most important or the most legitimated way to give meanings to a reading. Even when asked to retell the narrative through the non-verbal text, the pictures, children used to look for the written text as a support. The non-verbal text at times had a more descriptive than an interpretative reading, but children tended to have a more critical reading of it when stimulated to do that. Reading images is essential to the reader formation, and it is not dissociated either from reading written texts or preparing to this exercise. The activities of collective reading were the ones which showed more incidence of a more balanced articulation between the verbal and non- verbal texts... (Complete abstract, click eletronic address below)
212

A literatura infantil na Revista do Globo: a que leitor se destina?

Rodrigues, Sandra Tessler January 2007 (has links)
Made available in DSpace on 2013-08-07T19:00:55Z (GMT). No. of bitstreams: 1 000399936-Texto+Completo-0.pdf: 10970866 bytes, checksum: 4ea0297da31d24103e76dfb7069eab42 (MD5) Previous issue date: 2007 / The purpose of this work is the study of infant-juvenile literature texts published in Revista do Globo (1929-1967) in the period of time between 1930 and 1959, using the Aesthetics of Reception as theoretical basis for the analysis of the selected texts, keeping the focus on the implicit reader, marked intratextual category, with the purpose of identifying the aimed reader by the Revista at the moment of the selection and publication of the texts previously mentioned. Considering that literary production is not an isolated fact, but it occurs in a specific context, it is necessary the historical, political, social and cultural contextualization at the time of publication. It is also important to point out the relevance of the role performed by the periodicals - in this specific situation, the Revista - in the dissemination of literature and authors at that time, allowing to establish the connections among literature for children, history and mass culture. The research revealed that, in making available a space for infant-juvenile literature, the Revista do Globo showed sensitivity to the cultural and educational changes at that time, and tried to establish a dialogue with the children inserted in that society, making easier the access to reading and publishing texts, moralizing in on one hand and on the other hand emancipating, showing the division of ways in which the infantile-juvenile literature was going through. After the analisys of the texts previously mentioned, from the Aesthetics of Reception view, it was possible to conclude that the kind of reader aimed by the Revista was children and teenagers in the process of formation. Most of the texts was characterized by their moralistic and pedagogical aspects, with a clear educational intention of disseminate the values of the time, with the authors and publishers using literature as an instrument for moral formation of the reader.In a smaller scale there are texts that privilege literature, and try to enrich the imaginary of the receptor and make the reader see things through a different light, stimulating an autonomous and critical attitude, in rethinking their social insertion. / Este trabalho dedica-se ao estudo dos textos de literatura infanto-juvenil publicados na Revista do Globo (1929 -1967), no período compreendido entre 1930 e 1959, utilizando como aporte teórico na análise dos textos selecionados, a Estética da Recepção, tendo como foco o leitor implícito, categoria intratextual marcada, com o objetivo de identificar o leitor visado pela Revista no momento da seleção e publicação dos referidos textos. Como a produção literária não é um fato isolado, mas ocorre num determinado contexto, fez-se necessário a contextualização histórica, política, social e cultural da época das publicações. É importante ressaltar também a relevância do papel desempenhado pelos periódicos - neste caso específico, pela Revista do Globo - na divulgação da literatura e dos autores nessa época, permitindo assim, estabelecer as conexões entre literatura infantil, história e cultura de massa. A pesquisa revelou que, ao disponibilizar um espaço para a literatura infanto-juvenil, a Revista do Globo mostrou-se sensível às mudanças culturais e educacionais ocorridas na época, e buscou dialogar com a criança inserida nessa sociedade, facilitando o acesso à leitura e publicando textos, de um lado moralizantes e de outro emancipatórios, demonstrando a divisão de rumos por que passava a literatura infantil naquele momento. Ao término da análise dos referidos textos, a partir da Estética da Recepção, foi possível constatar que o leitor visado pela Revista era a criança e o jovem em formação. A grande maioria dos textos caracteriza-se por seu caráter moralizante e pedagógico, com clara intenção educativa e de transmissão dos valores vigentes na sociedade da época, com autores e editores fazendo uso da literatura como instrumento de formação moral do leitor.Em menor número, aparecem os textos que privilegiam a literariedade, que buscam enriquecer o imaginário do seu receptor e levar o leitor a enxergar as coisas sobre outro prisma, estimulando uma atitude autônoma e crítica ao repensar sua inserção social.
213

Experimentos comparativos combinando aprendizado supervisionado e tradução automática para mineração de emoçoes em textos multilíngues / Comparative experiments combining supervised learning and machine translation for multilingual emotion mining

Santos, Aline Graciela Lermen dos January 2016 (has links)
Com o avanço da Internet pelo mundo, as pessoas passaram a interagir cada vez mais com a Web, principalmente após o surgimento das redes sociais, criando conteúdo que pode ser explorado de diversas formas. Esse aumento de usuários tem sido global, ou seja, pessoas de diversos países passaram a produzir textos de diversos idiomas. Esses textos compõem um rico conteúdo para Análise de Sentimentos Multilíngue. A maior parte dos trabalhos da área se foca em Mineração de Opinião, analisando o sentimento através da polaridade. Outro tipo de sentimento que tem atraído atenção é a emoção, embora não seja amplamente explorada a Análise de Sentimentos Multilíngue usando emoção. Este trabalho utiliza técnicas geralmente usadas para Mineração de Opinião e polaridade para Análise de Sentimentos Multilíngues usando emoção. O objetivo deste trabalho é comparar diferentes combinações de aprendizado de máquina supervisionado e tradução automática para criar corpora em diferentes idiomas a partir de corpora anotados já existentes. As duas formas de utilizar as traduções comparadas são: criando classificadores de emoção separados por idiomas, chamados monolíngues, e criando um classificador composto do idioma original e das traduções, chamado multilíngue. É feito ainda um experimento cruzando dois corpora, visando avaliar o uso da tradução de um corpus com os textos originais do outro. Os resultados dos experimentos mostram não apenas o sucesso de analisar emoção usando aprendizado supervisionado e tradução automática, mas que o classificador multilíngue supera os classificadores monolíngues. O experimento cruzando os corpora mostra que para algumas emoções os corpora estão alinhados, mas que para outras é preciso que haja maior similaridade nos textos. / With the growth of the Internet around the world, people began to interact more and more with the Web, especially after the emergence of social networks, creating content that can be exploited in several ways. This increase in the number of users has been global, that is, people from different countries started producing texts in several languages. These texts comprise a rich content for Multilingual Sentiment Analysis. Most of the work in the area focus in Opinion Mining, analyzing the feeling through polarity. Another type of feeling that has attracted attention is emotion, although not extensively explored in Multilingual Sentiment Analysis. This work uses techniques commonly used for Opinion Mining and polarity for Multilingual Sentiment Analysis using emotion. The objective of this study is to compare different combinations of supervised machine learning and automatic translation to create corpora in different languages from existing annotated corpora. The two ways to use the translations compared are: creating emotion classifiers separated by languages, called monolingual, and creating a composed classifier, with the original language and it’s translations, called multilingual. An experiment crossing the two corpora used is made, to evaluate the use of the translation of one corpus with the original texts of the other. The results of the experiments show not only the success of analysing emotion using supervised machine learning and automatic translation, but that the multilingual classifier exceeds the monolingual classifiers. The experiment crossing the corpora shows that to some emotions the corpora are aligned, but for others there needs to be greater similarity in the texts.
214

Refinamento interativo de mapas de documentos apoiado por extração de tópicos / Interactive refinement of document maps supported by topic extraction

Renato Rodrigues Oliveira da Silva 15 December 2010 (has links)
Mapas de documentos são representações visuais que permitem analisar de forma eficiente diversas relações entre documentos de uma coleção. Técnicas de projeção multidimensional podem ser empregadas para criar mapas que refletem a similaridade de conteúdo, favorecendo a identificação de agrupamentos com conteúdo similar. Este trabalho aborda uma evolução do arcabouço genérico oferecido pelas projeções multidimensionais para apoiar a análise interativa de documentos textuais, implementado na plataforma PEx. Foram propostas e implementadas técnicas que permitem ao usuário interagir com o mapa de documentos utilizando tópicos extraídos do próprio corpus. Assim a representação visual pode gradualmente evoluir para refletir melhor os interesses do usuário, e apoiá-lo de maneira mais efetiva em tarefas exploratórias. A interação foi avaliada utilizando uma técnica de inspeção de usabilidade, que visa identificar os principais problemas enfrentados pelos usuários ao interagir com as funcionalidades desenvolvidas. Adicionalmente, a utilidade das funcionalidades foi avaliada pela condução de dois estudos de caso, em que foram definidas tarefas a serem conduzidas pelo usuário sobre os mapas de documentos. Os resultados mostram que com o auxílio das visualizações foi possível conduzir as tarefas satisfatoriamente, permitindo manipular de forma eficiente milhares de documentos sem a necessidade de ler individualmente cada texto / Content-based document maps are visualizations that help users to identify and explore relationships among documents in a collection. Multidimensional projection techniques have been employed to create similaritybased maps that can help identifying documents of similar content. This work aims to enhance the generic framework offered by the multidimensional projection techniques in the PEx visualization platform to support interactive analysis of textual data. Several interaction functions and visual representations have been proposed and implemented that allow users to interact with document maps aided by topics automatically extracted from the corpus. By exploring the topics and maps in an integrated manner, users can refine and evolve the visual representations gradually to better reflect their needs and interests, enhancing support to exploratory tasks. The proposed interaction functions were evaluated employing a usability inspection technique, seeking to detect interface problems. Moreover, two illustrative case studies were conducted to evaluate the usefulness of the proposed interactions, based on typical user tasks defined over different document collections. They illustrate how the developed visualizations can assist the proposed tasks, allowing users to interactively explore large document corpora and refine document maps
215

Formação continuada e uso das TICs para a produção de texto nas aulas de Língua Espanhola / Formación continuada y uso de las TICs para la producción de texto en las clases de Lengua Española

Dacoltivo, Fernanda 13 December 2017 (has links)
Submitted by Neusa Fagundes (neusa.fagundes@unioeste.br) on 2018-03-02T19:45:53Z No. of bitstreams: 2 Fernanda_Dacoltivo2017.pdf: 2951239 bytes, checksum: eb6dc33e94fbae08c2222fac88a7268b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-03-02T19:45:53Z (GMT). No. of bitstreams: 2 Fernanda_Dacoltivo2017.pdf: 2951239 bytes, checksum: eb6dc33e94fbae08c2222fac88a7268b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017-12-13 / Al basarnos en los cambios ocurridos en la década de 1980 con relación a la producción de textos, percibimos que la redacción, antes vista como algo inerte, mecánico, producido para el profesor asignar una nota, hoy es considerada como una actividad realizada por la escuela para promover la práctica social y el posicionamiento del lector como sujeto que participa del proceso discursivo. Estos cambios se reflejan en los documentos que guían la enseñanza de Lengua Extranjera, sean a nivel nacional como los Parámetros Curriculares Nacionales (BRASIL, 2000), y estaduales, como las Directrices Curriculares Estaduales (PARANÁ, 2008). Considerando que la producción de textos es un factor importante para el aprendizaje de cualquier lengua, nos propusimos a realizar una investigación sobre ese contenido, con una concepción interaccionista del lenguaje (BAKHTIN/VOLOCHINOV, 2002). Además, aliamos las Tecnologías de la Información y de la Comunicación (TIC) como herramienta pedagógica a ese proceso, con el objetivo de ampliar la circulación del material producido por los alumnos y la interacción. Nos proponemos a investigar como la formación continuada, con foco en las TICs, puede contribuir para el trabajo con producción textual, en una perspectiva interaccionista, en las clases de Lengua Española. Tenemos como objetivo general evaluar los desafíos y las contribuciones en el proceso de formación continuada, con foco en las TICs, para el encaminamiento de la producción textual, en una perspectiva interaccionista, en las clases de Lengua Española. Para tanto, adoptamos como metodología la investigación de cuño etnográfico, del tipo qualitativa-interpretativista. La investigación se inserta en el proyecto “Descripción y Elaboración de Objetos Digitales de Enseñanza-aprendizaje de Español”, coordinado por la profesora Greice Castela con auspicio de la Fundação Araucária, y se realizó con los profesores de Lengua Española, de la red estatal del municipio de Santa Helena, que actúan en la Enseñanza Media y en los Centros de Lenguas Extranjeras Modernas (CELEM). Estos profesores participaron de la "Formación Continuada para la producción de textos en la clase de Lengua Española con el auxilio de las TICs", que aplicamos en el período del 6 de abril al 22 de junio de 2017. El corpus de la investigación fue generado por medio de aplicación de cuestionarios, uno para los profesores y otro para los colegios que ofrecen la enseñanza de Lengua Española, diario de campo y grabación en audio de la formación continuada y análisis de planes de aula. Esta investigación se inserta en la Linguística Aplicada (LA) y se basa en los posicionamientos teóricos de Bakhtin (2011), Geraldi (1984, 1997), Costa-Hübes (2012), entre otros. Los datos nos revelaron que los profesores encuentran grandes dificultades para introducir la tecnología en el aula debido a la cantidad y el desguace de los recursos didáctico-tecnológicos puestos a disposición por los colegios. En cuanto a la producción de texto observamos que los profesores adoptan en parte los aspectos que conducen la actividad hacia un proceso de interacción. La formación continuada proporcionó momentos de reflexión, en los cuales se realizaron revisiones de los elementos que encaminan una propuesta de texto para la interacción y la proposición de utilizar las plataformas tecnológicas para la creación y circulación de los materiales producidos por los alumnos. / Ao nos basearmos nas mudanças ocorridas na década de 1980 com relação à produção de textos, percebemos que a redação, antes vista como algo inerte, mecânico, produzido para o professor atribuir uma nota, hoje é considerada como uma atividade realizada pela escola para promover a prática social e o posicionamento do leitor como sujeito que participa do processo discursivo. Tais mudanças estão refletidas nos documentos que norteiam o ensino de Língua Estrangeira, sejam eles em nível nacional como os Parâmetros Curriculares Nacionais (BRASIL, 2000), quanto estaduais, como as Diretrizes Curriculares Estaduais (PARANÁ, 2008). Considerando que a produção de textos é um fator importante para o aprendizado de qualquer língua estrangeira, nos propomos a realizar uma pesquisa que enfatizasse tal conteúdo, atrelado a uma concepção interacionista da linguagem (BAKHTIN/VOLOCHINOV, 2002). Além disso, aliamos as Tecnologias da Informação e da Comunicação (TICs) como ferramenta pedagógica a esse processo, com o intuito de ampliar a circulação do material produzido pelos alunos e a interação entre os mesmos. Neste viés, nos propomos a investigar como a formação continuada, com foco nas TICs, pode contribuir para o trabalho com produção textual, em uma perspectiva interacionista, nas aulas de Língua Espanhola. A pesquisa tem como objetivo avaliar os desafios e as contribuições do processo de formação continuada, com foco nas TICs, para o encaminhamento da produção textual, em uma perspectiva interacionista, nas aulas de Língua Espanhola. Para tanto, adotamos como metodologia a pesquisa de cunho etnográfico, do tipo qualitativa-interpretativista. A investigação se insere no projeto de pesquisa “Descrição e Elaboração de Objetos Digitais de Ensino–aprendizagem de Espanhol”, coordenado pela professora Greice Castela, com financiamento da Fundação Araucária, e foi realizada com os professores de Língua Espanhola, da rede estadual do município de Santa Helena, que atuam no Ensino Médio e nos Centros de Línguas Estrangeiras Modernas (CELEM). Esses professores participaram da “Formação Continuada para a produção de textos na aula de Língua Espanhola com o auxílio das TICs”, aplicada no período de 06 de abril a 22 de junho de 2017. O corpus da pesquisa foi gerado por meio de aplicação de questionários, um para os professores e outro para os colégios que ofertam o ensino de Língua Espanhola, diário de campo e gravação em áudio da formação continuada e análise de planos de aula gerados antes e após as oficinas. Esta pesquisa se insere no arcabouço da Linguística Aplicada (LA) e baseia-se nos posicionamentos teóricos de Bakhtin (2011), Geraldi (1984, 1997), Costa-Hübes (2012), entre outros. Os dados revelaram que os professores encontram dificuldades para introduzirem a tecnologia em sala de aula devido à escassez a ao sucateamento dos recursos didático-tecnológicos disponibilizados pelos colégios. Quanto à produção de texto, observamos que os professores adotam em parte os aspectos que conduzem a atividade para um processo de interação. A formação continuada proporcionou momentos de reflexão, nos quais foram realizadas revisões dos elementos que encaminham uma proposta de texto para a interação e a proposição de utilizar as plataformas tecnológicas para a criação e circulação dos materiais produzidos pelos alunos.
216

Los libros de texto para estudiantes nativos: un recurso para la ensenanza de E/LE

García-Day, Diana 09 April 2007 (has links)
Indiana University-Purdue University Indianapolis (IUPUI) / Un análisis de la importancia del uso de textos auténticos en las lecciones de español como segunda lengua y una propuesta de una fuente de explotación de los mismos: los libros de texto para jóvenes estudiantes nativos. Dichos libros han sido simplificados, adaptados y presentados por catedráticos nativos específicamente para niveles académicos, lingüísticos y culturales específicos con propósitos comunicativos naturales.
217

Cultura, neoliberalismo y educación : la construcción de la subjetividad desde los textos escolares de nivel secundario (periodo 2008-2012 y 2012-2016)

Pillaca Lizarbe, Gladys Reyna 03 November 2016 (has links)
Hoy en día, en el marco de la globalización y el neoliberalismo, la representación de la realidad se va reconstituyendo bajo ciertos paradigmas y exigencias del mercado global: la capitalización de recursos. En este sentido, por ejemplo, la cultura ha dado un giro en su concepción y es vista principalmente como un recurso económico y político (Yúdice 2003), que aparentemente genera ingreso económico a la región y al país a través del fomento del turismo nacional e internacional, y resuelve los problemas sociales como la falta de empleo y la pobreza. Asimismo, en este escenario, existen nuevos mandatos sociales sobre lo que debemos hacer o cuáles deben ser nuestras aspiraciones. En tal sentido, se construyen nuevos sujetos que respondan a los intereses de la cultura hegemónica (Portocarrero 2001), sujetos emprendedores, exitosos, que sean capaces de dinamizar la economía de su país. / Tesis
218

Textos especialitzats i variació vertical: la diversitat terminològica com a factor discriminant del nivell d'especialització d'un text

Domènech Bagaria, Ona 28 April 2006 (has links)
Aquesta tesi doctoral es proposa contribuir a la delimitació del nivell d'especialitat d'un text a partir de l'anàlisi quantitativa de la terminologia que conté, amb la voluntat, d'una banda, de contribuir a l'estudi i caracterització del text especialitzat des d'una perspectiva lingüística, i de l'altra, de proposar una via que permeti la determinació d'un paràmetre objectivable, vàlid per discriminar un text en funció del nivell d'especialització que presenta, amb la finalitat d'aportar les bases de futurs sistemes de detecció automàtica del nivell d'especialització d'un text.D'acord amb aquest objectiu, la tesi ofereix una revisió crítica de les diferents aproximacions lingüístiques al concepte de text especialitzat i a la consideració de la variació vertical present en les produccions especialitzades i proposa l'ús d'un mesurador estadístic de la diversitat (l'índex de Shannon-Weaver) per obtenir un paràmetre, relacionat amb la diversitat terminològica, susceptible de discriminar els textos en funció del nivell d'especialització que presenten.
219

[en] A STUDY OF MULTILABEL TEXT CLASSIFICATION ALGORITHMS USING NAIVE-BAYES / [pt] UM ESTUDO DE ALGORITMOS PARA CLASSIFICAÇÃO AUTOMÁTICA DE TEXTOS UTILIZANDO NAIVE-BAYES

DAVID STEINBRUCH 12 March 2007 (has links)
[pt] A quantidade de informação eletrônica vem crescendo de forma acelerada, motivada principalmente pela facilidade de publicação e divulgação que a Internet proporciona. Desta forma, é necessária a organização da informação de forma a facilitar a sua aquisição. Muitos trabalhos propuseram resolver este problema através da classificação automática de textos associando a eles vários rótulos (classificação multirótulo). No entanto, estes trabalhos transformam este problema em subproblemas de classificação binária, considerando que existe independência entre as categorias. Além disso, utilizam limiares (thresholds), que são muito específicos para o conjunto de treinamento utilizado, não possuindo grande capacidade de generalização na aprendizagem. Esta dissertação propõe dois algoritmos de classificação automática de textos baseados no algoritmo multinomial naive Bayes e sua utilização em um ambiente on-line de classificação automática de textos com realimentação de relevância pelo usuário. Para testar a eficiência dos algoritmos propostos, foram realizados experimentos na base de notícias Reuters 21758 e na base de documentos médicos Ohsumed. / [en] The amount of electronic information has been growing fast, mainly due to the easiness of publication and spreading that Internet provides. Therefore, is necessary the organisation of information to facilitate its retrieval. Many works have solved this problem through the automatic text classification, associating to them several labels (multilabel classification). However, those works have transformed this problem into binary classification subproblems, considering there is not dependence among categories. Moreover, they have used thresholds, which are very sepecific of the classifier document base, and so, does not have great generalization capacity in the learning process. This thesis proposes two text classifiers based on the multinomial algorithm naive Bayes and its usage in an on-line text classification environment with user relevance feedback. In order to test the proposed algorithms efficiency, experiments have been performed on the Reuters 21578 news base, and on the Ohsumed medical document base.
220

Inteligência práxis: estudo sobre o uso das tecnologias de informação para a gestão da análise do conteúdo de texto / Intelligence Praxis: study on the use of information technologies for the analysis of the management of the content of texts

Santos, Melquizedek Fernandes dos 08 February 2017 (has links)
O objetivo deste estudo foi o de apresentar uma nova tecnologia de software especialista, denominada Inteligência Práxis (IP), para a gestão da análise do conteúdo de textos de dissertações, relatórios e indicadores da produção. Este software demonstra através de gráficos lineares e da nuvem de palavras, o foco do texto em análise. Ele também permite a visualização do conteúdo, a partir das palavras contidas no texto e transportadas para um dicionário de dados criado pelas evidências relacionadas, organizando e apresentando para análise do pesquisador o conteúdo proposto como base do conhecimento (Corpus). O software foi implementado em linguagem de programação Delphi, Versão 7 e para armazenamento de dados foi utilizado o banco de dados Absolute Database. A metodologia utilizada para a análise dos dados foi a Metodologia Delphi e a Lógica Fuzzy. Esta tecnologia traz uma inovação na análise do conteúdo dos textos consultados, demonstrando a imagem consolidada do foco do corpus, a partir do dicionário de evidências contidas e pontualmente relacionadas. O mapeamento produzido e a interpretação dos diversos indicadores conduzem a um maior grau de acerto na análise do conteúdo contido no documento, inferindo um melhor entendimento das diversas demandas envolvidas, desveladas pela análise, na expectativa do melhor resultado possível. Assim, pode-se concluir, que a ferramenta desenvolvida atendeu aos objetivos propostos com eficiência e agilidade. / The objective of this study was to present a new specialized software technology, called Intelligence Práxis (IP), for the management of content analysis of dissertations, reports and production indicators. This software demonstrates through linear graphs and the word cloud, the focus of the text under analysis. It also allows the visualization of the content, from the words contained in the text and transported to a data dictionary created by the related evidences, organizing and presenting to the researcher the proposed content as the basis of knowledge (Corpus). The software was implemented in Delphi programming language version 7 and for data storage the Absolute Database was used. The methodology used for the data analysis was the Delphi Methodology and the Fuzzy Logic. This technology brings an innovation in the analysis of the content of the texts consulted, demonstrating the consolidated image of the corpus focus, from the dictionary of contained and punctually related evidences. The mapping produced and the interpretation of the various indicators lead to a greater degree of accuracy in the analysis of the content contained in the document, inferring a better understanding of the diverse demands involved, revealed by the analysis, in the expectation of the best possible result. Thus, it can be concluded that the tool developed met the proposed objectives with efficiency and agility.

Page generated in 0.0617 seconds