• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 611
  • 146
  • 19
  • 14
  • 9
  • 9
  • 9
  • 8
  • 7
  • 5
  • 5
  • 4
  • 2
  • 1
  • Tagged with
  • 807
  • 178
  • 170
  • 156
  • 156
  • 120
  • 107
  • 98
  • 92
  • 84
  • 84
  • 84
  • 83
  • 79
  • 77
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
201

A produção escrita de textos argumentativos: reflexões sobre a prática docente e aprendizagem dos alunos

CAMPOS, Albaneide de Souza 01 June 2012 (has links)
Submitted by Luiza Maria Pereira de Oliveira (luiza.oliveira@ufpe.br) on 2017-07-12T14:43:55Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Albaneide Campos.pdf: 6992242 bytes, checksum: e5f7753df5a2bb2d4784869022e138a6 (MD5) / Made available in DSpace on 2017-07-12T14:43:55Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) DISSERTAÇÃO Albaneide Campos.pdf: 6992242 bytes, checksum: e5f7753df5a2bb2d4784869022e138a6 (MD5) Previous issue date: 2012-06-01 / Este estudo teve por finalidade analisar práticas de ensino de produção de textos argumentativos escritos e verificar as possíveis relações entre essas práticas e as estratégias argumentativas mobilizadas pelos alunos. Nesse sentido, buscou identificar as concepções de língua, texto e argumentação que fundamentavam a prática de professores de português; analisar as situações didáticas em que eram propostas as produções de texto e analisar as produções dos alunos, verificando as estratégias argumentativas mobilizadas por eles. Para tanto, desenvolvemos uma pesquisa de campo com duas professoras que atuavam em duas diferentes escolas da rede pública estadual do município de Camaragibe (PE) em turmas de 3º ano do ensino médio regular. Da mesma forma, analisamos os textos produzidos pelos estudantes dessas turmas. Nossos instrumentos de coleta de dados foram a entrevista semiestruturada, a observação participante e a análise documental. No nosso referencial teórico, apoiamo-nos na concepção de língua como prática sócio-histórica (BAKHTIN, 2010); de texto como unidade linguística sociocomunicativa e produto da atividade verbal (MARCUSCHI, 2009; VAL, 2006; BRONCKART, 2007, MAINGUENEAU, 2005); de gêneros textuais como produtos da atividade de linguagem em funcionamento (BAZERMAN, 2011; MARCUSCHI, 2009; SUASSUNA, 2004). De igual modo, adotamos os conceitos de argumentação como ação de linguagem que possibilita aos sujeitos maior inserção social, tendo por base as considerações de Perelman e Olbrechts-Tyteca (2005), Gregolin (1993), Breton (2003). Ainda nos respaldamos em Suassuna (2008, 2009), Geraldi (2004, 2009), Pécora (2002), Leal e Morais (2006) e Antunes (2003) para lidarmos com questões que envolviam as situações didáticas de produção de texto e as novas perspectivas metodológicas para o ensino de língua portuguesa. No que se refere aos aspectos metodológicos, fizemos uma abordagem qualitativa e etnográfica com base nas considerações de André (2008) e Lopes (2006). Para a análise dos dados, valemo-nos do paradigma indiciário (GINZBURG apud SUASSUNA, 2004, 2008a). Em linhas gerais, os resultados indicaram que: (1) o texto tem ocupado um lugar de destaque nas aulas de português, mas a sua inserção tem sido equivocada; (2) alguns professores se apropriaram do discurso sobre um sistemático trabalho com gêneros textuais com vistas ao desenvolvimento de habilidades linguísticas e discursivas dos alunos, mas não têm conseguido efetivar uma prática diferenciada, de modo a atender à nova proposta para o ensino de língua portuguesa; (3) as situações de produção de texto argumentativo distanciam-se das finalidades propostas no currículo para o ensino-aprendizagem desse gênero, de forma a não favorecer significativamente o desenvolvimento das habilidades argumentativas escritas dos alunos; (4) situações artificiais de produção de texto conduzem a produções igualmente artificiais; (5) em virtude da ausência de reflexão sobre os aspectos linguístico-discursivos implicados nos textos, os alunos desconheciam as especificidades dos gêneros que lhes foram solicitados a escrever; (6) diferentes sujeitos expostos às mesmas condições de produção escolar de texto se constituem quase que em sujeitos semelhantes na elaboração de seus textos: atendem ao discurso da escola, ainda que semanticamente as suas produções possam ser consideradas como vazias de sentidos. / This study aimed to examine teaching practices of producing argumentative texts written and determine possible relationships between these practices and the argumentative strategies deployed by the students. Accordingly, we sought to identify the conceptions of language, text and arguments underpinning the practice of Portuguese teachers; analyze teaching situations in which the productions were proposed text and analyze students' productions, checking the argumentative strategies deployed by them. We develop a field study with two teachers who worked in two different schools in the public schools of the city of Camaragibe (PE) classes in 3rd year high school regular. Similarly, we analyze the texts produced by the students of these classes. Our instruments for data collection were semi-structured interview, participant observation and document analysis. In our theoretical framework, we rely on the concept of language as a socio-historical practice (BAKHTIN, 2010); text as linguistic unity and sociocomunicativa product of verbal activity (MARCUSCHI, 2009; VAL, 2006; BRONCKART, 2007, MAINGUENEAU, 2005 ) of textual genres as products of language activity in operation (BAZERMAN, 2011; MARCUSCHI, 2009; SUASSUNA, 2004). Similarly, we adopt the concepts of argument as action language that allows individuals greater social inclusion, based on considerations of Perelman and Olbrechts-Tyteca (2005), Gregolin (1993), Breton (2003). Although the study was supported in Suassuna (2008, 2009), Geraldi (2004, 2009), Pécora (2002), Leal and Morais (2006) and Antunes (2003) to deal with issues involving the production of didactic situations and new text methodological perspectives to the teaching of the Portuguese language. With regard to methodological aspects, we made a qualitative and ethnographic approach based on considerations of Andrew (2008) and Lopes (2006). For data analysis, we used the evidential paradigm (SUASSUNA apud GINZBURG, 2004, 2008a). In general, the results indicated that: (1) the text has occupied a prominent place in the Portuguese classes, but their inclusion has been wrong, (2) some teachers appropriated the discourse on a systematic work with text genres with views the development of linguistic and discursive skills of students, but have been unable to effect a differentiated practice in order to meet the new proposal for the teaching of Portuguese language, (3) the production situations of argumentative text aims distance themselves from proposals the curriculum for the teaching and learning of this kind, so as not to significantly promote the development of argumentative writing skills of students, (4) artificial situations of text production also lead to artificial productions, (5) because of the lack of reflection on aspects involved in linguistic-discursive texts, the students were unaware of the specific genres they were asked to write; (6) different individuals exposed to the same conditions of production school text constitute almost similar in subjects in preparing their texts: attending the school discourse, albeit semantically their production can be regarded as empty of meaning.
202

Mapeamento de dados multidimensionais usando árvores filogenéticas: foco em mapeamento de textos / Mapping multidimensional data using phylogenetic tress: focus text mapping

Valdivia, Ana Maria Cuadros 01 October 2007 (has links)
A Visualização Computacional trata de técnicas para representar e interagir graficamente com dados complexos, em geral de alta dimensionalidade. Dados de alta dimensionalidade são caracterizados por pontos representados em espaços vetoriais de alta dimensão, cada coordenada representando um atributo do vetor. Num grande número de aplicações da visualização multidimensional uma medida de similaridade existe entre esses vetores. Técnicas de projeção multidimensional podem ser utilizadas para posicionamento desses dados num plano de forma a facilitar a interpretação das relações de similaridade. Entretanto alguns problemas dessas técnicas comprometem a interpretação dos resultados obtidos. Este trabalho identifica esses problemas e propõe, uma técnica para posicionar os pontos no plano, através da formação de árvores filogenéticas a partir de relações de similaridade. Em geral árvores filogenéticas são utilizadas para codificação de relações de ancestralidade. Um algoritmo de geração e um algoritmo de traçado dessas árvores foram implementados no contexto do sistema PEx (Projection Explorer) e a solução é comparada com a funcionalidade das projeções na interpretação de dados multidimensionais em geral e, em particular, na representação de coleções de documentos, uma aplicação bastante estratégica da visualização computacional e da mineração visual de dados / Computational Visualization is concerned with graphical representation and exploration of complex data, usually bearing high dimensionality. Multidimensional data are characterized by points represented in vector spaces of many dimensions, each coordinate representing an attribute of the vector. In many applications a similarity measure can be found to highlight relationships of proximity between the vectors. In this environment projection techniques offer an alternative to ease interpretation coded by the similarity measures through proximity on the display. They do so by positioning the points on a bidimensional plane. Projection techniques are very useful to display and interact with data, but present some drawbacks that in some cases compromise the interpretation of certain features in data sets. This work discusses such problems and proposes, as an alternative to represent similarity relationships and to provide point placement on a plane, the use of phylogenetic trees, a representation typically employed to represent ancestrality relationships. An algorithm for generation and an algorithm for drawing such trees were implemented in a system called Projection Explorer. The approach is compared to that of multidimensional projections for multidimensional data in general and, in particular, for document data sets, an strategic application for multidimensional visualizations, since text can be represented and interpreted as multi-dimensional entities
203

O recurso cênico teatral como instrumento de ensino-aprendizagem quanto à organização de textos narrativos na escola pública

Gusmão Júnior, Ediney 15 June 2009 (has links)
Made available in DSpace on 2016-04-28T18:24:04Z (GMT). No. of bitstreams: 1 Ediney Gusmao Junior.pdf: 2935563 bytes, checksum: 284fd948a173335cd35d52f7f197916a (MD5) Previous issue date: 2009-06-15 / Secretaria da Educação do Estado de São Paulo / The aim of this research is to investigate and comprehend the teathral scenic instrument, specificly, the dramatic game in the class room context, to the criacion of the contexts that do learning and development of the public school students as for the narratives oral texts production. The activity focus has a propose to be a pedagogical intervencion in the teaching routine of a public school. This study is grounded on the sócio-historicalcultural activity theory (VYGOTSKY, 1930/1999, 1930/2000, 1931/1995, 1987, 1934/2001; LEONTIEV, 1977; ENGSTRÖM, 1987), on the vygotskyan conception of criativity (VYGOTSKY, 1930/1999, 1930/2000), and on the concept of dialogism and verbal interaction (BAKHTIN, 1970/2000; BAKHTIN/VOLOCHINOV, 1929/2002), on the system turn (KERBRAT-ORECCHIONI, 1996/2006), on the argumentaction (PERELMAN & OLBRECHTS, 1996; ABREU, 2007). It is supported too on the subjects that discuss the teathral theory (COURTNEY, 1968/1980; SPOLIN, 1963/1979; SLADE, 1978). These theories allowed comprehend the way that the dramatic games can do a criative interaction and the nature collaboration that occur in this place, how too, to watch the rules took by the participants in the argued object construction. This is a critical research collaboration (MAGALHÃES, 1994, 1996, 1998ª, 1998b, 1998c, 2002, 2003ª, 2003b; LIBERALI, 1994, 1999, 2007b), as a participant on the teacher place and researcher wanted conduct, analyse and comprehender and help to the tranformations by means of taking object concepts on study, helping on students development. The analysis of the selected data focused their contexto of production, theme contents, general text plain, analysis of turn taking and argumentation in order to comprehend if the dramatic game in the class room context can fulfills this aim. The results show that the dramatic game were constituted as a instrument to taking to the students concepts to narrative, because the colaborative set that the activity give, put them to live imaginary situactions, in that they could developed of the real world representactions, as the oral language organization and the narrative organization / O objetivo desta pesquisa é investigar e compreender o instrumento cênico teatral, especificamente, o jogo dramático no contexto da sala de aula, para a criação de contextos que possibilitem aprendizagem e desenvolvimento dos alunos de uma escola pública quanto à produção oral de textos narrativos. O foco da atividade proposta tem como meta, uma intervenção pedagógica na didática docente de uma escola pública. O estudo está fundamentado na Teoria da Atividade Sócio-Histórico-Cultural (VYGOTSKY, 1930/1999,1930/2000, 1931/1995, 1987, 1934/2001; LEONTIEV, 1977; ENGESTRÖM, 1987), na concepção vygotskiana de criatividade (VYGOTSKY, 1930/1999, 1930/2000) nos fundamentos de dialogismo e interação verbal (BAKHTIN, 1979/2000; BAKHTIN/VOLOCHINOV, 1929/2002), nos sistemas de turnos de falas (KERBRAT-ORECCHIONI, 1996/2006), na interações argumentativas (PERELMAN & OLBRECHTS- TYTECA, 1996; ABREU 2007). Está também apoiada nos pressupostos que discutem a teoria cênica teatral (COURTNEY, 1968/1980; SPOLIN, 1963/1979; SLADE, 1978). Essas teorias permitiram compreender a forma como o jogo propicia a interação criativa e a natureza da colaboração que ocorre nesse espaço, como também, observar, as regras assumidas pelos participantes na construção do objeto discutido. Trata-se de uma pesquisa crítico-colaborativa (MAGALHÃES, 1994, 1996, 1998a, 1998b, 1998c, 2002, 2003a, 2003b; LIBERALI, 1994, 1999, 2007b), em que como participante, no papel de professor e pesquisador, procurei mediar, analisar, compreender e colaborar para as transformações por meio da apropriação de conceito do objeto em estudo, assim, auxiliando no desenvolvimento dos alunos. A análise dos dados selecionados observou seu contexto de produção, conteúdo temático, plano geral do texto, análise de turno e argumentação, para compreender se a atividade sessão de jogos dramáticos, idealizada para apropriação de conceitos pelos alunos para a organização de texto narrativo na sala de aula, cumpre essa finalidade. Os resultados indicaram que os jogos dramáticos se constituíram como instrumento para apropriação de conceitos quanto à narrativa, pois o espaço colaborativo de criação que a atividade propicia aos participantes, proporcionou aos mesmos vivenciarem situações lúdicas, nas quais puderam desenvolver representações do mundo real, bem como a organização da linguagem oral e a organização narrativa
204

Mapeamento de dados multidimensionais usando árvores filogenéticas: foco em mapeamento de textos / Mapping multidimensional data using phylogenetic tress: focus text mapping

Ana Maria Cuadros Valdivia 01 October 2007 (has links)
A Visualização Computacional trata de técnicas para representar e interagir graficamente com dados complexos, em geral de alta dimensionalidade. Dados de alta dimensionalidade são caracterizados por pontos representados em espaços vetoriais de alta dimensão, cada coordenada representando um atributo do vetor. Num grande número de aplicações da visualização multidimensional uma medida de similaridade existe entre esses vetores. Técnicas de projeção multidimensional podem ser utilizadas para posicionamento desses dados num plano de forma a facilitar a interpretação das relações de similaridade. Entretanto alguns problemas dessas técnicas comprometem a interpretação dos resultados obtidos. Este trabalho identifica esses problemas e propõe, uma técnica para posicionar os pontos no plano, através da formação de árvores filogenéticas a partir de relações de similaridade. Em geral árvores filogenéticas são utilizadas para codificação de relações de ancestralidade. Um algoritmo de geração e um algoritmo de traçado dessas árvores foram implementados no contexto do sistema PEx (Projection Explorer) e a solução é comparada com a funcionalidade das projeções na interpretação de dados multidimensionais em geral e, em particular, na representação de coleções de documentos, uma aplicação bastante estratégica da visualização computacional e da mineração visual de dados / Computational Visualization is concerned with graphical representation and exploration of complex data, usually bearing high dimensionality. Multidimensional data are characterized by points represented in vector spaces of many dimensions, each coordinate representing an attribute of the vector. In many applications a similarity measure can be found to highlight relationships of proximity between the vectors. In this environment projection techniques offer an alternative to ease interpretation coded by the similarity measures through proximity on the display. They do so by positioning the points on a bidimensional plane. Projection techniques are very useful to display and interact with data, but present some drawbacks that in some cases compromise the interpretation of certain features in data sets. This work discusses such problems and proposes, as an alternative to represent similarity relationships and to provide point placement on a plane, the use of phylogenetic trees, a representation typically employed to represent ancestrality relationships. An algorithm for generation and an algorithm for drawing such trees were implemented in a system called Projection Explorer. The approach is compared to that of multidimensional projections for multidimensional data in general and, in particular, for document data sets, an strategic application for multidimensional visualizations, since text can be represented and interpreted as multi-dimensional entities
205

As Condições de Produção de Textos Ecritos em Língua Portuguesa de Usuários da Língua Cabo-Verdiana

Tavares, Maria dos Reis Moreno 21 August 2006 (has links)
Made available in DSpace on 2016-04-27T14:31:51Z (GMT). No. of bitstreams: 1 Maria dos Reis Moreno Tavares.pdf: 12220942 bytes, checksum: 7134ec1914db0382042fbb1b86662b55 (MD5) Previous issue date: 2006-08-21 / Cette dissertation aborde des aspects rapportés avec aux les processus et des pratiques de la production écriture dans la langue portugaise de différents utilisateurs de la langue Capverdienne dans l'Éducation Basique (EB) étudiants/enseignants en formation dans l'Institut Pédagogique, élèves de la 6º année de scolarité, animateurs qui travaillent dans les Cercles de Culture de l'Éducation Basique d'Adultes (EBA) et les apprentis de la 3ème phase de (EBA) divisés en 19 groupes. L'analyse des processus et les pratiques de la production de textes écrits réalisées en quatre groupes avec un total de 92 sujets nous a permis l identifier les fonctions de la Langue Portugaise et de la Langue Capverdienne dans le processus de production des textes écrits en Portugais par les sujets, ainsi que quelques aspects des textes relatifs à la cohésion et à la cohérence de ces textes. L'analyse nous a montré que pendant les processus et pratiques de la production de textes écrits en Portugais, les sujets utilisent la Langue Capverdienne (LCV), le Créole, pour les discussions orales et au moment de la rédaction du texte ils utilisent les deux langues, Langue Portugaise (LP) et LCV. Restent évidents là des aspects rapportés avec l'interférence et ou influences de la L1 sur la L2. Telles interférences peuvent limiter de quelque manière, dans le maniement des ressources linguistiques qui rendent possible l'utilisation appropriée des mécanismes de cohésion et de cohérence littérale. D'autre aspect important placé en évidence dans l'analyse est rapporté avec processus d enseignement-apprentisage de textes. D'un côté, les contenus thématiques sont travaillés de forme superficielle, avec des informations libérées uns des autres en rendant difficile la compréhension et l'appropriation des concepts étudiés. D'autre côté, les types de textes et les formes linguistiques sont peu travaillés, en laissant que les apprentis comprennent que tous les textes doivent être structurés d'une seule manière. Notre analyse a été motivée à la lumière des concepts et des conceptions proposées par Bakhtin (2000), Mugrabi (2002), Bronckart (2003), Charaudeau et Maingueneau (2004). Mots clés: Cap Vert, Éducation, currículum, langues, genres de textes, enseignement-apprentissage, prodution de textes / Esta dissertação aborda aspectos relacionados com os processos e práticas da produção escrita em língua portuguesa de diferentes usuários da língua Cabo-verdiana na Educação Básica (EB): estudantes/professores em formação no Instituto Pedagógico, alunos do 6º ano de escolaridade, animadores que trabalham nos Círculos de Cultura da Educação Básica de Adultos (EBA) e formandos da 3ª fase da (EBA), divididos em 19 grupos. A análise dos processos e práticas da produção de textos escritos realizadas em quatro turmas com um total de 92 sujeitos, permitiu-nos identificar as funções da Língua Portuguesa e da Língua Cabo-verdiana nos processos de produção dos textos escritos em português pelos sujeitos, assim como alguns aspectos dos textos relativos à coesão e à coerência desses textos. A análise mostrou-nos que durante os processos e práticas da produção de textos escritos em português, os sujeitos utilizam a Língua Cabo-verdiana (LCV), o Crioulo, para as discussões orais e no momento da redação do texto utilizam as duas línguas, Língua Portuguesa (LP) e a LCV. Ficam evidentes aí aspectos relacionados com a interferência e/ou influências da L1 sobre a L2. Tais interferências podem limitar de alguma maneira, no manejo dos recursos lingüísticos que possibilitam o uso adequado dos mecanismos de coesão e coerência textual. Outro aspecto importante colocado em evidência na análise está relacionado com o processo de ensino-aprendizagem de textos. De um lado, os conteúdos temáticos são trabalhados de forma superficial, com informações desvinculadas umas das outras dificultando a compreensão e apropriação dos conceitos estudados. De outro lado, os gêneros de textos e as formas linguísticas são pouco trabalhados, deixando que os aprendizes entendam que todos os textos devem ser estruturados de uma única maneira. A nossa análise foi fundamentada à luz dos conceitos e das concepções propostos por Bakhtin (2000), Mugrabi (2002), Bronckart (2003), Charaudeau e Maingueneau (2004). Palavras chaves: Cabo Verde, Crioulo cabo-verdiano, educação, currículo, ensino-aprendizagem, línguas, bilinguismo, Pedagogia do Texto, gêneros de textos, produção de textos, formação, animadores, professores
206

Experimentos comparativos combinando aprendizado supervisionado e tradução automática para mineração de emoçoes em textos multilíngues / Comparative experiments combining supervised learning and machine translation for multilingual emotion mining

Santos, Aline Graciela Lermen dos January 2016 (has links)
Com o avanço da Internet pelo mundo, as pessoas passaram a interagir cada vez mais com a Web, principalmente após o surgimento das redes sociais, criando conteúdo que pode ser explorado de diversas formas. Esse aumento de usuários tem sido global, ou seja, pessoas de diversos países passaram a produzir textos de diversos idiomas. Esses textos compõem um rico conteúdo para Análise de Sentimentos Multilíngue. A maior parte dos trabalhos da área se foca em Mineração de Opinião, analisando o sentimento através da polaridade. Outro tipo de sentimento que tem atraído atenção é a emoção, embora não seja amplamente explorada a Análise de Sentimentos Multilíngue usando emoção. Este trabalho utiliza técnicas geralmente usadas para Mineração de Opinião e polaridade para Análise de Sentimentos Multilíngues usando emoção. O objetivo deste trabalho é comparar diferentes combinações de aprendizado de máquina supervisionado e tradução automática para criar corpora em diferentes idiomas a partir de corpora anotados já existentes. As duas formas de utilizar as traduções comparadas são: criando classificadores de emoção separados por idiomas, chamados monolíngues, e criando um classificador composto do idioma original e das traduções, chamado multilíngue. É feito ainda um experimento cruzando dois corpora, visando avaliar o uso da tradução de um corpus com os textos originais do outro. Os resultados dos experimentos mostram não apenas o sucesso de analisar emoção usando aprendizado supervisionado e tradução automática, mas que o classificador multilíngue supera os classificadores monolíngues. O experimento cruzando os corpora mostra que para algumas emoções os corpora estão alinhados, mas que para outras é preciso que haja maior similaridade nos textos. / With the growth of the Internet around the world, people began to interact more and more with the Web, especially after the emergence of social networks, creating content that can be exploited in several ways. This increase in the number of users has been global, that is, people from different countries started producing texts in several languages. These texts comprise a rich content for Multilingual Sentiment Analysis. Most of the work in the area focus in Opinion Mining, analyzing the feeling through polarity. Another type of feeling that has attracted attention is emotion, although not extensively explored in Multilingual Sentiment Analysis. This work uses techniques commonly used for Opinion Mining and polarity for Multilingual Sentiment Analysis using emotion. The objective of this study is to compare different combinations of supervised machine learning and automatic translation to create corpora in different languages from existing annotated corpora. The two ways to use the translations compared are: creating emotion classifiers separated by languages, called monolingual, and creating a composed classifier, with the original language and it’s translations, called multilingual. An experiment crossing the two corpora used is made, to evaluate the use of the translation of one corpus with the original texts of the other. The results of the experiments show not only the success of analysing emotion using supervised machine learning and automatic translation, but that the multilingual classifier exceeds the monolingual classifiers. The experiment crossing the corpora shows that to some emotions the corpora are aligned, but for others there needs to be greater similarity in the texts.
207

Refinamento interativo de mapas de documentos apoiado por extração de tópicos / Interactive refinement of document maps supported by topic extraction

Silva, Renato Rodrigues Oliveira da 15 December 2010 (has links)
Mapas de documentos são representações visuais que permitem analisar de forma eficiente diversas relações entre documentos de uma coleção. Técnicas de projeção multidimensional podem ser empregadas para criar mapas que refletem a similaridade de conteúdo, favorecendo a identificação de agrupamentos com conteúdo similar. Este trabalho aborda uma evolução do arcabouço genérico oferecido pelas projeções multidimensionais para apoiar a análise interativa de documentos textuais, implementado na plataforma PEx. Foram propostas e implementadas técnicas que permitem ao usuário interagir com o mapa de documentos utilizando tópicos extraídos do próprio corpus. Assim a representação visual pode gradualmente evoluir para refletir melhor os interesses do usuário, e apoiá-lo de maneira mais efetiva em tarefas exploratórias. A interação foi avaliada utilizando uma técnica de inspeção de usabilidade, que visa identificar os principais problemas enfrentados pelos usuários ao interagir com as funcionalidades desenvolvidas. Adicionalmente, a utilidade das funcionalidades foi avaliada pela condução de dois estudos de caso, em que foram definidas tarefas a serem conduzidas pelo usuário sobre os mapas de documentos. Os resultados mostram que com o auxílio das visualizações foi possível conduzir as tarefas satisfatoriamente, permitindo manipular de forma eficiente milhares de documentos sem a necessidade de ler individualmente cada texto / Content-based document maps are visualizations that help users to identify and explore relationships among documents in a collection. Multidimensional projection techniques have been employed to create similaritybased maps that can help identifying documents of similar content. This work aims to enhance the generic framework offered by the multidimensional projection techniques in the PEx visualization platform to support interactive analysis of textual data. Several interaction functions and visual representations have been proposed and implemented that allow users to interact with document maps aided by topics automatically extracted from the corpus. By exploring the topics and maps in an integrated manner, users can refine and evolve the visual representations gradually to better reflect their needs and interests, enhancing support to exploratory tasks. The proposed interaction functions were evaluated employing a usability inspection technique, seeking to detect interface problems. Moreover, two illustrative case studies were conducted to evaluate the usefulness of the proposed interactions, based on typical user tasks defined over different document collections. They illustrate how the developed visualizations can assist the proposed tasks, allowing users to interactively explore large document corpora and refine document maps
208

Multi-scale analysis of languages and knowledge through complex networks / Análise multi-escala de línguas e conecimento por meio de redes complexas

Arruda, Henrique Ferraz de 24 January 2019 (has links)
There any many different aspects in natural languages and their related dynamics that have been studied. In the case of languages, some quantitative analyses have been done by using stochastic models. Furthermore, natural languages can be understood as complex systems. Thus, there is a possibility to use set of tools development to analyse complex networks, which are computationally represented by graphs, also to analyse natural languages. Furthermore, these tools can be used to represent and analyse some related dynamics taking place on the networks. Observe that knowledge is intrinsically related to language, because language is the vehicle used by humans beings to transmit dicoveries, and the language itself is also a type of knowledge. This thesis is divided into two types of analyses: (i) texts and (II) dynamical aspects. In the first part, we proposed networks representations of text in different scales analyses, starting from the analysis of writing style considering word adjacency networks (co-occurence) to understand local patterns of words, to a mesoscopic representation, which is created from chunks of text and grasps information of the unfolding of the story. In the second part, we considered the structure and dynamics related to knowledge and language, in this case, starting from the larger scale, in which we studied the connectivity between applied and theoretical physics. In the following, we simulated the knowledge acquisition by researchers in a multi-agent dynamics and an intelligent machine that solves problems, which is represented by a network. At the smallest considered scale, we simulate the transmission of networks. This transmission considers the data as a series of organized symbols that is obtained from a dynamics. In order to improve the speed of transmission, the series can be compacted. For that, we considered the information theory and Huffman code. The proposed network-based approaches were found to be suitable to deal with the employed analysis for all of the tested scales. / Existem diversos aspectos das linguagens naturais e de dinâmicas relacionadas que estão sendo estudadas. No caso das línguas, algumas análises quantitativas foram feitas usando modelos estocásticos. Ademais, linguagens naturais podem ser entendidas como sistemas complexos. Para analisar linguagens naturais, existe a possibilidade de utilizar o conjunto de ferramentas que já foram desenvolvidas para analisar redes complexas, que são representadas computacionalmente. Além disso, tais ferramentas podem ser utilizadas para representar e analisar algumas dinâmicas relacionadas a redes complexas. Observe que o conhecimento está intrinsecamente relacionado à linguagem, pois a linguagem é o veículo usado para transmitir novas descobertas, sendo que a própria linguagem também é um tipo de conhecimento. Esta tese é dividida em dois tipos de análise : (i) textos e (ii) aspectos dinâmicos. Na primeira parte foram propostas representações de redes de texto em diferentes escalas de análise. A partir da análise do estilo de escrita, considerando redes de adjacência de palavras (co-ocorrência) para entender padrões locais de palavras, até uma representação mesoscópica, que é criada a partir de pedaços de texto e que representa informações do texto de acordo com o desenrolar da história. Na segunda parte, foram consideradas a estrutura e dinâmica relacionadas ao conhecimento e à linguagem. Neste caso, partiu-se da escala maior, com a qual estudamos a conectividade entre física aplicada e física teórica. A seguir, simulou-se a aquisição de conhecimento por pesquisadores em uma dinâmica multi-agente e uma máquina inteligente que resolve problemas, que é representada por uma rede. Como a menor escala considerada, foi simulada a transmissão de redes. Essa transmissão considera os dados como uma série de símbolos organizados que são obtidos a partir de uma dinâmica. Para melhorar a velocidade de transmissão, a série pode ser compactada. Para tanto, foi utilizada a teoria da informação e o código de Huffman. As propostas de abordagens baseadas em rede foram consideradas adequadas para lidar com a análise empregada, em todas as escalas testadas.
209

Experimentos comparativos combinando aprendizado supervisionado e tradução automática para mineração de emoçoes em textos multilíngues / Comparative experiments combining supervised learning and machine translation for multilingual emotion mining

Santos, Aline Graciela Lermen dos January 2016 (has links)
Com o avanço da Internet pelo mundo, as pessoas passaram a interagir cada vez mais com a Web, principalmente após o surgimento das redes sociais, criando conteúdo que pode ser explorado de diversas formas. Esse aumento de usuários tem sido global, ou seja, pessoas de diversos países passaram a produzir textos de diversos idiomas. Esses textos compõem um rico conteúdo para Análise de Sentimentos Multilíngue. A maior parte dos trabalhos da área se foca em Mineração de Opinião, analisando o sentimento através da polaridade. Outro tipo de sentimento que tem atraído atenção é a emoção, embora não seja amplamente explorada a Análise de Sentimentos Multilíngue usando emoção. Este trabalho utiliza técnicas geralmente usadas para Mineração de Opinião e polaridade para Análise de Sentimentos Multilíngues usando emoção. O objetivo deste trabalho é comparar diferentes combinações de aprendizado de máquina supervisionado e tradução automática para criar corpora em diferentes idiomas a partir de corpora anotados já existentes. As duas formas de utilizar as traduções comparadas são: criando classificadores de emoção separados por idiomas, chamados monolíngues, e criando um classificador composto do idioma original e das traduções, chamado multilíngue. É feito ainda um experimento cruzando dois corpora, visando avaliar o uso da tradução de um corpus com os textos originais do outro. Os resultados dos experimentos mostram não apenas o sucesso de analisar emoção usando aprendizado supervisionado e tradução automática, mas que o classificador multilíngue supera os classificadores monolíngues. O experimento cruzando os corpora mostra que para algumas emoções os corpora estão alinhados, mas que para outras é preciso que haja maior similaridade nos textos. / With the growth of the Internet around the world, people began to interact more and more with the Web, especially after the emergence of social networks, creating content that can be exploited in several ways. This increase in the number of users has been global, that is, people from different countries started producing texts in several languages. These texts comprise a rich content for Multilingual Sentiment Analysis. Most of the work in the area focus in Opinion Mining, analyzing the feeling through polarity. Another type of feeling that has attracted attention is emotion, although not extensively explored in Multilingual Sentiment Analysis. This work uses techniques commonly used for Opinion Mining and polarity for Multilingual Sentiment Analysis using emotion. The objective of this study is to compare different combinations of supervised machine learning and automatic translation to create corpora in different languages from existing annotated corpora. The two ways to use the translations compared are: creating emotion classifiers separated by languages, called monolingual, and creating a composed classifier, with the original language and it’s translations, called multilingual. An experiment crossing the two corpora used is made, to evaluate the use of the translation of one corpus with the original texts of the other. The results of the experiments show not only the success of analysing emotion using supervised machine learning and automatic translation, but that the multilingual classifier exceeds the monolingual classifiers. The experiment crossing the corpora shows that to some emotions the corpora are aligned, but for others there needs to be greater similarity in the texts.
210

Representações textuais e a geração de hubs : um estudo comparativo

Aguiar, Raul Freire January 2017 (has links)
Orientador: Prof. Dr. Ronaldo Pratti / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2017. / O efeito de hubness, juntamente com a maldição de dimensionalidade, vem sendo estudado, sob diferentes oticas, nos ultimos anos. Os estudos apontam que este problema esta presente em varios conjuntos de dados do mundo real e que a presença de hubs (tendencia de alguns exemplos aparecem com frequencia na lista de vizinhos mais proximos de outros exemplos) traz uma serie de consequencias indesejaveis, como por exemplo, afetar o desempenho de classificadores. Em tarefas de mineração de texto, o problema depende tambem da maneira escolhida pra representar os documentos. Sendo assim o objetivo principal dessa dissertação é avaliar o impacto da formação de hubs em diferentes representações textuais. Ate onde vai o nosso conhecimento e durante o período desta pesquisa, não foi posivel encontrar na literatura um estudo aprofundado sobre as implicaçõess do efeito de hubness em diferentes representações textuais. Os resultados sugerem que as diferentes representações textuais implicam em corpus com propensão menor para a formação de hubs. Notou-se também que a incidencia de hubs nas diferentes representações textuais possuem in uencia similar em alguns classificadores. Analisamos tambem o desempenho dos classifcadores apos a remoção de documentos sinalizados como hubs em porçõess pre-estabelecidas do tamanho total do data set. Essa remoção trouxe, a alguns algoritmos, uma tendencia de melhoria de desempenho. Dessa maneira, apesar de nem sempre efetiva, a estrategia de identifcar e remover hubs com uma vizinhança majoritariamente ruim pode ser uma interessante tecnica de pre-processamento a ser considerada, com o intuito de melhorar o desempenho preditivo da tarefa de classificação. / The hubness phenomenon, associated to the curse of dimensionality, has been studied, from diferent perspectives, in recent years. These studies point out that the hubness problem is present in several real-world data sets and, as a consequence, the hubness implies a series of undesirable side efects, such as an increase in misclassifcation error in classification tasks. In text mining research, this problem also depends on the choice of text representation. Hence, the main objective of the dissertation is to evaluate the impact of the hubs presence in diferent textual representations. To the best of our knowledge, this is the first study that performs an in-depth analysis on the efects of the hub problem in diferent textual representations. The results suggest that diferent text representations implies in diferent bias towards hubs presence in diferent corpus. It was also noticed that the presence of hubs in dierent text representations has similar in uence for some classifiers. We also analyzed the performance of classifiers after removing documents agged as hubs in pre-established portions of the total data set size. This removal allows, to some algorithms, a trend of improvement in performance. Thus, although not always efective, the strategy of identifying and removing hubs with a majority of bad neighborhood may be an interesting preprocessing technique to be considered in order to improve the predictive performance of the text classification task.

Page generated in 0.0247 seconds