• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • Tagged with
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Aprendizado sem-fim de paráfrases

Polastri, Paulo César 04 March 2016 (has links)
Submitted by Luciana Sebin (lusebin@ufscar.br) on 2016-10-05T18:38:23Z No. of bitstreams: 1 DissPCP.pdf: 1921482 bytes, checksum: 5298cc1a066e0cfe217b2b9c61076e65 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-14T14:13:08Z (GMT) No. of bitstreams: 1 DissPCP.pdf: 1921482 bytes, checksum: 5298cc1a066e0cfe217b2b9c61076e65 (MD5) / Approved for entry into archive by Marina Freitas (marinapf@ufscar.br) on 2016-10-14T14:13:18Z (GMT) No. of bitstreams: 1 DissPCP.pdf: 1921482 bytes, checksum: 5298cc1a066e0cfe217b2b9c61076e65 (MD5) / Made available in DSpace on 2016-10-14T14:13:28Z (GMT). No. of bitstreams: 1 DissPCP.pdf: 1921482 bytes, checksum: 5298cc1a066e0cfe217b2b9c61076e65 (MD5) Previous issue date: 2016-03-04 / Não recebi financiamento / Use different words to express/convey the same message is a necessity in any natural language and, as such, should be investigated in research in Natural Language Processing (NLP). When it is just a simple word, we say that the interchangeable words are synonyms; while the term paraphrase is used to express a more general idea and that also may involve more than one word. For example, the sentences "the light is red" and "the light is closed" are examples of paraphrases as "sign" and "traffic light" represent synonymous in this context. Proper treatment of paraphrasing is important in several NLP applications, such as Machine Translation, which paraphrases can be used to increase the coverage of Statistical Machine Translation systems; on Multidocument Summarization, where paraphrases identification allows the recognition of repeated information; and Natural Language Generation, where the generation of paraphrases allows creating more varied and fluent texts. The project described in this document is intended to verify that is possible to learn, in an incremental and automatic way, paraphrases in words level from a bilingual parallel corpus, using Never-Ending Machine Learning (NEML) strategy and the Internet as a source of knowledge. The NEML is a machine learning strategy, based on how humans learn: what is learned previously can be used to learn new information and perhaps more complex in the future. Thus, the NEML has been applied together with the strategy for paraphrases extraction proposed by Bannard and Callison-Burch (2005) where, from bilingual parallel corpus, paraphrases are extracted using a pivot language. In this context, it was developed NEPaL (Never-Ending Paraphrase Learner) AMSF system responsible for: (1) extract the internet texts, (2) align the text using a pivot language, (3) rank the candidates according to a classification model and (4) use the knowledge to produce a new classifier model and therefore gain more knowledge restarting the never-ending learning cycle. / Usar palavras diferentes para expressar/transmitir a mesma mensagem é uma necessidade em qualquer língua natural e, como tal, deve ser investigada nas pesquisas em Processamento de Língua Natural (PLN). Quando se trata apenas de uma palavra simples, dizemos que as palavras intercambiáveis são sinônimos; enquanto o termo paráfrase é utilizado para expressar uma ideia mais geral e que pode envolver também mais de uma palavra. Por exemplo, as sentenças “o sinal está vermelho” e “o semáforo está fechado” são exemplo de paráfrases enquanto “sinal” e “semáforo” representam sinônimos, nesse contexto. O tratamento adequado de paráfrases é importante em diversas aplicações de PLN, como na Tradução Automática, onde paráfrases podem ser utilizadas para aumentar a cobertura de sistemas de Tradução Automática Estatística; na Sumarização Multidocumento, onde a identificação de paráfrases permite o reconhecimento de informações repetidas; e na Geração de Língua Natural, onde a geração de paráfrases permite criar textos mais variados e fluentes. O projeto descrito neste documento visa verificar se é possível aprender, de modo incremental e automático, paráfrases em nível de palavras a partir de corpus paralelo bilíngue, utilizando a estratégia de Aprendizado de Máquina Sem-fim (AMSF) e a Internet como fonte de conhecimento. O AMSF é uma estratégia de Aprendizado de Máquina, baseada na forma como os humanos aprendem: o que é aprendido previamente pode ser utilizado para aprender informações novas e talvez mais complexas, futuramente. Para tanto, o AMSF foi aplicado juntamente com a estratégia para a extração de paráfrases proposta por Bannard e Callison-Burch (2005) onde, a partir de corpus paralelo bilíngue, paráfrases são extraídas utilizando um idioma pivô. Nesse contexto, foi desenvolvido o NEPaL (Never-Ending Paraphrase Learner), sistema de AMSF responsável por: (1) extrair textos da internet, (2) alinhar os textos utilizando um idioma pivô, (3) classificar as candidatas de acordo com um modelo de classificação e (4) utilizar o conhecimento para produzir um novo modelo classificador e, consequentemente, adquirir mais conhecimento reiniciando o ciclo de aprendizado sem-fim.
2

Construções apositivas: estruturas desgarradas introduzidas por ou seja e quer dizer

França, Josefa jacinto de 22 February 2016 (has links)
Submitted by Maike Costa (maiksebas@gmail.com) on 2016-08-25T11:12:19Z No. of bitstreams: 1 arquivo total.pdf: 1437906 bytes, checksum: eda3008d89c5938770d382037e2f6809 (MD5) / Made available in DSpace on 2016-08-25T11:12:19Z (GMT). No. of bitstreams: 1 arquivo total.pdf: 1437906 bytes, checksum: eda3008d89c5938770d382037e2f6809 (MD5) Previous issue date: 2016-02-22 / This thesis analyzes often verbally functioning based expressions ou seja (that is) and quer dizer (that is to say) which introduce appositive constructions, present in op-eds in weekly periodicals belonging to Brazilian journalistic realm (VEJA, ISTOÉ, ÉPOCA) in 2012. Despite the fact that the labels attributed to such grammatical forms in current literature are varied, they are at first denominated conectores (connectors) in this thesis (GONÇALVES et al., 2007), as they connect the two units which compose the appositive construction – base and appositive units. They are later referred to as marcadores (markers) (MARTELOTTA; VOTRE; CEZÁRIO, 1996) as they sign reformulations carried out by text speaker/author. In order to carry out the research, interdisciplinary theoretical reference was Functional Linguistics, whose investigations are grounded in conceptual fundamentals of apposition and appositive constructions description in journalistic texts, allied to Textual Linguistics, which, through semantic relations study, helps to make a discursive connectors/markers’ profile. In this investigation, our main objective is to describe appositive constructions behavior spearheaded by the previously mentioned expressions, with reference to: a) generalizations about linguistic embodiment forms, marked by various punctuation marks, which permit their identification as desgarradas (dislocated) forms (DECAT, 2011); b) the different syntactic functions driven by the semantic relation of correferência do ponto de vista do locutor (co-reference from the speaker’s point of view) and performed by unit A base element (base or matrix); c) units weight relation (symmetry and asymmetry); d) expressions’ textual and discursive functions represented by unit B (appositive); and e) paraphrases types (WENZEL,1985) introduced by such connectors/markers. In order to achieve this purpose, we have taken as an object for analysis SN constructions (nominal syntagma) as well as the clause form (in the sentence) starting with a pragmatic and discursive approach. In corpus texts, the appositive constructions are used as argument and referencing strategy carriers. This is a descriptive and interpretative research, which leads to data qualitative and quantitative analysis, bearing in mind expressions’ syntactic, semantic and discursive profile. Final results confirm the hypothesis of discursive connectors/markers ou seja and quer dizer productivity in media written texts, introducing dislocated constructions which are highly functional in paraphrase’s contexts of use stablishing apposition. / En esta tesis se analiza el funcionamiento de las expresiones de base verbal, o sea, es decir, introductoras de las construcciones apositivas presentes en artículos de opinión en revistas semanales de ámbito periodístico (VEJA, ISTOÉ, ÉPOCA) de 2012. Aunque en la literatura actual, han sido cambiadas las rotulaciones asignadas a estas formas gramaticales, se les llama en esta tesis, al comienzo, conectores (GONÇALVES et al., 2007) para hacer la conexión entre las dos unidades que componen la construcción de aposición - unidad base y la unidad aposición; siendo después denominadas marcadores (MARTELOTTA; VOTRE; CEZÁRIO, 1996), por señalizar reformulaciones realizadas por el hablante/ autor del texto. Para la investigación, tomamos como base teórica, de carácter interdisciplinario, la Lingüística Funcional, que constituye la base de las investigaciones sobre los fundamentos conceptuales de la aposición y de la descripción de construcciones apositivas en estos textos, junto con Linguística Textual que, a través del estudio de las relaciones semánticas, ayuda en la caracterización de los conectores / marcadores del discurso. En este estudio, objetivamos describir esencialmente el comportamiento de las construcciones apositivas encabezadas por las expresiones citadas en relación con: a) las generalizaciones acerca de las formas de materialización lingüística, señaladas por varios signos de puntuación, que permiten identificarlas como desgarradas (DECAT, 2011); b) las diferentes funciones sintácticas, impulsadas por la relación semántica de correferencia bajo punto de vista del hablante y realizadas por el elemento base de la unidad (base o matriz); c) al cociente de peso (simetría y asimetría) de las unidades; d) las funciones textuales-discursivas representadas por la unidad B (aposición) de dichas construcciones; y e) los tipos de paráfrasis (WENZEL, 1985) introducidas por estos conectores / marcadores. Para lograr este propósito, tomemos como objeto de análisis construcciones en forma de SN (sintagma nominal) y también en la forma clausular (oracional), a partir de un enfoque que consideramos pragmático-discursivo. En los textos que conforman el corpus, las construcciones apositivas se utilizan como portadoras de las estrategias de argumentos y de remisión. La investigación es de carácter descriptivo e interpretativo, lo que llevó al análisis cuantitativo y cualitativo de los datos recogidos, teniendo en cuenta el perfil sintáctico, semántico y discursivo de esas construcciones. Los resultados finales confirman la hipótesis de la productividad de los conectores/marcadores del discurso, o sea, es decir, en textos escritos en los medios de comunicación, introductores de construcciones desgarradas, siendo altamente funcionales en los contextos de uso de las paráfrasis que forman la aposición. / Esta tese analisa o funcionamento das expressões de base verbal ou seja e quer dizer, introdutoras de construções apositivas, presentes em textos opinativos de periódicos semanais da esfera jornalística (VEJA, ISTOÉ, ÉPOCA) do ano de 2012. Apesar de, na literatura corrente, serem variadas as rotulações atribuídas a essas formas gramaticais, elas são denominadas nesta tese, a princípio, de conectores (GONÇALVES et al., 2007), por fazerem a conexão entre as duas unidades que compõem a construção apositiva – unidade base e unidade apositiva; sendo depois referidas como marcadores (MARTELOTTA; VOTRE; CEZÁRIO, 1996), por sinalizarem reformulações realizadas pelo autor do texto. Para a realização da pesquisa, tomamos como referencial teórico, de caráter interdisciplinar, a Linguística Funcional, que alicerça as investigações em torno dos fundamentos conceituais da aposição e da descrição de construções apositivas nesses textos, aliada à Linguística Textual, que, através do estudo das relações semânticas, auxilia na caracterização dos conectores/marcadores discursivos. Nesta investigação, objetivamos, essencialmente, descrever o comportamento das construções apositivas encabeçadas pelas expressões citadas no que concerne: a) a generalizações sobre as formas de materialização linguística, assinaladas por diversos sinais de pontuação, os quais permitem identificá-las como desgarradas (DECAT, 2011); b) às diferentes funções sintáticas, impulsionadas pela relação semântica de correferência do ponto de vista do locutor e desempenhadas pelo elemento base da unidade A (base ou matriz); c) à relação de peso (simetria e assimetria) das unidades; d) às funções textual-discursivas representadas pela unidade B (apositiva) das referidas construções; e e) aos tipos de paráfrases (WENZEL, 1985) introduzidas por esses conectores/marcadores. Para atingir esse propósito, tomamos como objeto de análise construções sob a forma de SN (sintagma nominal) e também sob a forma clausular (oracional), a partir de uma abordagem que consideramos pragmático-discursiva. Nos textos que constituem o corpus, as construções apositivas são usadas como portadoras de estratégias de argumentação e referenciação. A pesquisa tem caráter descritivo-interpretativo, o que levou à análise quanti-qualitativa dos dados colhidos, tendo em mente o perfil sintático, semântico e discursivo das referidas construções. Os resultados finais confirmam a hipótese da produtividade dos conectores/marcadores discursivos ou seja e quer dizer em textos escritos da mídia, introdutores de construções desgarradas, sendo estes altamente funcionais nos contextos de uso das paráfrases que dão forma à aposição.

Page generated in 0.0308 seconds