Global ETD Search

331	[en] NEW NON-X NOMINAL FORMATIONS AND THEIR CONTROVERSIES / [pt] NOVAS FORMAÇÕES A PARTIR DO NÃO - ANTEPOSTO A NOMES E SUAS CONTROVÉRSIAS LIVIA PENEDO JACOB 20 September 2010 (has links) [pt] O trabalho investiga os processos lexicais pertinentes à formação de novos itens através do não- anteposto a substantivos e adjetivos, incluindo os aspectos semânticos relevantes. Abordam-se inicialmente a derivação e a composição, na medida em que estes macro-processos de formação se colocam como hipóteses alternativas para a explicação do emprego lexical do elemento negativo não, tradicionalmente classificado apenas como advérbio. Expõe-se a visão trazida pela gramática tradicional, concluindo-se que esta não explica o fenômeno de modo satisfatório. Revisa-se a literatura produzida até o momento sobre o não ocorrendo em função diversa da de advérbio, observando-se grande divergência de abordagens. Apresentadas e analisadas as ocorrências do não- anteposto, opta-se pela derivação como explicação mais conveniente para o tópico investigado, que inclui a questão de estabelecer critérios de discriminação entre as construções que constituem novas palavras e as que devem ser excluídas do rol das novas formações. A análise é baseada em dois corpora representativos – o CORPOBRAS PUC RIO e o CORPUS NILC, que foram comparados em relação ao fenômeno investigado. A pesquisa foi parcialmente feita com base nos mecanismos e metodologias ditadas por pesquisadores da Lingüística de Corpus, tendo sido utilizadas ferramentas computacionais e o conceito de corpus definidos por estes autores. A partir da referida análise, verifica-se que nem todos os itens formados por não- seguido por nome configuram novas formações lexicais, uma vez que muitos dos exemplos estudados revelam aspectos sintáticos predominantes. Quanto à questão semântica, concluiu-se que os significados são relativamente delimitados, existindo algumas exceções. A pesquisa aponta ainda para a presença de possíveis aspectos estilísticos nestas formas. / [en] This work investigates lexical processes underlying the formation of não- X nouns and adjectives in Portuguese, taking into account both morphological and semantic aspects. We approach first the two main word formation possibilities, derivation and compounding, as they correspond to the possible alternative hypotheses for the use of não in word formation, since this lexical item is traditionally considered only as an adverb. Traditional approaches to the topic are described and considered insufficient to explain the phenomena in a satisfactory manner. More recent descriptive proposals on the subject are analyzed and their controversies commented upon. The data favor the analysis of não-X constructions in Portuguese as a case of derivation, specially in what concerns the need to establish criteria to classify não-X constructions as new words. The data were collected from two corpora – the CORPOBRAS PUC-RIO and the CORPUS NILC, which were compared as for the phenomena in question. The work is based, to a great extent, on the mechanisms and methodologies proposed by Corpus Linguistics researchers, with the use of computational tools and the conception of corpora as defined by CL authors. As a result of the analysis, it is proposed that not every não-X occurrence constitutes a new lexical item, since many of the studied examples reveal predominance of syntactic aspects. As for the semantic question, it has been observed that the meanings of the não-X constructions are partially predictable, in spite of some exceptions. The research also indicates the presence of some stylistic possibilities for the use of the não X construction. [pt] MORFOLOGIA [en] MORPHOLOGY [pt] SEMANTICA LEXICAL [en] LEXICAL SEMANTICS [pt] LEXICO [en] LEXICON [pt] COMPOSICAO [en] COMPOSITION [pt] FORMACAO DE PALAVRAS [en] WORD FORMATION [pt] PREFIXACAO [en] PREFIXATION
332	O ensino do vocabulário nas aulas de Língua Portuguesa : da realidade a um modelo didático / Dargel, Ana Paula Tribesse Patrício. January 2011 (has links) Orientador: Clotilde de Almeida A. Murakawa / Banca: Magali Sanches Duran / Banca: Eliana Dias / Banca: João Moraes Pinto Jr. / Banca: Odair Luiz Nadin / Resumo: O léxico é o nível da língua que mais revela o conhecimento de mundo de uma pessoa, uma vez que são as unidades lexicais a se referirem a elementos (ações, objetos, sentimentos, qualidades, eventos) do universo da vida humana. A realização deste trabalho foi motivada pela percepção da importância que a ampliação lexical tem no decorrer do caminhar de uma pessoa. Nessa ótica, é fato que a escola desempenha papel preponderante no desenvolvimento lexical de um aluno por ser o lugar em que ele entra em contato com um universo variado de textos. Desse modo, esta tese enfatizou aspectos referentes ao ensino-aprendizagem do vocabulário e apresenta subsídio metodológico, teórico e prático para o professor de Língua Portuguesa do Ensino Fundamental II, por meio de: i) orientações teóricas sobre o ensino do vocabulário; ii) sugestões sobre como ensinar o aluno a conhecer e a gostar de usar o dicionário e, desse modo, contribuir para que esse aluno utilize o dicionário como recurso didático útil, importante e prazeroso nos atos de leitura e de produção de textos; iii) exercícios diversos a respeito do vocabulário por intermédio de orientações para o aluno manusear o dicionário. Nessa perspectiva, os objetivos traçados para desenvolver este trabalho foram i) elaborar uma metodologia de ensino centrada nos aspectos da pedagogia do léxico durante as aulas de Língua Portuguesa do Ensino Fundamental II, mais precisamente nas turmas de 5ª. a 8ª. séries. Para a elaboração da proposta metodológica, no item em que são apresentados os exercícios de vocabulário, foi organizado um banco de dados no Programa Folio Views 4.2 com os textos dos Livros Didáticos utilizados nas aulas de Língua Portuguesa das escolas públicas da cidade de Cassilândia - Mato Grosso do Sul. / Abstract: The lexicon is the level of the language that shows the most the knowledge one has about the world, since the lexical unities refer to elements (actions, objects, feelings, qualities, events) of the human life universe. The fulfilment of this work was motivated by the perception of the importance that the lexical expansion has during someone's journey. From this point of view, it's a fact that the school has an important role on the lexical development of a student because it's the place where he/she is in contact with a great variety of texts. Thereby, this thesis emphasized the aspects related to vocabulary teaching and shows a methodological, theoretical and practical subsidy for the Basic Education Portuguese teacher by means of: i) theoretical orientations about vocabulary teaching; ii) suggestions on how to teach a student to know and like a dictionary and, this way, to contribute that this student will use the dictionary as a useful, important and pleasurable didactic resource, while reading and writing; iii) several exercises on vocabulary with some orientations about how the student can use the dictionary. From this perspective, the objective traced to develop this work was: i) to produce a methodology of teaching based on the aspects of the lexicon pedagogy during the Portuguese classes of the Basic Education, precisely in the groups of 5th and 8th grades. In this work, in the item where the exercises on vocabulary are presented, a database was organized in the Program Folio Views 4.2 with the texts extracted from the books used in the Portuguese classes of public schools in the city of Cassilândia - Mato Grosso do Sul. / Resumen: El léxico es un nivel de la lengua que más demuestra el conocimiento del mundo de una persona, puesto que son las unidades lexicales que se refieren a elementos (acciones, objetos, sentimientos, cuadidades, eventos) del universo de la vida humana. La realización de este trabajo fue motivada por la percepción de la importancia que la amplicación lexical tiene en el decurrir del caminar de una persona. En esa óptica, es facto que la escuela mantiene papel preponderante en el desesarollo lexical de un alumno por ser el lugar en que él entra en contacto con un universo variado de textos. Así, esta tesis ha enfatizado aspectos que se refieren a la enseñanza del vocabulario subsidio metodológico, teórico y práctico para el maestro de Lengua Portuguesa de la Enseñanza Fundamental por medio de: i) orientaciones teóricas sobre la enseñanza del vocabulario; ii) sugerencias sobre cõmo enseñarle al alumno a conocer y a gustar de usar el diccionario y, así, contribuir para que ese alumno utilize el diccionario como recurso didáctico útil, importante y plazeroso en los actos de lectura y de producción de textos; iii) ejercicios variados a respecto del vocabulario por intermédio de orientaciones para el alumno utilizar el diccionario. En esta perspectiva, lo objetivo trazado para desarollar este trabajo fue: i) elaborar una metodologia de enseñanza centrada en los aspectos de la pedagogia del léxico durante las clases de Lengua Portuguesa de Enseñanza Fundamental, más precisamente en las turmas de 5ª a la 8ª series. En la elaboración de este trabajo, en el iten en que son presentados los ejercicios de vocabulario, fue organizado un banco de datos en el Programa Folio Views 4.2 con los textos de los Libros Didácticos utilizados en las clases de Lengua Portuguesa de las escuelas públicas de la ciudad de Cassilandia - Mato Groso del Sur. / Doutor Lingua portuguesa - Estudo e ensino. Lingua portuguesa - Lexicografia.
333	Caracterização e recuperação de imagens usando dicionários visuais semanticamente enriquecidos / Image characterization and retrieval using visual dictionaries semantically enriched Glauco Vitor Pedrosa 24 August 2015 (has links) A análise automática da similaridade entre imagens depende fortemente de descritores que consigam caracterizar o conteúdo das imagens em dados compactos e discriminativos. Esses dados extraídos e representados em um vetor-de-características tem o objetivo de representar as imagens nos processos de mineração e análise para classificação e/ou recuperação. Neste trabalho foi explorado o uso de dicionários visuais e contexto para representar e recuperar as características locais das imagens utilizando formalismos estendidos com alto poder descritivo. Esta tese apresenta em destaque três novas propostas que contribuem competitivamente com outros trabalhos da literatura no avanço do estado-da-arte, desenvolvendo novas metodologias para a caracterização de imagens e para o processamento de consultas por similaridade. A primeira proposta estende a modelagem Bag-of-Visual-Words, permitindo codificar a interação entre palavras-visuais e suas disposições espaciais na imagem. Para tal fim, três novas abordagem são apresentadas: (i) Weighted Histogram (WE); (ii) Bunch-of-2-grams e (iii) Global Spatial Arrangement (GSA). Cada uma dessas técnicas permitem extrair informações semanticamente complementares, que enriquecem a representação final das imagens descritas em palavras-visuais. A segunda proposta apresenta um novo descritor, chamado de Bag-of-Salience-Points (BoSP), que caracteriza e analisa a dissimilaridade de formas (silhuetas) de objetos explorando seus pontos de saliências. O descritor BoSP se apoia no uso de um dicionário de curvaturas e em histogramas espaciais para representar sucintamente as saliências de um objeto em um único vetor-de-características de tamanho fixo, permitindo recuperar formas usando funções de distâncias computacionalmente rápidas. Por fim, a terceira proposta apresenta um novo modelo de consulta por similaridade, denominada Similarity Based on Dominant Images (SimDIm), baseada no conceito de Imagens Dominantes, que é um conjunto que representa, de uma maneira mais diversificada e reduzida, toda a coleção de imagens da base de dados. Tal conceito permite dar mais eficiência quando se deseja analisar o contexto da coleção, que é o objetivo da proposta. Os experimentos realizados mostram que os métodos propostos contribuem de maneira efetiva para caracterizar e quantificar a similaridade entre imagens por meio de abordagens estendidas baseadas em dicionários visuais e análise contextual, reduzindo a lacuna semântica existente entre a percepção humana e a descrição computacional. / The automatic similarity analysis between images depends heavily on the use of descriptors that should be able to characterize the images\' content in compact and discriminative features. These extracted features are represented by a feature-vector employed to represent the images in the process of mining and analysis for classification and/or retrieval. This work investigated the use of visual dictionaries and context to represent and retrieve the local image features using extended formalism with high descriptive power. This thesis presents three new proposals that contribute in advancing the state-of-the-art by developing new methodologies for characterizing images and for processing similarity queries by content. The first proposal extends the Bag-of-Visual-Words model, by encoding the interaction between the visual words and their spatial arrangements in the image space. For this, three new techniques are presented: (i) Weighted Histogram (WE); (ii) Bunch-of--grams and (iii) Global Spatial Arrangement (GSA). These three techniques allow to extract additional semantically information that enrich the final image representation described in visual-words. The second proposal introduces a new descriptor, called Bag-of-Salience-Points (BoSP), which characterizes and analyzes the dissimilarity of shapes (silhouettes) exploring their salient point. The BoSP descriptor is based on using a dictionary of curvatures and spatial-histograms to represent succinctly the saliences of a shape into a single fixed-length feature-vector, allowing to retrieve shapes using distance functions computationally fast. Finally, the third proposal introduces a new similarity query model, called Similarity based on Dominant Images (SimDIm), based on the concept of dominant images, which is a set of images representing the entire collection of images of the database in a more diversified and reduced manner. This concept allows to efficiently analyze the context of the entire collection, which is the final goal. The experiments showed that the proposed methods effectively contributed to characterize and quantify the similarity between images using extended approaches based on visual dictionaries and contextual analysis, reducing the semantic gap between human perception and computational description. Consultas por similaridade Dicionários visuais Extração de características Palavras visuais Recuperação de imagens Feature Extraction Image Retrieval Similarity Search Visual Dictionary Visual Words
334	Dynamics of Barred Galaxies in Triaxial Dark Matter Haloes / Dinâmica de galáxias barradas em halos triaxiais de matéria escura Rubens Eduardo Garcia Machado 05 October 2010 (has links) Cosmological N-body simulations indicate that the dark matter haloes of galaxies should be generally triaxial. Yet, the presence of a baryonic disc is believed to modify the shape of the haloes. The goal of this thesis is to study how bar formation is affected by halo triaxiality and how, in turn, the presence of the bar influences the shape of the halo. We performed a series of collisionless and hydrodynamical numerical simulations, using elliptical discs as initial conditions. Triaxial halos tend to become more spherical and we show that part of the circularisation of the halo is due to disc growth, but part must be attributed to the formation of a bar. We find that the presence of gas in the disc is a more efficient factor than halo triaxiality in inhibiting the formation of a strong bar. / As simulações cosmológicas de N-corpos indicam que os halos de matéria escura das galáxias devem ser em geral triaxiais. Contudo, acredita-se que a presença de um disco bariônico seja capaz de alterar a forma do halo. O objetivo desta tese é o de estudar como a formação de barras é afetada pela triaxialidade do halo e como, por sua vez, a presença da barra influencia a forma do halo. Nós realizamos uma série de simulações numéricas acolisionais e hidrodinâmicas, utilizando discos elípticos como condições iniciais. Os halos triaxiais tendem a se tornar mais esféricos e nós mostramos que parte da circularização do halo é devida ao crescimento do disco, mas parte precisa ser atribuída à formação da barra. Notamos que a presença de gás no disco é um fator mais eficiente do que a triaxialidade do halo em inibir a formação de uma barra forte. dinâmica galáctica galáxias: evolução galáxias: halos métodos: simulações numéricas palavras-chave: astrofísica astrophysics galactic dynamics galaxies: evolution galaxies: haloes methods: numerical simulations
335	Reconhecimento de comandos de voz por redes neurais Rodrigo Jorge Alvarenga 02 June 2012 (has links) Sistema de reconhecimento de fala tem amplo emprego no universo industrial, no aperfeiçoamento de operações e procedimentos humanos e no setor do entretenimento e recreação. O objetivo específico do trabalho foi conceber e desenvolver um sistema de reconhecimento de voz, capaz de identificar comandos de voz, independentemente do locutor. A finalidade precípua do sistema é controlar movimentos de robôs, com aplicações na indústria e no auxílio de deficientes físicos. Utilizou-se a abordagem da tomada de decisão por meio de uma rede neural treinada com as características distintivas do sinal de fala de 16 locutores. As amostras dos comandos foram coletadas segundo o critério de conveniência (em idade e sexo), a fim de garantir uma maior discriminação entre as características de voz, e assim alcançar a generalização da rede neural utilizada. O préprocessamento consistiu na determinação dos pontos extremos da locução do comando e na filtragem adaptativa de Wiener. Cada comando de fala foi segmentado em 200 janelas, com superposição de 25% . As features utilizadas foram a taxa de cruzamento de zeros, a energia de curto prazo e os coeficientes ceptrais na escala de frequência mel. Os dois primeiros coeficientes da codificação linear preditiva e o seu erro também foram testados. A rede neural empregada como classificador foi um perceptron multicamadas, treinado pelo algoritmo backpropagation. Várias experimentações foram realizadas para a escolha de limiares, valores práticos, features e configurações da rede neural. Os resultados foram considerados muito bons, alcançando uma taxa de acertos de 89,16%, sob as condições de pior caso da amostragem dos comandos. / Systems for speech recognition have widespread use in the industrial universe, in the improvement of human operations and procedures and in the area of entertainment and recreation. The specific objective of this study was to design and develop a voice recognition system, capable of identifying voice commands, regardless of the speaker. The main purpose of the system is to control movement of robots, with applications in industry and in aid of disabled people. We used the approach of decision making, by means of a neural network trained with the distinctive features of the speech of 16 speakers. The samples of the voice commands were collected under the criterion of convenience (age and sex), to ensure a greater discrimination between the voice characteristics and to reach the generalization of the neural network. Preprocessing consisted in the determination of the endpoints of each command signal and in the adaptive Wiener filtering. Each speech command was segmented into 200 windows with overlapping of 25%. The features used were the zero crossing rate, the short-term energy and the mel-frequency ceptral coefficients. The first two coefficients of the linear predictive coding and its error were also tested. The neural network classifier was a multilayer perceptron, trained by the backpropagation algorithm. Several experiments were performed for the choice of thresholds, practical values, features and neural network configurations. Results were considered very good, reaching an acceptance rate of 89,16%, under the `worst case conditions for the sampling of the commands. processamento de sinais reconhecimento de palavras MFCC coeficientes `mel-cepstral LPC redes neurais backpropagation automation signal processing word recognition MFCC mel-frequency ceptral coefficients LPC neural networks backpropagation ENGENHARIA MECANICA
336	Análise comparativa e expressão dos genes da família Dof em Citrus sinensis (L.) Osbeck durante o desenvolvimento dos frutos / Comparative analysis and expression of dof genes in Citrus sinensis (L.) osbeck during fruit development Guaberto, Luciana Machado 16 December 2016 (has links) Submitted by Michele Mologni (mologni@unoeste.br) on 2017-06-23T19:31:58Z No. of bitstreams: 1 Luciana Machado Guaberto.pdf: 1335752 bytes, checksum: aa6bb850bf2257d472ca5dbfd2512a5a (MD5) / Made available in DSpace on 2017-06-23T19:31:58Z (GMT). No. of bitstreams: 1 Luciana Machado Guaberto.pdf: 1335752 bytes, checksum: aa6bb850bf2257d472ca5dbfd2512a5a (MD5) Previous issue date: 2016-12-16 / The DOF family proteins (DNA binding with One Finger) comprises unique plant transcription factors (FTs) characterized by the presence of a DNA binding domain Dof containing a similar structure to the "zinc-finger" domain. These transcription factors are involved in different roles in various biological processes in plants. Although the analysis and genomic characterization of this gene family was performed in many plant species, information on Dof genes in sweet orange (Citrus sinensis (L.) Osbeck) and their involvement in the development of the fruits is still limited. For the full identification of CsDof genes in C. sinensis, including the structures of genes, chromosomal locations, introns and phylogeny, the examination of three databases resulted in the identification of 24 genes of this FT family distributed on 7 out of 9 chromosomes of this species. Phylogenetic analysis and classification of Dof transcription factors in C. sinensis was compared with their orthologs of Arabidopsis (Arabidopsis thaliana L.) and rice (Oryza sativa L.), which allowed their classification in four major groups (A, B, C and D) and 9 subgroups (a, B1, B2, C1, C2.1, C2.2, C3, D1, D2) of DOF proteins. For gene expression analysis, the 12 Dof genes with higher abundance of transcripts in fruits based on public RNA-seq data were selected for further analysis by semi-quantitative RT-PCR. This analysis revealed the CsDof genes were differentially expressed at different stages of development (up to 90 days after anthesis). It was also possible to establish three groups regarding their transcriptional activity relative to that in leaf tissue: genes with high (up to 8X), intermediate (up to 3X) and low relative expression (below 3 X). The gene CsDof1 showed higher expression in all of the fruit development stages, indicating that this isoform plays an important role in regulating the development of the fruits of C. sinensis. Taken together, our results provide new information about the regulation of Dof genes in controlling the formation of fruits of this important fruit species. / A família de proteínas Dof (DNA binding with One Finger) compreende fatores de transcrição (FT) exclusivos de plantas, caracterizados pela presença do domínio Dof de ligação ao DNA Estes fatores de transcrição estão envolvidos em diversos processos biológicos em plantas. Embora a análise e caracterização genômica de genes desta família tenha sido realizada em muitas espécies, informações sobre genes Dof em Citrus sinensis (L.) Osbeck (laranja doce) e o seu envolvimento no desenvolvimento do fruto é limitado. Para a identificação completa dos genes CsDof em C. sinensis, incluindo as estruturas dos genes (Exons - Íntrons), localizações cromossômicas e filogenia, três bancos de dados foram analisados. Como resultado desta busca 24 genes desta família de FTs distribuídos em 7 dos 9 cromossomos desta espécie. A análise filogenética e classificação dos fatores de transcrição Dof em C. sinensis foi realizada com a inclusão dos seus ortólogos de Arabidopsis (Arabidopsis thaliana L.) e arroz (Oryza sativa L.), sendo possível estabelecer quatro grupos principais (A, B, C e D) e 9 subgrupos (A, B1, B2, C1, C2.1, C2.2, C3, D1 e D2) de proteínas Dof. Foram selecionados 12 genes putativamente mais expressos em frutos de acordo com dados públicos de RNA-seq para a análise da expressão gênica por RT-PCR. Estes genes foram diferencialmente expressos durante as fases iniciais do desenvolvimento do fruto, sendo possível estabelecer três grupos: genes com alta expressão (acima de 8 X), expressão intermediária (acima de 3 X) e baixa expressão relativa (abaixo de 3 X) em relação à atividade transcricional em folhas. O gene CsDof1 se destacou como o gene com a maior expressão, sendo que esta manteve-se elevada em todos os estádios de desenvolvimento do fruto, evidenciando que esta isoforma desempenha um importante papel na regulação do desenvolvimento de frutos de C. sinensis. Considerados em conjunto, os nossos resultados fornecem novas informações sobre os genes CsDof na complexa rede regulatória envolvida no desenvolvimento dos frutos de laranja doce. CIENCIAS AGRARIAS::AGRONOMIA
337	Árvores de Ukkonen: caracterização combinatória e aplicações / Ukkonen\'s tree: combinatorial characterization and applications Gustavo Akio Tominaga Sacomoto 08 February 2011 (has links) A árvore de sufixos é uma estrutura dados, que representa em espaço linear todos os fatores de uma palavra, com diversos exemplos de aplicações práticas. Neste trabalho, definimos uma estrutura mais geral: a árvore de Ukkonen. Provamos para ela diversas propriedades combinatórias, dentre quais, a minimalidade em um sentido preciso. Acreditamos que a apresentação aqui oferecida, além de mais geral que as árvores de sufixo, tem a vantagem de oferecer uma descrição explícita da topologia da árvore, de seus vértices, arestas e rótulos, o que não vimos em nenhum outro trabalho. Como aplicações, apresentamos também a árvore esparsa de sufixos (que armazena apenas um subconjunto dos sufixos) e a árvore de k-fatores (que armazena apenas os segmentos de comprimento k, ao invés dos sufixos) definidas como casos particulares das árvores de Ukkonen. Propomos para as árvores esparsas um novo algoritmo de construção com tempo O(n) e espaço O(m), onde n é tamanho da palavra e m é número de sufixos. Para as árvores de k-fatores, propomos um novo algoritmo online com tempo e espaço O(n), onde n é o tamanho da palavra. / The suffix tree is a data structure that represents, in linear space, all factors of a given word, with several examples of practical applications. In this work, we define a more general structure: the Ukkonen\'s tree. We prove many properties for it, among them, its minimality in a precise sense. We believe that this presentation, besides being more general than the suffix trees, has the advantage of offering an explicit description of the tree topology, its vertices, edges and labels, which was not seen in any other work. As applications, we also presents the sparse suffix tree (which stores only a subset of the suffixes) and the k-factor tree (which stores only the substrings of length k, instead of the suffixes), both defined as Ukkonen\'s tree special cases. We propose a new construction algorithm for the sparse suffix trees with time O(n) and space O(m), where n is the size of the word and m is the number of suffixes. For the k-factor trees, we propose a new online algorithm with time and space O(n), where n is the size of the word. biologia computacional busca por padrões combinatória de palavras estrutura de dados recuperação de informação stringology combinatorics on words computational biology data structure information retrieval pattern matching stringology
338	[pt] A NATUREZA POLISSÊMICA DO PREFIXO CO(N) NO PORTUGUÊS: UMA ABORDAGEM COGNITIVA / [en] THE POLISEMYC NATURE OF THE PORTUGUESE PREFIX CO(N): A COGNITIVE APPROACH CARLOS ROBERTO DE SOUZA RODRIGUES 07 June 2016 (has links) [pt] Este trabalho estuda o prefixo co(N)- na Língua Portuguesa, entendido como um prefixo único que se manifesta sob as formas com, con e co. Na presente pesquisa, tais formas são estudadas a partir das construções lexicais em que podem ser reconhecidas, o que permite vislumbrar a variação de significados do prefixo na língua portuguesa. Os dados primários da análise foram coletados no Dicionário Houaiss da Língua Portuguesa. Para realizar tal estudo, foi aplicado um conjunto de conceitos operacionais e de procedimentos analítico-descritivos apresentados na Gramática Cognitiva de Ronald Langacker. Assume-se, portanto, que a estrutura fonológica co(N) evoca uma dada estrutura semântica – que se configura como tal devido à aplicação de um conjunto de operações de perspectivização sob o substrato conceptual obtido a partir do contexto em que são usadas as construções lexicais com tal prefixo. Por sua vez, as operações de perspectivização possibilitaram notar não só que, em distintas construções lexicais, bem como nos distintos contextos em que elas são usadas, o referido prefixo assume valores semânticos convencionais distintos; como também que esses sentidos, embora distintos, encontram-se relacionados mutuamente. O reconhecimento dessa relação mútua decorre do estabelecimento de um desses significados como prototípico, ou primário, sendo os demais considerados como sentidos derivados, sobretudo pelo fenômeno de atenuação conceptual. Essa abordagem propiciou o delineamento de uma rede polissêmica entre os valores semânticos convencionais apresentados pelo prefixo co(N)-, em convergência com a abordagem teórica da Gramática Cognitiva, baseada no modelo de rede, em que os vários significados assumidos por uma determinada unidade simbólica formam uma teia de relações entre si. / [en] This work is concerned with the Portuguese prefix co(n)-, understood as a single prefix which, however, can occur in the different forms com, con and co . In the research, the forms studied were extracted from the lexical constructions where they can be recognized, which leads to a better vision of the range of meanings of the prefix in Portuguese. The primary data of the analysis were collected from the Dicionário Houaiss da Língua Portuguesa. In the investigation, we applied a set of operational concepts and analytical procedures of description from Langacker s Cognitive Grammar. It is assumed, therefore, that the phonological structure corresponding to co(N) evokes a given semantic structure arrived at by means of a set of construal operations under the conceptual substract presented by the context in which lexical constructions with the prefix were used. In turn, the construal makes clear that this prefix not only can have different conventional semantic values, in different lexical constructions as well as in different contexts of use, but also that the different senses are mutually related. The recognition of this mutual relationship is possible once we take one of these meanings as prototypical, or primary, from which other meanings derive, especially by conceptual attenuation factors. This approach allowed us to outline a semantic network that permeates conventional semantic values of the prefix, thus converging with GC s theoretical approach based on a network model, in the sense that the various meanings assumed by certain symbolic unity form a web of relationships among themselves. [pt] MORFOLOGIA [pt] REDE POLISSEMICA [pt] PREFIXO CON [pt] GRAMATICA COGNITIVA [pt] FORMACAO DE PALAVRAS [pt] SEMANTICA LEXICAL [pt] LINGUA PORTUGUESA [en] MORPHOLOGY [en] WORD FORMATION [en] LEXICAL SEMANTICS [en] PORTUGUESE LANGUAGE
339	[en] A KEYWORD-BASED QUERY PROCESSING METHOD FOR DATASETS WITH SCHEMAS / [pt] MÉTODO PARA O PROCESSAMENTO DE CONSULTAS POR PALAVRAS-CHAVES PARA BASES DE DADOS COM ESQUEMAS GRETTEL MONTEAGUDO GARCÍA 23 June 2020 (has links) [pt] Usuários atualmente esperam consultar dados de maneira semelhante ao Google, digitando alguns termos, chamados palavras-chave, e deixando para o sistema recuperar os dados que melhor correspondem ao conjunto de palavras-chave. O cenário é bem diferente em sistemas de gerenciamento de banco de dados em que os usuários precisam conhecer linguagens de consulta sofisticadas para recuperar dados, ou em aplicações de banco de dados em que as interfaces de usuário são projetadas como inúmeras caixas que o usuário deve preencher com seus parâmetros de pesquisa. Esta tese descreve um algoritmo e um framework projetados para processar consultas baseadas em palavras-chave para bases de dados com esquema, especificamente bancos relacionais e bases de dados em RDF. O algoritmo primeiro converte uma consulta baseada em palavras-chave em uma consulta abstrata e, em seguida, compila a consulta abstrata em uma consulta SPARQL ou SQL, de modo que cada resultado da consulta SPARQL (resp. SQL) seja uma resposta para a consulta baseada em palavras-chave. O algoritmo explora o esquema para evitar a intervenção do usuário durante o processo de busca e oferece um mecanismo de feedback para gerar novas respostas. A tese termina com experimentos nas bases de dados Mondial, IMDb e Musicbrainz. O algoritmo proposto obtém resultados satisfatórios para os benchmarks. Como parte dos experimentos, a tese também compara os resultados e o desempenho obtidos com bases de dados em RDF e bancos de dados relacionais. / [en] Users currently expect to query data in a Google-like style, by simply typing some terms, called keywords, and leaving it to the system to retrieve the data that best match the set of keywords. The scenario is quite different in database management systems, where users need to know sophisticated query languages to retrieve data, and in database applications, where the user interfaces are designed as a stack of pages with numerous boxes that the user must fill with his search parameters. This thesis describes an algorithm and a framework designed to support keywordbased queries for datasets with schema, specifically RDF datasets and relational databases. The algorithm first translates a keyword-based query into an abstract query, and then compiles the abstract query into a SPARQL or a SQL query such that each result of the SPARQL (resp. SQL) query is an answer for the keywordbased query. It explores the schema to avoid user intervention during the translation process and offers a feedback mechanism to generate new answers. The thesis concludes with experiments over the Mondial, IMDb, and Musicbrainz databases. The proposed translation algorithm achieves satisfactory results and good performance for the benchmarks. The experiments also compare the RDF and the relational alternatives. [pt] RDF [pt] SQL [pt] BUSCA POR PALAVRAS CHAVE [pt] ARVORES DE STEINER [pt] SPARQL [en] RDF [en] SQL [en] KEYWORD SEARCH [en] STEINER TREE [en] SPARQL
340	[en] PART-OF-SPEECH TAGGING FOR PORTUGUESE / [pt] PART-OF-SPEECH TAGGING PARA PORTUGUÊS ROMULO CESAR COSTA DE SOUSA 07 April 2020 (has links) [pt] Part-of-speech (POS) tagging é o processo de categorizar cada palavra de uma sentença com sua devida classe morfossintática (verbo, substantivo, adjetivo e etc). POS tagging é considerada uma atividade fundamental no processo de construção de aplicações de processamento de linguagem natural (PLN), muitas dessas aplicações, em algum ponto, demandam esse tipo de informação. Nesse trabalho, construímos um POS tagger para o Português Contemporâneo e o Português Histórico, baseado em uma arquitetura de rede neural recorrente. Tradicionalmente a construção dessas ferramentas requer muitas features específicas do domínio da linguagem e dados externos ao conjunto de treino, mas nosso POS tagger não usa esses requisitos. Treinamos uma rede Bidirectional Long short-term memory (BLSTM), que se beneficia das representações de word embeddings e character embeddings das palavras, para atividade de classificação morfossintática. Testamos nosso POS tagger em três corpora diferentes: a versão original do corpus MacMorpho, a versão revisada do corpus Mac-Morpho e no corpus Tycho Brahe. Nós obtemos um desempenho ligeiramente melhor que os sistemas estado da arte nos três corpora: 97.83 por cento de acurácia para o Mac-Morpho original, 97.65 por cento de acurácia para o Mac-Morpho revisado e 97.35 por cento de acurácia para Tycho Brahe. Conseguimos, também, uma melhora nos três corpora para a medida de acurácia fora do vocabulário, uma acurácia especial calculada somente sobre as palavras desconhecidas do conjunto de treino. Realizamos ainda um estudo comparativo para verificar qual dentre os mais populares algoritmos de criação de word embedding (Word2Vec, FastText, Wang2Vec e Glove), é mais adequado para a atividade POS tagging em Português. O modelo de Wang2Vec mostrou um desempenho superior. / [en] Part-of-speech (POS) tagging is a process of labeling each word in a sentence with a morphosyntactic class (verb, noun, adjective and etc). POS tagging is a fundamental part of the linguistic pipeline, most natural language processing (NLP) applications demand, at some step, part-of-speech information. In this work, we constructed a POS tagger for Contemporary Portuguese and Historical Portuguese, using a recurrent neural network architecture. Traditionally the development of these tools requires many handcraft features and external data, our POS tagger does not use these elements. We trained a Bidirectional Long short-term memory (BLSTM) network that benefits from the word embeddings and character embeddings representations of the words, for morphosyntactic classification. We tested our POS tagger on three different corpora: the original version of the Mac-Morpho corpus, the revised version of the Mac-Morpho corpus, and the Tycho Brahe corpus. We produce state-of-the-art POS taggers for the three corpora: 97.83 percent accuracy on the original Mac-Morpho corpus, 97.65 percent accuracy on the revised Mac-Morpho and 97.35 percent accuracy on the Tycho Brahe corpus. We also achieved an improvement in the three corpora in out-of-vocabulary accuracy, that is the accuracy on words not seen in training sentences. We also performed a comparative study to test which different types of word embeddings (Word2Vec, FastText, Wang2Vec, and Glove) is more suitable for Portuguese POS tagging. The Wang2Vec model showed higher performance. [pt] APRENDIZADO DE MAQUINA [pt] INCORPORACAO DE PALAVRAS [pt] ANOTACAO MORFOSSINTATICA [pt] APRENDIZADO PROFUNDO [pt] PROCESSAMENTO DE LINGUAGEM NATURAL [en] MACHINE LEARNING [en] WORD EMBEDDING [en] PART-OF-SPEECH TAGGING [en] DEEP LEARNING [en] NATURAL LANGUAGE PROCESSING

Search results