• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 112
  • 100
  • 41
  • 33
  • 25
  • 10
  • 6
  • 4
  • 4
  • 4
  • 4
  • 3
  • 3
  • 3
  • 2
  • Tagged with
  • 391
  • 86
  • 76
  • 76
  • 66
  • 54
  • 52
  • 50
  • 36
  • 32
  • 31
  • 31
  • 30
  • 30
  • 24
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
121

Análise de sentimentos em tíquetes para o suporte de TI / Sentiment Analysis in Tickets for IT Support

Blaz, Cássio Castaldi Araújo January 2017 (has links)
Análise de Sentimentos/Mineração de Opinião é adotada na engenharia de software para questões como usabilidade e sentimentos de desenvolvedores em projetos. Este trabalho propõe métodos para avaliar os sentimentos presentes em tíquetes abertos à área de suporte de TI. Há diversos tipos de tíquetes abertos à TI (e.g. infraestrutura, software), que envolvem erros, incidentes, requisições, etc. O maior desafio é automaticamente distinguir entre a necessidade em si, a qual é intrinsecamente negativa (por exemplo, a descrição de um erro), de um sentimento embutido na descrição. Nossa abordagem automaticamente cria um dicionário de domínio que contém termos que expressam sentimentos no contexto de TI, utilizados para filtrar expressões em um tíquete para análise de sentimentos. Nós criamos e avaliamos três métodos de classificação para calcular a polaridade em tíquetes. Nosso estudo utilizou 34.895 tíquetes de cinco organizações. Para polaridade, 2.333 tíquetes foram selecionados aleatoriamente para compor nosso gold standard. Nossos melhores resultados apresentam uma precisão e revocação de 82,83% e 88,42%, respectivamente, o que supera outras soluções de análise de sentimentos comparadas. De forma complementar, emoções em tíquetes foram estudadas considerando os modelos de Ekman e VAD. Um dos três métodos de classificação criados foi adaptado para também identificar emoções nos tíquetes. Possíveis correlações entre polaridade e emoções foram verificadas via regras de associação. Resultados correlacionam tíquetes positivos com valência e dominância altas e excitação baixa, além de presença de alegria e surpresa e ausência de medo. Tíquetes negativos correlacionam com valência, excitação e dominância neutras, além de ausência de alegria e presença de medo. Contudo os resultados para a polaridade negativa não são precisos. / Sentiment Analysis/Opinion Mining has been adopted in software engineering for problems such as software usability and sentiment of developers in projects. This work proposes methods to evaluate the sentiment contained in tickets for IT (Information Technology) support. IT tickets are broad in coverage (e.g. infrastructure, software), and involve errors, incidents, requests, etc. The main challenge is to automatically distinguish between factual information, which is intrinsically negative (e.g. error description), from the sentiment embedded in the description. Our approach is to automatically create a domain dictionary that contains terms with sentiment in IT context, used to filter terms in tickets for sentiment analysis. We created and evaluate three classification methods for calculating the polarity of terms in tickets. Our study was developed using 34,895 tickets from five organizations. For polarity, we randomly selected 2.333 tickets to compose a gold standard. Our best results display an average precision and recall of 82.83% and 88.42%, respectively, which outperforms the compared sentiment analysis solutions. Complementarily, emotions in tickets were studied considering the models of Ekman and VAD. One of the three classification methods created has been adapted to also identify emotions in the tickets. Possible correlations between polarity and emotions were verified through association rules. Results correlate positive tickets with valence and dominance high and low excitation, besides presence of joy and surprise and absence of fear. Negative tickets correlate with valence, neutral excitement and dominance, besides absence of joy and presence of fear. However the results for negative polarity are not accurate.
122

Política de constituição do dicionário Caldas Aulete Digital

Siveris, Daiane January 2018 (has links)
Nesta pesquisa tivemos como objetivo explicitar a política de constituição do Dicionário Caldas Aulete Digital a partir da compreensão do funcionamento da concepção de língua veiculada nesse dicionário, uma vez que esta se constitui na tensão entre infraestrutura e superestrutura. Analisamos o funcionamento do conceito de língua na relação entre infraestrutura e superestrutura; compreendemos o conceito de política e suas relações com o sentido; apresentamos as especificidades e as condições de produção do Dicionário Caldas Aulete Digital, pensando a reformulação, do Dicionário Houaiss e do Dicionário Aurélio para entender que relações se estabelecem entre esses diferentes dicionários e buscamos apresentar o espaço de reformulação na articulação com as práticas sociais. O percurso teórico desenvolvido teve por base o materialismo histórico e dialético, perpassando também pelos estudos filológicos, estudos linguísticos estruturalistas e culminando nos estudos discursivos. Com os estudos filológicos de Michel Bréal, entendemos que a linguagem reflete o homem, suas vontades e seus desejos, remontando à condição humana de sujeito histórico e responsável pelas mudanças em uma língua. Os estudos linguísticos estruturalistas de Ferdinand de Saussure apontam a língua como objeto abstrato, cujas alterações ocorrem no deslocamento da relação entre o significante e o significado, sem qualquer interferência externa à língua, limitando-se o objeto língua, portanto, a um sistema estável. Os estudos materialistas de Mikhail Bakhtin/Valentin Volochínov abordam a linguagem enquanto materialidade, cujas condições de uso remetem aos sentidos, logo em funcionamento na realidade concreta de uso. Nos estudos discursivos de Michel Pêcheux, o conceito de língua está articulado ao de discurso, para o qual a língua serve de suporte para a realização dos efeitos de sentido. O conceito de política abordado a partir de Hannah Arendt está articulado ao de liberdade e é a criação do novo, do inesperado, é ação plural, sendo inerente à condição humana. Para Jacques Rancière, a política se instaura com o dano e este desfaz a ordem policial instituída, rompendo com a configuração da sociedade em que se definem as parcelas. Na teoria de Michel Pêcheux, observamos que a política se relaciona com o conceito de formação discursiva, pois é nesta que as palavras adquirem seus sentidos a partir da inscrição dos sujeitos em determinada formação ideológica. Para as análises, selecionamos verbetes que contribuíssem para ilustrar as relações infraestruturais e superestruturais que se estabelecem na produção do dicionário, bem como que possibilitassem a articulação com os conceitos estudados. As análises centraram-se, ainda, nos projetos da editora Lexikon e permitiram apresentar que no projeto inicial de produção dicionarística visava-se a uma obra aberta, de dicionarização da língua viva, isto é, a língua em funcionamento na sociedade, reflexo das práticas dos sujeitos na infraestrutura e na superestrutura, cuja contribuição era estendida aos sujeitos falantes da língua, leigos quanto aos critérios lexicográficos de constituição de um dicionário. No projeto seguinte, reformulado, há um retorno aos dicionários clássicos e tradicionais, pois há um controle sobre a dicionarização na medida em que o sujeito das forças orgânicas não pode mais contribuir com a produção desse dicionário, e a tarefa da lexicalização da língua retorna aos lexicógrafos, sujeitos academicamente instruídos para tal. / In this research we have aimed to explicit the politics of constitution of Caldas Aulete Digital Dictionary, starting from the comprehension of the functioning of the concept of language assumed in this dictionary, since this language is constituted by the tension between infrastructure and superstructure. We analyzed the functioning of the concept of language in the relationship between infrastructure and superstructure; we comprehended the concept of politics and its relations with meaning; we pointed the specificities and the conditions of production of Caldas Aulete Digital Dictionary, considering the reformulation of Houaiss Dictionary and Aurélio Dictionary in order to understand what relations are established between these different dictionaries, and we sought to present this space of reformulation in the articulation with social practices. The theoretical course developed was based on historical and dialectical materialism, also going through philological studies, structuralist linguistic studies, culminating in discursive studies. With Michel Bréal’s philological studies, we understand that language reflects the human being, its wills and desires, reinforcing the human condition of historical subject, responsible for changes in a language. The structuralist linguistic studies of Ferdinand de Saussure point to language as an abstract object, whose alterations occur in the displacement of the relation between the signifier and the signified, without any language external interference, thus limiting the language object to a stable system. Materialistic studies of Mikhail Bakhtin / Valentin Volochínov approach language as materiality, whose conditions of use refer to meaning, therefore, in functioning in the concrete reality of use. In discursive studies of Michel Pêcheux, the concept of language is articulated to the concept of discourse, to which the language serves as support for the accomplishment of the effects of meaning. The concept of politics taken from Hannah Arendt is articulated to the notion of freedom and it is the creation of the new, the unexpected, it is plural action and inherent to the human condition. To Jacques Rancière, politics is established with the damage and this damage undoes the police order instituted, breaking with the configuration of the society in which social classes are defined. In Michel Pêcheux’s theory, we observe that politics is related to the concept of discursive formation, as the words acquire their meaning inserted in such discursive formation, from the inscription of the subjects in a certain ideological formation. For the analysis, we selected entries which could contribute to illustrate the infrastructural and superstructural relations that are established in the production of the dictionary, as well as entries that could enable the relation with the concepts addressed. Such analysis also focused in the projects of Lexikon editor and allowed to present that in the initial project of the dictionary production an open work was aimed; a work of living language in the dictionary, that is, the functioning language in society, as a reflection of the practice of the subjects in infrastructure and superstructure, whose contribution was extended to the language speaking subjects, lay people when it comes to lexicographic criteria of the constitution of a dictionary. In the following project, redesigned, there is a return to classical and traditional dictionaries, as there is a control on the entries inclusion in the extent that the subject of organic forces can no longer contribute to the production of such dictionary, and the task of lexical establishment returns to lexicographers, subjects who are academically instructed to do so.
123

Segmentação de lesões melanocíticas usando uma abordagem baseada no aprendizado de dicionários / Segmentation of melanocytic lesions using a dictionary learning based approach

Flores, Eliezer Soares January 2015 (has links)
Segmentação é uma etapa essencial para sistemas de pré-triagem de lesões melanocíticas. Neste trabalho, um novo método para segmentar lesões melanocíticas em imagens de câmera padrão (i.e., imagens macroscópicas) é apresentado. Inicialmente, para reduzir artefatos indesejáveis, os efeitos de sombra são atenuados na imagem macroscópica e uma présegmentação é obtida usando um esquema que combina a transformada wavelet com a transformada watershed. Em seguida, uma imagem de variação textural projetada para melhorar a discriminabilidade da lesão em relação ao fundo é obtida e a região présegmentada é usada para o aprendizado de um dicionário inicial e de uma representação inicial via um método de fatoração de matrizes não-negativas. Uma versão nãosupervisionada e não-paramétrica do método de aprendizado de dicionário baseado em teoria da informação é proposta para otimizar esta representação, selecionando o subconjunto de átomos que maximiza a compactividade e a representatividade do dicionário aprendido. Por fim, a imagem da lesão de pele é representada usando o dicionário aprendido e segmentada com o método de corte normalizado em grafos. Nossos resultados experimentais baseados em uma base de imagens bastante utilizada sugerem que o método proposto tende a fornecer melhores resultados do que os métodos estado-da-arte analisados (em termos do erro XOR). / Segmentation is an essential step for the automated pre-screening of melanocytic lesions. In this work, a new method for segmenting melanocytic lesions in standard camera images (i.e., macroscopic images) is presented. Initially, to reduce unwanted artifacts, shading effects are attenuated in the macroscopic image and a pre-segmentation is obtained using a scheme that combines the wavelet transform and the watershed transform. Afterwards, a textural variation image designed to enhance the skin lesion against the background is obtained, and the presegmented skin lesion region is used to learn an initial dictionary and an initial representation via a nonnegative matrix factorization method. An unsupervised and non-parametric version of the information-theoretic dictionary learning method is proposed to optimize this representation by selecting the subset of atoms that maximizes the learned dictionary compactness and representation. Finally, the skin lesion image is represented using the learned dictionary and segmented with the normalized graph cuts method. Our experimental results based on a widely used image dataset suggest that the proposed method tends to provide more accurate skin lesion segmentations than comparable state-of-the-art methods (in terms of the XOR error).
124

Princípios teóricos e metodológicos para a elaboração de um dicionário bilíngue de verbos português-alemão

Pinto Júnior, João Moraes [UNESP] 11 December 2009 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:32:46Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-12-11Bitstream added on 2014-06-13T19:43:28Z : No. of bitstreams: 1 pintojunior_jm_dr_arafcl.pdf: 566082 bytes, checksum: 217455fa670f51d0af7436eef0e0bb1b (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / O dicionário bilíngue é um dos principais instrumentos pedagógicos para o estudo de uma língua estrangeira. No nosso caso, pretende-se descrever os passos da base teórica para a elaboração de um dicionário bilíngue de verbos português-alemão tendo o português como língua de partida e o alemão como língua de chegada. O objetivo mais geral é apresentar um conjunto de princípios que devem orientar na organização de um dicionário bilíngue. O objetivo mais específico é conseguir um modelo para a montagem de um dicionário gramatical de verbos português-alemão. A proposta é organizar um dicionário de língua, sincrônico e portanto um dicionário de usos. É um dicionário que leva em conta a frequência relativa dos itens selecionados e é preferencialmente um dicionário de equivalências lexicais. Optou-se por uma teoria gramatical que permite a descrição prévia do item - o verbo - na língua de partida buscando as correspondentes construções na língua de chegada - o alemão. Organizou-se a macroestrutura desse dicionário pelo critério de ocorrências num corpus sediado no Laboratório de Lexicografia da Faculdade de Ciências e Letras - UNESP - Campus de Araraquara que no momento (2009) conta com duzentos milhões de ocorrências de palavras em textos escritos no português do Brasil. Os esquemas descritivos se assentam numa teoria gramatical específica - a valência verbal, que se torna, então, a responsável pela regularidade na organização dos verbetes. / Bilingual dictionaries are one of the main pedagogical instruments for the study of a foreign language. This thesis seeks to describe the steps of the theoretical basis for the elaboration of a bilingual dictionary of Portuguese-German verbs, with Portuguese as the source language and German as the destination language. The more general objective is to present a set of principles that should guide the organization of a bilingual dictionary. The more specific objective, in turn, is to obtain a model for setting up a grammar dictionary of Portuguese-German verbs. The proposal is to organize a synchronic language dictionary and, hence, a dictionary of usage. This dictionary takes into account the relative frequency of the selected items and is preferentially a dictionary of lexical equivalence. A grammatical theory was chosen which allows for the prior description of the item – the verb – in the source language, seeking the corresponding constructions in the destination language – German. The nomenclature in this dictionary was organized according to the criterion of occurrences extracted from a corpus housed in the Laboratory of Lexicography at the Faculty of Sciences and Letters of UNESP at Araraquara, which currently (2009) contains two hundred million occurrences of words in texts written in Portuguese in Brazil. The descriptive schemes fit into a specific grammatical theory, i.e., verbal valency, which is thus responsible for the regularity of the organization of the entries.
125

Como lidar com os neologismos no texto jornalístico

Peruzzo, Marinella Stefani January 2007 (has links)
Este trabalho parte da idéia de que os neologismos recebem, nos dicionários e manuais de redação jornalística, um tratamento assistemático, desprovido de rigor e critérios para que os jornalistas (e pessoas em geral) os reconheçam como tais e saibam lidar convenientemente com eles. A partir da elaboração de uma taxonomia própria, identificamos diferentes tipos de neologismos e constatamos que eles são um fenômeno natural na língua, que permite a sua subsistência e continuidade. Porém, ainda que naturais e necessários, os neologismos costumam ser “incômodos”: nos manuais de redação, são logo considerados “incorretos” ou “inexistentes”, embora a própria menção que se faz a eles ateste sua existência. Após o exame dos conceitos de correção e incorreção na língua, propomos, com o apoio de Rabanales (1984), a substituição dos termos “correto/incorreto” e “existente/inexistente”, que, geralmente, caracterizam-nos, por “necessário/desnecessário”, “culto/inculto”, “formal/informal”, “exato/inexato” e “genuíno/falso”, de acordo com os tipos de neologismos que identificamos. / Our starting point in this paper is the belief that neologisms receive a non systematic treatment in dictionaries and newspaper stylebooks. There is no rigour nor criteria for journalists to be able to recognize them for what they are and to deal conveniently with them. Through the design of our own taxonomy for them, we were able to identify different types of neologisms and consider them as a natural fenomenon of language which permits its subsistency and continuity. However, even if they are something natural and necessary, they are also seen as troubling: in the stylebooks they are usually considered “incorrect” or “inexistent”, but the mere fact of having been mentioned in these kind of books proves their existence. After examining the concepts of correction and incorrection in language, we propose, following Rabanales (1984), the substitution of the terms “correct/incorrect” and “existent/non existent” for “necessary/unecessary”, “cult/incult”, “formal/informal”, “exact/inexact” and “genuine/false” according to the types of neologisms.
126

An Examination of Hopimomngwit: Hopi Leadership

January 2016 (has links)
abstract: The Hopi people have the distinct term mongwi applied to a person who is charged with leadership of a group. According to Hopi oral history and some contemporary Hopi thought, a mongwi (leader) or group of momngwit (leaders), gain their foremost positions in Hopi society after being recognizably able to fulfill numerous qualifications linked to their respective clan identity, ceremonial initiation, and personal conduct. Numerous occurrences related to the Hopis historical experiences have rendered a substantial record of what are considered the qualifications of a Hopi leader. This thesis is an extensive examination of the language used and the context wherein Hopi people express leadership qualities in the written and documentary record. / Dissertation/Thesis / Masters Thesis American Indian Studies 2016
127

Scaling Up Large-scale Sparse Learning and Its Application to Medical Imaging

January 2017 (has links)
abstract: Large-scale $\ell_1$-regularized loss minimization problems arise in high-dimensional applications such as compressed sensing and high-dimensional supervised learning, including classification and regression problems. In many applications, it remains challenging to apply the sparse learning model to large-scale problems that have massive data samples with high-dimensional features. One popular and promising strategy is to scaling up the optimization problem in parallel. Parallel solvers run multiple cores on a shared memory system or a distributed environment to speed up the computation, while the practical usage is limited by the huge dimension in the feature space and synchronization problems. In this dissertation, I carry out the research along the direction with particular focuses on scaling up the optimization of sparse learning for supervised and unsupervised learning problems. For the supervised learning, I firstly propose an asynchronous parallel solver to optimize the large-scale sparse learning model in a multithreading environment. Moreover, I propose a distributed framework to conduct the learning process when the dataset is distributed stored among different machines. Then the proposed model is further extended to the studies of risk genetic factors for Alzheimer's Disease (AD) among different research institutions, integrating a group feature selection framework to rank the top risk SNPs for AD. For the unsupervised learning problem, I propose a highly efficient solver, termed Stochastic Coordinate Coding (SCC), scaling up the optimization of dictionary learning and sparse coding problems. The common issue for the medical imaging research is that the longitudinal features of patients among different time points are beneficial to study together. To further improve the dictionary learning model, I propose a multi-task dictionary learning method, learning the different task simultaneously and utilizing shared and individual dictionary to encode both consistent and changing imaging features. / Dissertation/Thesis / Doctoral Dissertation Computer Science 2017
128

Proposta lexicográfica sinonímica: locuções adverbiais e prepositivas com 'a', 'de' e 'em' / Synonymic lexicographical proposal: adverbial and prepositional phrases with 'a', 'de' and 'em'

Bertonha, Fábio Henrique de Carvalho 02 March 2018 (has links)
Submitted by Fabio Henrique de Carvalho Bertonha null (bertonha.tradutor@hotmail.com) on 2018-03-09T19:12:11Z No. of bitstreams: 1 Dissertação_Bertonha_final correto.pdf: 1390555 bytes, checksum: 8ac12bde0223b3326acd29aba930ca02 (MD5) / Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2018-03-12T18:13:01Z (GMT) No. of bitstreams: 1 bertonha_fhc_me_sjrp.pdf: 1390555 bytes, checksum: 8ac12bde0223b3326acd29aba930ca02 (MD5) / Made available in DSpace on 2018-03-12T18:13:01Z (GMT). No. of bitstreams: 1 bertonha_fhc_me_sjrp.pdf: 1390555 bytes, checksum: 8ac12bde0223b3326acd29aba930ca02 (MD5) Previous issue date: 2018-03-02 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Este trabalho propõe, primeiramente, analisar locuções adverbiais e prepositivas compostas por „a‟, „de‟ e „em‟; em seguida, propor um dicionário especial na direção português-italiano, da macro à microestrutura. Apoiados em Berruto (1979), Ilari e Geraldi (1985), Tamba-Mecz (2006), Oliveira (2012) e Regueiro Rodríguez (2013), acreditamos que duas ou mais palavras podem ser consideradas como sinônimas em uma língua se forem intercambiáveis em um dado contexto, sem provocar alteração de sentido, em outro. Uma vez que assumimos a equivalência entre as línguas como condição sine qua non para a elaboração de dicionários bilíngues, delineamos um verbete-modelo, que inclui contextos de uso a fim de atestar a ocorrência das locuções adverbiais e prepositivas deste estudo. Para o desenvolvimento desta pesquisa, consideramos 154 itens lexicais que estão presentes no Dicionário Houaiss: Sinônimos e Antônimos (2011). Com relação à busca dos equivalentes em italiano, observamos a semelhança na descrição das locuções adverbiais e prepositivas em dicionários italianos monolíngues e bilíngues, bem como em dicionários brasileiros. Além disso, legitimamos o uso da(s) locução(ões) equivalente(s) por meio de motores de busca na internet. Desse modo, verificamos a correspondência das ocorrências sinonímicas, ou melhor, se os contextos de uso na língua-fonte e na língua-alvo eram os mesmos. Se por um lado, nossos resultados demonstraram a presença de equivalentes sinonímicos como locuções adverbiais e prepositivas, por outro lado, também indicaram a recorrência de advérbios terminados em „-mente‟, funcionando como sinónimos de nosso objeto de pesquisa, tanto em português quanto em italiano (ambos, inter- e intralinguisticamente). Com isso, destacamos a importância da sinonímia como fenômeno linguístico, particularmente, para tradutores, pois pode conduzi-los a equivalentes mais apropriados para um contexto particular. Por fim, tendo como proposta ulterior a elaboração de um dicionário bilíngue, apresentamos 119 verbetes nos quais estão distribuídas 99 locuções adverbiais e 29 locuções prepositivas constituídas pelas preposições „a‟, „de‟ e „em‟. / This study aims, firstly, to analyse adverbial and prepositional phrases composed of ‘a’, ‘de’ and ‘em’; secondly, to propose a Portuguese-Italian special dictionary, from its macrostructure to its microstructure. Based on Berruto (1979), Ilari and Geraldi (1985), Tamba-Mecz (2006), Oliveira (2012) and Regueiro Rodríguez (2013), we affirm that two or more words can be considered as synonymous in a language if they are interchangeable in a given context, without meaning alteration, in another. Once we assume as sine qua non condition for the elaboration of bilingual dictionaries the equivalence between languages, we delineate a prototype entry, which includes contexts of use in order to certify the occurrence of adverbial and prepositional phrases in study. For the development of this research, we consider 154 itens that are present in the Dicionário Houaiss: Sinônimos e Antônimos (2011). Concerning the search for the Italian equivalents, we observe the similarity in the description of adverbial and prepositional phrases in bilingual and monolingual Italian dictionaries, as well as in Brazilian dictionaries. Moreover, we legitimate the use of the equivalent phrase(s) by means of web search engines. Thus, we verify the correspondence of synonymic occurrences, or rather, if the contexts of use in source and target languages are the same. If, on one hand, our results demonstrate the presence of synonymic equivalents as adverbial and prepositional phrases, on the other hand, they also indicate the recurrence of adverbs ending in –mente functioning as synonyms of our research object, both in Portuguese and Italian (both inter- and intra-linguistically). For this reason, we highlight the importance of synonymy as a language phenomenon, especially for translators, since it can conduce them to the most appropriate equivalents in a particular context. Finally, having as an ulterior purpose the elaboration of a bilingual dictionary, we present 119 entries in which are included 99 adverbial phrases and 29 prepositional phrases composed of ‘a’, ‘de’ and ‘em’.
129

Princípios teóricos e metodológicos para a elaboração de um dicionário bilíngue de verbos português-alemão /

Pinto Junior, João Moraes. January 2009 (has links)
Orientador: Francisco da Silva Borba / Banca: Beatriz de Oliveira Longo / Banca: José Pedro Antunes / Banca: Gladis Maria de Barcellos Almeida / Banca: Masa Nomura / Resumo: O dicionário bilíngue é um dos principais instrumentos pedagógicos para o estudo de uma língua estrangeira. No nosso caso, pretende-se descrever os passos da base teórica para a elaboração de um dicionário bilíngue de verbos português-alemão tendo o português como língua de partida e o alemão como língua de chegada. O objetivo mais geral é apresentar um conjunto de princípios que devem orientar na organização de um dicionário bilíngue. O objetivo mais específico é conseguir um modelo para a montagem de um dicionário gramatical de verbos português-alemão. A proposta é organizar um dicionário de língua, sincrônico e portanto um dicionário de usos. É um dicionário que leva em conta a frequência relativa dos itens selecionados e é preferencialmente um dicionário de equivalências lexicais. Optou-se por uma teoria gramatical que permite a descrição prévia do item - o verbo - na língua de partida buscando as correspondentes construções na língua de chegada - o alemão. Organizou-se a macroestrutura desse dicionário pelo critério de ocorrências num corpus sediado no Laboratório de Lexicografia da Faculdade de Ciências e Letras - UNESP - Campus de Araraquara que no momento (2009) conta com duzentos milhões de ocorrências de palavras em textos escritos no português do Brasil. Os esquemas descritivos se assentam numa teoria gramatical específica - a valência verbal, que se torna, então, a responsável pela regularidade na organização dos verbetes. / Abstract: Bilingual dictionaries are one of the main pedagogical instruments for the study of a foreign language. This thesis seeks to describe the steps of the theoretical basis for the elaboration of a bilingual dictionary of Portuguese-German verbs, with Portuguese as the source language and German as the destination language. The more general objective is to present a set of principles that should guide the organization of a bilingual dictionary. The more specific objective, in turn, is to obtain a model for setting up a grammar dictionary of Portuguese-German verbs. The proposal is to organize a synchronic language dictionary and, hence, a dictionary of usage. This dictionary takes into account the relative frequency of the selected items and is preferentially a dictionary of lexical equivalence. A grammatical theory was chosen which allows for the prior description of the item - the verb - in the source language, seeking the corresponding constructions in the destination language - German. The nomenclature in this dictionary was organized according to the criterion of occurrences extracted from a corpus housed in the Laboratory of Lexicography at the Faculty of Sciences and Letters of UNESP at Araraquara, which currently (2009) contains two hundred million occurrences of words in texts written in Portuguese in Brazil. The descriptive schemes fit into a specific grammatical theory, i.e., verbal valency, which is thus responsible for the regularity of the organization of the entries. / Doutor
130

Análise de sentimentos em tíquetes para o suporte de TI / Sentiment Analysis in Tickets for IT Support

Blaz, Cássio Castaldi Araújo January 2017 (has links)
Análise de Sentimentos/Mineração de Opinião é adotada na engenharia de software para questões como usabilidade e sentimentos de desenvolvedores em projetos. Este trabalho propõe métodos para avaliar os sentimentos presentes em tíquetes abertos à área de suporte de TI. Há diversos tipos de tíquetes abertos à TI (e.g. infraestrutura, software), que envolvem erros, incidentes, requisições, etc. O maior desafio é automaticamente distinguir entre a necessidade em si, a qual é intrinsecamente negativa (por exemplo, a descrição de um erro), de um sentimento embutido na descrição. Nossa abordagem automaticamente cria um dicionário de domínio que contém termos que expressam sentimentos no contexto de TI, utilizados para filtrar expressões em um tíquete para análise de sentimentos. Nós criamos e avaliamos três métodos de classificação para calcular a polaridade em tíquetes. Nosso estudo utilizou 34.895 tíquetes de cinco organizações. Para polaridade, 2.333 tíquetes foram selecionados aleatoriamente para compor nosso gold standard. Nossos melhores resultados apresentam uma precisão e revocação de 82,83% e 88,42%, respectivamente, o que supera outras soluções de análise de sentimentos comparadas. De forma complementar, emoções em tíquetes foram estudadas considerando os modelos de Ekman e VAD. Um dos três métodos de classificação criados foi adaptado para também identificar emoções nos tíquetes. Possíveis correlações entre polaridade e emoções foram verificadas via regras de associação. Resultados correlacionam tíquetes positivos com valência e dominância altas e excitação baixa, além de presença de alegria e surpresa e ausência de medo. Tíquetes negativos correlacionam com valência, excitação e dominância neutras, além de ausência de alegria e presença de medo. Contudo os resultados para a polaridade negativa não são precisos. / Sentiment Analysis/Opinion Mining has been adopted in software engineering for problems such as software usability and sentiment of developers in projects. This work proposes methods to evaluate the sentiment contained in tickets for IT (Information Technology) support. IT tickets are broad in coverage (e.g. infrastructure, software), and involve errors, incidents, requests, etc. The main challenge is to automatically distinguish between factual information, which is intrinsically negative (e.g. error description), from the sentiment embedded in the description. Our approach is to automatically create a domain dictionary that contains terms with sentiment in IT context, used to filter terms in tickets for sentiment analysis. We created and evaluate three classification methods for calculating the polarity of terms in tickets. Our study was developed using 34,895 tickets from five organizations. For polarity, we randomly selected 2.333 tickets to compose a gold standard. Our best results display an average precision and recall of 82.83% and 88.42%, respectively, which outperforms the compared sentiment analysis solutions. Complementarily, emotions in tickets were studied considering the models of Ekman and VAD. One of the three classification methods created has been adapted to also identify emotions in the tickets. Possible correlations between polarity and emotions were verified through association rules. Results correlate positive tickets with valence and dominance high and low excitation, besides presence of joy and surprise and absence of fear. Negative tickets correlate with valence, neutral excitement and dominance, besides absence of joy and presence of fear. However the results for negative polarity are not accurate.

Page generated in 0.0951 seconds