1 |
Escansão automática de versos em portuguêsMittmann, Adiel January 2016 (has links)
Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2016. / Made available in DSpace on 2017-05-23T04:11:41Z (GMT). No. of bitstreams: 1
345441.pdf: 1702787 bytes, checksum: 51f063c1d010c581cc86f9b07d5993a4 (MD5)
Previous issue date: 2016 / Esta tese apresenta o Aoidos, um sistema capaz de escandir versos em português. Os versos passíveis de serem analisados pelo sistema são os métricos, aqueles para os quais o número de sílabas constitui uma característica fundamental. A partir de um poema, o sistema processa os versos palavra a palavra, encontrando sua sílaba tônica e realizando a divisão silábica. O sistema concatena então todas as palavras de um verso numa só unidade e obtém uma lista de possíveis pronúncias para o verso através da aplicação de diversas regras, realizando ou não fenômenos como sinéreses e sinalefas. As pronúncias encontradas para todos os versos de um poema são analisadas de forma conjunta para determinar a métrica do poema, ou seja, a quantidade de sílabas que cada um dos versos possui. Agrupando os versos de cada tamanho, o sistema encontra os padrões rítmicos e, dentre as pronúncias de cada verso, escolhe aquela que mais adere ao ritmo. Para validar o sistema, foram processados dez corpora compostos por autores diferentes e produzidos entre os séculos XVI e XX, somando mais de 100.000 versos. Através da conferência manual de 1.080 versos aleatoriamente selecionados (1% do total), averiguou-se que a taxa média de acerto do sistema foi de 99,0%, variando entre os corpora de 97,5 a 100,0%.<br> / Abstract : This thesis presents a system capable of scanning verses in Portuguese. The system aims to scan metrical verses, those for which the number of syllables is a fundamental feature. Given a poem, the system first processes individual words, finding the position of their stress and dividing them into syllables. Words are then concatenated and the system finds a list of possible pronunciations for each verse, using a set of rules in order to apply phenomena such as synaeresis or synaloepha. The set of pronunciations for all verses in the poem are analyzed together in order to determine the poem?s meter, that is, the number of syllables its verses should contain. By grouping together all verses of a given length, the system finds rhythmical patterns and chooses, for each verse, the pronunciation that most closely matches the pattern. In order to validate the system, it was applied to ten corpora, from different authors and whose production dates range from the 16th to the 20th century, for a total of more than 100,000 verses. By manually assessing the correctness of the scansion produced for 1.080 randomly selected verses (1% of the total), the accuracy rate was ascertained to be 99,0%, ranging from 97,5 to 100,0% among the different corpora.
|
2 |
UMA ABORDAGEM EM ANÁLISE DE CLUSTER PARA PROBLEMAS DE AGRUPAMENTO DE ÁREAS FLORESTAIS.MOURA, A. A. 27 September 2004 (has links)
Made available in DSpace on 2016-08-29T15:33:16Z (GMT). No. of bitstreams: 1
tese_4602_.pdf: 978024 bytes, checksum: 68d510098defbd15aab47bc0b03dd189 (MD5)
Previous issue date: 2004-09-27 / Organizar a produção de materiais de diferentes tipos para garantir o suprimento deles no momento necessário e na quantidade desejada é uma tarefa complicada. Para empresas do ramo de celulose, o
fornecimento de madeiras para a produção na fábrica é um bom exemplo. Nesse contexto, saber onde estão localizados os diferentes tipos de madeira e quando as árvores podem ser cortadas é
muito importante. Com essa informação, um analista de planejamento deve ser capaz de organizar as áreas plantadas em grupos para indicar quando e quais áreas serão cortadas no decorrer de um
período. Com o objetivo de auxiliar essa análise, buscou-se uma solução para o problema de agrupamento de áreas florestais baseado na existência de grupos homogêneos na área total analisada. Dentro das abordagens em Análise de Cluster, desenvolveu-se uma ferramenta que implementa o algoritmo HCS (Highly Connected Subgraphs) e comparou-se o resultado com uma simulação do processamento realizado por um analista humano. O algoritmo conseguiu soluções
mais detalhadas e homogêneas do que a simulação e, com algumas adaptações ou apoio de outras ferramentas, pode gerar resultados de forma mais rápida para fornecer soluções para grandes volumes de dados em tempo hábil.
|
3 |
Um Algoritmo Baseado em Técnicas de Agrupamento para Detecção de Anomalias em Séries Temporais Utilizando a Distância de MahalanobisNASCIMENTO, E. G. S. 24 August 2012 (has links)
Made available in DSpace on 2016-08-29T15:33:18Z (GMT). No. of bitstreams: 1
tese_5950_.pdf: 1565644 bytes, checksum: 43f4342be309a5412d660526cd99eb64 (MD5)
Previous issue date: 2012-08-24 / Este trabalho propõe um algoritmo para a detecção de anomalias em séries temporais, baseado em técnicas de agrupamento, utilizando a função de distância de Mahalanobis. Após uma revisão das principais e mais recentes contribuições feitas neste campo de pesquisa, uma descrição formal e detalhada do algoritmo é apresentada, seguida por uma discussão sobre como configurar seus parâmetros. A fim de avaliar sua efetividade, ele foi aplicado a casos reais, e seus resultados foram comparados com outra técnica aplicável ao mesmo problema. Os resultados obtidos sugerem que esta proposta pode ser aplicada com sucesso na detecção de anomalias em séries temporais.
|
4 |
Identificação e delimitação de relações associativas em tesauros: um estudo de caso na área do direito do trabalhoMarroni, Gilza Núria Brandão 05 1900 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração, Contabilidade e Ciência da Informação e Documentação, Departamento de Ciência da Informação e Documentação, 2006. / Submitted by Suelen Silva dos Santos (suelenunb@yahoo.com.br) on 2010-06-07T16:57:12Z
No. of bitstreams: 1
2006_Gilza Núria Brandão Marroni.pdf: 491682 bytes, checksum: d3fb1874e171a64a2a9568f2ad096396 (MD5) / Approved for entry into archive by Daniel Ribeiro(daniel@bce.unb.br) on 2010-06-07T18:43:08Z (GMT) No. of bitstreams: 1
2006_Gilza Núria Brandão Marroni.pdf: 491682 bytes, checksum: d3fb1874e171a64a2a9568f2ad096396 (MD5) / Made available in DSpace on 2010-06-07T18:43:08Z (GMT). No. of bitstreams: 1
2006_Gilza Núria Brandão Marroni.pdf: 491682 bytes, checksum: d3fb1874e171a64a2a9568f2ad096396 (MD5)
Previous issue date: 2006-05 / Pesquisa que objetiva identificar e delimitar as relações associativas em tesauros, através da investigação de suas características conceituais. Tema pouco explorado pela literatura e manuais das áreas da Biblioteconomia e da Ciência da Informação, justifica-se pelo fato desse tipo de relacionamento ser empregado, na maioria das vezes, de forma subjetiva, resultando na limitação do tesauro como ferramenta de indexação, o que compromete sua utilização por sistemas inteligentes de busca. A metodologia do trabalho constitui-se de três etapas: a) identificação, na literatura e manuais, das recomendações dos autores acerca dos parâmetros conceituais que permitem reconhecer as relações associativas; b) realização de um estudo de caso na área do Direito do Trabalho, que analisa esse tipo de relacionamento em descritores extraídos dos tesauros jurídicos da Justiça Federal e do Senado Federal; c) comparação entre os apontamentos teóricos e as aplicações constatadas no estudo de caso, a fim de elencar os grupos conceituais identificados. O resultado da pesquisa aponta para a existência de diferentes tipos de relações associativas que, embora guardem um princípio comum, são passíveis de desmembramento, o que lhes permite uma melhor explicitação. _________________________________________________________________________________ ABSTRACT / This research has the objective of identifying and delimitating the associative relationships in thesauri, through the investigation of their conceptual characteristics. The theme is little explored in the literature and in the manuals of both Library Science and Science of Information and its importance lies in the fact that this kind of relationship is used, most times, in a subjective way, resulting in the limitation of the thesaurus as an indexation tool, which compromises its utilization by intelligent search systems. The methodology consists in three phases: a) identification, in the literature and in the manuals, of the authors´ recommendations about the conceptual parameters that lead to the recognition of the associative relationships ; b) conduction of a case study in the field of Labor Law, that analyses this sort of relationship in descriptors extracted from juridical thesauri of Federal Justice and Federal Senate; c) comparison between the theoretical issues and the applications of the case study, in order to enumerate the conceptual groups identified. The result of the research points to the existence of different sorts of associative relationships that, in spite of having a common principle, are liable to have ramifications, which allows them to have a better definition.
|
5 |
Rebolar e requebrar, algo a mais do que dançar? : um estudo experimental sobre o acesso visual de verbos prefixados e pseudo-prefixados na lingua portuguesaRuiz, Luciana Garcia 23 February 2001 (has links)
Orientador: Edson Françoso / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-07-29T00:51:01Z (GMT). No. of bitstreams: 1
Ruiz_LucianaGarcia_M.pdf: 3329902 bytes, checksum: 8d356aaf3e6c91dd4989147ba49880c5 (MD5)
Previous issue date: 2001 / Resumo: O propósito desta dissertação é estudar, por via de um enfoque experimental, o acesso lexical de palavras morfologicamente complexas, apresentadas visualmente. A questão de interesse central relaciona-se a como as palavras morfologicamente complexas ¿ em especial, os verbos prefixados - estão representadas: as unidades de processamento correspondem à palavra integral, ou elas correspondem às unidades morfológicas constituintes (base e afixos)? Inicialmente procedeu-se a uma revisão bibliográfica, e em seguida uma série de experimentos foi planejada. Esse programa experimental foi parcialmente implementado, constituindo-se de dois experimentos (ao que se sabe, inéditos em Língua Portuguesa). No primeiro deles, replicou-se resultados tradicionais na literatura relativos à existência de efeito de priming semântico entre pares de palavras morfologicamente simples. Já no segundo experimento, trabalhamos o efeito de priming semântico com duas classes de verbos prefixados, os verbos prefixados transparentes e os pseudo-prefixados. No caso destas últimas, existe uma aparente prefixação formal, mas de fato esta palavra é uma outra unidade lexical semanticamente distante desta unidade analisada (por exemplo, requebrar nada tem a ver com quebrar). A comparação do comportamento dos sujeitos experimentais, numa tarefa de decisão lexical, frente a essas duas condições, permite estabelecer uma distinção no processamento de palavras que pode refletir diferenças de representação. Assim, conclui-se que as informações morfológicas têm um papel importante no acesso lexical / Abstract: The aim of this dissertation is to experimentally study the lexical access of morphologically complex words, presented visually. The main question relates to how morphologically complex words ¿ especially prefixed verbs - are represented: are processing units in correspondence to a whole-word representation, or are they in correspondence to morphological constituents (base and affixes)? Firstly, a literature review was conducted, and next a series of experiments was designed. Such an experimental program was partially implemented, and two experiments were run (to the best of our knowledge, none of them has ever been carried out in Portuguese). In the first, it was shown that semantic priming obtains between morphologically simple pairs; this is a common result in the psycholinguistic literature. In the second, semantic priming was employed to study the processing of two classes of morphologically complex verbs: those that are derivationally transparent, and those that are pseudo-prefixed. The latter are apparently the result of prefixation, but in fact form semantically different words (for instance, reserve cannot be put in correspondence with serve). The comparison of the subjects' responses on these two conditions, in a lexical decision task, allows one to determine processing differences related to differences in access representation. Thus, morphological information is shown to play a most important role in lexical access / Mestrado / Mestre em Linguística
|
6 |
O famigerado SE : uma analise sincronica e diacronica das construções com SE apassivador e indeterminadorNunes, Jairo Morais, 1966- 15 February 1990 (has links)
Orientador: Fernando Tarallo / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-07-14T03:50:56Z (GMT). No. of bitstreams: 1
Nunes_JairoMorais_M.pdf: 4106178 bytes, checksum: e88bf7a1860bc135d4db9f467b1806f6 (MD5)
Previous issue date: 1990 / Resumo: Este estudo visa a analisar sincrônica e diacronicamente construções com os denominados se apassivador, como (1); e se indeterminador, como (2) .... Observação: O resumo, na íntegra, poderá ser visualizado no texto completo da tese digital / Abstract: The purpose of this study is to provide a synchronic and diachronic analysis of the so called passive and impersonal se, respectively exemplified in (1) and (2)... Note: The complete abstract is available with the full electronic digital thesis or dissertations / Mestrado / Linguistica / Mestre em Linguística
|
7 |
Análise do retificador trifásico em ponte com capacitores em série nos ramos CA. / Sem título em inglês.Ferreira Junior, José Alberto Fernandes 14 December 2007 (has links)
Retificadores com comutação capacitiva são conversores comutados pela rede que têm capacitâncias em série com as indutâncias nos ramos CA. Essas capacitâncias melhoram a regulação de tensão do retificador e possibilitam sua operação com ângulos de disparo negativos. Este trabalho apresenta o equacionamento da comutação capacitiva e da característica tensão versus corrente no lado CC do retificador, assumindo simetria do conversor e alisamento perfeito da corrente CC, e uma análise da faixa de valores de capacitâncias que viabilizam a sua operação. / Rectifiers with capacitive commutation are line-commutated converters that have capacitances in series with the inductances in the AC branches. These capacitances improve the rectifier\'s voltage regulation and enable converter operation with negative firing angles. This work presents the mathematical formulation of the capacitive commutation and of the characteristic of voltage versus current on the rectifier\'s DC side, assuming converter symmetry, perfect smoothness of DC current, and a range of values of capacitances that make its operation feasible.
|
8 |
Modelo econômico-operacional para o dimensionamento do transporte intermodal de cargas pela Hidrovia Tietê-Paraná. / Sem título em inglêsMendes, André Bergsten 11 June 1999 (has links)
A Hidrovia Tietê-Paraná é um complexo hidroviário que atravessa a região sudeste do Brasil e constitui um meio de transporte alternativo ainda pouco explorado, que interliga 5 grandes estados brasileiros, além de ser um elo de ligação com os países do MERCOSUL. O gabarito da hidrovia limita barcaças a dimensões principais de 60m x 11m x 2,5m, mas que acopladas formam comboios com capacidade de até 4500t. Estas embarcações podem transportar cargas de granel sólido (commodities agrícolas) e de granel líquido (combustíveis) no longo curso, areia e cana-de-açúcar em curtas distâncias, sendo que experiências com carga geral também foram feitas. Devido ao fato dos centros produtores e dos centros consumidores estarem distantes da hidrovia, a eficiência do transporte hidroviário é altamente dependente da eficiência do sistema logístico em que está inserido. Desta forma, tanto os sistemas de transporte nas pontas de origem e destino (rodoviário e ferroviário), como também a armazenagem nos terminais intermodais devem estar operando de maneira eficaz e balanceada para tornar este sistema competitivo. O objetivo desta pesquisa é dar uma resposta eficiente e realista ao problema de dimensionar um sistema de transporte utilizando modais combinados. Desta forma, dado uma origem e um destino, um tipo de carga, sua demanda mensal, os modais de transporte utilizados, busca-se dimensionar cada parte deste sistema intermodal, fornecendo como resposta a configuração de frota de caminhões e o número de viagens necessárias, o número de composições ferroviárias e a frequência de requisição das mesmas, a frota de embarcações fluviais e a capacidade dos terminais de carga. O dimensionamento é focado na solução que atende à demanda a um mínimo custo. Desta forma, os aspectos econômicos de cada operação também são considerados. Para resolver este problema complexo, utilizou-se a técnica de simulação probabilística, pois a mesma permite modelar com maior precisão a interação entre os diversos subsistemas, além de poder representar os fenômenos aleatórios presentes. A simulação também é uma boa ferramenta para lidar com os congestionamentos observados na passagem em eclusas, canais e na utilização de berços dos terminais. O sistema consiste de um módulo de entrada de dados, no qual o usuário define o cenário padrão que deverá ser simulado. O modelo computacional foi desenvolvido na linguagem de simulação ARENA, o qual conta com uma rica interface gráfica, módulos de análise de dados (input and output analyser), ferramentas para construção de templates personalizados, programação complementada por recursos do Visual Basic for Applications e um gerenciador de cenários que permite programar diversas rodadas consecutivas do modelo. O modelo foi aplicado à Hidrovia Tietê-Paraná e aos modais a ela associados, e permitiu dimensionar um sistema intermodal com menor custo total do que o transporte de grãos exclusivamente rodoviário. / Tietê-Paraná Waterway is a complex inland navigation system that crosses the southeast area of Brazil, and it is an alternative mean of transportation still not very explored, that connects 5 great Brazilian states, besides being a connection link with the countries of MERCOSUL. The waterway dimensions limits the barges to 60m x 11m x 2,5m, but when coupled, form convoys with capacity of up to 4500 tons. These vessels transport dry bulk (agricultural commodities) and wet bulk (fuels) in the long course, and sand and sugar-cane in short distances. Due to the fact of the producing centers and of the consuming centers are distant from the waterway, the efficiency of the waterway transportation is highly dependent of the efficiency of the whole logistics system. Therefore the transport systems in the origin and destiny points (road and rail transport), as well as the storage in the intermodal terminals should be designed and operated in an effective and balanced way to turn a competitive system. The objective of this current research is to give a fast and realistic answer to the design problem of a transportation system using different combined modals. Therefore, given an origin and a destiny, a cargo type, its monthly demand and the modals of transportation, the model would design each part of this intermodal system, giving as a response the configuration of the fleet of trucks and the number of necessary trips, the number of rail compositions and their frequency of requisition, the fleet of vessels and the storage capacity of the terminals. The system design is focused in the solution that attends the monthly demand at a minimum cost. Therefore the economical aspects of each operation are also considered.To solve this complex problem, the technique of probabilistic simulation was used, because it allows to model with larger precision the interaction among the several subsystems, besides allowing to represent the randomness of the system. Simulation is also an appropriate tool to represent the traffic jams in the locks and in the passage through the channels and also to lead with the occupation of terminal\'s berths. The system consists of a module of data entrance, in which the user defines the standard scenario that should be simulated. The computational model was developed using the simulation language ARENA, that has a rich graphic interface, modules of data analysis (input and output analyzer), tools for construction of customized templates, programming complemented by resources of Visual Basic for Applications and a scenario manager that allows to program several serial runs of the model.
|
9 |
Um método para incrementar a extração automática de palavras-chave de textos baseado na expansão do conjunto de treinamento com termos candidatos inferidos a partir de modelos de conhecimento / A method to increment the automatic keyphrases extraction of texts based on the expansion of the training set with candidate terms inferred from knowledge models (Inglês)Silveira, Francisca Raquel de Vasconcelos 18 April 2018 (has links)
Made available in DSpace on 2019-03-30T00:06:02Z (GMT). No. of bitstreams: 0
Previous issue date: 2018-04-18 / Extraction keyphrase systems traditionally use classification algorithms and do not consider the fact that part of the keyphrases may not be found in the text, reducing the accuracy of such algorithms a priori. In this work, it is proposed to improve the accuracy of these systems, expanding the training set used by classification algorithms with terms that are not in the text (not-in-text terms) inferred from knowledge models such as knowledge bases and distributional semantics. The basic assumption of the thesis is that not-in-text terms have a semantic relationship with terms that are in the text. For capturing and representing this relationship, we have defined three new heuristics to characterize the relevance of the not-in-text terms to be keyphrases. The first heuristic have the objective of capturing if the semantic relatedness of a not-in-text term (in relation to the other terms in the text) is higher than the semantic relatedness of the textual term from which it was inferred. The intuition is that terms that are more semantically related to other terms in the document are more likely to represent the text. The second feature refers to the power of discrimination of the inferred not-in-text term. The intuition behind this is that good candidates to be a keyphrase are those that are deduced from various textual terms in a specific document and that are not often deduced in other documents. The other feature represents the descriptive strength of a not-in-text candidate. We argue that not-in-text keyphrases must have a strong semantic relationship with the text and that the power of this semantic relationship can be measured in a similar way as popular metrics like TFxIDF. The method proposed in this work was compared with state-of-the-art systems using seven corpora and the results show that it has significantly improved automatic keyphrase extraction, dealing with the limitation of extracting keyphrases absent of the text.
Keywords: Keyphrases extraction. Keyphrases absent from the text. Deduction of keyphrases. Knowledge models. / Sistemas de extração de palavras-chave tradicionalmente usam algoritmos de classificação e não consideram o fato que parte das palavras-chave podem não ser encontradas no texto, reduzindo a acurácia desses algoritmos. Neste trabalho, propõe-se melhorar a acurácia desses sistemas, expandindo o conjunto de treinamento usado pelos algoritmos de classificação com termos que não estão no texto (termos não-texto) inferidos de modelos de conhecimento, tais como bases de conhecimento e semântica distributiva. A suposição básica da tese é que termos não-texto têm um relacionamento semântico com os termos que estão no texto. Para capturar e representar esse relacionamento, foram definidas três novas heurísticas para caracterizar a relevância dos termos não-texto a serem palavras-chave. A primeira heurística tem o objetivo de capturar se o relacionamento semântico de um termo não-texto (em relação aos outros termos no texto) é maior que o relacionamento semântico do termo do texto que o inferiu. A intuição é que termos que são mais relacionados semanticamente a outros termos no documento são mais prováveis para representar o texto. A segunda heurística refere-se ao poder de discriminação do termo não-texto. A intuição é que bons candidatos para ser uma palavra-chave são aqueles que são deduzidos de vários termos do texto em um documento específico e que não são frequentemente deduzidos em outros documentos. A outra heurística representa o poder descritivo de um candidato não-texto. Argumenta-se que palavras-chave não-texto devem ter um forte relacionamento semântico com o texto e que o poder desse relacionamento semântico pode ser medido em uma maneira similar como métricas populares, tal como TFxIDF. O método proposto neste trabalho foi comparado com sistemas de estado-da-arte usando sete corpora e os resultados exibem que o método proposto tem melhorado significativamente a extração automática de palavras-chave em documentos desses corpora, lidando com a limitação de extrair palavras-chave ausentes do texto.
Palavras-chave: Extração de palavras-chave. Palavras-chave ausentes do texto. Dedução de palavras-chave. Modelos de conhecimento.
|
10 |
Análise do retificador trifásico em ponte com capacitores em série nos ramos CA. / Sem título em inglês.José Alberto Fernandes Ferreira Junior 14 December 2007 (has links)
Retificadores com comutação capacitiva são conversores comutados pela rede que têm capacitâncias em série com as indutâncias nos ramos CA. Essas capacitâncias melhoram a regulação de tensão do retificador e possibilitam sua operação com ângulos de disparo negativos. Este trabalho apresenta o equacionamento da comutação capacitiva e da característica tensão versus corrente no lado CC do retificador, assumindo simetria do conversor e alisamento perfeito da corrente CC, e uma análise da faixa de valores de capacitâncias que viabilizam a sua operação. / Rectifiers with capacitive commutation are line-commutated converters that have capacitances in series with the inductances in the AC branches. These capacitances improve the rectifier\'s voltage regulation and enable converter operation with negative firing angles. This work presents the mathematical formulation of the capacitive commutation and of the characteristic of voltage versus current on the rectifier\'s DC side, assuming converter symmetry, perfect smoothness of DC current, and a range of values of capacitances that make its operation feasible.
|
Page generated in 0.0527 seconds