Indução de léxicos bilíngües e regras para a tradução automática / Induction of translation lexicons and transfer rules for machine translation

Caseli, Helena de Medeiros 21 May 2007 (has links)
A Tradução Automática (TA) -- tradução de uma língua natural (fonte) para outra (alvo) por meio de programas de computador -- é uma tarefa árdua devido, principalmente, à necessidade de um conhecimento lingüístico aprofundado das duas (ou mais) línguas envolvidas para a construção de recursos, como gramáticas de tradução, dicionários bilíngües etc. A escassez de recursos lingüísticos, e mesmo a dificuldade em produzi-los, geralmente são fatores limitantes na atuação dos sistemas de TA, restringindo-os, por exemplo, quanto ao domínio de aplicação. Neste contexto, diversos métodos vêm sendo propostos com o intuito de gerar, automaticamente, conhecimento lingüístico a partir dos recursos multilíngües e, assim, tornar a construção de tradutores automáticos menos trabalhosa. O projeto ReTraTos, apresentado neste documento, é uma dessas propostas e visa à indução automática de léxicos bilíngües e de regras de tradução a partir de corpora paralelos etiquetados morfossintaticamente e alinhados lexicalmente para os pares de idiomas português--espanhol e português--inglês. O sistema proposto para a indução de regras de tradução apresenta uma abordagem inovadora na qual os exemplos de tradução são divididos em blocos de alinhamento e a indução é realizada para cada bloco, separadamente. Outro fator inovador do sistema de indução é uma filtragem mais elaborada das regras induzidas. Além dos sistemas de indução de léxicos bilíngües e de regras de tradução, implementou-se também um módulo de tradução automática para permitir a validação dos recursos induzidos. Os léxicos bilíngües foram avaliados intrinsecamente e os resultados obtidos estão de acordo com os relatados na literatura para essa área. As regras de tradução foram avaliadas direta e indiretamente por meio do módulo de TA e sua utilização trouxe um ganho na tradução palavra-a-palavra em todos os sentidos (fonte--alvo e alvo--fonte) para a tradução dos idiomas em estudo. As traduções geradas com os recursos induzidos no ReTraTos também foram comparadas às geradas por sistemas comerciais, apresentando melhores resultados para o par de línguas português--espanhol do que para o par português--inglês. / Machine Translation (MT) -- the translation of a natural (source) language into another (target) by means of computer programs -- is a hard task, mainly due to the need of deep linguistic knowledge about the two (or more) languages required to build resources such as translation grammars, bilingual dictionaries, etc. The scarcity of linguistic resources or even the difficulty to build them often limits the use of MT systems, for example, to certain application domains. In this context, several methods have been proposed aiming at generating linguistic knowledge automatically from multilingual resources, so that building translation tools becomes less hard. The ReTraTos project presented in this document is one of these proposals and aims at inducing translation lexicons and transfer rules automatically from PoS-tagged and lexically aligned translation examples for Portuguese--Spanish and Portuguese--English language pairs. The rule induction system brings forth a new approach, in which translation examples are split into alignment blocks and induction is performed for each type of block separately. Another new feature of this system is a more elaborate strategy for filtering the induced rules. Besides the translation lexicon and the transfer rule induction systems, we also implemented a MT module for validating the induced resources. The induced translation lexicons were evaluated intrinsically and the results obtained agree with those reported on the literature. The induced translation rules were evaluated directly and indirectly by the MT module, and improved the word-by-word translation in both directions (source--target and target--source) for the languages under study. The target sentences obtained by the induced resources were also compared to those generated by commercial systems, showing better results for Portuguese--Spanish than for Portuguese--English.

\"Constantes de acoplamento a partir das regras de soma da QCD\" / The coupling constants in QCD sum rules

Silva, Rômulo Rodrigues da 29 June 2005 (has links)
Usamos as regras de soma da QCD para obter a massa dos pentaquarks \" \'teta\' POT.+\"(1540) e \"\'ksi\' POT.--\" (1862), a largura de decaimento da \"\'teta\' POT.+\" e a constante de acoplamento e fator de forma presentes no vertice J/ \'psi\' \"DD POT.*\". No estudo dos pentaquarks, usamos dois tipos de campos interpolantes contendo dois diquarks altamente correlacionados. Obtemos as massas consistentes com os dados experimentais, porém esta regra de soma têm uma grande contribuição do contínuo e a OPE não é muito boa. Obtivemos uma largura de decaimento compatível com os valores experimentais desde que sejam subtraídos diagramas que representam a \" \'teta\' POT.+\" como um estado ligado K - n. No estudo do vértice vertice J/ \'psi\' \"DD POT.*\" calculamos o fator de forma e a constante de acoplamento, considerando três casos: D off-shell, \"D POT.*\" off-shell e J/ \'psi\' off-shell. A constante de acoplamento é a mesma nesses três casos, porém o fator de forma depende da escolha da partícula off-shell, onde para a J/ \'psi\' off-shell o fator de forma é bem mais duro que o fator de forma obtido para os outros casos. Também comparamos os nossos resultados com outros métodos: o modelo de quark méson constituintes e o modelo de quarks relativísticos constituintes / We use the QCD sum rules to obtain the masses of the pentaquarks _+(1540) and _−−(1862), _+ decay width and the coupling constant and the form factor for the J/ DD* vertex.In the study of the pentaquarks, we use two kinds of interpolating fields, containing two highly correlated diquarks. We get the masses in a good agreement with the experimental value, but this sum rule has a large continuuum contribution and the OPE convergence is not so good. We get the decay width compatible with the experimental value, since we subtract the diagrams that represent _+ as a K − n bound state. In the study of J/ DD* vertex, we calculate the form factor and the coupling constant considering three cases: D off-shell, D* off-shell and J/ off-shell. The coupling constant is the same in those three cases, however the form factor depends on the choice of the particle off-shell, where for the J/ off-shell the form factor is much harder than the form factor obtained for the other cases. We also compare our results with other methods: the constituent quark meson model and the relativistic constituent quark model.

A importância das regras e do gameplay no envolvimento do jogador de videogame / The importance of rules and gameplay on the engagement of the videogame player

Santos, Hélia Vannucchi de Almeida 16 April 2010 (has links)
Este trabalho tem como intuito trazer luz a elementos que possibilitem o claro entendimento dos conceitos responsáveis pelo envolvimento do jogador com o jogo, em especial, as regras e o gameplay, que consideramos como primordiais para a construção de sua experiência de jogar. Neste intento, partimos do entendimento do conceito de jogo, buscando identificar os elementos que são importantes para que um jogo se constitua como tal, derivando os que consideramos ser essenciais ao jogo. Discutimos os conceitos de regras e gameplay, seus tipos e elementos, e as relações e as influências que se estabelecem entre eles. Observamos que quando o jogo apresenta um desafio ao jogador, que o coloca imerso no ambiente do jogo, a manipulação das mecânicas e da combinação das regras lhe permitirá experimentar a emergência de novos elementos, decorrentes de sua agência, e capazes de lhe porporcionar uma experiência gratificante e prazerosa. / The work is concerned primarily to point out some elements that can clarify the understanding of the concepts responsible by the player engagement with the game; the rules and the gameplay are the elements, considered as principal, to construct the experience of playing. Comprehending the concept of the game, we tried to identify the elements responsible for that. The rules and the gameplay concepts, types and elements, and their interrelations have been discussed. The challenge proposed by the game can create an immersive condition to the player; the mechanics manipulation and the rules combination will evoke the emergence of new elements and turn this experimentation enjoyable and grateful.

Mineração de regras de associação em dados georreferenciados / Mining of association rules in geographic data

Pivato, Marina Abichabki 21 March 2006 (has links)
Sistemas de informações geográficas permitem armazenar, manipular e armazenar, manipular e analisar dados espaciais e aspectos descritivos desses dados. A análise de dados espaciais pode ser realizada por meio de técnicas de extração de regras de associação, ou seja, regras que descrevem relacionamentos entre os dados. Porém, a mineração de regras de associação não considera as relações topológicas existentes entre dados georreferenciados. Para solucionar esse problema, Koperski and Han (1995) e Malerba et al. (2001) propuseram um processo de extração de regras integrado ao algoritmo de mineração e utilizavam predicados lógicos para representar as regras. Como alternativa a essa solução, este trabalho propõe pré-processar os dados referenciados para encontrar relações topológicas em separado e aplicar um algoritmo de mineração de regras de associação disponí?vel pela comunidade acadêmica. As regras geradas devem apresentar características descritivas dos dados e relações topológicas. Para atingir esse objetivo foi especificado um processo de extração de regras em dados georreferenciados e implementado um módulo de pré-processamento que extrai relações topológicas. O módulo foi avaliado por meio de um estudo de caso utilizando o sistema de informação geográfica da cidade de Jaboticabal, no contexto de planejamento urbano. As regras encontradas foram analisadas por um especialista utilizando as medidas de suporte e confiança. Além disso, uma análise sobre o tempo de processamento e consumo de memória para encontrar as relações topológicas foi realizada, mostrando que é possível extrair padrões utilizando o processo e o módulo proposto neste trabalho. / Geographic information systems are used to store, manipulate, and analyze spatial data and its descriptive aspects. Spatial data analysis can be done by searching association rules that describe relationships between the data. However, georeferenced data present topological relations unknown to traditional mining association rule algorithms. To solve this problem, Koperski and Han (1995) and Malerba et al. (2001) proposed a topological relation extraction process integrated to a mining association rule algorithm. This process requires all data to be translated as logical predicates. As an alternative to this solution, this work proposes to break down this process by pre-processing the georeferenced data to find topological relations, then executing traditional mining association rule algorithms. The resulting rules must present descriptive characteristics of the data and topological relations. To reach this objective, a process of rule extraction in georeferenced data was specified, in addition to a pre-processing module implementation. This module was evaluated by using a case study that uses a geographic information system of the city of Jaboticabal, in the context of urban planning. The generated rules were analyzed by a specialist using the measures of support and confidence. In addition, an analysis regarding the processing time and memory consumption was provided to find the topological relations, which shows that it is possible to extract the patterns with the proposed process and module.

Pós-processamento de regras de associação via redes e propagação de rótulos / Post-processing association rules using networks and label propagation

Padua, Renan de 27 February 2015 (has links)
Dentre as técnicas de mineração existentes encontra-se a associação, responsável por identificar relações que ocorrem no conjunto de dados. Embora a associação seja uma das técnicas mais utilizadas, a quantidade de padrões extraídos pode vir a sobrecarregar o usuário de tal maneira que encontrar algo interessante dentre a imensidão de padrões obtidos passa a ser um novo desafio. Para solucionar esse problema, uma grande parte dos trabalhos relacionados à associação está voltada a etapa de pós-processamento. Esses trabalhos geralmente propõem abordagens de pós-processamento que visam, segundo determinada estratégia, facilitar a busca pelos padrões interessantes ao domínio. Nos últimos anos, essas abordagens têm incluído no processo o conhecimento e/ou interesse do usuário sobre o domínio. Contudo, nas abordagens atualmente existentes, o usuário deve, por meio de algum formalismo descrever explicitamente seu conhecimento e/ou interesse, requerendo do usuário um tempo considerável, podendo levar, inclusive, a especificações incompletas e/ou incorretas. Além disso, na maioria das vezes, o usuário não tem ideia do que é provavelmente interessante, nem a partir de quais relações iniciar a busca. Nota-se, portanto, que um dos desafios dessas abordagens é considerar o conhecimento e/ou interesse do usuário. Além disso, é necessário considerar também o número de regras que o usuário analisará. A análise de regras feita por um especialista é custosa e, na maioria dos casos, o usuário quer explorar as regras geradas sem limitar a exploração ao conhecimento que ele já possui. Portanto, é importante que o usuário avalie o menor número de regras possível e, com base nessa avaliação, abordagens de pós-processamento consigam o auxiliar na busca pelas regras que ele poderá considerar interessante. Para tanto, é proposto neste trabalho que o pós-processamento seja tratado como um problema de classificação semissupervisionada transdutiva, uma vez que permite que o usuário rotule, considerando classes pré-definidas (por exemplo, \"Interessante\" ou \"Não Interessante\"), apenas algumas regras do conjunto a ser explorado para que todas as outras regras sejam automaticamente rotuladas. Além disso, por meio da definição dos rótulos de algumas regras, é possível capturar implicitamente o conhecimento e/ou interesse do usuário sobre o domínio. Para tanto, é necessário que as regras sejam modeladas de maneira a permitir: (a) selecionar as regras a serem rotuladas pelo usuário a fim de capturar implicitamente seu conhecimento e/ou interesse; (b) propagar os rótulos das regras já classificadas pelo usuário a todas as outras regras não rotuladas. Desse modo, neste trabalho, as regras foram modeladas via redes, uma vez que: (i) uma vasta quantidade de medidas de exploração de redes pode ser utilizada, em conjunto com as informações fornecidas pelo usuário, a fim de viabilizar o item (a); (ii) algoritmos de propagação de rótulos podem ser utilizados a fim de viabilizar o item (b). Diante do apresentado, ressalta-se que as contribuições deste trabalho estão na capacidade de se extrair o conhecimento e/ou interesse do usuário de acordo com as características da base de dados e direcionar sua exploração sem a necessidade de se definir previamente o que será explorado. Além disso, os resultados obtidos demonstram a capacidade da PARLP em direcionar o usuário para o conhecimento considerado interessante, reduzindo, para tanto, a quantidade de regras a serem exploradas. Por fim, este trabalho contribui também para demonstrar que é possível tratar o pós-processamento de regras de associação como um problema de propagação de rótulos. / One of the existing data mining techniques is association rules, responsible for identifying relationships that occur in the data set. Although the association rule is one of the most widely used techniques, the amount of extracted patterns can overload the user in such a way that finding interesting patterns among the large amount of obtained patterns becomes a challenge. To solve this problem, a large part of the association-related work is focused on the post-processing step. These works generally propose a post-processing approaches that, according to a certain strategy, aims facilitating the search for interesting patterns. Nowadays, approaches have included the user knowledge in the domain and / or interests on the process. However, in the current existing approaches, the user knowledge and/or interest must be explicitly described by some formalism, requiring a considerable time and may even lead to incomplete and / or incorrect specifications. In addition, the user has no idea what probably is interesting or which patterns to begin the searching. Notice that one of the challenges of these approaches is to consider the knowledge and / or user interest. In addition, consider the number of rules the user will examine is necessary. The analysis of the rules by an expert is expensive and, in most cases, the user wants to explore the rules generated without limiting exploration to the knowledge he already has. Therefore, the user evaluate the fewest amount of rules possible is important and, based on this assessment, the post-processing approaches be able to assist in the search for the rules that he may consider interesting. So, in this work is proposed that the post-processing is treated as a transductive semi supervised classification problem, since it allows the user to label some rules based on two predefined classes (e.g. \"interesting\"or \"not interesting\"), in a way that just a small amount of the rule set needs to be explored and all other association rules are automatically labeled. Furthermore, you can implicitly capture the knowledge and / or user interest in the domain by labeling some rules. Thus, the rules need to be modeled to allow: (a) select the rules to be labeled by the user to implicitly capture their knowledge and / or interest; (b) propagate the rules\' labels classified by the user to all not labeled rules. To do so, the rules were modeled via networks in this work, due to: (i) a large amount of network measures can be used in conjunction with the information provided by the user, to make item (a) possible; (ii) label propagation algorithms can be used in order to make item (b) possible. Therefore, we highlight that the contributions of this work are the ability to extract knowledge and / or user interest according to database characteristics and direct the user exploration without previously defining what will be explored. In addition, the results demonstrate that the proposed approach is able to direct the user to the knowledge considered interesting, reducing the amount of rules to be explored. Finally, this work also contributes to demonstrate that treat the post-processing of association rules as a problem of propagation of labels is possible.

Data mining em banco de dados de eletrocardiograma / Data mining in electrocardiogram databases

Ferreira, José Alves 23 April 2014 (has links)
Neste estudo, foi proposta a exploração de um banco de dados, com informações de exames de eletrocardiogramas (ECG), utilizado pelo sistema denominado Tele-ECG do Instituto Dante Pazzanese de Cardiologia, aplicando a técnica de data mining (mineração de dados) para encontrar padrões que colaborem, no futuro, para a aquisição de conhecimento na análise de eletrocardiograma. A metodologia proposta permite que, com a utilização de data mining, investiguem-se dados à procura de padrões sem a utilização do traçado do ECG. Três pacotes de software (Weka, Orange e R-Project) do tipo open source foram utilizados, contendo, cada um deles, um conjunto de implementações algorítmicas e de diversas técnicas de data mining, além de serem softwares de domínio público. Regras conhecidas foram encontradas (confirmadas pelo especialista médico em análise de eletrocardiograma), evidenciando a validade dessa metodologia. / In this study, the exploration of electrocardiograms (ECG) databases, obtained from a Tele-ECG System of Dante Pazzanese Institute of Cardiology, has been proposed, applying the technique of data mining to find patterns that could collaborate, in the future, for the acquisition of knowledge in the analysis of electrocardiograms. The proposed method was to investigate the data looking for patterns without the use of the ECG traces. Three Data-mining open source software packages (Weka, Orange and R - Project) were used, containing, each one, a set of algorithmic implementations and various data mining techniques, as well as being a public domain software. Known rules were found (confirmed by medical experts in electrocardiogram analysis), showing the validity of the methodology.

"Pós-processamento de regras de associação" / Post-processing of association rules

Melanda, Edson Augusto 30 November 2004 (has links)
A demanda por métodos de análise e descoberta de conhecimento em grandes bases de dados tem fortalecido a pesquisa em Mineração de Dados. Dentre as tarefas associadas a essa área, tem-se Regras de Associação. Vários algoritmos foram propostos para tratamento de Regras de Associação, que geralmente tˆem como resultado um elevado número de regras, tornando o Pós-processamento do conhecimento uma etapa bastante complexa e desafiadora. Existem medidas para auxiliar essa etapa de avaliação de regras, porém existem lacunas referentes a inexistência de um método intuitivo para priorizar e selecionar regras. Além disso, não é possível encontrar metodologias específicas para seleção de regras considerando mais de uma medida simultaneamente. Esta tese tem como objetivo a proposição, desenvolvimento e implementação de uma metodologia para o Pós-processamento de Regras de Associação. Na metodologia proposta, pequenos grupos de regras identificados como potencialmente interessantes são apresentados ao usuário especialista para avaliação. Para tanto, foram analisados métodos e técnicas utilizadas em Pós-processamento de conhecimento, medidas objetivas para avaliação de Regras de Associação e algoritmos que geram regras. Dessa perspectiva foram realizados experimentos para identificar o potencial das medidas a serem empregadas como filtros de Regras de Associação. Uma avaliação gráfica apoiou o estudo das medidas e a especificação da metodologia proposta. Aspecto inovador da metodologia proposta é a utilização do método de Pareto e a combinação de medidas para selecionar as Regras de Associação. Por fim foi implementado um ambiente para avaliação de Regras de Associação, denominado ARInE, viabilizando o uso da metodologia proposta. / The large demand of methods for knowledge discovery and analysis in large databases has continously increased the research in data mining area. Among the tasks associated to this area, one can find Association Rules. Several algorithms have been proposed for treating Association Rules. However, these algorithms give as results a huge amount of rules, making the knowledge post-processing phase very complex and challeging. There are several measures that can be used in this evaluation phase, but there are also some limitations regarding to the ausence of an intuitive method to rank and select rules. Moreover, it is not possible to find especific methodologies for selecting rules, considering more than one measure simultaneously. This thesis has as objective the proposal, development and implementation of a postprocessing methodology for Association Rules. In the proposed methodology, small groups of rules, which have been identified as potentialy interesting, are presented to the expert for evaluation. In this sense, methods and techniques for knowledge post-processing, objective measures for rules evaluation, and Association Rules algorithms have been analized. From this point of view, several experiments have been realized for identifying the potential of such measures to be used to filter Association Rules. The study of measures and the specification of the proposed methodology have been supported by a graphical evaluation. The novel aspect of the proposed methodology consists on using the Pareto’s method and combining measures for selecting Association Rules. Finally, an enviroment for evaluating Association Rules, named as ARInE, has been implemented according to the proposed methodology.

Elevers användning av räknelagar, räkneregler och räknestrategier / Students´ use of the laws, rules and strategies of arithmetic

Linder, Sanna January 2019 (has links)
Syftet med den här studien är att undersöka hur elever i de tidiga skolåren är medvetna om de lagar, regler och strategier som bygger strukturen i aritmetiska uttryck. Inom matematiken finns det räknelagar, räkneregler och räknestrategier. Därför är det viktigt att elever i skolan ges möjligheten att utveckla kunskaper om dem. Data har samlats in genom 16 semistrukturerade intervjuer med elever från årskurs 1. Eleverna i studien har under fyra deluppgifter fått visa hur de gör när de summerar tre eller fyra tal. Studien har visat att elever väljer tal efter olika principer, placerar tal efter olika principer och ändrar placering av talen vid beräkningar. I den här studien har elever visat att de kan göra motiveringar till varför operationsordningar går att ändra. Studien har visat att eleverna använt associativa lagen trots att de saknar formell undervisning om den. Vid de olika deluppgifterna har räknelagar, räkneregler och räknestrategier används. Studien har visat att flera elever kan göra generaliseringar över kommutativa och associativa lagen. Slutsatsen av studien är att elever redan i årskurs 1 är väl medvetna om de lagar, regler och strategier som bygger strukturen i aritmetiska uttryck. / In mathematics, there are laws, rules and strategies of arithmetic. That is why it is important that young students are given the opportunity to develop knowledge about them. The purpose of this study it to investigate whether students in the early school years are aware of the laws, rules and strategies that build the structure of arithmetic. The data for this study is 16 semi-structured interviews with Swedish 1:st grade students. The students in this study have, during four sub-tasks, shown how they add three or four numbers. The study shows that students choose numbers according to different principles, place numbers according to different principles and change the placement of the numbers in calculations. Students can also give reasons for why the order of number can be changed. Students used the associative law even though they lack formal education about it. For the various sub-tasks, it is obvious that arithmetic laws, rules and strategies have been used. Particularly several students have shown that they can make generalizations of the commutative and associative law. The conclusion of the study shows that students are aware of the laws, rules and strategies that build the structure of arithmetic expressions.

From legislation to implementation? : Understanding the implementation deficiency of the general rules of consideration, the Swedish Environmental Code (2000:61)

Lehtimäki, Linda January 2019 (has links)
The Environmental Code is a central environmental policy instrument, which contributes to achieve Sweden’s national environmental objectives. Therefore, the implementation of the rules and regulations of the Environmental Code are of importance. This thesis focuses on the identified research gap in the implementation of the general rules of consideration in the Environmental Code, adopting a Swedish perspective and seeking to understand the reasons why. This thesis intends to increase the understanding of both external and internal aspects affecting the implementation at a municipal level. The results show that the implementation deficiency in the general rules of consideration consists of several complex, interconnected factors. The findings implicate three fundamental aspects affecting the implementation: prerequisites, work procedures and interpretations of the general rules of consideration. Furthermore, the implementation requires an improved understanding among concerned stakeholders. This thesis argues that there is a shortage of knowledge and understanding of the general rules of consideration among stakeholders, therefore there is much more to learn, in order to reduce the implementation deficiency of the rules. Additionally, the findings indicate a need for exemplified guidance from state authorities and government agencies, to reduce the knowledge gap among municipalities and operators. Furthermore, operators ought to increase the understanding of the general rules of consideration, to contribute to the implementation of the general rules of consideration.

Fair play a pravidla ve sportu / Fair play and the rules of sport

Vejpravová, Dominika January 2019 (has links)
Title: Fair play and the rules of sport Objectives: The main aim of this work is to define the concept of fair play in terms of formalism, and its detailed explanation, explanation of related concepts while using examples from practice, and subsequent critique of formalism in comparison with other concepts of fair play. Methods: The methods of compilation, analysis and synthesis were used. We used the compilation method to summarize the theme based on available literature. The method of analysis was used to understand concepts closely related to fair play as formalism and the method of synthesis to understand the whole theme through the synthesis of the explained parts. Furthermore, we used the method of comparison, for comparing fair play as formalism with other concepts of fair play. Results: The theme of fair play and its relationship to rules was explained. We identified some limits of fair play as formalism, based on comparison with other concepts of fair play. Keywords: Fair play, rules, virtues, cases of fair play conduct, education

