Global ETD Search

11	Análise da aplicação do regulamento técnico da qualidade do nível de eficiência energética no prédio do IBAM / Analysis of the technical regulation of energy efficiency in commercial and public buildings used to study the building IBAM Esther Martin de Bernardo Roma 08 December 2010 (has links) Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A racionalização do uso da energia elétrica nas edificações é um assunto atual e de grande importância face ao grande impacto ambiental produzido. O consumo de energia elétrica no Brasil nas edificações residenciais, comerciais, de serviços e públicas é bastante significativo. Calcula-se que quase 50% da energia elétrica produzida no país seja consumida não só na operação e manutenção das edificações como também nos sistemas artificiais, que proporcionam conforto ambiental para seus usuários como iluminação, climatização e aquecimento de água. O Regulamento Técnico de Qualidade do Nível de Eficiência Energética de Edifícios Comerciais e Serviços e Públicos, RQT-C do INMETRO surge como uma contribuição à etiquetagem do nível de eficiência energética das edificações de uso coletivo. Para a determinação da eficiência são considerados três requisitos: envoltória da edificação, sistema de iluminação e sistema de condicionamento de ar. Todos os requisitos têm cinco níveis de eficiência que variam de A (mais eficiente) até E (menos eficiente), que associados com algumas bonificações (uso da energia solar, ventilação natural, etc.) tornam possível a atribuição de uma classificação geral para o edifício em seu todo. Neste trabalho objetivou-se avaliar esse desempenho energético para o prédio do Instituto Brasileiro de Adminstração Municipal -IBAM, situado na cidade do Rio de Janeiro, de concepção modernista. Foi mostrado como as decisões arquitetônicas tomadas e o uso da ventilação natural podem influenciar na avaliação de sua eficiência energética. / Nowadays, the electricity energy conservation in buildings is an important subject due to the environmental impacts produced. The electricity consumption in Brazil in the residential, commercial, and public service buildings, is quite significant. It is estimated that nearly 50% of the electricity produced in the country is consumed not only in the operation and maintenance of the buildings, but also in artificial systems that provide environmental comfort for its users such as lighting, air conditioning and water heating. The Technical Regulation of Energy Efficiency in Commercial and Public Buildings RQT-C raises to provide an energy efficiency certification for buildings of public domain. To determine the efficiency three criteria are considered: the building envelope, the illumination system, and the air conditioning system. All requirements are classified into five levels from A (most efficient) to E (least efficient), which could be associated with some subsidies (solar energy, natural ventilation, etc.), making possible the attribution of a classification standard for the building as a whole. The aim of this work is to apply this procedure to analyze the energy efficiency of the building of the Brazilian Institute of Municipal Administration (IBAM), located in the city of Rio de Janeiro. The study of the building, created under modernist architectural concepts. It has been showed how architectural decisions and the use natural ventilation may influence the evaluation of its efficiency energy class. Energia elétrica - Edifícios Regulamento Etiquetagem Eficiência energética Energy efficiency Architectural practice Assessment ENGENHARIA MECANICA
12	Etiqueta A em clima tropical: edif?cio residencial de m?dio padr?o Silva J?nior, Carlos Alberto da 26 June 2017 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-10-05T19:04:05Z No. of bitstreams: 1 CarlosAlbertoDaSilvaJunior_DISSERT.pdf: 52545359 bytes, checksum: eefc1cf9d219ea222b91fcf8b4a678cb (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-10-17T19:18:51Z (GMT) No. of bitstreams: 1 CarlosAlbertoDaSilvaJunior_DISSERT.pdf: 52545359 bytes, checksum: eefc1cf9d219ea222b91fcf8b4a678cb (MD5) / Made available in DSpace on 2017-10-17T19:18:51Z (GMT). No. of bitstreams: 1 CarlosAlbertoDaSilvaJunior_DISSERT.pdf: 52545359 bytes, checksum: eefc1cf9d219ea222b91fcf8b4a678cb (MD5) Previous issue date: 2017-06-26 / Esse estudo investigou alternativas de projeto, com potencial para aumentar os n?veis de efici?ncia energ?tica e a ocorr?ncia de conforto em apartamentos populares, para a cidade de Mossor?-RN, cujas caracter?sticas clim?ticas variam entre quente e seco e quente e ?mido ao longo do ano. Foi elaborado um mapeamento do processo de projeto que dividiu o trabalho em oito etapas, passando pelo referencial te?rico, estudo do zoneamento bioclim?tico brasileiro e uso de programa??o arquitet?nica para identificar problemas e propor solu??es. Esta ?ltima orientou a escolha dos precedentes arquitet?nicos, a defini??o das caracter?sticas mais relevantes para o desenvolvimento do partido e a elabora??o do anteprojeto. Foram especificados os materiais construtivos para viabilizar a aplica??o do m?todo simplificado de predi??o e realizar um refinamento do projeto at? que a ENCE A fosse alcan?ada. A simula??o t?rmica desenvolvida no software Design Builder foi utilizada para comprovar ou refutar os resultados da simula??o simplificada, avaliar a ocorr?ncia de conforto nas Uhs e identificar o peso da estrat?gias de projeto. Foi previsto a elabora??o de um or?amento preliminar a fim de comprovar a viabilidade financeira do empreendimento e seu enquadramento nos limites impostos pela faixa 2 do programa Minha Casa Minha Vida. Este trabalho comprovou a efici?ncia da intera??o entre os m?todos de projeto e simula??o, na elabora??o da proposta de uma moradia de popular eficiente e confort?vel. / This study investigated project alternatives, with potential to increase energy efficiency levels and the occurrence of comfort in popular apartments, for the city of Mossor?- RN, whose climatic characteristics vary from warm to dry and hot and humid throughout the year. A mapping of the project process was elaborated that divided the work in eight steps, passing through the theoretical reference, study of Brazilian bioclimatic zoning and use of architectural programming to identify problems and propose solutions. The latter guided the choice of architectural precedents, the definition of the characteristics most relevant to the development of the party and the preparation of the draft. Construction materials were specified to enable the simplified prediction method to be applied and to refine the project until ENCE A was achieved. The thermal simulation developed in the Design Builder software was used to prove or refute the simplified simulation results, to evaluate the occurrence of comfort in the Uhs and to identify the weight of the design strategies. It was planned to prepare a preliminary budget to prove the financial viability of the project and its compliance with the limits imposed by track 2 of the Minha Casa Minha Vida program. This work proved the efficiency of the interaction between the methods of design and simulation, in the elaboration of the proposal of an efficient and comfortable popular housing. Projeto Apartamentos Etiquetagem Desempenho
13	AstrolÃbio: um corpus de redaÃÃes escolares do CearÃ anotado multidimensionalmente conforme a TEI P5 / AstrolÃbio: a corpus of school writings of CearÃ multi-dimensionally annotated according to TEI P5 Katiuscia de Moraes Andrade 18 February 2013 (has links) CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior / AstrolÃbio is a compiled corpus, with multidimensional annotation, and shared under Creative Commons Attribution-NonCommercial 3.0 Unported licence. It is a corpus, in Brazilian Portuguese, that uses advanced technologies to text processing and corpora annotation. AstrolÃbio has multidimensional annotation based on TEI P5 guidelines, that prescribes XML metalanguage. Through these guidelines, essential structures from the annotated documents were preserved, keeping the transcription as reliable as possible to the original. By using tag <choice>, it enabled keep, in the same archive, linguistic variation phenomena, orthographic and punctuation errors, as the respectives corrected and normalized forms, and also makes possible the visualization of added and deleted terms. To automatize the integration of many levels of annotation, Astro was used, it is a software that works with several Python modules to Natural Language Processing (NLP), including Aelius and Enchant. To POS tagging, Aelius, a package that uses Natural Language Toolkit (NLTK) libraries, was utilized. From Aelius, AeliusHunPosMacMorpho was chosen, it is a tagger based on HunPos and trained by MAC-Morpho, a corpus composed of journalistic texts. The 9spell checking was made by Enchant, a large library with API (Application Programming Interface) in C and C++ languages. The tagger chosen from inside training corpus MacMorpho,. AstrolÃbio's texts were produced during text production workshops from the second edition of Rota das Especiarias project, realized on first semester of 2012, with public school students from Camocim, Barroquinha e Jijoca de Jericoacoara, cities located in CearÃ. Until this moment of AstrolÃbio's creation, concluded stages are texts selection, compilation and the first step of automatic annotation by Astro. AstrolÃbio corpus is already partially avaiable at Rota das Especiarias' website (www.rotadasespeciarias.art.br). Soon, the corpus will be submitted to University of Oxford Text Archive (OTA). As we observed from corpora scene of Portuguese, there's no corpus, in Brazilian Portuguese, with this level of annotation. / AstrolÃbio Ã um corpus compilado, anotado multidimensionalmente e disponibilizado eletronicamente sob a licenÃa Creative Commons Attribution-NonCommercial 3.0 Unported. Trata-se de um corpus, em PortuguÃs brasileiro, que emprega avanÃadas tecnologias para o processamento de texto e anotaÃÃo de corpora. AstrolÃbio possui anotaÃÃo multidimensional baseada na codificaÃÃo TEI P5, que prescreve o uso metalinguagem XML. Com o uso dessa codificaÃÃo, preservaram-se caracterÃsticas essenciais da estrutura e do conteÃdo dos documentos anotados, tornando a transcriÃÃo o mais fiel possÃvel ao original. Por meio do emprego da tag <choice>, foi possÃvel reunir, em um mesmo arquivo, fenÃmenos de variaÃÃo linguÃstica, erros ortogrÃficos e de pontuaÃÃo, bem como as respectivas formas corrigidas e normalizadas, alÃm de possibilitar a visualizaÃÃo de termos que foram acrescidos ou suprimidos. Para a integraÃÃo automÃtica dos vÃrios nÃveis de anotaÃÃo, utilizou-se o Astro, um software que utiliza diversos mÃdulos em Python para o Processamento da Linguagem Natural (PLN), como o Aelius e o Enchant. Na etiquetagem morfossintÃtica, utilizou-se o pacote Aelius, que, por sua vez, recorre Ã biblioteca Natural Language Toolkit (NLTK). O etiquetador escolhido, dentro do Aelius, foi o AeliusHunposMacMorpho, criado a partir do etiquetador Hunpos, treinado no corpus de textos jornalÃsticos MAC-Morpho. Efetivou-se a correÃÃo ortogrÃfica com o Enchant, uma vasta biblioteca com API (Application Programming Interface) em linguagem C e C++. Os textos que compÃem esse corpus foram produzidos durante as oficinas de produÃÃo textual da segunda ediÃÃo do projeto Rota das Especiarias, realizadas no primeiro semestre de 2012, com alunos de escolas pÃblicas das cidades cearenses de Camocim, Barroquinha e Jijoca de Jericoacoara. AtÃ o presente momento da construÃÃo do AstrolÃbio, encontram-se concluÃdas as etapas de seleÃÃo, escanerizaÃÃo, compilaÃÃo e a primeira fase de anotaÃÃo automÃtica dos textos por meio do Astro. O corpus AstrolÃbio jÃ se encontra parcialmente disponÃvel no sÃtio eletrÃnico Rota das Especiarias (www.rotadasespeciarias.art.br). Em breve, serÃ submetido ao repositÃrio eletrÃnico University of Oxford Text Archive (OTA). Pelo que se observou do panorama de corpora do PortuguÃs, inexiste um corpus, em PortuguÃs Brasileiro, com esse nÃvel de anotaÃÃo. LinguÃstica Computacional LinguÃstica de Corpus TEI P5 NLTK CorreÃÃo automÃtica de textos Etiquetagem morfossintÃtica LINGUISTICA
14	Uma estratégia de recomendação associativa de etiquetas usando grafo de contexto em estado de Cold Start Santos, Janiel Medeiros dos, 92-99250-3134 02 October 2017 (has links) Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-12-21T18:03:56Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - Janiel M. dos Santos.pdf: 1303124 bytes, checksum: 92eab239c46bd44d736df8430f688f9c (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2017-12-21T18:04:15Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - Janiel M. dos Santos.pdf: 1303124 bytes, checksum: 92eab239c46bd44d736df8430f688f9c (MD5) / Made available in DSpace on 2017-12-21T18:04:15Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação - Janiel M. dos Santos.pdf: 1303124 bytes, checksum: 92eab239c46bd44d736df8430f688f9c (MD5) Previous issue date: 2017-10-02 / FAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonas / The growing production of multimedia content on the web has stimulated studies related to the improvement of the strategies responsible for the organization and recovery of this content in the applications. Among the several strategies, the assignment of a set of tags to an object expressing its content, called the tagging process, has been the subject of recent studies, mainly associative methods that are based on the exploration of co-occurrence patterns of tags. Although associative methods present state of the art results, few investigate the behavior of this type of recommendation in a state in which the object is being inserted into the system and has no previously associated information, characterized as cold start problem. To investigate the behavior of strategies in a cold start, its main motivation is to improve the quality of the recommendations, especially when the strategies are dependent on the information provided by the publishers of the content. This work presents an associative tags recommendation strategy that explores the concept of context graphs through the integration of co-occurrence and tags relevance metrics with the collaborative knowledge of existing relationships between concepts found in Wikipedia articles. With the balance in the valorization of the candidate tags for the recommendation, the proposed strategy obtained improvement in the quality of the re-commendation of the tags in videos that have a median number of tags. / A crescente produção de conteúdo multimídia na web tem estimulado estudos relacionados ao aprimoramento das estratégias responsáveis pela organização e recuperação desse conteúdo nas aplicações. Dentre as diversas estratégias existentes, a atribuição de um conjunto de etiquetas a um objeto expressando o seu conteúdo, denominada de processo de etiquetagem, têm sido objeto de estudos recentes, principalmente os métodos associativos que exploram padrões de coocorrência. Apesar dos métodos associativos apresentarem resultados estado da arte, poucos exploram o comportamento desse tipo de recomendação em um estado em que o objeto está sendo inserido no sistema e não possui informações previamente associadas, caracterizado como problema de cold start. Investigar o comportamento das estratégias, em um estado de cold start, tem como motivação principal melhorar a qualidade das recomendações, principalmente quando as estratégias ficam dependentes das informações fornecidas pelos publicadores do conteúdo. Nesta dissertação apresenta-se uma estratégia de recomendação associativa de etiquetas que explora o conceito de grafos de contexto, por meio da integração da coocorrência e métricas de relevância de etiquetas com o conhecimento colaborativo dos relacionamentos existentes entre conceitos presentes nos artigos da Wikipédia. Com o equilíbrio na valorização das etiquetas candidatas a recomendação, a estratégia proposta obteve melhoria na qualidade da recomendação das etiquetas em vídeos que possuem uma quantidade mediana de etiquetas. Etiquetagem Recomendação de etiquetas Método associativo Grafo de contexto Cold start
15	Modelagem de contextos para aprendizado automático aplicado à análise morfossintática / Modeling contexts for automatic learning applied to morphosyntactic analysis Fábio Natanael Kepler 28 May 2010 (has links) A etiquetagem morfossintática envolve atribuir às palavras de uma sentença suas classes morfossintáticas de acordo com os contextos em que elas aparecem. Cadeias de Markov de Tamanho Variável (VLMCs, do inglês \"Variable-Length Markov Chains\") oferecem uma forma de modelar contextos maiores que trigramas sem sofrer demais com a esparsidade de dados e a complexidade do espaço de estados. Mesmo assim, duas palavras do português apresentam um alto grau de ambiguidade: \'que\' e \'a\'. O número de erros na etiquetagem dessas palavras corresponde a um quarto do total de erros cometidos por um etiquetador baseado em VLMCs. Além disso, essas palavras parecem apresentar dois diferentes tipos de ambiguidade: um dependendo de contexto não local e outro de contexto direito. Exploramos maneiras de expandir o modelo baseado em VLMCs através do uso de diferentes modelos e métodos, a fim de atacar esses problemas. As abordagens mostraram variado grau de sucesso, com um método em particular (aprendizado guiado) se mostrando capaz de resolver boa parte da ambiguidade de \'a\'. Discutimos razões para isso acontecer. Com relação a \'que\', ao longo desta tese propusemos e testamos diversos métodos de aprendizado de informação contextual para tentar desambiguá-lo. Mostramos como, em todos eles, o nível de ambiguidade de \'que\' permanece praticamente constante. / Part-of-speech tagging involves assigning to words in a sentence their part-of-speech class based on the contexts they appear in. Variable-Length Markov Chains (VLMCs) offer a way of modeling contexts longer than trigrams without suffering too much from data sparsity and state space complexity. Even so, two words in Portuguese show a high degree of ambiguity: \'que\' and \'a\'. The number of errors tagging these words corresponds to a quarter of the total errors made by a VLMC-based tagger. Moreover, these words seem to show two different types of ambiguity: one depending on non-local context and one on right context. We searched ways of expanding the VLMC-based model with a number of different models and methods in order to tackle these issues. The approaches showed variable degrees of success, with one particular method (Guided Learning) solving much of the ambiguity of \'a\'. We explore reasons why this happened. Rega rding \'que\', throughout this thesis we propose and test various methods for learning contextual information in order to try to disambiguate it. We show how, in all of them, the level of ambiguity shown by \'que\' remains practically c onstant. Cadeias de markov Etiquetagem morfossintática Linguística computacional Computational linguistics Markov chains Part-of-speech tagging
16	Taxonomia e etiquetagem: análise dos processos de organização e representação da informação jurídica na web Santos, Naiara Andrade Malta January 2014 (has links) Submitted by Valdinei Souza (neisouza@hotmail.com) on 2015-10-08T20:54:14Z No. of bitstreams: 1 TAXONOMIA E ETIQUETAGEM - NAIARA ANDRADE MALTA SANTOS.pdf: 3461653 bytes, checksum: de172816740035ba4556e8642e1e1b10 (MD5) / Approved for entry into archive by Urania Araujo (urania@ufba.br) on 2016-03-04T20:06:01Z (GMT) No. of bitstreams: 1 TAXONOMIA E ETIQUETAGEM - NAIARA ANDRADE MALTA SANTOS.pdf: 3461653 bytes, checksum: de172816740035ba4556e8642e1e1b10 (MD5) / Made available in DSpace on 2016-03-04T20:06:01Z (GMT). No. of bitstreams: 1 TAXONOMIA E ETIQUETAGEM - NAIARA ANDRADE MALTA SANTOS.pdf: 3461653 bytes, checksum: de172816740035ba4556e8642e1e1b10 (MD5) / A pesquisa foi realizada com o objetivo de analisar a taxonomia e etiquetagem, empregadas na organização e representação do conhecimento da informação jurídica nos websites jurídicos do Brasil. Para isso, procedeu-se, inicialmente, pelo mapeamento dos websites jurídicos brasileiros que se encontravam entre os 500 mais acessados do país em dezembro de 2013, localizando 02 websites jurídicos (portal JusBrasil e o Portal do Tribunal de Justiça do Estado de São Paulo), que foi verificado quanto a disponibilidade das tipologias da documentação jurídica. Em seguida, identificou-se os níveis de taxonomia e etiquetagem empregadas na organização e representação do conhecimento nos websites selecionados comparando desta forma os mesmos. Foi verificado também se os termos que compõem a tabela do conhecimento da CAPES da área de Direito são encontrados nas taxonomia e na etiquetagem no tesauro jurídico do STF. Desta forma, o instrumento utilizado para coleta dos dados foi à observação participante e o formulário, quanto ao tratamento dos dados obtidos, a pesquisa é caracterizada como uma abordagem qualitativa e apresenta como resultados a taxonomia e a etiquetagem como aliadas na organização e representação do conhecimento jurídico nos portais estudados. Além dos usuários do Portal JusBrasil que participam de forma colaborativa na organização e representação do conhecimento jurídico disponível no portal. / ABSTRACT The research was performed with the aim of analyzing the taxonomy and tagging, employed in the organization and knowledge representation of juridical information in the juridical websites in Brazil. For this, proceeded, initially, by mapping of Brazilian legal websites witch were among the 500, that is the most accessed of the country on December, in 2013, localizing 02 juridical websites (Portal JusBrasil and the Portal of the Court of Justice of the State of Sao Paulo), which was verified for the availability of the types of legal documentation. Then, levels of taxonomy and tagging used in the organization and representation of knowledge on selected websites comparing this way the same. It was also verified that the terms that compose the table of knowledge of CAPES of the area of law are found in the taxonomy and tagging in legal thesaurus of STF. This way, the tool used for the data collection was participant observation and the form, regarding the treatment of data, the research is characterized as a qualitative approach and presents as results the taxonomy and tagging as allies in the organization and representation of legal knowledge in the portals studied. In addition to the Portal users JusBrasil participating collaboratively in the organization and representation of legal knowledge available in the portal. Ciência da Informação Organização do conhecimento Representação do conhecimento Taxonomia Etiquetagem Informação jurídica Knowledge organization Knowledge representation Taxonomy Tagging Legal/Juridical information
17	CompilaÃÃo, anotaÃÃo e anÃlise linguÃstico-computacional de um corpus de textos literÃrios dos sÃculos XIX e XX: corpus Coelho Neto / Compilation, annotation and linguistic and computational analysis of corpus Coelho Netto (CCN), a corpus of literary texts of 19th and 20th centuries Francimary MacÃdo Martins 06 June 2014 (has links) nÃo hÃ / Esta tese Ã a compilaÃÃo, anotaÃÃo morfossintÃtica e anÃlise linguÃstico-computacional de um corpus de textos literÃrios dos sÃc. XIX e XX: o Corpus Coelho Netto (CCN), contendo textos dos romances A Conquista e TurbilhÃo e contos do livro SertÃo. O trabalho estÃ na interface da LinguÃstica de Corpus e da LinguÃstica Computacional (BERBER SARDINHA, 2000, 2003, 2004, 2005, 2009; BERBER SARDINHA; ALMEIDA, 2008; OLIVEIRA, 2009; BIDERMAN, 1998, 2001; ALUÃSIO; ALMEIDA, 2006; SHEPHERD, 2012; MACENERY E WILSON, 2001; LEECH, 2004; ALVES; TAGNIN, 2012; ALENCAR, 2009, 2010a, 2010b, 2011a, 2011b, 2013a, 2013b). O CCN contÃm 53.080 (cinquenta e trÃs mil e oitenta) tokens (pontuaÃÃo e palavras). A compilaÃÃo consiste nas etapas de seleÃÃo, coleta de textos e manipulaÃÃo; nesta sÃo realizadas a limpeza, ediÃÃo e atualizaÃÃo dos textos (ALUÃSIO; ALMEIDA, 2006), para depois ser submetido Ã anotaÃÃo morfossintÃtica e anÃlise linguÃstico-computacional, com o objetivo de obter dados que comprovem ou nÃo o uso âexcessivoâ de adjetivos, de verbos e de advÃrbios em âmente, demonstrando a diversidade lexical nos textos de Coelho Netto, constatando se o que a crÃtica modernista dizia a respeito do escritor era procedente. A anotaÃÃo morfossintÃtica foi realizada pelo etiquetador automÃtico Aelius, modelo AeliusHunPos, um software livre em Python que utiliza a biblioteca Natural Language Toolkit â NLTK (BIRD; KLEIN; LOPER, 2009), no prÃ-processamento de textos, na construÃÃo de etiquetador morfossintÃtico e na anotaÃÃo de corpora com auxÃlio de revisÃo humana (ALENCAR, 2010a, 2013a, 2013b), e que foi treinado no Corpus HistÃrico do PortuguÃs Tycho Brahe (CHPTB). A compilaÃÃo e anotaÃÃo do CCN envolve outras aÃÃes como a reavaliaÃÃo da acurÃcia desse etiquetador em textos literÃrios. Os resultados da pesquisa revelaram que: o AeliusHunpos ao anotar os textos do CCN demonstrou maior acurÃcia que em outros textos jÃ anotados, de 97,9%; que o modelo AeliusHunPos mostrou um desempenho muito alÃm ao anotar os corpora que com o modelo AeliusMaxEnt; e que, apÃs a seleÃÃo e correÃÃo manual dos 10% dos corpora anotados e gerados arquivos padrÃo gold, sugerimos um melhoramento dos aproximados 3% de erros cometidos pelo etiquetador, visando o aumento de sua acurÃcia. Quanto Ãs analises realizadas com os dados obtidos no CCN constatamos que: a diversidade lexical, especificamente quanto a verbos, adjetivos e advÃrbios em âmente, declarada como exagerada pela crÃtica Ã Coelho Netto nÃo procede, pois seus textos sÃo ricos, mas quando comparados aos textos de AluÃsio Azevedo e Camilo Castelo Branco, o Corpus de ComparaÃÃo, apresentam riqueza vocabular similar ao CCN, como expostos nos resultados. / This thesis is the compilation, morphosyntactic annotation and linguistic and computational analysis of a corpus of literary texts of 19th and 20th centuries: Corpus Coelho Netto (CCN), containing texts of the novels A Conquista and TurbilhÃo and short stories of the book SertÃo. The work is in the Corpus Linguistics and Computational Linguistics interface (BERBER SARDINHA, 2000, 2003, 2004, 2005, 2009; BERBER SARDINHA; ALMEIDA, 2008; OLIVEIRA, 2009; BIDERMAN, 1998, 2001; ALUÃSIO; ALMEIDA, 2006; SHEPHERD, 2012; MACENERY AND WILSON, 2001; LEECH, 2004; ALVES; TAGNIN, 2012; ALENCAR, 2009, 2010a, 2010b, 2011a, 2011b, 2013a, 2013b). The CCN contains 53.080 (fifty-three thousand and eighty) tokens. The compilation consists of the steps selection, collection off texts and handling; in which cleaning, editing and updating of texts (ALUÃSIO; ALMEIDA, 2006), and then be submitted to the morphosyntactic annotation and linguistic-computational analysis, with the goal of obtaining data to show whether or not the "excessive" use of adjectives, verbs and adverbs in ââmenteâ, demonstrating the lexical diversity in Coelho NettoÂs texts, noting if what the modernist critics said about the writer was correct. The annotation was performed by automatic tagger Aelius, AeliusHunPos model, free software in Python that uses the Natural Language Toolkit â NLTK library (BIRD; KLEIN; LOPER, 2009), in the pre-processing of texts, in the construction of morphosyntactic tagger and the automatic annotation of corpora with the help of human review (ALENCAR, 2010a, 2013a, 2013b), and it was trained in the Historical Corpus of Tycho Brahe Portuguese (CHPTB). The compilation and annotation CCN involves other actions such as revaluation the accuracy of this tagger in literary texts. The search results indicated that: AeliusHunpos demonstrated better performance than other texts already noted (97.9 %); AeliusHunPos model showed a far beyond performance by annotating corpora with AeliusMaxEnt model; and that, after selection and manual correction of 10% annotated corpora and generated gold standard files, it is suggested an improvement of the approximate 3% of errors by the tagger, in order to increase its accuracy. Regarding the analyzes performed with the CCN, it was found that: lexical diversity - about verbs, adjectives and adverbs in ââmenteâ considered exaggerated by critics to Coelho Netto unfounded, because his texts are rich, but when compared to the texts by AluÃsio Azevedo and Camilo Castelo Branco, comparison of corpus, present vocabulary richness similar to CCN, as exposed in the results. LinguÃstica de Corpus LinguÃstica Computacional Etiquetagem MorfossintÃtica AeliusHunPos Coelho Netto Corpus Linguistics Computational Linguistics Morphosyntactic tagging AeliusHunPos Coelho Netto LINGUISTICA APLICADA
18	Leis de Escala nos gastos com saneamento básico: dados do SIOP e DOU / Scaling Patterns in Basic Sanitation Expenditure: data from SIOP and DOU Ribeiro, Ludmila Deute 14 March 2019 (has links) A partir do final do século 20, o governo federal criou vários programas visando a ampliação de acesso ao saneamento básico. Embora esses programas tenham trazido o abastecimento de água potável e a coleta de resíduos sólidos para a maioria dos municípios brasileiros, o esgotamento sanitário ainda está espacialmente concentrado na região Sudeste e nas áreas mais urbanizadas. Para explicar esse padrão espacialmente concentrado, é frequentemente assumido que o tamanho das cidades realmente importa para o saneamento básico, especialmente para o esgotamento sanitário. De fato, à medida que as cidades crescem em tamanho, devemos esperar economias de escala no volume de infraestrutura de saneamento. Economias de escala na infra-estrutura implicam uma redução nos custos de saneamento básico, de forma proporcional ao tamanho da cidade, levando também a uma (esperada) relação de lei de escala (ou de potência) entre os gastos com saneamento básico e o tamanho da cidade. Usando a população, N(t), como medida do tamanho da cidade no momento t, a lei de escala para infraestrutura assume o formato Y(t) = Y0N(t)&#946 onde &#946 &#8776 0.8 < 1, Y denota o volume de infraestrutura e Y0 é uma constante. Diversas propriedades das cidades, desde a produção de patentes e renda até a extensão da rede elétrica, são funções de lei de potência do tamanho da população com expoentes de escalamento, &#946, que se enquadram em classes distintas. As quantidades que refletem a criação de riqueza e a inovação têm &#946 &#8776 1.2 > 1 (retornos crescentes), enquanto aquelas responsáveis pela infraestrutura exibem &#946 &#8776 0.8 < 1 (economias de escala). Verificamos essa relação com base em dados extraídos do Sistema Integrado de Planejamento e Orçamento (SIOP), que abrangem transferências com recursos não onerosos, previstos na Lei Orçamentária Anual (LOA), na modalidade saneamento básico. No conjunto, os valores estimados de &#946 mostram redução das transferências da União Federal para saneamento básico, de forma proporcional ao tamanho dos municípios beneficiários. Para a dotação inicial, valores programados na LOA, estimado foi de aproximadamente: 0.63 para municípios com população superior a dois mil habitantes; 0.92 para municípios acima de vinte mil habitantes; e 1.18 para municípios com mais de cinquenta mil habitantes. A segunda fonte de dados identificada foi o Diário Oficial da União (DOU), periódico do governo federal para publicação de atos oficiais. Os dados fornecidos pelo DOU referem-se aos recursos não onerosos e também aos empréstimos com recursos do Fundo de Garantia por Tempo de Serviço (FGTS). Para extração dos dados textuais foram utilizadas técnicas de Processamento de Linguagem Natural(PLN). Essas técnicas funcionam melhor quando os algoritmos são alimentados com anotações - metadados que fornecem informações adicionais sobre o texto. Por isso geramos uma base de dados, a partir de textos anotados do DOU, para treinar uma rede LSTM bidirecional aplicada à etiquetagem morfossintática e ao reconhecimento de entidades nomeadas. Os resultados preliminares obtidos dessa forma estão relatados no texto / Starting in the late 20th century, the Brazilian federal government created several programs to increase the access to water and sanitation. However, although these programs made improvements in water access, sanitation was generally overlooked. While water supply, and waste collection are available in the majority of the Brazilian municipalities, the sewage system is still spatially concentrated in the Southeast region and in the most urbanized areas. In order to explain this spatially concentrated pattern it is frequently assumed that the size of cities does really matter for sanitation services provision, specially for sewage collection. As a matter of fact, as cities grow in size, one should expect economies of scale in sanitation infrastructure volume. Economies of scale in sanitation infrastructure means a decrease in basic sanitation costs, proportional to the city size, leading also to a (expected) power law relationship between the expenditure on sanitation and city size.Using population, N(t), as the measure of city size at time t, power law scaling for infrastructure takes the form Y(t) = Y0N(t)&#946 where &#946 &#8776 0.8 < 1, Y denotes infrastructure volume and is a constant. Many diverse properties of cities from patent production and personal income to electrical cable length are shown to be power law functions of population size with scaling exponents, &#946, that fall into distinct universality classes. Quantities reflecting wealth creation and innovation have &#946 &#8776 1.2 > 1 (increasing returns), whereas those accounting for infrastructure display &#946 &#8776 0.8 < 1 (economies of scale). We verified this relationship using data from federal government databases, called Integrated Planning and Budgeting System, known as SIOP. SIOP data refers only to grants, funds given to municipalities by the federal government to run programs within defined guidelines. Preliminary results from SIOP show decrease in Federal Grants to Brazilian Municipalities, proportional to the city size. For the initial budget allocation, &#946 was found to be roughly 0.63 for municipalities above twenty thousand inhabitants; to be roughly 0.92 for municipalities above twenty thousand inhabitants; and to be roughly 1.18 for municipalities above fifty thousand inhabitants. The second data source is DOU, government journal for publishing official acts. DOU data should give us information not only about grants, but also about FGTS funds for basic sanitation loans. In order to extract data from DOU we have applied Natural Language Processing (NLP) tools. These techniques often work better when the algorithms are provided with annotations metadata that provides additional information about the text. In particular, we fed a database with annotations into a bidirectional LSTM model applied to POS Tagging and Named-entity Recognition. Preliminary results are reported in the paper Basic Sanitation Cidades Cities Etiquetagem Morfossintática Leis de Escala Named-entity Recognition Natural Language Processing POS Tagging Power Law Scaling Processamento de Linguagem Natural Reconhecimento de Entidades Nomeadas Saneamento Básico
19	A Linguística de Corpus na formação do tradutor: compilação e proposta de análise de um corpus paralelo de aprendizes de tradução / Corpus linguistics in translator education: compilation and analysis proposal of a parallel corpus of translation learners Oliveira, Joacyr Tupinambás de 01 December 2014 (has links) Os estudos sobre o ensino da tradução no Brasil ainda oferecem muito espaço para discussões. Valendo-se disso, este trabalho traz como um de seus objetivos uma breve reflexão sobre a sala de aula e sugere um possível método de ensino de tradução baseado na análise de material produzido por tradutores-aprendizes. A intenção é que, por meio da Linguística de Corpus, consigamos observar o processo de construção do texto de chegada pela ótica do aluno, nos mesmos moldes que o fazemos ao analisar material produzido por aprendizes de idiomas. Para tanto, compilamos um corpus de aprendizes de tradução, constituído por oito textos originais e cerca de 100 traduções para cada um deles. Alinhar tantas traduções referentes a um original de modo a permitir análises não foi tarefa fácil. A estratégia empregada para superar tal dificuldade foi o desenvolvimento de uma metodologia específica de alinhamento tendo como ferramenta planilhas eletrônicas. Tal metodologia tornou-se o foco central desta pesquisa. A utilização de fórmulas para a manipulação de dados textuais na planilha eletrônica resultou em um corpus alinhado, com todos os textos de partida e suas referidas traduções com cabeçalhos e com todas as linhas etiquetadas. Esse procedimento possibilitou a organização de um corpus para ser analisado tanto no editor de planilhas eletrônicas quando em programas como AntConc e WordSmith Tools. Além disso, também apresentamos a planilha eletrônica como uma ferramenta didática para ser usada nas aulas de prática de tradução. / Studies on the teaching of translation in Brazil still offer room for discussions. Having that in mind, one of the goals of this research aims at fostering a brief reflection upon the classroom and proposes a teaching method based on the analyses of material produced by translation learners. We show that Corpus Linguistics can be used to analyze student translations in the same way we do when we analyze material produced by language learners. For that purpose, we compiled a corpus of translations produced by learners, consisting of eight source texts in English and about 800 translations into Portuguese, approximately 100 for each text. Aligning so many translations to their original texts to favor analyses was not a simple task. Such difficulties were overcome by the development of a methodology for alignment, which became the central focus of this research. By utilizing formulas to deal with textual data in spreadsheets resulted in an aligned corpus containing source texts and their referring translations with headers and all lines tagged. Such procedure allowed us to come up with a corpus to be analyzed in both the spreadsheet editor and in programs such as AntConc and WordSmith Tools. In addition to that, we also introduced the spreadsheets as a didactic tool to be used in translation practice classes. Alinhamento automático Automatic alignment Cabeçalho e etiquetagem Corpus de aprendizes de tradução Corpus linguistics Header and tagging Linguística de Corpus Planilha eletrônica Spreadsheet Translation learner corpus
20	A Linguística de Corpus na formação do tradutor: compilação e proposta de análise de um corpus paralelo de aprendizes de tradução / Corpus linguistics in translator education: compilation and analysis proposal of a parallel corpus of translation learners Joacyr Tupinambás de Oliveira 01 December 2014 (has links) Os estudos sobre o ensino da tradução no Brasil ainda oferecem muito espaço para discussões. Valendo-se disso, este trabalho traz como um de seus objetivos uma breve reflexão sobre a sala de aula e sugere um possível método de ensino de tradução baseado na análise de material produzido por tradutores-aprendizes. A intenção é que, por meio da Linguística de Corpus, consigamos observar o processo de construção do texto de chegada pela ótica do aluno, nos mesmos moldes que o fazemos ao analisar material produzido por aprendizes de idiomas. Para tanto, compilamos um corpus de aprendizes de tradução, constituído por oito textos originais e cerca de 100 traduções para cada um deles. Alinhar tantas traduções referentes a um original de modo a permitir análises não foi tarefa fácil. A estratégia empregada para superar tal dificuldade foi o desenvolvimento de uma metodologia específica de alinhamento tendo como ferramenta planilhas eletrônicas. Tal metodologia tornou-se o foco central desta pesquisa. A utilização de fórmulas para a manipulação de dados textuais na planilha eletrônica resultou em um corpus alinhado, com todos os textos de partida e suas referidas traduções com cabeçalhos e com todas as linhas etiquetadas. Esse procedimento possibilitou a organização de um corpus para ser analisado tanto no editor de planilhas eletrônicas quando em programas como AntConc e WordSmith Tools. Além disso, também apresentamos a planilha eletrônica como uma ferramenta didática para ser usada nas aulas de prática de tradução. / Studies on the teaching of translation in Brazil still offer room for discussions. Having that in mind, one of the goals of this research aims at fostering a brief reflection upon the classroom and proposes a teaching method based on the analyses of material produced by translation learners. We show that Corpus Linguistics can be used to analyze student translations in the same way we do when we analyze material produced by language learners. For that purpose, we compiled a corpus of translations produced by learners, consisting of eight source texts in English and about 800 translations into Portuguese, approximately 100 for each text. Aligning so many translations to their original texts to favor analyses was not a simple task. Such difficulties were overcome by the development of a methodology for alignment, which became the central focus of this research. By utilizing formulas to deal with textual data in spreadsheets resulted in an aligned corpus containing source texts and their referring translations with headers and all lines tagged. Such procedure allowed us to come up with a corpus to be analyzed in both the spreadsheet editor and in programs such as AntConc and WordSmith Tools. In addition to that, we also introduced the spreadsheets as a didactic tool to be used in translation practice classes. Alinhamento automático Cabeçalho e etiquetagem Corpus de aprendizes de tradução Linguística de Corpus Planilha eletrônica Automatic alignment Corpus linguistics Header and tagging Spreadsheet Translation learner corpus

Search results