Global ETD Search

371	B2 : um sistema para indexação e agrupamento de artigos científicos em português brasileiro utilizando computação evolucionária Afonso, Alexandre Ribeiro 11 November 2013 (has links) Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013. / Submitted by Alaíde Gonçalves dos Santos (alaide@unb.br) on 2014-04-08T12:57:37Z No. of bitstreams: 1 2013_AlexandreRibeiroAfonso.pdf: 2162448 bytes, checksum: 65e0879f67cfb9f2deb91c9642e5d9ac (MD5) / Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-04-23T13:20:38Z (GMT) No. of bitstreams: 1 2013_AlexandreRibeiroAfonso.pdf: 2162448 bytes, checksum: 65e0879f67cfb9f2deb91c9642e5d9ac (MD5) / Made available in DSpace on 2014-04-23T13:20:38Z (GMT). No. of bitstreams: 1 2013_AlexandreRibeiroAfonso.pdf: 2162448 bytes, checksum: 65e0879f67cfb9f2deb91c9642e5d9ac (MD5) / Nesta tese é apresentado um estudo estatístico sobre o agrupamento automático de artigos científicos escritos em português do Brasil, são propostos novos métodos de indexação e agrupamento de textos com o objetivo futuro de desenvolver um software para indexar e agrupar textos por área de conhecimento. Foram testadas três classes conhecidas de termos simples para representar (indexar) os textos de entrada a agrupar: (substantivos), (substantivos e adjetivos), (substantivos, adjetivos e verbos) e também foram desenvolvidas três novas classes de termos compostos para representação (indexação) dos textos: classes de termos mais complexos, onde um termo pode ser composto pela junção de substantivos, adjetivos e preposições. Durante a fase de agrupamento textual dos experimentos foram testados os algoritmos de agrupamento: Expectation-Maximization (EM), X-Means, um Algoritmo Evolucionário de Agrupamento Convencional e, ainda, um novo Algoritmo Evolucionário de Agrupamento Proposto cujo diferencial é trabalhar em duas etapas de processamento: uma etapa para localização do agrupamento subótimo genérico e outra etapa para melhorar tal solução. Adicionalmente, o novo algoritmo permite ao usuário definir a formação de mais grupos ou menos grupos no resultado de agrupamento. Os algoritmos de indexação e agrupamento propostos foram codificados e implementados em um protótipo denominado B2, no entanto, para testar os algoritmos de agrupamento EM e X-Means foi utilizado o pacote de mineração de dados WEKA. Quatro corpora de artigos científicos, diferentes entre si por guardarem artigos de áreas científicas distintas, foram reunidos para testar as combinações de indexação e algoritmo de agrupamento propostas. Melhores resultados de agrupamento (por área de conhecimento dos artigos) foram obtidos utilizando termos compostos na indexação, ao invés do uso de termos simples, quando combinados com o uso do novo Algoritmo Evolucionário de Agrupamento Proposto, porém, para obter grupos bem formados, um número excessivo de grupos é gerado pelo protótipo, consumindo alto tempo de computação para executar tais novos métodos, em um computador pessoal convencional do ano de 2012. Pode-se concluir que o problema de agrupar automaticamente artigos científicos em suas áreas originais é uma tarefa complexa. Logo, acredita-se que os métodos de indexação e agrupamento desenvolvidos possam ser aprimorados para utilização futura em situações específicas, onde a fragmentação e geração adicional de grupos além do esperado não seja um problema maior. ______________________________________________________________________________________ ABSTRACT / This thesis presents an empirical study about automated text clustering for scientific articles written in Brazilian Portuguese. We tested three already known classes of simple terms for representing (or indexing) the input texts: (nouns), (nouns and adjectives) and (nouns, adjectives and verbs); we also developed three new classes of composed terms for text representation (or indexing): the new classes consist of more complex terms, where a complex term could be composed by the joint of nouns, adjectives and prepositions. Our final goal is to develop new software for text indexing and clustering. During the clustering stage of the experiments we tested the Expectation-Maximization (EM) Clustering Algorithm, the X-Means Clustering Algorithm, the Conventional Clustering Evolutionary Algorithm and, finally, we also proposed a new Two Phase Clustering Evolutionary Algorithm which works in two phases, the first phase finds the sub-optimal text clustering and the second one improves the result found by the first phase. The Two Phase Clustering Evolutionary Algorithm also permits the user to define whether the system should create a high number or a low number of clusters. The new indexing and clustering algorithmic strategies presented were implemented in a prototype named B2, but for testing the EM and X-Means algorithms we used the known WEKA data mining package. Four different scientific corpora having different sets of scientific topics were assembled and applied for testing the combinations of indexing and clustering methods. Although considerable better results were achieved when indexing with the classes of composed terms combined with the new Two Phase Clustering Evolutionary Algorithm, a considerable higher number of clusters was generated and a considerable additional time was consumed when running the new system over a 2012 conventional personal computer. We conclude that the problem of clustering scientific articles in their original topics is a complex task. Good results of clustering correctness were achieved by the new methods but producing many fragmented additional clusters as output, so, in the future, the methods can be improved and applied in specific situations where the fragmentation and additional production of clusters are not a major problem. Indexação automática Linguística - processamento de dados Algoritmos Mineração de texto Artigo científico
372	Diagnóstico de leucemia linfóide auxiliado por computador / Not available Daniela Mayumi Ushizima 06 October 2004 (has links) O presente trabalho de doutorado visa estudar o diagnóstico de leucemias por meio de processamento das imagens de microscópio óptico de transmissão, em colaboração com médicos hematologistas do HC-FMRP-USP e sob supervisão do Prof. Dr. Marco Zago. Como nem todas as leucemias podem ser diagnosticadas por meio de parâmetros visuais, apenas os casos de leucemia linfóide serão considerados, uma vez que esses são casos onde as células podem ser classificadas visualmente com precisão. A análise citológica é feita por especialistas humanos, cotidianamente em casos de contagem do número de leucócitos e se limitam à avaliação de um número reduzido de amostras pois é uma tarefa repetitiva, minuciosa e especializada. Com a automação desse processo, há possibilidade de maior número de análises de imagens, com geração de informações estatísticas a respeito das células presentes em amostras de sangue. O reconhecimento automático da célula envolve três etapas básicas: a segmentação da imagem, a extração de características e a classificação. A técnica de reconhecimento de padrões adotada para segmentação das imagens de esfregaços de sangue utiliza aprendizagem supervisionada por cor no espaço RGB, gerando imagens binárias contendo as diferentes regiões de interesse: núcleo, citoplasma, fundo e hemácia. O usuário pode treinar o classificador para uma imagem de esfregaço de sangue periférico, segmentar, filtrar e processar várias medidas das ROIs, particularmente do núcleo e citoplasma, considerando parâmetros de forma, textura e cor. A contribuição desse projeto está na elaboração de programas de interface amigável tanto para reconhecimento de padrões quanto para seleção de característica e mineração de dados. O programa de reconhecimento de padrões é baseado em casos de leucócitos normais, de leucemia linfóide crônica, prolinfocítica e tricoleucemia. Para desenvolvimento do programa de reconhecimento de padrões foi necessária uma grande base de dados, que hoje conta com aproximadamente 1.439 imagens, onde cerca de 1.058 são de leucócitos normais e cerca de 381 de leucêmicos / The current PhD project deals with the leukemia diagnosis using optical microscope image processing, in collaboration with hematologists from HC-FMRP-USP and under supervision of Prof. Dr. Marco Zago. Only specific leukemia cases can be diagnosed through visual parameter, therefore only lymphoid leukemias have been considered since these are the cases in which the cells can be classified visually with accuracy. Expert humans have dedicated to leukocyte differential count daily, limiting the analysis to a reduced number of samples since this task is time-consuming and painstaking. The automation of this process would allow to analyze many more images with wide statistical information about each blood smear slide. The cell recognition can be divided in three steps: the image segmentation, the feature extraction and the classification. The pattern recognition technique to color segment the images utilizes supervised learning in the RGB color space, generating binary images containing the different regions of interest: nucleus, cytoplasm, background and red blood cells. The user can train the classifier to segment a particular image, to filter the resulted image, to process and to extract several cell attributes. Particularly, we are interested in the nucleus and the cytoplasm in terms of the shape, size, color and texture. We have developed softwares with user-friendly interface both to pattern recognition and feature selection/datamining. The pattern recognition system is dedicated to recognize normal leukocytes and lymphoid leukemias as chronic lymphocitic, prolymphocitic and Hairy cells. For developing the pattern recognition system, we collected a large database, which contains approximately 1,439 images nowadays, being around 1,058 normal leukocytes and around 381 abnormal lymphocytes Mineração de dados Reconhecimento de padrões Visão computacional Not available
373	Imersão de espaços métricos em espaços multidimensionais para indexação de dados usando detecção de agrupamentos / Embedding of metric spaces in multidimensional spaces for data indexing using cluster detection Adriano Arantes Paterlini 28 March 2011 (has links) O sucesso dos Sistemas de Gerenciamento de Banco de Dados (SGBDs) em aplicações envolvendo dados tradicionais (números e textos curtos) encorajou o seu uso em novos tipos de aplicações, que exigem a manipulação de dados complexos. Séries temporais, dados científicos, dados multimídia e outros são exemplos de Dados Complexos. Inúmeras áreas de aplicação têm demandado soluções para o gerenciamento de dados complexos, dentre as quais a área de informática médica. Dados complexos podem também ser estudos com técnicas de descoberta de conhecimentos, conhecidas como KDD (Knowledge Discovery in Database), usando alguns algoritmos de detecção de agrupamentos apropriados. Entretanto, estes algoritmos possuem custo computacional elevado, o que dificulta a sua utilização em grandes conjuntos de dados. As técnicas já desenvolvidas na Área de Bases de Dados para indexação de espaços métricos usualmente consideram o conjunto de maneira uniforme sem levar em conta a existência de agrupamentos nos dados, por isso as estruturas buscam maximizar a eficiência das consultas para todo o conjunto simultaneamente. No entanto muitas vezes as consultas por similaridade estão limitadas a uma região específica do conjunto de dados. Neste contexto, esta dissertação propõe a criação de um novo método de acesso, que seja capaz de indexar de forma eficiente dados métricos, principalmente para conjuntos que contenham agrupamentos. Para atingir esse objetivo este trabalho também propõe um novo algoritmo para detecção de agrupamentos em dados métricos tornando mais eficiente a escolha do medoide de determinado conjunto de elementos. Os resultados dos experimentos mostram que os algoritmo propostos FAMES e M-FAMES podem ser utilizados para a detecção de agrupamentos em dados complexos e superam os algoritmos PAM, CLARA e CLARANS em eficácia e eficiência. Além disso, as consultas por similaridade realizadas com o método de acesso métrico proposto FAMESMAM mostraram ser especialmente apropriados para conjuntos de dados com agrupamentos / The success of Database Management System (DBMS) for applications with traditional data (numbers and short texts) has encouraged its use in new types of applications that require manipulation of complex data. Time series, scientific data and other multimedia data are examples of complex data. Several application fields, like medical informatics, have demanded solutions for managing complex data. Complex data can also be studied by means of Knowledge Discovery Techniques (KDD) applying appropriate clustering algorithms. However, these algorithms have high computational cost hindering their use in large data sets. The techniques already developed in the Databases research field for indexing metric spaces usually consider the sets have a uniform distribution, without taking into account the existence of clusters in the data, therefore the structures need to generalize the efficiency of queries for the entire set simultaneously. However the similarity searching is often limited to a specific region of the data set. In this context, this dissertation proposes a new access method able to index metric data efficiently, especially for sets containing clusters. It also proposes a new algorithm for clustering metric data so that selection of a medoid from a particular subset of elements becomes more efficient. The experimental results showed that the proposed algorithms FAMES and M-FAMES can be used as a clustering technique for complex data that outperform PAM, CLARA and CLARANS in effectiveness and efficiency. Moreover, the similarity searching performed with the proposed metric access method FAMESMAM proved to be especially appropriate to data sets with clusters Banco de dados Clusters Mineração de dados Clusterings Data Mining Database
374	Estudos de rotas de beneficiamento da nefelina-sienito para aplicação como fundente na massa cerâmica do porcelanato Volkmann, Alexandre Ritter January 2004 (has links) Este trabalho consiste em um estudo de caracterização e viabilidade econômica, para implantação de uma linha de processo, para beneficiar uma jazida de nefelina-sienito. Esta jazida pertence à Mineração e Pesquisa Brasileira Ltda e está localizada no Domo Alcalino do Planalto Lageano, no Estado de Santa Catarina. Nefelina-sienito é uma rocha ígnea de origem plutônica, com ausência de quartzo livre, constituída por minerais félsicos que são os feldspatos e feldspatóides e máficos, que são o piroxênio e anfibólio, associados a minerais acessórios como zircão, apatita, titanita e minerais opacos. Sua principal utilização é como fundente para a indústria cerâmica e vidreira. Este insumo concorre com o Feldspato neste segmento, com vantagens intrínsecas, como teor mais elevado de álcalis (Na2O+K2O), homogeneidade da jazida, além da proximidade do centro consumidor. Por outro lado, apresenta uma grande desvantagem que limita sua utilização na indústria cerâmica, e praticamente exclui seu emprego para o porcelanato e esmalte, que é a interferência na cor do produto final, reflexo do elevado teor de ferro. O objetivo deste trabalho é obter um produto que sirva de insumo (matériaprima) fundente à indústria cerâmica, especificamente na linha de revestimentos nobres, para a fabricação de um piso cerâmico de alto valor agregado, denominado grêsporcelanato Para atingir este objetivo, definiu-se as etapas e ensaios a serem realizados para extrair os minerais máficos (cromóforos), ou seja, aqueles com ferro presente em sua estrutura, e com isto enquadrar o produto dentro dos padrões exigidos pela indústria cerâmica. Inicialmente realizou-se uma caracterização mineralógica da nefelina-sienito, identificando suas características estruturais e texturais e seus minerais constituintes, diferenciando os máficos dos félsicos, estudando suas características físicas, químicas e morfológicas. Posteriormente, efetuou-se a caracterização tecnológica avaliando o grau de liberação destes minerais e, por fim, ensaios de beneficiamento, utilizando-se as técnicas de flotação e separação magnética a seco e a úmido, avaliando suas performances e definindo a rota de processo mais indicada.Elaborou-se um fluxograma de processo específico para esta linha de produção considerando os equipamentos que a empresa já possui, buscando reduzir o custo de implantação. Definida a linha de processo e os equipamentos necessários para sua implantação, avaliou-se os investimentos e custos envolvidos para duas escalas de produção. Por fim elaborou-se um fluxo de caixa para avaliar a viabilidade econômica do projeto. Os resultados encontrados confirmaram a viabilidade técnica e econômica para implantação desta nova linha de processo. Mineração : Aspectos econômicos Nefelina-sienito : Caracterização Tratamento de minérios
375	Determinação e quantificação de elementos de relevância em infraestrutura de mina Vieira, João Carlos January 2013 (has links) Este estudo apresenta, de forma sistemática, a importância da infraestrutura de mina a céu aberto, determinando as atividades principais dessa fase e os impactos e benefícios causados por alterações na forma de execução, medidos através de indicadores de produtividade e resultados financeiros. Algumas atividades principais como a reconfiguração das faces dos bancos de lavra pela aplicação comparativa de desempenho de trator de esteira e retroescavadeira; o estabelecimento de padrão para o dimensionamento das camadas estruturais e funcionais das estradas de mina; a mensuração dos benefícios da construção e manutenção das estradas, no desempenho dos caminhões e dos tratores de esteira, através de estudos de caso e demonstrar que a aplicação de técnicas adequadas modificam o resultado operacional. A metodologia utilizada aborda a relevância da infraestrutura e da frota de equipamentos auxiliares dentro do ciclo operacional, propondo uma aplicação correta e sistemática, baseada na demanda e nas atividades auxiliares que proporcionam condições operacionais para as atividades "que geram valor", suportando o cumprimento das metas estabelecidas no plano de produção. Os principais resultados obtidos vão desde a melhoria da segurança operacional, da imagem da empresa, do resultado financeiro, ao melhor aproveitamento dos recursos minerais, impactando diretamente a sustentabilidade do negócio. Através dos casos abordados neste trabalho, conclui-se que o desempenho da mineração a céu aberto é fortemente dependente do foco dado à infraestrutura de mina, ou seja: da qualidade das pistas, adequação das praças de carregamento, condição operacional de pilhas de estéril ou minério, drenagem superficial, dos métodos de trabalho e da disciplina operacional, gerando ganhos e/ou perdas que vão de unidades de porcentagem a várias vezes a capacidade do processo abordado. / This study presents, in a systematic way, the importance of the infrastructure in the open pit mining, determining the main activities of this operation and the impacts and benefits from changes implemented measured by operating productivity indicators and financial results. Some major activities such as the reconfiguration of the slope faces by the comparative performance of bulldozer and backhoe; the establishment of standards for the design of structural and functional layers of the mine haul roads; measure the benefits of the construction and maintenance of roads, the performance of trucks and bulldozers, through case studies show that the application of appropriate techniques can modify the operating result. The methodology addresses the importance of infrastructure and auxiliary equipment fleet in the operating cycle, proposing a correct and systematic application, based on demand and auxiliary activities that provide operating conditions for activities "that create value", supporting the achievement of the goals established in the production plan. The main results ranging from improved operational safety, company image, financial results, the best use of mineral resources, directly impacts on the business sustainability. Through the cases discussed in this work, it is concluded that the performance of the open pit mining is strongly dependent on the focus given to the mine infrastructure wich means, the quality of the tracks, adequacy of the loading spots, operating condition of waste dumps or ore bins, surface drainage, working methods and operational discipline, generating gains and/or losses ranging from small amounts to several times the capacity of the covered process. Mineração a céu aberto Equipamento Infraestrutura Infrastructure Open pit mining Equipment
376	Diversidade e composição de comunidades microbianas de solos construídos e de solos sob diferentes manejos agrícolas / Diversity and composition of soil microbial communities of constructed soils, and soils under different agricultural management Quadros, Patrícia Dörr de January 2013 (has links) Este estudo avaliou as comunidades microbianas do solo de dois ecossistemas para tentar encontrar particularidades e relações entre os microrganismos e as características do solo. Para isto, foram estudadas a diversidade, a abundância relativa e a composição microbiana do solo, utilizando-se sequenciamento Illumina do gene de rRNA 16S. Foram avaliadas 5 áreas de solo construído após a mineração de carvão, uma área de floresta e uma de campo-nativo em Candiota/RS, assim como uma área experimental agrícola sob diferentes sistemas de manejo e rotação de culturas, na Estação Experimental Agronômica da UFRGS, em Eldorado do Sul/RS. Foi observada uma redução drástica na diversidade microbiana nos solos construídos comparando-se com solos de mata ou pastagem nativa. Os gêneros mais abundantes nos solos construídos foram Thiobacillus, Sphingomonas, Novosphingobium, Acinetobacter, e Variovorax. Bradyrhizobium foi o gênero mais abundante na área de floresta (6,4% do total de sequencias) e Bacillus no site pastagens (4,8% do total de sequencias). A diversidade microbiana nos solos construídos aumentou com o tempo, porem mesmo 20 anos após o processo de construção do solo, a diversidade, composição e abundância de microrganismos não retornou aos níveis originais, indicando que os solos construídos não foram recuperados adequadamente com o manejo de solo que foi aplicado. A comunidade microbiana dos solos agrícolas foi significativamente diferente comparando-se os sistemas de plantio convencional e de plantio direto. A diversidade microbiana foi maior nas parcelas em pousio ou onde foram cultivadas apenas gramíneas. O gênero mais abundante nos sistemas convencional e de plantio direto foi Sphingomonas. A bactéria anaeróbia Clostridium demonstrou ser dominante nos solos sob sistema de plantio direto e também onde foram cultivadas gramíneas. A população de Burkholderia foi dominante nos solos onde havia o cultivo da leguminosa Lablab. Os teores de P, Mg, carbono orgânico total, N total e N mineral foram significativamente maiores no sistema de plantio direto. Os resultados confirmaram que tanto o distúrbio causado pela mineração e construção do solo, quanto o manejo agrícola, interferem na diversidade, abundância e composição da comunidade microbiana. Este trabalho sugere a utilização do gênero Bradyrhizobium como um microrganismo “assinatura” em solos naturais, tais como florestas, pastagens ou em locais onde a agricultura cessou há várias décadas, assim como, o gênero Clostridium como um microrganismo “assinatura” do solo agrícola estudado sob plantio direto. A diversidade microbiana demonstrou neste estudo estar totalmente relacionada com a diversidade de plantas. Ambos os solos estudados demonstraram que as características do solo selecionam a comunidade microbiana. / This study examined the soil microbial communities from disturbed ecosystems in order to find particularities and relationships between microorganisms and their specific habitat’s soil features. For this study, the soil features were analyzed, as well as the microbial communities relative abundance, diversity, and composition using Illumina high throughput sequencing of the 16S rRNA gene. Five post-mined sites under restoration, and two sites in an agricultural long-term experiment under different treatments were studied in South Brazil. A drastic decrease in microbial diversity was observed in the post-mined soils when compared to native forest or grassland regional soils. The most abundant genera in the constructed soils were Thiobacillus, Sphingomonas, Novosphingobium, Acinetobacter, and Variovorax. Bradyrhizobium was the most abundant genus in the forest soil (6.4% of total reads) and Bacillus in the grassland soil (4.8 % of total reads). The microbial diversity in constructed soil increased over time, but even twenty years after soil construction, the diversity, composition and abundance of microorganisms did not return to the original levels. The findings indicate that constructed soils were not recovered after the soil management applied. When compared in tillage and no-tillage systems, the microbial community in the studied agricultural sites greatly differed. The microbial diversity was higher in fallow plots, and where only grasses were grown. The most abundant genus in tilled and in no-tilled soil was Sphingomonas. The anaerobe bacteria Clostridium was very abundant in notilled soil, and also dominated the microbial population in soils where grasses were grown. Burkholderia dominated in plots containing the legume Lablab bean. The P, Mg, total organic carbon, total N, and mineral N levels were significantly higher in the no-tillage system. The results confirmed that those environmental disturbances from coal mining and agricultural, led to changes in the nutrition level, switching the abundance of some functional groups responsible for the degradation of compounds as well as for the biogeochemical cycle. Also, it was found that the genus Bradyrhizobium can be used as a signature microorganism in natural soils, such as forest and grassland or in sites where the agriculture had been stopped many decades ago. Similarly, Clostridium can be used as a signature in the studied no-tilled soils. The microbial diversity is higher in natural soils and is reduced in constructed soils after coal mining as well as soils under agricultural management. Both soil environments that were studied had a particular microbial community where a few genera dominates the niche. The environmental niche occupied by each group of microorganisms also had particular soil features that changed according to the soil management. Microbiologia do solo Mineração de carvão Plantio direto Analise do solo
377	Avaliação da contribuição antrópica proveniente das atividades de mineração de carvão na bacia hidrográfica do Arroio do Conde, Região do Baixo Jacuí - RS Vecchio, Gracianine Rocca January 2001 (has links) Esse trabalho teve como meta estudar os efeitos provenientes das atividades de mineração de carvão sobre as águas superficiais e sedimentos de corrente em seis pontos localizados na bacia do Arroio do Conde, região do Baixo Jacuí, RS. Para avaliar a influência antrópica nos cursos d’água superficiais, foram utilizadas as informações adquiridas no presente trabalho, durante o período de setembro à dezembro de 1997 e nos meses de fevereiro, abril e junho de 1998, e as pertencentes ao estudo realizado por Teixeira e Sanchez (1998), correspondente ao período entre maio de 1994 à novembro de 1995. Quanto aos sedimentos de corrente, foram utilizados os dados obtidos nesse trabalho nos meses de janeiro, outubro e dezembro de 1997, e por Teixeira e Sanchez (1998) durante os meses de outubro de 1992, abril de 1993, agosto e novembro de 1994, fevereiro, maio e setembro de 1995. Com base nos dados disponíveis, os resultados para as águas superficiais indicaram influência antrópica mais significativa no Arroio Capão da Roça, evidenciada pela estimativa dos fluxos de transferência elevada para todos os elementos metálicos analisados. Os sedimentos de corrente apresentaram teores elevados de Carbonototal e Enxofretotal para o Arroio Capão da Roça e um aumento gradual de montante para jusante para os elementos Cu, Ni e Zn. As áreas que sofrem maior influência antropogênica apresentaram concentrações elevadas de Fe e Cr, e as localizadas a jusante das principais fontes de contaminação por carvão revelaram concentrações elevadas de Mn, Cd e Co, bem como enriquecimento moderado para os elementos Co, Cu, Zn, Cd, Ni e Fe. Não houve acumulação significativa de metais nos sedimentos da bacia hidrográfica estudada. Técnicas estatísticas de Análise Fatorial e Funções Discriminantes Canônicas foram utilizadas como ferramentas complementares para integração, síntese e apresentação visual dos resultados de águas superficiais e sedimentos de corrente, respectivamente. A determinação de um Índice de Poluição para as águas superficiais, possibilitou definir os locais críticos em relação aos parâmetros analisados, bem como revelou boa qualidade para os cursos d’água situados a jusante desses locais. A técnica das Funções Discriminantes Canônicas permitiu diferenciar os sedimentos de corrente mediante a identificação dos parâmetros que apresentaram maior variabilidade entre os seis pontos estudados (Ni, Co, Zn, Carbonototal e Enxofretotal). De forma geral, com exceção de alguns pontos específicos, a bacia do Arroio do Conde não encontra-se comprometida pela influência antrópica proveniente do carvão. / The goal of this study was to understand the effects of the coal mining activities on fluvial waters and stream sediments of the Arroio do Conde basin, Baixo Jacuí region, Rio Grande do Sul State. Besides the data collected in this work, from September 1997 to June 1998, data from Teixeira and Sanchez (1998) were add to evaluate the anthropogenic influence in fluvial waters and stream sediments contamination. Fluvial waters analysis showed that the strongest influence was in the Arrio Capão da Roça were the data indicate high metais transference flux. In the same stream, high grades of carbon and sulfur and na increasing content of Cu, Ni and Zn in up stream sediments were identified. The zones of higher anthropogenic influence contain high concentrations on Fe and Cr and the zones located downstream of the sources of coai contamination showed high levels of Mn, Cd, and Co, as well moderate enrichment of Cu, Zn, Cd, Ni and Fe. No significant acumulation of metais was identified in the stream sediments of the Arroio do Conde basin. Factorial analysis (FA) and canonic discriminant functions (CDF) were applied as complementary tools in the general analysis and integration of results for fluvial waters and stream sediments. The definition of a Pollution Index for fluvial waters alloweed to define the criticai polluted areas as well indicated the good quality of downstream waters far from those areas. The CDF technique was able to classify steam sediments based on the variability of the studied parameters (Ni, Co, Zn, C and S). With a few exceptions, in a general way the Arroio do Conde basin was not seriously polluted by the coal mining activities. Poluição da água Mineração Carvão Conde, Arroio do, Bacia (RS)
378	Estudo da Criptografia Completamente Homomórfica Aplicada na Mineração de Dados Costa, Laécio Araujo 06 June 2014 (has links) Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-09T19:08:53Z No. of bitstreams: 2 DISSERTAÇÃO Laécio Araújo Costa.pdf: 3437666 bytes, checksum: 478f05a3dafea12ef059cfeefd8a8c32 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-09T19:08:53Z (GMT). No. of bitstreams: 2 DISSERTAÇÃO Laécio Araújo Costa.pdf: 3437666 bytes, checksum: 478f05a3dafea12ef059cfeefd8a8c32 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2014-06-06 / FACEPE / Nesta era digital, organizações produzem um grande volume de dados, e armazenar estes dados de forma que se garanta a sua segurança, privacidade, confidencialidade e integridade é uma necessidade ainda maior quando se está conectado à rede mundial de computadores. Além do serviço de armazenamento, as organizações e usuários necessitam recuperar informações úteis a partir de diversas bases de dados (processo de mineração de dados) ou efetuar buscas de dados armazenados na nuvem. Desta forma, os usuários recorrem às técnicas criptográficas para tornar difícil o acesso por pessoas não autorizadas às informações em texto claro e garantir a segurança dos dados armazenados e processados. No processo natural de mineração de dados, os algoritmos mineradores necessitam ter acesso aos dados em seu estado original a fim de extrair as informações úteis a partir das várias bases de dados distribuídas, processo este que não preserva as propriedades como a segurança, a privacidade e o sigilo dos dados sensíveis. Com o objetivo de preservar tais propriedades é necessário executar operações com os dados em seu estado codificado protegendo as informações em todo o processo minerador. Assim, técnicas de Encriptação Completamente Homomórfica (ECH) poderão ser utilizadas na mineração de dados com esta perspectiva: preservar a segurança, a privacidade e o sigilo das informações. A privacidade homomórfica foi concebida por Rivest, Adleman e Dertouzous em 1978, a qual ficou obscura por mais de 30 anos. Somente em meados de 2009, foi que Craig Gentry conseguiu comprovar que é possível computar arbitrariamente dados codificados com a encriptação homomórfica baseado em reticulados ideais. Desta forma, o esquema proposto por Gentry foi concebido como o propulsor da ECH permitindo a computação arbitraria com o texto codificado e obter um resultado codificado que corresponde à sequência de operações realizadas no texto original. A aplicação da encriptação completamente homomórfica na mineração de dados poderá resolver problemas como a preservação do sigilo, da privacidade e da segurança dos dados durante todo o processo minerador. Assim, este trabalho objetiva identificar e selecionar os estudos relevantes que propõem algum tipo de mecanismo aplicado no processo minerador e que seja baseado na Encriptação Completamente Homomórfica. Essa seleção visa verificar se a ECH é prática, eficiente e computacionalmente viável quando aplicada na mineração de dados com o objetivo de preservar a privacidade, o sigilo e a segurança das informações. Após a análise dos estudos, conclui-se que há esforços em desenvolver protocolos para o processo minerador com base na ECH, mas que os atuais esquemas de ECH ainda não são práticos para que possam ser aplicados no processo de mineração com eficiência. No entanto, criptógrafos estão dedicando esforços visando melhorar as propostas atuais da ECH, tornando-os computacionalmente viáveis. Encriptação Completamente Homomórfica Mineração de Dados Preservação da Privacidade e do Sigilo
379	Monitoramento online de riscos operacionais no desenvolvimento de software: uma abordagem baseada em mineração de processos e de dados D’Castro, Raphael José 26 August 2013 (has links) Submitted by Luiz Felipe Barbosa (luiz.fbabreu2@ufpe.br) on 2015-03-12T13:51:39Z No. of bitstreams: 2 Dissertaçao Raphael Jose D'Castro.pdf: 3419625 bytes, checksum: bc95cbbe40fd85831a5b15cf012a58d8 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Approved for entry into archive by Daniella Sodre (daniella.sodre@ufpe.br) on 2015-03-13T12:55:08Z (GMT) No. of bitstreams: 2 Dissertaçao Raphael Jose D'Castro.pdf: 3419625 bytes, checksum: bc95cbbe40fd85831a5b15cf012a58d8 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-13T12:55:09Z (GMT). No. of bitstreams: 2 Dissertaçao Raphael Jose D'Castro.pdf: 3419625 bytes, checksum: bc95cbbe40fd85831a5b15cf012a58d8 (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-08-26 / Um grande desafio para a engenharia de software é entregar um produto com qualidade, no prazo acordado, a custos aceitáveis. Neste contexto, a gestão de risco é essencial para evitar ou minimizar os problemas durante a execução do projeto de software. Diversas abordagens foram propostas para o gerenciamento de riscos em projeto de software, mas esta ainda é uma atividade negligenciada nas organizações que desenvolvem software. Um fator que contribui para este cenário é a escassez de critérios para mensurar a incerteza, o que torna a gestão de riscos na engenharia de software uma atividade abstrata e subjetiva. Visando oferecer uma alternativa a essa situação, propomos um framework para monitoramento em tempo de execução de riscos operacionais no desenvolvimento de software. Esse framework utiliza mineração de processos e mineração de dados para extrair indicadores de desempenho e qualidade a partir dos logs das ferramentas de gestão de configuração de software. Esses indicadores são utilizados para monitorar, em tempo real, condições indesejadas no desenvolvimento de software. Para verificar sua viabilidade, conduzimos um estudo, aplicando o framework proposto em um ambiente real de desenvolvimento de software. Gerenciamento de riscos Monitoramento de riscos Indicador Mineração de processos Detecção de anomalias
380	A solution to extractive summarization based on document type and a new measure for sentence similarity MELLO, Rafael Ferreira Leite de 20 March 2015 (has links) Submitted by Isaac Francisco de Souza Dias (isaac.souzadias@ufpe.br) on 2016-02-19T18:25:04Z No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) TESE Rafael Ferreira Leite de Mello.pdf: 1860839 bytes, checksum: 4d54a6ef5e3c40f8bce57e3cc957a8f4 (MD5) / Made available in DSpace on 2016-02-19T18:25:04Z (GMT). No. of bitstreams: 2 license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) TESE Rafael Ferreira Leite de Mello.pdf: 1860839 bytes, checksum: 4d54a6ef5e3c40f8bce57e3cc957a8f4 (MD5) Previous issue date: 2015-03-20 / The Internet is a enormous and fast growing digital repository encompassing billions of documents in a diversity of subjects, quality, reliability, etc. It is increasingly difficult to scavenge useful information from it. Thus, it is necessary to provide automatically techniques that allowing users to save time and resources. Automatic text summarization techniques may offer a way out to this problem. Text summarization (TS) aims at automatically compress one or more documents to present their main ideas in less space. TS platforms receive one or more documents as input to generate a summary. In recent years, a variety of text summarization methods has been proposed. However, due to the different document types (such as news, blogs, and scientific articles) it became difficult to create a general TS application to create expressive summaries for each type. Another related relevant problem is measuring the degree of similarity between sentences, which is used in applications, such as: text summarization, information retrieval, image retrieval, text categorization, and machine translation. Recent works report several efforts to evaluate sentence similarity by representing sentences using vectors of bag of words or a tree of the syntactic information among words. However, most of these approaches do not take in consideration the sentence meaning and the words order. This thesis proposes: (i) a new text summarization solution which identifies the document type before perform the summarization, (ii) the creation of a new sentence similarity measure based on lexical, syntactic and semantic evaluation to deal with meaning and word order problems. The previous identification of the document types allows the summarization solution to select the methods that is more suitable to each type of text. This thesis also perform a detailed assessment with the most used text summarization methods to selects which create more informative summaries for news, blogs and scientific articles contexts.The sentence similarity measure proposed is completely unsupervised and reaches results similar to humans annotator using the dataset proposed by Li et al. The proposed measure was satisfactorily applied to evaluate the similarity between summaries and to eliminate redundancy in multi-document summarization. / Atualmente a quantidade de documentos de texto aumentou consideravelmente principalmente com o grande crescimento da internet. Existem milhares de artigos de notícias, livros eletrônicos, artigos científicos, blog, etc. Com isso é necessário aplicar técnicas automáticas para extrair informações dessa grande massa de dados. Sumarização de texto pode ser usada para lidar com esse problema. Sumarização de texto (ST) cria versões comprimidas de um ou mais documentos de texto. Em outras palavras, palataformas de ST recebem um ou mais documentos como entrada e gera um sumário deles. Nos últimos anos, uma grande quantidade de técnicas de sumarização foram propostas. Contudo, dado a grande quantidade de tipos de documentos (por exemplo, notícias, blogs e artigos científicos) é difícil encontrar uma técnica seja genérica suficiente para criar sumários para todos os tipos de forma eficiente. Além disto, outro tópico bastante trabalhado na área de mineração de texto é a análise de similaridade entre sentenças. Essa similaridade pode ser usada em aplicações como: sumarização de texto, recuperação de infromação, recuperação de imagem, categorização de texto e tradução. Em geral, as técnicas propostas são baseados em vetores de palavras ou árvores sintáticas, com isso dois problemas não são abordados: o problema de significado e de ordem das palavras. Essa tese propõe: (i) Uma nova solução em sumarização de texto que identifica o tipo de documento antes de realizar a sumarização. (ii) A criação de uma nova medida de similaridade entre sentenças baseada nas análises léxica, sintática e semântica. A identificação de tipo de documento permite que a solução de sumarização selecione os melhores métodos para cada tipo de texto. Essa tese também realizar um estudo detalhado sobre os métodos de sumarização para selecinoar os que criam sumários mais informativos nos contextos de notícias blogs e artigos científicos. A medida de similaridade entre sentences é completamente não supervisionada e alcança resultados similarires dos anotadores humanos usando o dataset proposed por Li et al. A medida proposta também foi satisfatoriamente aplicada na avaliação de similaridade entre resumos e para eliminar redundância em sumarização multi-documento. Ciência da computação Inteligência artificial Mineração de texto Processamento de linguagem natural

Search results