Global ETD Search

161	Otimiza??o de comit?s de agrupamento usando o algoritmo coral reefs optimization / Cluster ensembles optimization using coral reefs optimization algorithm Silva, Huliane Medeiros da 04 March 2016 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-01-12T13:24:40Z No. of bitstreams: 1 HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-01-16T14:40:28Z (GMT) No. of bitstreams: 1 HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5) / Made available in DSpace on 2017-01-16T14:40:28Z (GMT). No. of bitstreams: 1 HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5) Previous issue date: 2016-03-04 / O presente trabalho est? inserido na linha de pesquisa de aprendizado de m?quina, que ? um campo de pesquisa associado ? Intelig?ncia Artificial e dedicado ao desenvolvimento de t?cnicas que, permitem ao computador aprender com experi?ncias passadas. Em aprendizado de m?quina, h? diferentes tarefas de aprendizado que pertencem a determinado paradigma de aprendizado, entre elas podemos citar agrupamento de dados, que pertencente ao paradigma de aprendizado n?o supervisionado. Diversos algoritmos de agrupamento v?m sendo utilizados com sucesso em diferentes aplica??es. No entanto, cada algoritmo possui suas pr?prias caracter?sticas e limita??es, que podem gerar diferentes solu??es para um mesmo conjunto de dados. Dessa forma, combinar v?rios m?todos de agrupamento (comit?s de agrupamento), capaz de aproveitar as caracter?sticas de cada algoritmo ? uma abordagem bastante utilizada na tentativa de superar as limita??es de cada t?cnica de agrupamento. Nesse contexto, diversas abordagens t?m sido propostas na literatura no intuito de otimizar, ou seja, de melhorar cada vez mais as solu??es encontradas. Dessa forma, o objetivo deste trabalho ? propor uma abordagem para otimiza??o de comit?s de agrupamento, por meio da fun??o consenso, utilizando t?cnicas inspiradas na natureza. Essa abordagem consiste na forma??o de um comit? de agrupamento heterog?neo, de modo que as parti??es iniciais s?o combinadas por um m?todo que utilizada o algoritmo de otimiza??o Coral Reefs Optimization com o m?todo de co-associa??o, resultando em uma parti??o final. Essa estrat?gia ? avaliada atrav?s dos ?ndices de avalia??o de agrupamento, Dunn, Calinski-Harabasz, Dom e Jaccard, no intuito de analisar a viabilidade da abordagem proposta. Finalmente, o desempenho da abordagem proposta ? comparado com duas outras abordagens, s?o elas: algoritmo gen?tico com o m?todo de co-associa??o e o m?todo de co-associa??o tradicional. Essa compara??o ? feita atrav?s da utiliza??o de testes estat?sticos, especificamente teste de Friedman. Aprendizado de M?quina Comit?s de agrupamento Otimiza??o
162	Abordagem heur?stica baseada em busca em vizinhan?a vari?vel para o agrupamento balanceado de dados pelo crit?rio da soma m?nima das dist?ncias quadr?ticas Costa, Leandro Rochink 22 August 2016 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-02-13T19:22:38Z No. of bitstreams: 1 LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-02-14T18:08:27Z (GMT) No. of bitstreams: 1 LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5) / Made available in DSpace on 2017-02-14T18:08:27Z (GMT). No. of bitstreams: 1 LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5) Previous issue date: 2016-08-22 / Ap?s v?rios avan?os na tecnologia de capta??o e armazenamento de dados e do crescimento de aplica??es que prov?m novas informa??es, o n?mero de elementos informacionais dispon?veis ? enorme tanto em volume quanto em variedade. Com esse aumento na quantidade de informa??es, a necessidade de entend?-los e resumi-los se tornou cada vez mais urgente. O Agrupamento Balanceado de Dados, do ingl?s Balanced Clustering, visa encontrar grupos de entidades similares que possuam aproximadamente o mesmo tamanho. Neste trabalho, ? proposta uma nova abordagem heur?stica baseada na metaheur?stica Busca em Vizinhan?a Vari?vel, do ingl?s Variable Neighborhood Search (VNS), e na metodologia Menos ? mais, do ingl?s Less is more approach, para o problema de agrupamento de dados usando o crit?rio da soma m?nima das dist?ncias quadr?ticas com restri??o de balanceamento dos grupos. Os algoritmos encontrados na literatura n?o s?o escal?veis ao passo que aumentamos o tamanho do problema para al?m de 5000 elementos de acordo com experimentos realizados nesta pesquisa. Os experimentos computacionais mostram que o m?todo proposto supera o atual estado da arte neste problema. / After advances in collecting and storing data and the growth in applications that provide new information, the number of data elements available is huge in both volume and variety. With this increase in the quantity of information, the need to understand them and summarize them has become increasingly urgent. The Balanced Clustering seeks to find groups of similar entities that have approximately the same size. In this dissertation, we propose a new heuristic approach based on metaheuristic Variable Neighborhood Search (VNS) and methodology "Less is More Approach"(LIMA) to data clustering problem using the criterion of the minimum sum-of-squared distances applying balancing restriction for the groups. The algorithms found in the literature are not scalable, while the problem of increased size in addition to elements 5000 in accordance with experiments performed in this study. The computational experiments show that the proposed method outperforms the current state of the art for the problem. Agrupamento de dados Otimiza??o Minera??o de dados
163	Utiliza??o do problema das k-medianas como crit?rio para o agrupamento de dados semi-supervisionado Randel, Rodrigo Alves 12 December 2016 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-03T19:47:15Z No. of bitstreams: 1 RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-06T20:17:18Z (GMT) No. of bitstreams: 1 RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Made available in DSpace on 2017-04-06T20:17:18Z (GMT). No. of bitstreams: 1 RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) Previous issue date: 2016-12-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Agrupamento de dados ? uma poderosa ferramenta para an?lise autom?tica de dados. Essa t?cnica se prop?e a resolver o seguinte problema: dado um conjunto de entidades, encontrar subconjuntos, denominados clusters, que s?o homog?neos e/ou bem separados. O maior desafio do agrupamento de dados ? encontrar um crit?rio que apresente boa separa??o de dados em grupos homog?neos, e que estes agrupamentos possam trazer informa??es ?teis ao usu?rio. Para resolver este problema, ? sugerido que o usu?rio possa fornecer informa??es pr?vias a respeito do conjunto de dados que auxiliem/guiem o processo de agrupamento. Realizar o agrupamento de dados utilizando essas informa??es auxiliares ? denominado de agrupamento de dados semi-supervisionado (ADSS). Este trabalho explora o problema de ADSS utilizando um novo modelo: os dados s?o agrupados atrav?s da resolu??o do problemas das k-medianas. Resultados mostram que essa abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em diversos dom?nios diferentes. / Clustering is a powerful tool for automated analysis of data. It addresses the following general problem: given a set of entities, find subsets, or clusters, which are homogeneous and/or well separated. The biggest challenge of data clustering is to find a criterion to present good separation of data into homogeneous groups, so that these groups bring useful information to the user. To solve this problem, it is suggested that the user can provide a priori information about the data set. Clustering under this assumption is called semi-supervised clustering. This work explores the semi-supervised clustering problem using a new model: the data is clustered by solving the k-medians problem. Results shows that this new approach was able to efficiently cluster the data in many different domains. Agrupamento de dados semi-supervisionado Minera??o de dados k-medianas
164	Novas heur?sticas para o agrupamento de dados pela soma m?nima de dist?ncias quadr?ticas Pereira, Thiago Correia 12 April 2017 (has links) Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-10-02T23:37:05Z No. of bitstreams: 1 ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-10-09T19:56:01Z (GMT) No. of bitstreams: 1 ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5) / Made available in DSpace on 2017-10-09T19:56:01Z (GMT). No. of bitstreams: 1 ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5) Previous issue date: 2017-04-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Devido ao grande volume de dados gerados pelo crescimento de aplica??es que prov?m novas informa??es, tanto em volume quanto em variedade, t?cnicas cada vez mais eficientes s?o exigidas para classific?-los e process?-los. Uma t?cnica muito utilizada ? o agrupamento de dados, cujo objetivo ? extrair conhecimento dos dados atrav?s da divis?o de entidades em subconjuntos homog?neos e/ou bem separados. Crit?rios podem ser utilizados para expressar a classifica??o dos dados. Dentre eles, um crit?rio frequentemente utilizado ? a soma m?nima das dist?ncias euclidianas quadr?ticas, do ingl?s, minimun sum-of-squares clustering (MSSC). Neste crit?rio, entidades s?o elementos no espa?o n-dimensional. O problema de agrupamento de dados pelo MSSC ? NP-?rduo, logo heur?sticas s?o t?cnicas extremamente ?teis para este tipo de problema. Este trabalho prop?e novas heur?sticas, baseadas na busca de vizinhan?as vari?veis gerais, do ingl?s, general variable neighborhood search (GVNS). Tamb?m ? proposto neste trabalho, a adapta??o da heur?stica reformulation descent (RD) para o problema MSSC, na forma de duas variantes, de forma in?dita na literatura. Os experimentos computacionais mostram que as variantes GVNS propostas neste trabalho apresentam melhores resultados, para inst?ncias grandes. / Due to the large volume of data generated by the growth of applications that provide new information, both in volume and variety, more efficient techniques are required to classify and processes them. A widely used technique is data grouping whose aim is to extract characteristics of the entities dividing them into homogeneous and/or well separated subsets. Many different criteria can be used to express the data classification. Among them, a commonly used criteria is the minimun sum-of-squares clustering (MSSC). In this criterion, entities are elements in n-dimensional Euclidean space. The data clustering problem by MSSC is NP-hard, then heuristics are extremely useful techniques for this type of problem. This work proposes new heuristics, based on the general variable neighborhood search (GVNS). Also proposed in this work is the adaptation of the heuristic reformulation descent (RD) to the MSSC problem, in the form of two variants, unapplied to this problem before in literature. The computational experiments show that the GVNS variants proposed in this work present better results, in large instances, than the current state of the art. Heur?stica VNS MSSC Agrupamento de dados
165	Investigation of changes in groundwater quality in the baixo Acarau result of irrigation management / InvestigaÃÃo de mudanÃas na qualidade das Ãguas subterrÃneas do Baixo AcaraÃ em decorrÃncia do manejo da irrigaÃÃo. Nayara Rochelli de Sousa Luna 09 March 2012 (has links) FundaÃÃo Cearense de Apoio ao Desenvolvimento Cientifico e TecnolÃgico / Irrigation is currently an important component in the development of agriculture, not only in arid and semiarid regions, but also in other regions, providing the balance of production and avoiding the possible interference caused by the occasional lack of water. Irrigated agriculture has increased the productivity of crops, but the return flows of irrigation are a main contributor in the degradation of water resources (surface and groundwater). This research was conducted aiming to identify the inference of irrigation management and climate seasonality in soil and water resources of form a quantitative and qualitative of Irrigation District Baixo AcaraÃ â DIBAU, CearÃ. The study was conducted with data from water collected in nine shallow wells, six (6) inserted in the irrigated area and three (3) outside irrigated area of DIBAU. Water samples were collected monthly during the August/10 July/11, totaling 12 sampling campaigns. The chemical analyses were performed at the Laboratory of Soil and Water Embrapa agribusiness Tropical. The attributes analyzed in the water were: pH, electrical conductivity (EC), Ca2+, Mg2+, Na+, K+, HCO3 -, Cl-, NH4 +, NO3 - and Sodium Adsorption Ratio (SAR). Soil samples were taken in (2) points, one batch area irrigated and the other in an uncultivated area. Both samples were collected the dry and rainy periods, each 50 cm depth from the surface to the zone of saturation of water table. To check the similarity of water quality was employed the statistical technique of multivariate analysis (cluster analysis) processed in SPSS 16.0. The classification of the chemical quality of water was performed by using the Piper diagram software QUALIGRAF (FUNCEME, 2009). According to the results of the water wells investigated were grouped without presenting geographical continuity, forming two distinct groups for the two seasons. The highest values of cations (Ca2+, Mg2+, Na+ and K+) were recorded in the waters of wells P1, P8 and P9. The soil texture was the determining factor for the reduction of sodium, chloride and nitrate in the soil profile of irrigated area according to the deeper layers. There was an increase in levels of nitrate in water from wells affected by agricultural practices (P5 and P7). These concentrations exceeded the maximum allowed limits by Resolution 357/2005 and by Ordinance 518/2004 for human consumption in certain months of collected. Groundwater the DIBAU were predominantly classified as chlorinated sodium. / A irrigaÃÃo Ã atualmente uma componente importante no desenvolvimento da agricultura, nÃo somente nas regiÃes Ãridas e semiÃridas, mas tambÃm em outras regiÃes, proporcionando o equilÃbrio da produÃÃo e evitando as possÃveis interferÃncias ocasionais provocadas pela falta de Ãgua. A agricultura irrigada tem aumentado Ã produtividade das culturas, mas o retorno dos fluxos de irrigaÃÃo Ã um dos principais contribuintes na degradaÃÃo das Ãguas superficiais e subterrÃneas. Esta pesquisa foi desenvolvida objetivando identificar a inferÃncia do manejo da irrigaÃÃo e da sazonalidade climÃtica nos recursos solo e Ãgua de forma quantitativa e qualitativa do Distrito de IrrigaÃÃo Baixo AcaraÃ â DIBAU, CearÃ. O estudo foi desenvolvido com dados de Ãguas coletadas em nove poÃos rasos, sendo seis inseridos na Ãrea irrigada e trÃs fora da Ãrea Ãtil do DIBAU. As coletas de Ãgua foram realizadas mensalmente durante o perÃodo de Agosto/10 a Julho/11, totalizando 12 campanhas de coletas. As anÃlises quÃmicas foram realizadas no LaboratÃrio de Solo e Ãgua da EMBRAPA AgroindÃstria Tropical. Os atributos analisados na Ãgua foram: pH, CEa, Ca2+, Mg2+, Na+, K+, HCO3 -, Cl -, NH4 +, NO3 - e RAS. As amostras de solos foram efetuadas em dois pontos de amostragens, sendo um em lote irrigado e o outro em uma Ãrea nÃo irrigada. Ambas as coletadas foram efetuadas no perÃodo seco e chuvoso, a cada 50 cm de profundidade da superfÃcie atÃ a zona de saturaÃÃo do lenÃol freÃtico. Para verificar a similaridade da qualidade das Ãguas foi empregada a tÃcnica estatÃstica de anÃlise multivariada (anÃlise de agrupamento) processada no SPSS 16.0. A classificaÃÃo da qualidade quÃmica das Ãguas foi realizada pelo diagrama de Piper atravÃs do software QUALIGRAF (FUNCEME, 2009). De acordo com os resultados as Ãguas dos poÃos investigados foram agrupadas sem apresentar continuidade geogrÃfica, formando dois grupos distintos para as duas estaÃÃes. Os maiores valores de Ca2+,Mg2+, Na+ e K+ foram registradas nas Ãguas dos poÃos P1, P8 e P9. A granulometria do solo foi o fator determinante para a reduÃÃo dos teores de sÃdio, cloreto e nitrato no perfil do solo da Ãrea irrigada de acordo com as camadas mais profundas. Houve um incremento nos teores de nitrato nas Ãguas dos poÃos influenciados pelas prÃticas agrÃcolas (P5 e P7). Estas concentraÃÃes excederam os limites mÃximos aceitÃveis pela ResoluÃÃo 357/2005 (CONAMA) e pela Portaria 518/2004 (MS) para consumo humano em determinados meses de coletas. As Ãguas subterrÃneas do DIBAU foram predominantemente classificadas como AGRONOMIA
166	Abordagens evolutivas para agrupamento relacional de dados / Evolutionary approaches to relational data clustering Danilo Horta 22 February 2010 (has links) O agrupamento de dados é uma técnica fundamental em aplicações de diversos campos do mercado e da ciência, como, por exemplo, no comércio, na biologia, na psiquiatria, na astronomia e na mineração da Web. Ocorre que em um subconjunto desses campos, como engenharia industrial, ciências sociais, engenharia sísmica e recuperação de documentos, as bases de dados são usualmente descritas apenas pelas proximidades entre os objetos (denominadas bases de dados relacionais). Mesmo em aplicações nas quais os dados não são naturalmente relacionais, o uso de bases relacionais permite que os dados em si sejam mantidos sob sigilo, o que pode ser de grande valia para bancos ou corretoras, por exemplo. Nesta dissertação é apresentada uma revisão de algoritmos de agrupamento de dados que lidam com bases de dados relacionais, com foco em algoritmos que produzem partições rígidas (hard ou crisp) dos dados. Particular ênfase é dada aos algoritmos evolutivos, que têm se mostrado capazes de resolver problemas de agrupamento de dados com relativa acurácia e de forma computacionalmente eficiente. Nesse contexto, propõe-se nesta dissertação um novo algoritmo evolutivo de agrupamento capaz de operar sobre dados relacionais e também capaz de estimar automaticamente o número de grupos nos dados (usualmente desconhecido em aplicações práticas). É demonstrado empiricamente que esse novo algoritmo pode superar métodos tradicionais da literatura em termos de eficiência computacional e acurácia / Data clustering is a fundamental technique for applications in several fields of science and marketing, as commerce, biology, psychiatry, astronomy, and Web mining. However, in a subset of these fields, such as industrial engineering, social sciences, earthquake engineering, and retrieval of documents, datasets are usually described only by proximities between their objects (called relational datasets). Even in applications where the data are not naturally relational, the use of relational datasets preserves the datas secrecy, which can be of great value to banks or brokers, for instance. This dissertation presents a review of data clustering algorithms which deals with relational datasets, with a focus on algorithms that produce hard or crisp partitions of data. Particular emphasis is given to evolutionary algorithms, which have proved of being able to solve problems of data clustering accurately and efficiently. In this context, we propose a new evolutionary algorithm for clustering able to operate on relational datasets and also able to automatically estimate the number of clusters (which is usually unknown in practical applications). It is empirically shown that this new algorithm can overcome traditional methods described in the literature in terms of computational efficiency and accuracy Abordagens evolutivas Agrupamento de dados relacionais Estimação do número de grupos Estimation of the number of clusters Evolutionary approaches Relational data clustering
167	Identificação de covers a partir de grandes bases de dados de músicas / Cover song identification using big data bases Martha Dais Ferreira 30 April 2014 (has links) Acrescente capacidade de armazenamento introduziu novos desafios no contexto de exploração de grandes bases de dados de músicas. Esse trabalho consiste em investigar técnicas de comparação de músicas representadas por sinais polifônicos, com o objetivo de encontrar similaridades, permitindo a identificação de músicas cover em grandes bases de dados. Técnicas de extração de características a partir de sinais musicais foram estudas, como também métricas de comparação a partir das características obtidas. Os resultados mostraram que é possível encontrar um novo método de identificação de covers com um menor custo computacional do que os existentes, mantendo uma boa precisão / The growing capacity in storage and transmission of songs has introduced a new challenges in the context of large music data sets exploration. This work aims at investigating techniques for comparison of songs represented by polyphonic signals, towards identifying cover songs in large data sets. Techniques for music feature extraction were evaluated and compared. The results show that it is possible to develop new methods for cover identification with a lower computational cost when compared to existing solutions, while keeping the good precision Agrupamento de dados Identificação de covers Recuperação da informação de música Cover song identification Data clustering Music information retrieval
168	Classificação e caracterização de tipos de minérios de cobre da Mina do Sossego - região de Carajás / Classification and characterization of copper ore types from Sossego Mine - Carajás region. Viviane Kotani Shimizu 24 July 2012 (has links) Neste trabalho é apresentada a classificação de cerca de 110 amostras de minério da Mina do Sossego com base nas ferramentas de difração de raios X e análise estatística por agrupamento (cluster analysis). A comparação, baseada na posição e intensidade dos picos difratados, permitiu a distinção dos tipos de minérios, sendo que as diferenças entre os grupos referem-se às proporções dos principais minerais constituintes: quartzo, feldspato, actinolita, óxidos de ferro, mica e clorita. Observou-se forte correlação do agrupamento com a origem das amostras. Esta relação deve-se aos diferentes tipos e intensidades das alterações hidrotermais atuantes em cada corpo, que refletem na mineralogia e, consequentemente, nos difratogramas de raios X das amostras. Complementando o trabalho, foram conduzidos estudos de caracterização tecnológica em amostras compostas dos tipos identificados, os quais permitiram definir a composição mineralógica das amostras e outros parâmetros relevantes ao beneficiamento. Vários são os minerais de ganga: quartzo, plagioclásio, feldspato, anfibólio, magnetita, apatita, epídoto, clorita, escapolita, micas e calcita. A calcopirita é praticamente o único mineral de minério, e ocorre tanto na forma de microcristais inclusos nos minerais de ganga quanto como cristais maiores. Com exceção da pirita, os demais sulfetos (calcocita, siegenita e milerita) ocorrem como traços. As curvas de liberação da calcopirita demonstram que as amostras do corpo Sossego possuem maior grau de liberação do que as de Sequeirinho. A metodologia para classificação de amostras mostrou-se bastante eficiente, possibilitando a análise de grande número de amostras, de forma objetiva e com resultado satisfatório, tendo-se verificado não só distinções mineralógicas entre estes como também características distintas frente ao processo de concentração. / This work presents the classification of approximately 110 copper ore samples from Sossego Mine using cluster analysis and X-ray diffraction technique. The comparison based on the position and intensity of the diffracted peaks allowed the distinction the major ore types differentiated by the proportion of major minerals: quartz, feldspar, actinolite, iron oxides, mica and chlorite. There was a strong correlation between the grouping and the location of the samples in Sequeirinho and Sossego orebodies. This relationship is due to different types and intensities of hydrothermal alteration prevailing in each body, which reflect the mineralogy and thus the X-ray diffractograms of samples. In addition, technological characterization studies on composed samples from the defined ore types were carried out based in order to gather mineralogical composition and other relevant parameters for mineral processing. There are several gangue minerals, including: quartz, plagioclase, feldspar, amphibole, magnetite, apatite, epidote, chlorite, scapolite, mica and calcite. Chalcopyrite is essentially the only valuable mineral. It occurs both as microcrystals included in other minerals such as larger crystals. Excepting pyrite, other sulfides (chalcocite, millerite and siegenite) occur as traces. Chalcopyrite liberation curves indicate that samples from Sossego have higher liberation degree than those from Sequeirinho. The proposed method for classification of ore samples proved to be very efficient. It enables the analysis of large numbers of samples in a short time with a satisfactory result allowing distinctions of the ore types regarding to their mineralogical composition as well as parameters for mineral processing. Análise por agrupamento Caracterização tecnológica Mina do Sossego Cluster analysis Sossego mine Technological characterization
169	Agrupamento de séries temporais em fluxos contínuos de dados / Time series clustering for data streams Cássio Martini Martins Pereira 29 October 2013 (has links) Recentemente, a área de mineração de fluxos contínuos de dados ganhou importância, a qual visa extrair informação útil a partir de conjuntos massivos e contínuos de dados que evoluem com o tempo. Uma das técnicas que mais se destaca nessa área e a de agrupamento de dados, a qual busca estruturar grandes volumes de dados em hierarquias ou partições, tais que objetos mais similares estejam em um mesmo grupo. Diversos algoritmos foram propostos nesse contexto, porém a maioria concentrou-se no agrupamento de fluxos compostos por pontos em um espaço multidimensional. Poucos trabalhos voltaram-se para o agrupamento de séries temporais, as quais se caracterizam por serem coleções de observações coletadas sequencialmente no tempo. Técnicas atuais para agrupamento de séries temporais em fluxos contínuos apresentam uma limitação na escolha da medida de similaridade, a qual na maioria dos casos e baseada em uma simples correlação, como a de Pearson. Este trabalho mostra que até para modelos clássicos de séries temporais, como os de Box e Jenkins, a correlação de Pearson não é capaz de detectar similaridade, apesar das séries serem provenientes de um mesmo modelo matemático e com mesma parametrização. Essa limitação nas técnicas atuais motivou este trabalho a considerar os modelos geradores de séries temporais, ou seja, as equações que regem sua geração, por meio de diversas medidas descritivas, tais como a Autoinformação Mútua, o Expoente de Hurst e várias outras. A hipótese considerada e que, por meio do uso de medidas descritivas, pode-se obter uma melhor caracterização do modelo gerador de séries temporais e, consequentemente, um agrupamento de maior qualidade. Nesse sentido, foi realizada uma avaliação de diversas medidas descritivas, as quais foram usadas como entrada para um novo algoritmo de agrupamento baseado em árvores, denominado TS-Stream. Experimentos com bases sintéticas compostas por diversos modelos de séries temporais foram realizados, mostrando a superioridade de TS-Stream sobre ODAC, a técnica mais popular para esta tarefa encontrada na literatura. Experimentos com séries reais provenientes de preços de ações da NYSE e NASDAQ mostraram que o uso de TS-Stream na escolha de ações, por meio da criação de uma carteira de investimentos diversificada, pode aumentar os retornos das aplicações em várias ordens de grandeza, se comparado a estratégias baseadas somente no indicador econômico Moving Average Convergence Divergence / Recently, the data streams mining area has gained importance, which aims to extract useful information from massive and continuous data sources that evolve over time. One of the most popular techniques in this area is clustering, which aims to structure large volumes of data into hierarchies or partitions, such that similar objects are placed in the same group. Several algorithms were proposed in this context, however most of them focused on the clustering of streams composed of multidimensional points. Few studies have focused on clustering streaming time series, which are characterized by being collections of observations sampled sequentially along time. Current techniques for clustering streaming time series have a limitation in the choice of the similarity measure, as most are based on a simple correlation, such as Pearson. This thesis shows that even for classic time series models, such as those from Box and Jenkins, the Pearson correlation is not capable of detecting similarity, despite dealing with series originating from the same mathematical model and the same parametrization. This limitation in current techniques motivated this work to consider time series generating models, i.e., generating equations, through the use of several descriptive measures, such as Auto Mutual Information, the Hurst Exponent and several others. The hypothesis is that through the use of several descriptive measures, a better characterization of time series generating models can be achieved, which in turn will lead to better clustering quality. In that context, several descriptive measures were evaluated and then used as input to a new tree-based clustering algorithm, entitled TS-Stream. Experiments were conducted with synthetic data sets composed of various time series models, confirming the superiority of TS-Stream when compared to ODAC, the most successful technique in the literature for this task. Experiments with real-world time series from stock market data of the NYSE and NASDAQ showed that the use of TS-Stream in the selection of stocks, by the creation of a diversified portfolio, can increase the returns of the investment in several orders of magnitude when compared to trading strategies solely based on the Moving Average Convergence Divergence financial indicator Agrupamento Aprendizado de máquina Fluxos contínuos de dados Séries temporais Clustering Data streams Machine learning Time series
170	Radio resource allocation for coordinated multi-point systems / AlocaÃÃo de recursos de rÃdio para sistemas multi-ponto coordenados Rodrigo Lopes Batista 05 August 2011 (has links) Ericsson Brasil / The International Telecommunications Union (ITU) established through the International Mobile Telecommunications (IMT)-Advanced a set of requirements for high performance of 4th Generation (4G) communication systems and, with the aim of meeting such requirements, 3rd Generation Partnership Project (3GPP) Long Term Evolution (LTE) is considering a set of enhancements, referred to as LTE-Advanced. In the LTE-Advanced context, Coordinated Multi-Point (CoMP) communication appears as a promising technology to boost system throughput and to allow for an efficient Radio Resource Allocation (RRA). CoMP systems promise very high performance in terms of spectral efficiency and coverage benefits when perfect Channel State Information (CSI) is available at the transmitter. However, perfect CSI is difficult to obtain in CoMP systems due to an increased number of channel parameters to be estimated at the receiver and to be fed back to the transmitter. So, the performance of such systems is compromised when the CSI is not perfectly known during CoMP processing, which is an important problem to be addressed. Space Division Multiple Access (SDMA) grouping algorithms are usually employed in order to find a suitable set of users for spatial multiplexing. The largest SDMA group is not always the best group in a given data transmission such that higher gains might be achieved by dynamically adjusting the SDMA group size. Besides, algorithms that balance the Signal to Interference-plus-Noise Ratio (SINR) among different links might ensure a certain level of link quality and so provide a more reliable communication for the scheduled users. This master thesis provides system-level analyses for RRA algorithms that exploit coordination in the downlink of CoMP systems to implement adaptive resource reuse and so improve system throughput. Herein, RRA strategies which consider dynamic SDMA grouping, joint precoding and power allocation for SINR balancing are studied in CoMP systems assuming imperfect CSI in order to obtain a better approximation with regard to the real-world implementations. It is shown through system-level analyses that quite high throughput gains are achieved through intelligent RRA. In conclusion, the results show that Sequential Removal Algorithms (SRAs) and SINR balancing provide system spectral efficiency gains. However, a critical degradation on the performance of these RRA strategies due to imperfect CSI is also shown. / A UniÃo Internacional para TelecomunicaÃÃes (ITU) estabeleceu atravÃs da iniciativa para o Sistema AvanÃado Internacional de TelecomunicaÃÃes MÃveis (IMT-Advanced), um conjunto de requisitos de alto desempenho para os sistemas de comunicaÃÃo de quarta geraÃÃo (4G) e, com o objetivo de atender tais requisitos, a EvoluÃÃo de Longo Prazo (LTE) do Projeto de Parceria para a Terceira GeraÃÃo (3GPP) estÃ considerando um conjunto de melhorias, referidas como LTE-AvanÃado. No contexto do LTE-AvanÃado, a comunicaÃÃo multi-ponto coordenada (CoMP) aparece como uma tecnologia promissora para aumentar a vazÃo do sistema e permitir uma AlocaÃÃo de Recursos de RÃdio (RRA) eficiente. Os sistemas CoMP prometem alto desempenho em termos de eficiÃncia espectral e benefÃcios de cobertura quando a InformaÃÃo do Estado do Canal (CSI) perfeita estÃ disponÃvel no transmissor. No entanto, CSI perfeita Ã difÃcil de se obter em sistemas CoMP devido a um alto nÃmero de parÃmetros de canal a serem estimados no receptor e enviados para o transmissor. Assim, o desempenho de tais sistemas Ã comprometido quando a CSI nÃo Ã perfeitamente conhecida durante o processamento CoMP tal que esse Ã um problema importante a ser abordado. Algoritmos de agrupamento para MÃltiplo Acesso por DivisÃo no EspaÃo (SDMA) geralmente sÃo utilizados a fim de encontrar um conjunto adequado de usuÃrios para multiplexaÃÃo espacial. O maior grupo SDMA nem sempre Ã o melhor grupo em uma transmissÃo de dados tal que maiores ganhos podem ser obtidos ajustando dinamicamente o tamanho do grupo SDMA. AlÃm disso, os algoritmos que balanceiam a RazÃo Sinal-InterferÃncia mais RuÃdo (SINR) entre diferentes canais podem garantir um certo nÃvel de qualidade de canal e assim proporcionar uma comunicaÃÃo mais confiÃvel para os usuÃrios agrupados. Esta dissertaÃÃo de mestrado fornece anÃlises em nÃvel sistÃmico para algoritmos de RRA que exploram a coordenaÃÃo no enlace direto de sistemas CoMP para implementar reuso adaptativo de recursos e assim melhorar o desempenho do sistema. SÃo estudadas aqui estratÃgias de RRA em sistemas CoMP que consideram agrupamento SDMA dinÃmico, precodificaÃÃo e alocaÃÃo de potÃncia conjuntas para balanceamento de SINR, sendo assumida CSI imperfeita a fim de conseguir maior aproximaÃÃo com relaÃÃo Ãs implementaÃÃs em cenÃrios reais. Ã mostrado atravÃs de anÃlises em nÃvel sistÃmico que ganhos de vazÃo bastante altos sÃo alcanÃados atravÃs de RRA inteligente. Em conclusÃo, os resultados mostram que Algoritmos de RemoÃÃo Sequencial (SRAs) e de balanceamento de SINR proporcionam ganhos de eficiÃncia espectral do sistema. No entanto, Ã tambÃm mostrada uma degradaÃÃo crÃtica no desempenho dessas estratÃgias de RRA devido Ã CSI imperfeita. Recursos de informaÃÃo Agrupamento SDMA Balanceamento de SINR CoMP imperfect CSI SDMA grouping SINR balancing TELEINFORMATICA

Search results