Spelling suggestions: "subject:"agrupamento"" "subject:"grupamento""
161 |
Otimiza??o de comit?s de agrupamento usando o algoritmo coral reefs optimization / Cluster ensembles optimization using coral reefs optimization algorithmSilva, Huliane Medeiros da 04 March 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-01-12T13:24:40Z
No. of bitstreams: 1
HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-01-16T14:40:28Z (GMT) No. of bitstreams: 1
HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5) / Made available in DSpace on 2017-01-16T14:40:28Z (GMT). No. of bitstreams: 1
HulianeMedeirosDaSilva_DISSERT.pdf: 1790198 bytes, checksum: 7bff972160b98509ed9a2c86472d6cd2 (MD5)
Previous issue date: 2016-03-04 / O presente trabalho est? inserido na linha de pesquisa de aprendizado de m?quina, que ? um campo de pesquisa associado ? Intelig?ncia Artificial e dedicado ao desenvolvimento de t?cnicas que, permitem ao computador aprender com experi?ncias passadas. Em aprendizado de m?quina, h? diferentes tarefas de aprendizado que pertencem a determinado paradigma de aprendizado, entre elas podemos citar agrupamento de dados, que pertencente ao paradigma de aprendizado n?o supervisionado. Diversos algoritmos de agrupamento v?m sendo utilizados com sucesso em diferentes aplica??es. No entanto, cada algoritmo possui suas pr?prias caracter?sticas e limita??es, que podem gerar diferentes solu??es para um mesmo conjunto de dados. Dessa forma, combinar v?rios m?todos de agrupamento (comit?s de agrupamento), capaz de aproveitar as caracter?sticas de cada algoritmo ? uma abordagem bastante utilizada na tentativa de superar as limita??es de cada t?cnica de agrupamento. Nesse contexto, diversas abordagens t?m sido propostas na literatura no intuito de otimizar, ou seja, de melhorar cada vez mais as solu??es encontradas. Dessa forma, o objetivo deste trabalho ? propor uma abordagem para otimiza??o de comit?s de agrupamento, por meio da fun??o consenso, utilizando t?cnicas inspiradas na natureza. Essa abordagem consiste na forma??o de um comit? de agrupamento heterog?neo, de modo que as parti??es iniciais s?o combinadas por um m?todo que utilizada o algoritmo de otimiza??o Coral Reefs Optimization com o m?todo de co-associa??o, resultando em uma parti??o final. Essa estrat?gia ? avaliada atrav?s dos ?ndices de avalia??o de agrupamento, Dunn, Calinski-Harabasz, Dom e Jaccard, no intuito de analisar a viabilidade da abordagem proposta. Finalmente, o desempenho da abordagem proposta ? comparado com duas outras abordagens, s?o elas: algoritmo gen?tico com o m?todo de co-associa??o e o m?todo de co-associa??o tradicional. Essa compara??o ? feita atrav?s da utiliza??o de testes estat?sticos, especificamente teste de Friedman.
|
162 |
Abordagem heur?stica baseada em busca em vizinhan?a vari?vel para o agrupamento balanceado de dados pelo crit?rio da soma m?nima das dist?ncias quadr?ticasCosta, Leandro Rochink 22 August 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-02-13T19:22:38Z
No. of bitstreams: 1
LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-02-14T18:08:27Z (GMT) No. of bitstreams: 1
LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5) / Made available in DSpace on 2017-02-14T18:08:27Z (GMT). No. of bitstreams: 1
LeandroRochinkCosta_DISSERT.pdf: 1175831 bytes, checksum: 3fb21392f141799634d3dbee38317729 (MD5)
Previous issue date: 2016-08-22 / Ap?s v?rios avan?os na tecnologia de capta??o e armazenamento de dados e do crescimento
de aplica??es que prov?m novas informa??es, o n?mero de elementos informacionais
dispon?veis ? enorme tanto em volume quanto em variedade. Com esse aumento
na quantidade de informa??es, a necessidade de entend?-los e resumi-los se tornou cada
vez mais urgente. O Agrupamento Balanceado de Dados, do ingl?s Balanced Clustering,
visa encontrar grupos de entidades similares que possuam aproximadamente o mesmo tamanho.
Neste trabalho, ? proposta uma nova abordagem heur?stica baseada na metaheur?stica
Busca em Vizinhan?a Vari?vel, do ingl?s Variable Neighborhood Search (VNS),
e na metodologia Menos ? mais, do ingl?s Less is more approach, para o problema de
agrupamento de dados usando o crit?rio da soma m?nima das dist?ncias quadr?ticas com
restri??o de balanceamento dos grupos. Os algoritmos encontrados na literatura n?o s?o
escal?veis ao passo que aumentamos o tamanho do problema para al?m de 5000 elementos
de acordo com experimentos realizados nesta pesquisa. Os experimentos computacionais
mostram que o m?todo proposto supera o atual estado da arte neste problema. / After advances in collecting and storing data and the growth in applications that provide
new information, the number of data elements available is huge in both volume and
variety. With this increase in the quantity of information, the need to understand them and
summarize them has become increasingly urgent. The Balanced Clustering seeks to find
groups of similar entities that have approximately the same size. In this dissertation, we
propose a new heuristic approach based on metaheuristic Variable Neighborhood Search
(VNS) and methodology "Less is More Approach"(LIMA) to data clustering problem
using the criterion of the minimum sum-of-squared distances applying balancing restriction
for the groups. The algorithms found in the literature are not scalable, while the
problem of increased size in addition to elements 5000 in accordance with experiments
performed in this study. The computational experiments show that the proposed method
outperforms the current state of the art for the problem.
|
163 |
Utiliza??o do problema das k-medianas como crit?rio para o agrupamento de dados semi-supervisionadoRandel, Rodrigo Alves 12 December 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-04-03T19:47:15Z
No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-04-06T20:17:18Z (GMT) No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5) / Made available in DSpace on 2017-04-06T20:17:18Z (GMT). No. of bitstreams: 1
RodrigoAlvesRandel_DISSERT.pdf: 1482786 bytes, checksum: d296cc0bcb0193a4d23da06aacd37afc (MD5)
Previous issue date: 2016-12-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Agrupamento de dados ? uma poderosa ferramenta para an?lise autom?tica de dados.
Essa t?cnica se prop?e a resolver o seguinte problema: dado um conjunto de entidades,
encontrar subconjuntos, denominados clusters, que s?o homog?neos e/ou bem separados.
O maior desafio do agrupamento de dados ? encontrar um crit?rio que apresente
boa separa??o de dados em grupos homog?neos, e que estes agrupamentos possam trazer
informa??es ?teis ao usu?rio. Para resolver este problema, ? sugerido que o usu?rio possa
fornecer informa??es pr?vias a respeito do conjunto de dados que auxiliem/guiem o processo
de agrupamento. Realizar o agrupamento de dados utilizando essas informa??es
auxiliares ? denominado de agrupamento de dados semi-supervisionado (ADSS). Este
trabalho explora o problema de ADSS utilizando um novo modelo: os dados s?o agrupados
atrav?s da resolu??o do problemas das k-medianas. Resultados mostram que essa
abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em
diversos dom?nios diferentes. / Clustering is a powerful tool for automated analysis of data. It addresses the following
general problem: given a set of entities, find subsets, or clusters, which are homogeneous
and/or well separated. The biggest challenge of data clustering is to find a criterion to
present good separation of data into homogeneous groups, so that these groups bring
useful information to the user. To solve this problem, it is suggested that the user can
provide a priori information about the data set. Clustering under this assumption is called
semi-supervised clustering. This work explores the semi-supervised clustering problem
using a new model: the data is clustered by solving the k-medians problem. Results shows
that this new approach was able to efficiently cluster the data in many different domains.
|
164 |
Novas heur?sticas para o agrupamento de dados pela soma m?nima de dist?ncias quadr?ticasPereira, Thiago Correia 12 April 2017 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-10-02T23:37:05Z
No. of bitstreams: 1
ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-10-09T19:56:01Z (GMT) No. of bitstreams: 1
ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5) / Made available in DSpace on 2017-10-09T19:56:01Z (GMT). No. of bitstreams: 1
ThiagoCorreiaPereira_DISSERT.pdf: 849760 bytes, checksum: 18b8f71b02ed28bbc81789242e6e17b4 (MD5)
Previous issue date: 2017-04-12 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / Devido ao grande volume de dados gerados pelo crescimento de aplica??es que prov?m
novas informa??es, tanto em volume quanto em variedade, t?cnicas cada vez mais
eficientes s?o exigidas para classific?-los e process?-los. Uma t?cnica muito utilizada ? o
agrupamento de dados, cujo objetivo ? extrair conhecimento dos dados atrav?s da divis?o
de entidades em subconjuntos homog?neos e/ou bem separados. Crit?rios podem ser utilizados
para expressar a classifica??o dos dados. Dentre eles, um crit?rio frequentemente
utilizado ? a soma m?nima das dist?ncias euclidianas quadr?ticas, do ingl?s, minimun
sum-of-squares clustering (MSSC). Neste crit?rio, entidades s?o elementos no espa?o
n-dimensional. O problema de agrupamento de dados pelo MSSC ? NP-?rduo, logo heur?sticas
s?o t?cnicas extremamente ?teis para este tipo de problema. Este trabalho prop?e
novas heur?sticas, baseadas na busca de vizinhan?as vari?veis gerais, do ingl?s, general
variable neighborhood search (GVNS). Tamb?m ? proposto neste trabalho, a adapta??o
da heur?stica reformulation descent (RD) para o problema MSSC, na forma de duas variantes,
de forma in?dita na literatura. Os experimentos computacionais mostram que as
variantes GVNS propostas neste trabalho apresentam melhores resultados, para inst?ncias
grandes. / Due to the large volume of data generated by the growth of applications that provide
new information, both in volume and variety, more efficient techniques are required to
classify and processes them. A widely used technique is data grouping whose aim is to
extract characteristics of the entities dividing them into homogeneous and/or well separated
subsets. Many different criteria can be used to express the data classification. Among
them, a commonly used criteria is the minimun sum-of-squares clustering (MSSC). In
this criterion, entities are elements in n-dimensional Euclidean space. The data clustering
problem by MSSC is NP-hard, then heuristics are extremely useful techniques for this
type of problem. This work proposes new heuristics, based on the general variable neighborhood
search (GVNS). Also proposed in this work is the adaptation of the heuristic
reformulation descent (RD) to the MSSC problem, in the form of two variants, unapplied
to this problem before in literature. The computational experiments show that the GVNS
variants proposed in this work present better results, in large instances, than the current
state of the art.
|
165 |
Investigation of changes in groundwater quality in the baixo Acarau result of irrigation management / InvestigaÃÃo de mudanÃas na qualidade das Ãguas subterrÃneas do Baixo Acaraà em decorrÃncia do manejo da irrigaÃÃo.Nayara Rochelli de Sousa Luna 09 March 2012 (has links)
FundaÃÃo Cearense de Apoio ao Desenvolvimento Cientifico e TecnolÃgico / Irrigation is currently an important component in the development of agriculture, not only in
arid and semiarid regions, but also in other regions, providing the balance of production and
avoiding the possible interference caused by the occasional lack of water. Irrigated agriculture
has increased the productivity of crops, but the return flows of irrigation are a main
contributor in the degradation of water resources (surface and groundwater). This research
was conducted aiming to identify the inference of irrigation management and climate
seasonality in soil and water resources of form a quantitative and qualitative of Irrigation
District Baixo Acaraà â DIBAU, CearÃ. The study was conducted with data from water
collected in nine shallow wells, six (6) inserted in the irrigated area and three (3) outside
irrigated area of DIBAU. Water samples were collected monthly during the August/10
July/11, totaling 12 sampling campaigns. The chemical analyses were performed at the
Laboratory of Soil and Water Embrapa agribusiness Tropical. The attributes analyzed in the
water were: pH, electrical conductivity (EC), Ca2+, Mg2+, Na+, K+, HCO3
-, Cl-, NH4
+, NO3
-
and Sodium Adsorption Ratio (SAR). Soil samples were taken in (2) points, one batch area
irrigated and the other in an uncultivated area. Both samples were collected the dry and rainy
periods, each 50 cm depth from the surface to the zone of saturation of water table. To check
the similarity of water quality was employed the statistical technique of multivariate analysis
(cluster analysis) processed in SPSS 16.0. The classification of the chemical quality of water
was performed by using the Piper diagram software QUALIGRAF (FUNCEME, 2009).
According to the results of the water wells investigated were grouped without presenting
geographical continuity, forming two distinct groups for the two seasons. The highest values
of cations (Ca2+, Mg2+, Na+ and K+) were recorded in the waters of wells P1, P8 and P9. The
soil texture was the determining factor for the reduction of sodium, chloride and nitrate in the
soil profile of irrigated area according to the deeper layers. There was an increase in levels of
nitrate in water from wells affected by agricultural practices (P5 and P7).
These concentrations exceeded the maximum allowed limits by Resolution 357/2005 and by
Ordinance 518/2004 for human consumption in certain months of collected. Groundwater the
DIBAU were predominantly classified as chlorinated sodium. / A irrigaÃÃo à atualmente uma componente importante no desenvolvimento da agricultura, nÃo
somente nas regiÃes Ãridas e semiÃridas, mas tambÃm em outras regiÃes, proporcionando o
equilÃbrio da produÃÃo e evitando as possÃveis interferÃncias ocasionais provocadas pela falta
de Ãgua. A agricultura irrigada tem aumentado à produtividade das culturas, mas o retorno dos
fluxos de irrigaÃÃo à um dos principais contribuintes na degradaÃÃo das Ãguas superficiais e
subterrÃneas. Esta pesquisa foi desenvolvida objetivando identificar a inferÃncia do manejo da
irrigaÃÃo e da sazonalidade climÃtica nos recursos solo e Ãgua de forma quantitativa e
qualitativa do Distrito de IrrigaÃÃo Baixo Acaraà â DIBAU, CearÃ. O estudo foi desenvolvido
com dados de Ãguas coletadas em nove poÃos rasos, sendo seis inseridos na Ãrea irrigada e
trÃs fora da Ãrea Ãtil do DIBAU. As coletas de Ãgua foram realizadas mensalmente durante o
perÃodo de Agosto/10 a Julho/11, totalizando 12 campanhas de coletas. As anÃlises quÃmicas
foram realizadas no LaboratÃrio de Solo e Ãgua da EMBRAPA AgroindÃstria Tropical. Os
atributos analisados na Ãgua foram: pH, CEa, Ca2+, Mg2+, Na+, K+, HCO3
-, Cl -, NH4
+, NO3
- e
RAS. As amostras de solos foram efetuadas em dois pontos de amostragens, sendo um em
lote irrigado e o outro em uma Ãrea nÃo irrigada. Ambas as coletadas foram efetuadas no
perÃodo seco e chuvoso, a cada 50 cm de profundidade da superfÃcie atà a zona de saturaÃÃo
do lenÃol freÃtico. Para verificar a similaridade da qualidade das Ãguas foi empregada a
tÃcnica estatÃstica de anÃlise multivariada (anÃlise de agrupamento) processada no SPSS 16.0.
A classificaÃÃo da qualidade quÃmica das Ãguas foi realizada pelo diagrama de Piper atravÃs
do software QUALIGRAF (FUNCEME, 2009). De acordo com os resultados as Ãguas dos
poÃos investigados foram agrupadas sem apresentar continuidade geogrÃfica, formando dois
grupos distintos para as duas estaÃÃes. Os maiores valores de Ca2+,Mg2+, Na+ e K+ foram
registradas nas Ãguas dos poÃos P1, P8 e P9. A granulometria do solo foi o fator determinante
para a reduÃÃo dos teores de sÃdio, cloreto e nitrato no perfil do solo da Ãrea irrigada de
acordo com as camadas mais profundas. Houve um incremento nos teores de nitrato nas Ãguas
dos poÃos influenciados pelas prÃticas agrÃcolas (P5 e P7).
Estas concentraÃÃes excederam os limites mÃximos aceitÃveis pela ResoluÃÃo 357/2005
(CONAMA) e pela Portaria 518/2004 (MS) para consumo humano em determinados meses
de coletas. As Ãguas subterrÃneas do DIBAU foram predominantemente classificadas como
|
166 |
Abordagens evolutivas para agrupamento relacional de dados / Evolutionary approaches to relational data clusteringDanilo Horta 22 February 2010 (has links)
O agrupamento de dados é uma técnica fundamental em aplicações de diversos campos do mercado e da ciência, como, por exemplo, no comércio, na biologia, na psiquiatria, na astronomia e na mineração da Web. Ocorre que em um subconjunto desses campos, como engenharia industrial, ciências sociais, engenharia sísmica e recuperação de documentos, as bases de dados são usualmente descritas apenas pelas proximidades entre os objetos (denominadas bases de dados relacionais). Mesmo em aplicações nas quais os dados não são naturalmente relacionais, o uso de bases relacionais permite que os dados em si sejam mantidos sob sigilo, o que pode ser de grande valia para bancos ou corretoras, por exemplo. Nesta dissertação é apresentada uma revisão de algoritmos de agrupamento de dados que lidam com bases de dados relacionais, com foco em algoritmos que produzem partições rígidas (hard ou crisp) dos dados. Particular ênfase é dada aos algoritmos evolutivos, que têm se mostrado capazes de resolver problemas de agrupamento de dados com relativa acurácia e de forma computacionalmente eficiente. Nesse contexto, propõe-se nesta dissertação um novo algoritmo evolutivo de agrupamento capaz de operar sobre dados relacionais e também capaz de estimar automaticamente o número de grupos nos dados (usualmente desconhecido em aplicações práticas). É demonstrado empiricamente que esse novo algoritmo pode superar métodos tradicionais da literatura em termos de eficiência computacional e acurácia / Data clustering is a fundamental technique for applications in several fields of science and marketing, as commerce, biology, psychiatry, astronomy, and Web mining. However, in a subset of these fields, such as industrial engineering, social sciences, earthquake engineering, and retrieval of documents, datasets are usually described only by proximities between their objects (called relational datasets). Even in applications where the data are not naturally relational, the use of relational datasets preserves the datas secrecy, which can be of great value to banks or brokers, for instance. This dissertation presents a review of data clustering algorithms which deals with relational datasets, with a focus on algorithms that produce hard or crisp partitions of data. Particular emphasis is given to evolutionary algorithms, which have proved of being able to solve problems of data clustering accurately and efficiently. In this context, we propose a new evolutionary algorithm for clustering able to operate on relational datasets and also able to automatically estimate the number of clusters (which is usually unknown in practical applications). It is empirically shown that this new algorithm can overcome traditional methods described in the literature in terms of computational efficiency and accuracy
|
167 |
Identificação de covers a partir de grandes bases de dados de músicas / Cover song identification using big data basesMartha Dais Ferreira 30 April 2014 (has links)
Acrescente capacidade de armazenamento introduziu novos desafios no contexto de exploração de grandes bases de dados de músicas. Esse trabalho consiste em investigar técnicas de comparação de músicas representadas por sinais polifônicos, com o objetivo de encontrar similaridades, permitindo a identificação de músicas cover em grandes bases de dados. Técnicas de extração de características a partir de sinais musicais foram estudas, como também métricas de comparação a partir das características obtidas. Os resultados mostraram que é possível encontrar um novo método de identificação de covers com um menor custo computacional do que os existentes, mantendo uma boa precisão / The growing capacity in storage and transmission of songs has introduced a new challenges in the context of large music data sets exploration. This work aims at investigating techniques for comparison of songs represented by polyphonic signals, towards identifying cover songs in large data sets. Techniques for music feature extraction were evaluated and compared. The results show that it is possible to develop new methods for cover identification with a lower computational cost when compared to existing solutions, while keeping the good precision
|
168 |
Classificação e caracterização de tipos de minérios de cobre da Mina do Sossego - região de Carajás / Classification and characterization of copper ore types from Sossego Mine - Carajás region.Viviane Kotani Shimizu 24 July 2012 (has links)
Neste trabalho é apresentada a classificação de cerca de 110 amostras de minério da Mina do Sossego com base nas ferramentas de difração de raios X e análise estatística por agrupamento (cluster analysis). A comparação, baseada na posição e intensidade dos picos difratados, permitiu a distinção dos tipos de minérios, sendo que as diferenças entre os grupos referem-se às proporções dos principais minerais constituintes: quartzo, feldspato, actinolita, óxidos de ferro, mica e clorita. Observou-se forte correlação do agrupamento com a origem das amostras. Esta relação deve-se aos diferentes tipos e intensidades das alterações hidrotermais atuantes em cada corpo, que refletem na mineralogia e, consequentemente, nos difratogramas de raios X das amostras. Complementando o trabalho, foram conduzidos estudos de caracterização tecnológica em amostras compostas dos tipos identificados, os quais permitiram definir a composição mineralógica das amostras e outros parâmetros relevantes ao beneficiamento. Vários são os minerais de ganga: quartzo, plagioclásio, feldspato, anfibólio, magnetita, apatita, epídoto, clorita, escapolita, micas e calcita. A calcopirita é praticamente o único mineral de minério, e ocorre tanto na forma de microcristais inclusos nos minerais de ganga quanto como cristais maiores. Com exceção da pirita, os demais sulfetos (calcocita, siegenita e milerita) ocorrem como traços. As curvas de liberação da calcopirita demonstram que as amostras do corpo Sossego possuem maior grau de liberação do que as de Sequeirinho. A metodologia para classificação de amostras mostrou-se bastante eficiente, possibilitando a análise de grande número de amostras, de forma objetiva e com resultado satisfatório, tendo-se verificado não só distinções mineralógicas entre estes como também características distintas frente ao processo de concentração. / This work presents the classification of approximately 110 copper ore samples from Sossego Mine using cluster analysis and X-ray diffraction technique. The comparison based on the position and intensity of the diffracted peaks allowed the distinction the major ore types differentiated by the proportion of major minerals: quartz, feldspar, actinolite, iron oxides, mica and chlorite. There was a strong correlation between the grouping and the location of the samples in Sequeirinho and Sossego orebodies. This relationship is due to different types and intensities of hydrothermal alteration prevailing in each body, which reflect the mineralogy and thus the X-ray diffractograms of samples. In addition, technological characterization studies on composed samples from the defined ore types were carried out based in order to gather mineralogical composition and other relevant parameters for mineral processing. There are several gangue minerals, including: quartz, plagioclase, feldspar, amphibole, magnetite, apatite, epidote, chlorite, scapolite, mica and calcite. Chalcopyrite is essentially the only valuable mineral. It occurs both as microcrystals included in other minerals such as larger crystals. Excepting pyrite, other sulfides (chalcocite, millerite and siegenite) occur as traces. Chalcopyrite liberation curves indicate that samples from Sossego have higher liberation degree than those from Sequeirinho. The proposed method for classification of ore samples proved to be very efficient. It enables the analysis of large numbers of samples in a short time with a satisfactory result allowing distinctions of the ore types regarding to their mineralogical composition as well as parameters for mineral processing.
|
169 |
Agrupamento de séries temporais em fluxos contínuos de dados / Time series clustering for data streamsCássio Martini Martins Pereira 29 October 2013 (has links)
Recentemente, a área de mineração de fluxos contínuos de dados ganhou importância, a qual visa extrair informação útil a partir de conjuntos massivos e contínuos de dados que evoluem com o tempo. Uma das técnicas que mais se destaca nessa área e a de agrupamento de dados, a qual busca estruturar grandes volumes de dados em hierarquias ou partições, tais que objetos mais similares estejam em um mesmo grupo. Diversos algoritmos foram propostos nesse contexto, porém a maioria concentrou-se no agrupamento de fluxos compostos por pontos em um espaço multidimensional. Poucos trabalhos voltaram-se para o agrupamento de séries temporais, as quais se caracterizam por serem coleções de observações coletadas sequencialmente no tempo. Técnicas atuais para agrupamento de séries temporais em fluxos contínuos apresentam uma limitação na escolha da medida de similaridade, a qual na maioria dos casos e baseada em uma simples correlação, como a de Pearson. Este trabalho mostra que até para modelos clássicos de séries temporais, como os de Box e Jenkins, a correlação de Pearson não é capaz de detectar similaridade, apesar das séries serem provenientes de um mesmo modelo matemático e com mesma parametrização. Essa limitação nas técnicas atuais motivou este trabalho a considerar os modelos geradores de séries temporais, ou seja, as equações que regem sua geração, por meio de diversas medidas descritivas, tais como a Autoinformação Mútua, o Expoente de Hurst e várias outras. A hipótese considerada e que, por meio do uso de medidas descritivas, pode-se obter uma melhor caracterização do modelo gerador de séries temporais e, consequentemente, um agrupamento de maior qualidade. Nesse sentido, foi realizada uma avaliação de diversas medidas descritivas, as quais foram usadas como entrada para um novo algoritmo de agrupamento baseado em árvores, denominado TS-Stream. Experimentos com bases sintéticas compostas por diversos modelos de séries temporais foram realizados, mostrando a superioridade de TS-Stream sobre ODAC, a técnica mais popular para esta tarefa encontrada na literatura. Experimentos com séries reais provenientes de preços de ações da NYSE e NASDAQ mostraram que o uso de TS-Stream na escolha de ações, por meio da criação de uma carteira de investimentos diversificada, pode aumentar os retornos das aplicações em várias ordens de grandeza, se comparado a estratégias baseadas somente no indicador econômico Moving Average Convergence Divergence / Recently, the data streams mining area has gained importance, which aims to extract useful information from massive and continuous data sources that evolve over time. One of the most popular techniques in this area is clustering, which aims to structure large volumes of data into hierarchies or partitions, such that similar objects are placed in the same group. Several algorithms were proposed in this context, however most of them focused on the clustering of streams composed of multidimensional points. Few studies have focused on clustering streaming time series, which are characterized by being collections of observations sampled sequentially along time. Current techniques for clustering streaming time series have a limitation in the choice of the similarity measure, as most are based on a simple correlation, such as Pearson. This thesis shows that even for classic time series models, such as those from Box and Jenkins, the Pearson correlation is not capable of detecting similarity, despite dealing with series originating from the same mathematical model and the same parametrization. This limitation in current techniques motivated this work to consider time series generating models, i.e., generating equations, through the use of several descriptive measures, such as Auto Mutual Information, the Hurst Exponent and several others. The hypothesis is that through the use of several descriptive measures, a better characterization of time series generating models can be achieved, which in turn will lead to better clustering quality. In that context, several descriptive measures were evaluated and then used as input to a new tree-based clustering algorithm, entitled TS-Stream. Experiments were conducted with synthetic data sets composed of various time series models, confirming the superiority of TS-Stream when compared to ODAC, the most successful technique in the literature for this task. Experiments with real-world time series from stock market data of the NYSE and NASDAQ showed that the use of TS-Stream in the selection of stocks, by the creation of a diversified portfolio, can increase the returns of the investment in several orders of magnitude when compared to trading strategies solely based on the Moving Average Convergence Divergence financial indicator
|
170 |
Radio resource allocation for coordinated multi-point systems / AlocaÃÃo de recursos de rÃdio para sistemas multi-ponto coordenadosRodrigo Lopes Batista 05 August 2011 (has links)
Ericsson Brasil / The International Telecommunications Union (ITU) established through the International Mobile Telecommunications (IMT)-Advanced a set of requirements for high performance of 4th Generation (4G) communication systems and, with the aim of meeting such requirements, 3rd Generation Partnership Project (3GPP) Long Term Evolution (LTE) is considering a set of enhancements, referred to as LTE-Advanced. In the LTE-Advanced context, Coordinated Multi-Point (CoMP) communication appears as a promising technology to boost system throughput and to allow for an efficient Radio Resource Allocation (RRA). CoMP systems promise very high performance in terms of spectral efficiency and coverage benefits when perfect Channel State Information (CSI) is available at the transmitter. However, perfect CSI is difficult to obtain in CoMP systems due to an increased number of channel parameters to be estimated at the receiver and to be fed back to the transmitter. So, the performance of such systems is compromised when the CSI is not perfectly known during CoMP processing, which is an important problem to be addressed. Space Division Multiple Access (SDMA) grouping algorithms are usually employed in order to find a suitable set of users for spatial multiplexing. The largest SDMA group is not always the best group in a given data transmission such that higher gains might be achieved by dynamically adjusting the SDMA group size. Besides, algorithms that balance the Signal to Interference-plus-Noise Ratio (SINR) among different links might ensure a certain level of link quality and so provide a more reliable communication for the scheduled users.
This master thesis provides system-level analyses for RRA algorithms that exploit coordination in the downlink of CoMP systems to implement adaptive resource reuse and so improve system throughput. Herein, RRA strategies which consider dynamic SDMA grouping, joint precoding and power allocation for SINR balancing are studied in CoMP systems assuming imperfect CSI in order to obtain a better approximation with regard to the real-world implementations. It is shown through system-level analyses that quite high throughput gains are achieved through intelligent RRA. In conclusion, the results show that Sequential Removal Algorithms (SRAs) and SINR balancing provide system spectral efficiency gains. However, a critical degradation on the performance of these RRA strategies due to imperfect CSI is also shown. / A UniÃo Internacional para TelecomunicaÃÃes (ITU) estabeleceu atravÃs da iniciativa para o Sistema AvanÃado Internacional de TelecomunicaÃÃes MÃveis (IMT-Advanced), um conjunto de requisitos de alto desempenho para os sistemas de comunicaÃÃo de quarta geraÃÃo (4G) e, com o objetivo de atender tais requisitos, a EvoluÃÃo de Longo Prazo (LTE) do Projeto de Parceria para a Terceira GeraÃÃo (3GPP) està considerando um conjunto de melhorias, referidas como LTE-AvanÃado. No contexto do LTE-AvanÃado, a comunicaÃÃo multi-ponto coordenada (CoMP) aparece como uma tecnologia promissora para aumentar a vazÃo do sistema e permitir uma AlocaÃÃo de Recursos de RÃdio (RRA) eficiente. Os sistemas CoMP prometem alto desempenho em termos de eficiÃncia espectral e benefÃcios de cobertura quando a InformaÃÃo do Estado do Canal (CSI) perfeita està disponÃvel no transmissor. No entanto, CSI perfeita à difÃcil de se obter em sistemas CoMP devido a um alto nÃmero de parÃmetros de canal a serem estimados no receptor e enviados para o transmissor. Assim, o desempenho de tais sistemas à comprometido quando a CSI nÃo à perfeitamente conhecida durante o processamento CoMP tal que esse à um problema importante a ser abordado. Algoritmos de agrupamento para MÃltiplo Acesso por DivisÃo no EspaÃo (SDMA) geralmente sÃo utilizados a fim de encontrar um conjunto adequado de usuÃrios para multiplexaÃÃo espacial. O maior grupo SDMA nem sempre à o melhor grupo em uma transmissÃo de dados tal que maiores ganhos podem ser obtidos ajustando dinamicamente o tamanho do grupo SDMA. AlÃm disso, os algoritmos que balanceiam a RazÃo Sinal-InterferÃncia mais RuÃdo (SINR) entre diferentes canais podem garantir um certo nÃvel de qualidade de canal e assim proporcionar uma comunicaÃÃo mais confiÃvel para os usuÃrios agrupados.
Esta dissertaÃÃo de mestrado fornece anÃlises em nÃvel sistÃmico para algoritmos de RRA que exploram a coordenaÃÃo no enlace direto de sistemas CoMP para implementar reuso adaptativo de recursos e assim melhorar o desempenho do sistema. SÃo estudadas aqui estratÃgias de RRA em sistemas CoMP que consideram agrupamento SDMA dinÃmico, precodificaÃÃo e alocaÃÃo de potÃncia conjuntas para balanceamento de SINR, sendo assumida CSI imperfeita a fim de conseguir maior aproximaÃÃo com relaÃÃo Ãs implementaÃÃs em cenÃrios reais. à mostrado atravÃs de anÃlises em nÃvel sistÃmico que ganhos de vazÃo bastante altos sÃo alcanÃados atravÃs de RRA inteligente. Em conclusÃo, os resultados mostram que Algoritmos de RemoÃÃo Sequencial (SRAs) e de balanceamento de SINR proporcionam ganhos de eficiÃncia espectral do sistema. No entanto, à tambÃm mostrada uma degradaÃÃo crÃtica no desempenho dessas estratÃgias de RRA devido à CSI imperfeita.
|
Page generated in 0.0652 seconds