Spelling suggestions: "subject:"agrupamento""
61 |
Ecologia de bandos mistos de aves na Estação Ecológica de Itirapina, estado de São PauloReis, Matheus Gonçalves dos 07 February 2011 (has links)
Made available in DSpace on 2016-06-02T19:31:53Z (GMT). No. of bitstreams: 1
3423.pdf: 2509172 bytes, checksum: 46766229822e73097e99235e1a114322 (MD5)
Previous issue date: 2011-02-07 / Universidade Federal de Sao Carlos / The degradation of natural grassland and open area remnants is still intense and affect environmental integrity of these ecosystems. The mixed-flocks of birds are a common feature in open environments which provide advantages to members. We aimed to analyze mixed-flocks of birds in three open physiognomies of cerrado to verify differences among sampled areas and periods. We believe that mixed-flock structure changes according to the physiognomy and between the seasons. We followed and record 337 mixed-flocks formed by 45 bird species between July 2008 and December 2010, in Estação Ecológica de Itirapina, São Paulo state. The flocks of campo limpo (grassland vegetation) had a lower participation of species than flocks from other areas, and structure did not varied significantly between breeding (summer) and non-breeding (winter) period. Two species formed flocks only in campo limpo . The campo sujo (grassland with scattered shrubs), considered an intermediate environment in our study, had no exclusive species. The seasonal variation in flock structure was significant. The campo cerrado (shrubby-grassland with many scattered trees) indicates the same differentiation between seasons. We found similarities between the breeding period of campo sujo and campo cerrado . Twelve species were present only in flocks of campo cerrado with low occurrence frequencies; all of them are birds of more wooded or forested environments. We categorized species according to their function played in mixed-flocks: True Leaders, Leaders/Followers, True Followers, Occasional Followers, Migrants. Five species played a role as True Leaders, and nine species can be considered as nuclear species of mixed-flocks. Saltator atricollis, Neothraupis fasciata and Cypsnagra hirundinacea were the most 29 common True Leaders. The formation of mixed-flocks, a phenomenon which benefits its members, were recorded in open areas of savanna throughout the year, but were especially important for birds during the period of resources scarcity. Nine flocking species, 20% of all species observed in this study, are threatened in São Paulo state and have high ecological relevance. / A degradação de áreas campestres naturais ainda remanescentes é intensa e prejudica a integridade ambiental destes ecossistemas. Parte da assembléia de aves que vive nestes ambientes exibe o comportamento de formação de bandos mistos, o qual traz benefícios para seus integrantes. Objetivamos analisar bandos mistos de aves presentes em três fisionomias abertas de cerrado para evidenciar possíveis diferenças entre as áreas e entre os períodos amostrados. Acreditamos que sua estrutura muda de acordo com o ambiente e com a época do ano. Acompanhamos 337 bandos mistos formados por 45 espécies, entre julho de 2008 e dezembro de 2010, na Estação Ecológica de Itirapina, estado de São Paulo. Os bandos mistos de campo limpo tiveram uma menor participação de espécies que outros ambientes, e a estrutura dos bandos não se alterou significativamente entre os períodos reprodutivo (verão) e nãoreprodutivo (inverno). Duas espécies integraram bandos somente nesta fisionomia. O campo sujo, considerado um ambiente intermediário em nosso estudo, não apresentou espécies exclusivas. A variação sazonal na estrutura dos bandos foi significativa. O campo cerrado obteve esta mesma diferenciação entre as estações, e o período reprodutivo nesta área apresentou bandos similares aos do mesmo período no campo sujo. No campo cerrado foram registradas 12 espécies que não estavam presentes nas outras fisionomias, todas elas características de ambientes florestais e com baixas freqüências de ocorrência nos bandos mistos. As espécies foram categorizadas de acordo com sua função no bando: líderes verdadeiros, líderes/seguidores, seguidores verdadeiros, seguidores ocasionais e migrantes. Cinco espécies em todo o estudo 27 desempenharam papel de liderança verdadeira, e nove espécies puderam ser consideradas nucleares. Os líderes mais presentes foram Saltator atricollis, Neothraupis fasciata e Cyspnagra hirundinacea. A formação de bandos mistos, fenômeno que beneficia seus integrantes, foi registrada em fisionomias abertas de cerrado durante todo o ano, mas foram especialmente mais importantes para as aves durante o período de escassez de recursos. Nove espécies (20%) que participaram dos bandos amostrados estão ameaçadas no estado de São Paulo e possuem alta relevância ecológica.
|
62 |
DFA e an?lise de agrupamento aplicadas a perfis de porosidade neutr?nico em po?os de petr?leoSilva, Francisco Wilton de Freitas 22 May 2009 (has links)
Made available in DSpace on 2015-03-03T13:59:42Z (GMT). No. of bitstreams: 1
FranciscoWFA.pdf: 1362232 bytes, checksum: 33548c2a28a5c7d6034cf165f163a691 (MD5)
Previous issue date: 2009-05-22 / ?Peng was the first to work with the Technical DFA (Detrended Fluctuation Analysis), a
tool capable of detecting auto-long-range correlation in time series with non-stationary.
In this study, the technique of DFA is used to obtain the Hurst exponent (H) profile of the electric neutron porosity of the 52 oil wells in Namorado Field, located in the Campos Basin -Brazil. The purpose is to know if the Hurst exponent can be used to characterize spatial distribution of wells. Thus, we verify that the wells that have close values of H are spatially close together. In this work we used the method of hierarchical clustering and non-hierarchical clustering method (the k-mean method). Then compare the two methods to see which of the two provides the best result. From this, was the parameter ? (index neighborhood) which checks whether a data set generated by the k- average method, or at random, so in fact spatial patterns. High values of ? indicate that the data are aggregated, while low values of ? indicate that the data are scattered (no spatial correlation). Using the Monte Carlo method showed that combined data show a random distribution of ? below the empirical value. So the empirical evidence of H obtained from 52 wells are grouped geographically. By passing the data of standard curves with the results obtained by the k-mean, confirming that it is effective to correlate well in spatial distribution / Peng foi o primeiro a trabalhar com a T?cnica DFA (Detrended Fluctuation Analysis),
uma ferramenta capaz de detectar auto-correla??o de longo alcance em s?ries temporais
com n?o-estacionaridade. Nesse trabalho, a t?cnica de DFA ? utilizada para obter o
expoente de Hurst (H) do perfil el?trico de Porosidade Neutr?nica dos 52 po?os
petrol?feros Campo de Namorado, situado na Bacia de Campos ? RJ. A finalidade ?
saber se o expoente de Hurst pode ou n?o ser usado para se caracterizar uma
distribui??o espacial dos po?os. Assim, queremos verificar se os po?os que apresentam
valores pr?ximos de H est?o espacialmente pr?ximos entre si. Neste trabalho foi
utilizado o m?todo de agrupamento hier?rquico e o m?todo de agrupamento n?o
hier?rquico (m?todo do k-m?dia). Em seguida comparamos os dois m?todos para ver
qual dos dois fornece o melhor resultado. A partir disso, foi criado o par?metro
(?ndice de vizinhan?a) o qual verifica se um conjunto de dados gerados pelo m?todo km?dia,
ou de forma aleat?ria, forma de fato padr?es espaciais. Altos valores de
indicam que os dados est?o agregados, enquanto que baixos valores de indicam que
os dados est?o espalhados (sem correla??o espacial). Com aux?lio do m?todo de Monte
Carlo observou-se que dados agrupados aleatoriamente apresentam uma distribui??o de
inferior ao valor emp?rico. Portanto os dados emp?ricos de H obtidos dos 52 po?os
est?o agrupados espacialmente. Ao cruzar os dados das curvas de n?vel com os
resultados obtidos pelo k-m?dia, confirmam que este ? eficaz para correlacionar po?os
em distribui??o espacial
|
63 |
An?lise de Agrupamentos Com Base na Teoria da Informa??o: Uma Abordagem RepresentativaAra?jo, Daniel Sabino Amorim de 18 March 2013 (has links)
Made available in DSpace on 2014-12-17T14:55:09Z (GMT). No. of bitstreams: 1
DanielSAA_TESE_inicio_pag67.pdf: 3521346 bytes, checksum: 030bba7c8ca800b8151b345676b6759c (MD5)
Previous issue date: 2013-03-18 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / Currently, one of the biggest challenges for the field of data mining is to perform
cluster analysis on complex data. Several techniques have been proposed but, in general,
they can only achieve good results within specific areas providing no consensus of what
would be the best way to group this kind of data. In general, these techniques fail due
to non-realistic assumptions about the true probability distribution of the data. Based on
this, this thesis proposes a new measure based on Cross Information Potential that uses
representative points of the dataset and statistics extracted directly from data to measure
the interaction between groups. The proposed approach allows us to use all advantages of
this information-theoretic descriptor and solves the limitations imposed on it by its own
nature. From this, two cost functions and three algorithms have been proposed to perform
cluster analysis. As the use of Information Theory captures the relationship between different
patterns, regardless of assumptions about the nature of this relationship, the proposed
approach was able to achieve a better performance than the main algorithms in literature.
These results apply to the context of synthetic data designed to test the algorithms in
specific situations and to real data extracted from problems of different fields / Atualmente, um dos maiores desafios para o campo de minera??o de dados ? realizar
a an?lise de agrupamentos em dados complexos. At? o momento, diversas t?cnicas foram
propostas mas, em geral, elas s? conseguem atingir bons resultados dentro de dom?nios
espec?ficos, n?o permitindo, dessa maneira, que exista um consenso de qual seria a melhor
forma para agrupar dados. Essas t?cnicas costumam falhar por fazer suposi??es nem sempre
realistas sobre a distribui??o de probabilidade que modela os dados. Com base nisso,
o trabalho proposto neste documento cria uma nova medida baseada no Potencial de Informa??o
Cruzado que utiliza pontos representativos do conjunto de dados e a estat?stica
extra?da diretamente deles para medir a intera??o entre grupos. A abordagem proposta
permite usar todas as vantagens desse descritor de informa??o e contorna as limita??es
impostas a ele pela sua pr?pria forma de funcionamento. A partir disso, duas fun??es
custo de otimiza??o e tr?s algoritmos foram constru?dos para realizar a an?lise de agrupamentos.
Como o uso de Teoria da Informa??o permite capturar a rela??o entre diferentes
padr?es, independentemente de suposi??es sobre a natureza dessa rela??o, a abordagem
proposta foi capaz de obter um desempenho superior aos principais algoritmos citados
na literatura. Esses resultados valem tanto para o contexto de dados sint?ticos desenvolvidos
para testar os algoritmos em situa??es espec?ficas quanto em dados extra?dos de
problemas reais de diferentes naturezas
|
64 |
Sistema inteligente de controle e monitoramento de ambiente de laborat?rios de an?lises qu?micasSilva, Artejose Revoredo da 20 July 2016 (has links)
Submitted by Automa??o e Estat?stica (sst@bczm.ufrn.br) on 2017-01-13T14:35:43Z
No. of bitstreams: 1
ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2017-01-26T14:53:00Z (GMT) No. of bitstreams: 1
ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5) / Made available in DSpace on 2017-01-26T14:53:00Z (GMT). No. of bitstreams: 1
ArtejoseRevoredoDaSilva_DISSERT.pdf: 15158528 bytes, checksum: 4aa5411704db7ed0abe93c1d6be7b4b5 (MD5)
Previous issue date: 2016-07-20 / Os laborat?rios de an?lises qu?micas, por se constitu?rem em um conjunto de testes e procedimentos, usando produtos e equipamentos espec?ficos para tratar dos resultados nas amostras que s?o testadas, est?o sempre sujeitos aos fatores inerentes ao ambiente. Devido a esse fato, controlar fatores como a temperatura e a umidade relativa do ar ? tarefa primordial, para que os processos desenvolvidos dentro de tais ambientes (laborat?rios de an?lises qu?micas) possam ser repetidos dentro dos par?metros exigidos. Buscando propor mecanismos de controle para ambientes, mais especificamente para laborat?rios de an?lises qu?micas, neste trabalho, apresentamos um sistema baseado em rede de sensores e reconhecimento de padr?es para controle inteligente de ambientes. Nosso prot?tipo utiliza os pr?prios dados gerados pelos sensores distribu?dos pelo ambiente, para identificar um padr?o de comportamente. Atrav?s da utiliza??o de algoritmos de aprendizado de m?quina, identificam-se as classes contidas nos dados (agrupamento), treina-se e testa-se o sistema (algoritmos de classifica??o), para que o mesmo consiga generalizar o que foi aprendido. Por ?ltimo, criam-se regras de controle associadas as classes previamente identificadas, para controlar os aparelhos de ar condicionado, tanto o principal quanto o reserva, e mais o desumificador. Dessa forma, o prot?tipo mant?m temperatura e umidade estaveis de forma inteligente.
|
65 |
Uma nova metáfora visual escalável para dados tabulares e sua aplicação na análise de agrupamentos / A scalable visual metaphor for tabular data and its application on clustering analysisEvinton Antonio Cordoba Mosquera 19 September 2017 (has links)
A rápida evolução dos recursos computacionais vem permitindo que grandes conjuntos de dados sejam armazenados e recuperados. No entanto, a exploração, compreensão e extração de informação útil ainda são um desafio. Com relação às ferramentas computacionais que visam tratar desse problema, a Visualização de Informação possibilita a análise de conjuntos de dados por meio de representações gráficas e a Mineração de Dados fornece processos automáticos para a descoberta e interpretação de padrões. Apesar da recente popularidade dos métodos de visualização de informação, um problema recorrente é a baixa escalabilidade visual quando se está analisando grandes conjuntos de dados, resultando em perda de contexto e desordem visual. Com intuito de representar grandes conjuntos de dados reduzindo a perda de informação relevante, o processo de agregação visual de dados vem sendo empregado. A agregação diminui a quantidade de dados a serem representados, preservando a distribuição e as tendências do conjunto de dados original. Quanto à mineração de dados, visualização de informação vêm se tornando ferramental essencial na interpretação dos modelos computacionais e resultados gerados, em especial das técnicas não-supervisionados, como as de agrupamento. Isso porque nessas técnicas, a única forma do usuário interagir com o processo de mineração é por meio de parametrização, limitando a inserção de conhecimento de domínio no processo de análise de dados. Nesta dissertação, propomos e desenvolvemos uma metáfora visual baseada na TableLens que emprega abordagens baseadas no conceito de agregação para criar representações mais escaláveis para a interpretação de dados tabulares. Como aplicação, empregamos a metáfora desenvolvida na análise de resultados de técnicas de agrupamento. O ferramental resultante não somente suporta análise de grandes bases de dados com reduzida perda de contexto, mas também fornece subsídios para entender como os atributos dos dados contribuem para a formação de agrupamentos em termos da coesão e separação dos grupos formados. / The rapid evolution of computing resources has enabled large datasets to be stored and retrieved. However, exploring, understanding and extracting useful information is still a challenge. Among the computational tools to address this problem, information visualization techniques enable the data analysis employing the human visual ability by making a graphic representation of the data set, and data mining provides automatic processes for the discovery and interpretation of patterns. Despite the recent popularity of information visualization methods, a recurring problem is the low visual scalability when analyzing large data sets resulting in context loss and visual disorder. To represent large datasets reducing the loss of relevant information, the process of aggregation is being used. Aggregation decreases the amount of data to be represented, preserving the distribution and trends of the original dataset. Regarding data mining, information visualization has become an essential tool in the interpretation of computational models and generated results, especially of unsupervised techniques, such as clustering. This occurs because, in these techniques, the only way the user interacts with the mining process is through parameterization, limiting the insertion of domain knowledge in the process. In this thesis, we propose and develop the new visual metaphor based on the TableLens that employs approaches based on the concept of aggregation to create more scalable representations of tabular data. As application, we use the developed metaphor in the analysis of the results of clustering techniques. The resulting framework does not only support large database analysis but also provides insights into how data attributes contribute to clustering regarding cohesion and separation of the composed groups
|
66 |
Mapeamento geoambiental do município de Delfinópolis (MG) / Geoenvironmental mapping of the municipality of Delfinópolis (MG)Ana Paula Pereira Carvalho 05 May 2017 (has links)
O estudo do espaço físico territorial é de extrema importância para o planejamento municipal, principalmente quando se situa no seu limite administrativo uma área protegida. Neste contexto, o mapeamento geoambiental se destaca como uma ferramenta essencial na identificação e delimitação de regiões que apresentam características semelhantes, direcionando de forma rápida e eficiente os órgãos gestores na solução das demandas de cada área. Este trabalho teve como objetivo realizar o mapeamento geoambiental do município de Delfinópolis (MG), na escala de 1:50.000, tendo como base a utilização da análise de agrupamentos para delimitar as áreas com alto nível de similaridade referente às características do meio físico. O município pode ser considerado especial, devido 40,35% da sua área corresponder à unidade de conservação do Parque Nacional da Serra da Canastra (PNSC). O mapeamento teve por base a caracterização física das bacias hidrográficas de até 4ª ordem de ramificação que se encontram totalmente inseridas no município. A análise de agrupamentos das bacias de 1ª ordem foi realizada considerando o percentual de área de três atributos fundamentais do meio físico (materiais inconsolidados, substrato rochoso, e declividade). Já as bacias hidrográficas de 2ª, 3ª e 4ª ordens foram inicialmente agrupadas com base em nove índices morfométricos e posteriormente analisadas frente aos mesmos atributos fundamentais do meio físico. Em todas as análises de agrupamentos foi utilizado o método pareado igualmente ponderado e na análise dos dendrogramas foi estabelecida uma linha de fusão de 20% para identificação das unidades homogêneas e de 80% para os grupos de unidades que apresentam alto nível de dissimilaridade. A integração da análise morfométrica com as informações do meio físico permitiu a delimitação de nove unidades geoambientais com nível de homogeneidade compatível com a escala de mapeamento. A análise dessas unidades mostrou certa compatibilidade das características físicas da zona intangível e da zona de ocupação temporária do PNSC com a unidade UG 8. Com relação às áreas de preservação permanente, nenhuma das unidades obedece totalmente os limites previstos na legislação. Dentre as unidades, duas apresentam-se pouco degradadas, duas encontram-se degradadas e as demais se enquadram em nível regular de degradação. / The study of territorial physical space is extremely important for municipal planning, especially when a protected area is located within its administrative boundary. In this context, the geoenvironmental mapping stands out as an essential tool in the identification and delimitation of regions that present similar characteristics, directing public management quickly and efficiently in the solution of the demands of each area. The objective of this work is to perform the geoenvironmental mapping of the city of Delfinópolis (MG), in the scale of 1: 50.000, based on the use of cluster analysis to delimit the areas with high level of similarity referent to the characteristics of the physical environment. The municipality can be considered special, since 40,35% of its area corresponds to the conservation unit of National Park Serra da Canastra (PNSC).The mapping was based on the physical characteristics of the watersheds up to the 4th order of ramification that are totally inserted in the municipality. The analysis of groupings of the 1st order basins was performed considering the percentage of area of three fundamental attributes of the physical environment (unconsolidated materials, geology, and slope).The 2nd, 3rd and 4th order watersheds were initially grouped based on nine morphometric indices and later analyzed against the same fundamental attributes of the physical environment. In all cluster analysis, we used the unweighted pair-group method and in the analysis of dendrograms a 20% melting line was established to identify the homogeneous units and 80% of the groups of units with a high level of dissimilarity.The integration of the morphometric analysis with the information about the physical environment allowed the delimitation of nine geoenvironmental units with level of homogeneity compatible with the scale of mapping.The analysis of these units showed the similarity of the physical characteristics of the intangible zone and the temporary occupation zone of the PNSC with the unit UG 8.In relation to the areas of permanent preservation, none of the units fully obey the limits established in the legislation. Among the units, two are poorly degraded, two are degraded and the other ones fall into a regular level of degradation.
|
67 |
Estudo dos atributos do meio físico como base para o zoneamento geoambiental da região de influência do reservatório da Usina Hidroelétrica de Caconde (SP), escala: 1:50.000, com uso de geoprocessamento / Study of the geoenvironment attributes as a subsidy to the geoenvironmental zoning in the region of influence at Caconde\'s Hydroelectric Reservoir (SP), scale 1:50.000, using geoprocessingHolden Robson de Amorim 19 May 2003 (has links)
Estudos geoambientais se propõem a avaliar e planejar o uso do solo tomando como base os principais atributos do meio físico. O objetivo principal desse trabalho é apresentar e aplicar uma proposta metodológica, considerando os procedimentos e os produtos da cartografia geotécnica desenvolvida para as condições brasileiras, que vise o planejamento territorial. A proposta foi aplicada na região de influência do reservatório da Usina Hidroelétrica de Caconde (SP). Foram avaliadas características geomorfológicas, geológicas, de solos (comportamento geotécnico) e aptidão agrícola. A carta de zoneamento geoambiental foi produzida por meio de trabalhos de geoprocessamento e análise de agrupamentos dos diversos planos de informações produzidos. Os resultados mostraram que a proposta funcionou adequadamente considerando os atributos do meio físico selecionados. Todos os produtos cartográficos gerados na pesquisa, encontram-se inseridos nos sistemas de informações geográficas Idrisi 32 e ArcView GIS 3.1, no qual este último associa aos mapas e cartas confeccionados um banco de dados geoambiental de modo a possibilitar que as informações possam ser acrescidas, inseridas, recuperadas, atualizadas ou simplesmente removidas desde que se queira ou se faça necessário. / Geonvironmental studies are important to promote environment management. The main objective of this work is to present and to apply a methodological proposal based in both procedures and products of the Engineering Geological Mapping that should aid the territorial planning. The proposal has been applied in the region of influence of the Caconde\'s Hydroelectric Reservoir (SP). Geological and geomorpholocial information were evaluated and the characteristics of unconsolidated materials and agricultural potential have been determined. Geoenvironmental zoning map was produced by using geoprocessing and cluster analysis techniques of several produced information plans. The proposal operate adequately environment attributes selected and realize appropriately the results. All cartographic products generated in this work were handled in the geographical information system Idrisi 32 and ArcView 3,1. Geoenvironmental database has been associated with produced maps in ArcView Gis.
|
68 |
Algoritmos de agrupamento particionais baseados na Meta-heurística de otimização por busca em grupoPACÍFICO, Luciano Demétrio Santos 26 August 2016 (has links)
Submitted by Irene Nascimento (irene.kessia@ufpe.br) on 2016-10-17T18:58:21Z
No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese-ldsp-cin-ufpe.pdf: 2057113 bytes, checksum: 40e1baebc2bc4840cd9803fdc16d952f (MD5) / Made available in DSpace on 2016-10-17T18:58:21Z (GMT). No. of bitstreams: 2
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
tese-ldsp-cin-ufpe.pdf: 2057113 bytes, checksum: 40e1baebc2bc4840cd9803fdc16d952f (MD5)
Previous issue date: 2016-08-26 / CNPQ / A Análise de Agrupamentos, também conhecida por Aprendizagem Não-Supervisionada,
é uma técnica importante para a análise exploratória de dados, tendo sido largamente
empregada em diversas aplicações, tais como mineração de dados, segmentação de imagens,
bioinformática, dentre outras. A análise de agrupamentos visa a distribuição de um
conjunto de dados em grupos, de modo que indivíduos em um mesmo grupo estejam mais
proximamente relacionados (mais similares) entre si, enquanto indivíduos pertencentes a
grupos diferentes tenham um alto grau de dissimilaridade entre si.
Do ponto de vista de otimização, a análise de agrupamentos é considerada como um caso
particular de problema de NP-Difícil, pertencendo à categoria da otimização combinatória.
Técnicas tradicionais de agrupamento (como o algoritmo K-Means) podem sofrer algumas
limitações na realização da tarefa de agrupamento, como a sensibilidade à inicialização
do algoritmo, ou ainda a falta de mecanismos que auxiliem tais métodos a escaparem de
pontos ótimos locais.
Meta-heurísticas como Algoritmos Evolucionários (EAs) e métodos de Inteligência de
Enxames (SI) são técnicas de busca global inspirados na natureza que têm tido crescente
aplicação na solução de uma grande variedade de problemas difíceis, dada a capacidade de
tais métodos em executar buscas minuciosas pelo espaço do problema, tentando evitar
pontos de ótimos locais. Nas últimas décadas, EAs e SI têm sido aplicadas com sucesso
ao problema de agrupamento de dados. Nesse contexto, a meta-heurística conhecida por
Otimização por Busca em Grupo (GSO) vem sendo aplicada com sucesso na solução de
problemas difíceis de otimização, obtendo desempenhos superiores a técnicas evolucionárias
tradicionais, como os Algoritmos Genéticos (GA) e a Otimização por Enxame de Partículas
(PSO). No contexto de análise de agrupamentos, EAs e SIs são capazes de oferecer boas
soluções globais ao problema, porém, por sua natureza estocástica, essas abordagens
podem ter taxas de convergência mais lentas quando comparadas a outros métodos de
agrupamento.
Nesta tese, o GSO é adaptado ao contexto de análise de agrupamentos particional. Modelos
híbridos entre o GSO e o K-Means são apresentados, de modo a agregar o potencial de
exploração oferecido pelas buscas globais do GSO à velocidade de exploitação de regiões
locais oferecida pelo K-Means, fazendo com que os sistemas híbridos formados sejam
capazes de oferecerem boas soluções aos problemas de agrupamento tratados.
O trabalho apresenta um estudo da influência do K-Means quando usado como operador
de busca local para a inicialização populacional do GSO, assim como operador para
refinamento da melhor solução encontrada pela população do GSO durante o processo
geracional desenvolvido por esta técnica.
Uma versão cooperativa coevolucionária do modelo GSO também foi adaptada ao contexto
da análise de agrupamentos particional, resultando em um método com grande potencial
para o paralelismo, assim como para uso em aplicações de agrupamentos distribuídos.
Os resultados experimentais, realizados tanto com bases de dados reais, quanto com o
uso de conjuntos de dados sintéticos, apontam o potencial dos modelos alternativos de
inicialização da população propostos para o GSO, assim como de sua versão cooperativa
coevolucionária, ao lidar com problemas tradicionais de agrupamento de dados, como a
sobreposição entre as classes do problema, classes desbalanceadas, dentre outros, quando
em comparação com métodos de agrupamento existentes na literatura. / Cluster analysis, also known as unsupervised learning, is an important technique for
exploratory data analysis, and it has being widely employed in many applications such as
data mining, image segmentation, bioinformatics, and so on. Clustering aims to distribute
a data set in groups, in such a way that individuals from the same group are more closely
related (more similar) among each other, while individuals from different groups have a
high degree of dissimilarity among each other.
From an optimization perspective, clustering is considered as a particular kind of NP-hard
problem, belonging in the combinatorial optimization category. Traditional clustering
techniques (like K-Means algorithm) may suffer some limitations when dealing with
clustering task, such as the sensibility to the algorithm initialization, or the lack of
mechanisms to help these methods to escape from local minima points.
Meta-heuristics such as EAs and SI methods are nature-inspired global search techniques
which have been increasingly applied to solve a great variety of difficult problems, given
their capability to perform thorough searches through a problem space, attempting to
avoid local optimum points. From the past few decades, EAs and SI approaches have
been successfully applied to tackle clustering problems. In this context, Group Search
Optimization (GSO) meta-heuristic has been successfully applied to solve hard optimization
problems, obtaining better performances than traditional evolutionary techniques, such as
Genetic Algorithms (GA) and Particle Swarm Optimization (PSO). In clustering context,
EAs an SIs are able to obtain good global solutions to the problem at hand, however,
according to their stochastic nature, these approaches may have slow convergence rates in
comparison to other clustering methods.
In this thesis, GSO is adapted to the context of partitional clustering analysis. Hybrid
models of GSO and K-Means are presented, in such a way that the exploration offered
by GSO global searches are combined with fast exploitation of local regions provided
by K-Means, generating new hybrid systems capable of obtaining good solutions to the
clustering problems at hands.
The work also presents a study on the influence of K-Means when adopted as a local
search operator for GSO population initialization, just like its application as an refinement
operator for the best solution found by GSO population during GSO generative process.
A cooperative coevolutionary variant of GSO model is adapted to the context of partitional
clustering, resulting in a method with great potential to parallelism, as much as for the
use in distributed clustering applications.
Experimental results, performed as with the use of real data sets, as with the use of
synthetic data sets, showed the potential of proposed alternative population initialization
models and the potential of GSO cooperative coevolutionary variant when dealing with
classic clustering problems, such as data overlapping, data unbalancing, and so on, in
comparison to other clustering algorithms from literature.
|
69 |
HCA e PCA de espectros FT-IR e UV-VIS de ácidos húmicos e DRX de solos de TPILoureiro, João Vitor Silva de 15 May 2015 (has links)
Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-10-26T15:25:30Z
No. of bitstreams: 1
Dissertação - João Vitor Silva de Loureiro.pdf: 2409815 bytes, checksum: 3450dbc2ad4f05bc1bd2ccbd06e220a6 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-10-26T18:05:45Z (GMT) No. of bitstreams: 1
Dissertação - João Vitor Silva de Loureiro.pdf: 2409815 bytes, checksum: 3450dbc2ad4f05bc1bd2ccbd06e220a6 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-10-26T18:07:52Z (GMT) No. of bitstreams: 1
Dissertação - João Vitor Silva de Loureiro.pdf: 2409815 bytes, checksum: 3450dbc2ad4f05bc1bd2ccbd06e220a6 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-10-26T18:21:27Z (GMT) No. of bitstreams: 1
Dissertação - João Vitor Silva de Loureiro.pdf: 2409815 bytes, checksum: 3450dbc2ad4f05bc1bd2ccbd06e220a6 (MD5) / Made available in DSpace on 2015-10-26T18:21:27Z (GMT). No. of bitstreams: 1
Dissertação - João Vitor Silva de Loureiro.pdf: 2409815 bytes, checksum: 3450dbc2ad4f05bc1bd2ccbd06e220a6 (MD5)
Previous issue date: 2015-05-15 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The formation of Terra Preta (TPI) intrigued many researchers, besides it has too many hypotheses, the most likely involves human activities, whose origin is related to the deposition of material remained of pre-Columbian populations. It resulted in soils rich in humic acid (HA) that are regarded as natural binders most widely distributed in nature, which greatly contributes to soil fertility. This study applied statistical methods of multivariate analyzes such as hierarchical cluster analysis (HCA), Principal Component Analysis (PCA), infrared spectra Fourier Transform (FT-IR) and ultraviolet-visible spectra (UV-Vis) AH ICC for eight sites in the Amazon region, and applied to spectra of X-ray diffraction (XRD) of soil same eight sites of the ICC. Statistical methods were applied using the R software that makes use of normalization of the data obtained from each spectrum to generate the results of PCA and HCA. Using r software tools, it was possible observe which functional groups and stretches contributed positively OH, C=O and C=C, to generate graphics of PCA and HCA extracted from the FT-IR spectra. As for the results of UV-Vis spectra it was not possible to observe that groups could contribute to generation of HCA and PCA. For the XRD spectra it was observed that the PC1 that kaolinite and illite were the most positive contribution to the graphics, the PC2 that in most of the contribution was quartz. Thus, the simple application of HCA and PCA in the spectra allowed to compare the eight sites and classifies them according to similarity of the spectra. / A formação da Terra Preta de Índio (TPI) intriga muitos pesquisadores, por mais que exista muitas hipóteses, a mais plausível envolve atividades antrópicas, cuja origem está relacionada à deposição de restos de materiais de populações précolombianas. O que resultou em solos ricos em ácidos húmicos (AH), que são consideradas ligantes naturais mais amplamente distribuídos na natureza, o que contribui bastante para a fertilidade do solo. Neste estudo foi aplicado os métodos estatísticos de análises multivariadas como Análise de Agrupamentos Hierárquicos (HCA) e Análise de Componentes Principais (PCA) de espectros de infravermelho com Transformada de Fourier (FT-IR) e espectros de ultravioleta-visível (UV-Vis) para AH de oito sítios de TPI da região amazônica, e aplicado para espectros de difração de raios x (DRX) de solos dos mesmos oito sítios de TPI. Os métodos estatísticos foram aplicados com software R, que faz uso de normalização dos dados obtidos de cada espectro para geração dos resultados de HCA e PCA. Com ajuda das ferramentas do software R foi possível observar grupos funcionas ou estiramentos contribuíram positivamente, O-H, C=O e C=C, para gerar os gráficos de HCA e PCA extraídos dos espectros FTIR. Já para os resultados obtidos dos espectros UV-Vis não foi possível observar que grupamentos poderiam contribuir para geração do HCA e PCA. Quanto aos espectros dos de DRX foi possível observar que que na PC1 a caulinita e a ilita foram as que mais contribuíram positivamente para os gráficos, quanto que na PC2 a maior parte da contribuição foi do quartzo. Dessa forma, a simples aplicação de HCA e PCA nos espectros permitiu comparar os oitos sítios e classifica-los segundo similaridades dos espectros.
|
70 |
O uso de redes neurais auto-organizÃveis na anÃlise da transferÃncia de conhecimentos prosÃdico em aprendizes brasileirios de lÃngua inglesa / The use of self-organizing artificial neural networks for the analysis of prosodic knowledge in Brazilian learner of EnglishAna Cristina Cunha da Silva 08 October 2010 (has links)
CoordenaÃÃo de AperfeiÃoamento de Pessoal de NÃvel Superior / FundaÃÃo de Amparo à Pesquisa do Estado do Cearà / O objetivo desta tese foi investigar como o conhecimento prosÃdico està organizado em um estÃgio inicial de aquisiÃÃo de L2 em aprendizes brasileiros de inglÃs com a ajuda de uma rede neural conexionista. A abordagem proposta neste trabalho consiste primeiramente em "quantificar" as elocuÃÃes dos aprendizes de L2 na forma de coeficientes LPC e outras caracterÃsticas linguÃsticas/fonÃticas que possam representar o fenÃmeno aqui estudado (TransferÃncia do Conhecimento
ProsÃdico do PortuguÃs para o inglÃs). A este processo dÃ-se o nome de "extraÃÃo de caracterÃsticas" da fala (feature extraction), uma importante etapa na abordagem
conexionista do processamento da fala. Em segundo lugar, uma vez determinadas as caracterÃsticas do item lexical ou da frase produzida por cada aprendiz, sÃo
inseridos esses dados na rede neural a fim de analisar as propriedades (regularidades) estatÃsticas do conjunto de falantes como um todo. Em terceiro, utiliza-se ferramentas de visualizaÃÃo para analisar como a rede organiza os falantes e quais informaÃÃes sÃo mais relevantes para este processo de formaÃÃo de grupos
(e.g. nÃvel de proficiÃncia, uma certa caracterÃstica ou propriedade da fala, entre outros). A rede utilizada à conhecida como Mapa Auto-OrganizÃvel (Self-Organizing
Map, SOM). A rede SOM organiza os falantes por grau de similaridade em grupos bem definidos (clusters). A aplicaÃÃo da rede SOM neste contexto Ã, portanto,
inovadora. A rede SOM à implementada no ambiente Matlab usando o pacote Som toolbox, que à um conjunto de rotinas de programaÃÃo desenvolvidas pelo grupo de
pesquisa da FinlÃndia, tambÃm inventores da rede SOM. Os resultados das simulaÃÃes apontam que a rede SOM pode vir a ser usada mais frequentemente para avaliar o grau de distÃncia a que um grupo de aprendizes està do grupo de falantes nativos. Dessa forma, uma rede neural pode vir a ser aplicada como ferramenta no contexto de determinaÃÃo de nÃvel de proficiÃncia em lÃngua estrangeira. / The objective of this dissertation was to investigate how the prosodic knowledge is organized in an early stage of L2 acquisition in Brazilian learners of English with the help of a connectionist neural network. The approach proposed in
this research is first, to quantify the utterances of L2 learners in the form of LPC coefficients and other linguistic/phonetics features that can represent the
phenomenon studied here (Transfer of the prosodic knowledge from Portuguese to English). This process is called speech feature extraction, an important step in the connectionist approach to speech processing. Second, since certain features of the lexical item or sentence produced by each learner are determined, these data are entered into the neural network to analyze the statistical properties (regularities) of the set of speakers as a whole. Third, visualization tools are used to analyze how the network organizes speakers and what information is most relevant to this process of group formation (e.g. proficiency level, a certain characteristic or property of speech, among others). The network is known as Self-Organizing Map (Self-Organizing Map, SOM). The SOM organizes speakers for similarity degree in well-defined groups (clusters). Application of SOM in this context is therefore innovative. The SOM network is implemented in Matlab environment using the SOMtoolbox package, which is a set of programming routines developed by the research group in Finland,
also the inventors of the SOM. The simulation results indicate that SOM might be used more frequently to assess the degree of distance that a group of learners is to
the group of native speakers. Thus, a neural network might be used as a tool in the context of determining the level of foreign language proficiency.
|
Page generated in 0.0782 seconds