Global ETD Search

41	Recuperação de imagens por cor utilizando analise de distribuição discreta de caracteristicas / Color-based image retrieval using discrete distribution features analysis Almeida Junior, Jurandy Gomes de, 1983- 08 August 2007 (has links) Orientadores: Siome Klein Goldenstein, Ricardo da Silva Torres / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação / Made available in DSpace on 2018-08-09T20:33:35Z (GMT). No. of bitstreams: 1 AlmeidaJunior_JurandyGomesde_M.pdf: 4495355 bytes, checksum: 23f3f269bbf0d0e9336b8f3d53677c93 (MD5) Previous issue date: 2007 / Resumo: A evolução das tecnologias de aquisição, transmissão e armazenamento de imagens tem permitido a construção dc bancos dc imagens cada vez maiores. À medida em que cresce o volume de imagens nessas coleções, cresce também o intcresse por sistemas capazes de recuperar essas imagens. Essa tarefa tcem sido endereçada pelos sistemas de recuperação de imagens por conteúdo. Nesses sistemas, o conteúdo de uma imagem é descrito a partir de suas características visuais de baixo nível, tais como cor, forma e textura. Um sistema de recuperação de imagens por conteúdo idcal deve ser eficaz e eficiente. A eficácia é resultado de representações abstratas das imagens. Em geral, os métodos que realizam esse processo normalmente falham na presença de diferentes condições de iluminação, oclusão e foco. A eficiência, por outro lado, é resultado da organização dada à essas representações. Em geral, os métodos de agrupamento constituem uma das técnicas mais úteis para diminuir o espaço de busca e acelerar o processamento de uma consulta. Para endereçar a eficácia, este trabalho apresenta o 81FT -Texton, um método capaz de incorporar informações sobre iluminação, oclusão e foco nas características visuais de baixo nível. Esse método baseia-se na distribuição discreta de características invariantes locais e em propriedades de baixo nível das imagens. Em relação às questões de eficiência, este trabalho apresenta o DAH-Cluster, um novo paradigma de agrupamento aplicado à recuperação de imagens por conteúdo. Esse método combina características dos paradigmas hierárquicos divisivo e aglomerativo. Além disso, o DAH-Cluster introduz um novo conceito; chamado fator de reagrupamento, que permite agrupar elementos similares que seriam separados pelos paradigmas tradicionais. Experimentos mostram que a combinação dessas técnicas permite a criação de um mecanismo robusto de recuperação de imagens por conteúdo, atingindo resultados mais eficazes e mais eficientes que as abordagens tradicionais descritas na literatura. As principais contribuições deste trabalho são: (1) um novo método para recuperação de imagens capaz de incorporar informações sobre iluminação, oclusão e foco nas características visuais de baixo nível; e (2) um novo paradigma de agrupamento de dados que pode ser aplicado à recuperação de informação / Abstract: Advances in data storage, data transmission, and image acquisition have enabled the creation of large images datasets. This has spurred great interest for systems that are ablc to efficicntly rctricve images from these collections. This task has been addressed by thc so-called Content-Based Image Retrieval (CBIR) systems. ln these systems, image content is represented by their low-level features, such as color, shape, and texture. An ideal CBIR system should be effective and efficient. Effectiveness is achieved from image's abstract representations. ln general, traditional approaches for this process often fail in presence of different illumination, occlusion, and viewpoint conditions. Efficiency, on the other hand, is achieved from the organization given for these representations. ln general, data clustering approaches are one of the most useful techniques to reduce search space and speed up query processing. To address effectiveness issues, this work presents 81FT-Texton, a new method to incorporate illumination, occlusion, and viewpoint conditions into low-level features. This approach is based on discrete distributions of local invariant features and low-level image properties. With regard to efficiency issues, this work presents DAH-Cluster, a new clustering paradigm applied to CBIR. This approach combines features from both divisive and agglomerative hierarchical clustering paradigms. ln addition, DAH-Cluster introduces a new concept, called factor of reclustering, that allows grouping similar elements that would be separated by traditional clustering paradigms. Experiments show that the combination of these techniques allows the creation of a robust CBIR mechanism, achieving more effective and efficient results than traditional approaches in literature. The main contributions of this work are: (1) a new method for image retrieval that incorporates illumination, occ1usion, and viewpoint conditions into low-level features; and (2) a new data clustering paradigm that can be applied to information retrieval tasks / Mestrado / Sistemas de Informação / Mestre em Ciência da Computação Processamento de imagens Banco de dados Recuperação da informação Análise por agrupamento Image processing Database Information retrieval Clustering analysis
42	Estudo de resultados do espectro multifractal da retina humana, como medida de classificação: uma aplicação de análise de agrupamento SANTOS, Esdras Adriano Barbosa dos 25 February 2008 (has links) Submitted by (ana.araujo@ufrpe.br) on 2016-07-05T15:53:56Z No. of bitstreams: 1 Esdras Adriano Barbosa dos Santos.pdf: 719323 bytes, checksum: 7defd3639c47f0575744d0faadba2053 (MD5) / Made available in DSpace on 2016-07-05T15:53:56Z (GMT). No. of bitstreams: 1 Esdras Adriano Barbosa dos Santos.pdf: 719323 bytes, checksum: 7defd3639c47f0575744d0faadba2053 (MD5) Previous issue date: 2008-02-25 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Image analysis is frequently used by ophthalmologists as part of the diagnostic procedure. Inspection of the vascular structure of the retina may reveal early stages of pathologies such as diabetic retinopathy, and there have been various efforts to develop more efficient methods for diagnosing such diseases. Currently, identification of abnormalities requires a laborious inspection of a large number of images from the part of specialists, and there is a necessity of automating this process to provide auxiliary diagnostic tools of high speed and precision. One of the lines of research conducted in the direction of differentiating between healthy and pathological retinal images uses the concept of fractal dimension. Recently it was shown that the vascular structure of the human retina is not a simple fractal, but rather a multifractal, characterized by a non trivial multifractal spectrum. In this work, multivariate clustering methods are applied to the results of the multifractal analysis, in order to establish the sensitivity of this analysis, and its ability to differentiate between the normal and pathological cases of the human retina. The variables used for this purpose are the elements of the multifractal spectrum f (a) and the generalized dimension D(q), from which three distinct sets of variables were chosen. The clustering methods used for this study are the Ward method, K-means, PAM and Fuzzy C-means. As a measure ofvalidation of the obtained groups the cophenetic correlation was used for the Ward method,and the silhouette graphs for K-means, PAM and Fuzzy C-means. The results show that for the skeletonized images 70-80% of the pathological images were correctly classified (depending on the method and the variables used), while for the original segmented images clustering produces worse results. This fact indicates that the width of the vessels exerts less influence on the conclusions of the current analysis in comparison with the length distribution and the ramification structure. Thus, we may conclude that the multifractal analysis, with adequate pre-processing of the images and choice of variables, can be used for detection of pathological cases, as part of the pre-diagnostic procedure. / A análise de imagens é freqüentemente praticada por oftalmologistas para diagnóstico de doenças. A inspeção da vascularização da retina pode revelar inícios de doenças como a retinopatia diabética. Desta forma, existem vários esforços para o desenvolvimento de métodos mais eficazes no diagnóstico destas doenças. A identificação de anormalidades requer uma trabalhosa inspeção de uma grande quantidade das imagens por especialistas. Assim sendo, há necessidade de desenvolvimento de softwares para o auxílio dos oftalmologistas na busca de uma diagnose mais rápida e mais precisa. O uso da dimensão fractal na busca de diferenciação entre retinas com e sem patologias é mais um dos ramos de pesquisa realizados nesta área. Recentemente, foi mostrado que a retina humana não é um fractal simples, mas um multifractal, caracterizado pelo espectro multifractal não trivial. Neste trabalho, foram aplicados métodos de agrupamento nos resultados da análise multifractal para verificar a sensibilidade desta análise na diferenciação entre casos patológicos e casos normais da retina humana. As variáveis usadas são os elementos de espectro multifractal f (a) e dimensões generalizadas D(q), das quais foram escolhidos três conjuntos distintos. Os métodos de agrupamento usados para análise foram o método de Ward, K-médias, PAM e Fuzzy c-means. Como medida para a validação dos grupos obtidos, foiusada a correlação cofenética para o método de Ward e gráficos de silhueta e silhueta média para os métodos K-médias, PAM e Fuzzy c-means. Os resultados mostraram que, para imagens esqueletonizadas, 70-80% das retinas patológicas (dependendo do método e do conjunto de variáveis usadas) foram agrupadas corretamente, enquanto que para as imagens segmentadas originais, o agrupamento não apresentou resultados tão satisfatórios. Este fato indica que a largura dos vasos apresenta menor influência para as conclusões da análise atual, em comparação com o comprimento dos vasos e suas ramificações. Diante disso, é possível concluir que a análise multifractal, aliada ao pré-processamento adequado das imagens e a escolha adequada das variáveis, pode ser utilizada para detecção de casos patológicos ou para o pré-diagnóstico. Análise de agrupamento Multifractal Retina Vascularização Vascular Structure Clustering Methods
43	Métodos robustos em análise de agrupamento para dados simbólicos Cristina de Assis, Elaine 31 January 2011 (has links) Made available in DSpace on 2014-06-12T16:00:00Z (GMT). No. of bitstreams: 2 arquivo5813_1.pdf: 1242512 bytes, checksum: 898cc02cecdade8681b49f419621a5ce (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Faculdade de Amparo à Ciência e Tecnologia do Estado de Pernambuco / Análise de agrupamento (cluster analysis) visa organizar um conjunto de itens em grupos tal que os itens em um dado grupo têm alto grau de similaridade, enquanto itens pertencentes a grupos diferentes têm um alto grau de dissimilaridade. Técnicas de análise de agrupamento podem ser divididas em hierárquicas e de particionamento. Métodos hierárquicos formam seqüências de partições dos dados de entrada gerando assim hierarquias completas, enquanto métodos de particionamento procuram obter uma simples partição dos dados de entrada em um número fixo de grupos. Em geral esses métodos são divididos em dois grupos de paradigmas: rígido (hard) e difuso/nebuloso (fuzzy). Os algoritmos rígidos associam um item a apenas um grupo, enquanto os algoritmos difusos/nebulosos associam um item a todos os grupos através de um grau de pertinência do item em cada grupo. Os algoritmos de agrupamento baseados em medoid são conhecidos por serem menos sensíveis na presença de observações aberrantes/ruídos. Adicionalmente, esses algoritmos são mais flexíveis uma vez que a entrada de dados é uma matriz de dissimilaridade. A fim de modelar variabilidade e/ou incerteza inerente aos dados, variáveis podem assumir conjuntos de categorias ou intervalos, possivelmente até mesmo com freqüências ou pesos. A análise de dados simbólicos (Symbolic Data Analysis) é um domínio relacionado com análise multivariada, reconhecimento de padrão e inteligência artificial para tratar com conjuntos de dados simbólicos descritos por intervalos, distribuição de peso (probabilidade) ou conjuntos de categorias. Esta dissertação apresenta métodos de agrupamento rígidos e difusos/nebulosos baseados em medoid para conjuntos de dados simbólicos. Diferentes funções de distâncias padronizadas para dados simbólicos são também investigadas. Para avaliar os métodos aplicados a dados simbólicos, foram realizados experimentos com conjuntos de dados intervalares artificiais contendo observações aberrantes e conjuntos de dados simbólicos reais mistos. Os resultados da medida de qualidade adotada demonstraram que em geral os métodos baseados em medoid obtiveram um desempenho satisfatório em relação a outros métodos de particionamento existentes na literatura de dados simbólicos Análise de Agrupamento Análise de Dados Simbólicos Dados Simbólicos Mistos
44	Métodos multivariados aplicados no monitoramento da qualidade da água de cisternas de placas na região do Pajeú - PE OLIVEIRA, Manoel Rivelino Gomes de 28 June 2016 (has links) Submitted by Mario BC (mario@bc.ufrpe.br) on 2018-05-16T15:14:45Z No. of bitstreams: 1 Manoel Rivelino Gomes de Oliveira.pdf: 1989352 bytes, checksum: c90a6cdc5ab597ebf9119b283df02988 (MD5) / Made available in DSpace on 2018-05-16T15:14:45Z (GMT). No. of bitstreams: 1 Manoel Rivelino Gomes de Oliveira.pdf: 1989352 bytes, checksum: c90a6cdc5ab597ebf9119b283df02988 (MD5) Previous issue date: 2016-06-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The monitoring of water quality is of utmost importance for humanity, whether in rural or urban areas, since all living things depend on this liquid for survival, and it is getting increasingly scarce. The studies on water quality variables still benefits very little statistical methods to detect problems the same. This work aimed to develop a new approach to cluster analysis, from the combination of hierarchical methods and non-hierarchical clustering, showing that these statistical techniques can contribute effectively in studies related to quality variables gives water. This study will use a database related to quality variables gives water collected in cisterns plaques in four settlements located in the city of Serra Talhada Pajeu in the region in the interior of Pernambuco. The methodology used here were the multivariate statistical methods specifically the hierarchical cluster analysis and non-hierarchical and the silhouette of statistical indices as validation criteria of the obtained clusters. The idea is basically to compare the various clustering methods as the "quality" of the groups obtained, relating the quality of water variables of the plaques of cisterns, the various methods used. The groups obtained for cisterns now studied showed that in general the cisterns C14, C49 and C90, C98 are similar among themselves, and dissimilar to other groups according to hierarchical methods of grouping. Regarding the size of the groups, which is generally observed Group 1 scored the highest number of cisterns both in the hierarchical method with the Euclidean distance as the non-hierarchical method k - medoid, while the grouping of hierarchical methods with the metric of canberra and non hierarchical clustering k - mean and fuzzy grouping this behavior was not observed, and consequently the cisterns were better distributed among all groups. The Correlation cophenetic has indicated as better grouping of the average bond method. In fuzzy clustering only two groups were left with seven end eight cisterns respectively, as in the non-hierarchical clustering k - mean hear the formation of three groups which roughly classified the same number of cisterns, and yet it has been found that this grouping method rated a group of dissimilar cisterns of other cisterns classified in other groups where these tanks are easily identified, the is the cisterns C64, C65, C66, C71, C79 and C100 have rates fecal coliforms beyond abnormality in other quality variables gives water. The k method - medoid also formed three groups, wherein the group 1 allocated many cisterns while groups 2 and 3 were with few observations where cisterns C75, C64 and C53 are the centroids or cisterns which represent each group respectively. Therefore, it is concluded that the hierarchical methods and non-hierarchical clustering aided by the silhouette of statistical index can, quite satisfactorily monitor the water quality boards tanks in a semiarid region of Nordeste Brasileiro. / O monitoramento da qualidade da água é de extrema importância para a humanidade, seja em regiões rurais, seja em regiões urbanas, visto que todos os seres vivos dependem desse líquido para sobrevivência, embora ele esteja ficando cada vez mais escasso. Os estudos realizados em variáveis de qualidade da água ainda se beneficiam muito pouco dos métodos estatísticos, para detectar problemas relacionados a mesma. Neste trabalho, objetivou-se desenvolver uma nova abordagem para a análise de agrupamento, a partir da combinação dos métodos hierárquicos e não-hierárquicos de agrupamento, mostrando que essas técnicas estatísticas podem contribuir de forma eficaz em estudos relacionados a variáveis de qualidade da água. Nesse estudo,utilizamos uma base dedados relacionada a variáveis de qualidade da água, coletada em cisternas de placas, em quatro assentamentos localizados no Município de Serra Talhada, na Região do Pajeú, no sertão do Estado de Pernambuco. A metodologia aqui utilizada foram os métodos estatísticos multivariados, mais especificamente a análise de agrupamento hierárquica e não hierárquica, e os índices da estatística da silhueta como critério de validação dos agrupamentos obtidos. A ideia consistiu basicamente em comparar os vários métodos de agrupamento quanto à “qualidade” dos grupos obtidos, relacionados as variáveis de qualidade da água das cisternas de placas, pelos vários métodos utilizados. Os agrupamentos obtidos para as cisternas ora estudadas mostraram que, no geral, as cisternas C14, C49, C90e C98 são similares entre si e dissimilares em relação aos demais agrupamentos, de acordo com os métodos hierárquicos de agrupamento. Com relação ao tamanho dos grupos, observou-se que geralmente o grupo 1 classificou o maior número de cisternas tanto nos métodos hierárquicos com a distância euclidiana, quanto no método não hierárquico do k – medoid, enquanto que, nos métodos hierárquicos de agrupamento com a métrica de camberra e nos agrupamentos não hierárquicos de k – média e agrupamento fuzzy, esse comportamento não se verificou, e, consequentemente, as cisternas ficaram melhor distribuídas entre todos os grupos.A Correção Cofenética indicou como melhor agrupamento o método da ligação média. No agrupamento fuzzy, apenas dois grupos ficaram com sete e oito cisternas respectivamente, já no agrupamento não hierárquico de k – média, houve uma formação de três grupos que classificaram aproximadamente o mesmo número de cisternas. Ainda se verificou que este método de agrupamento classificou um grupo de cisternas dissimilares das demais cisternas classificadas em outros grupos, pois estas cisternas são facilmente identificadas, ou seja, as cisternas C64, C65, C66, C71, C79 e C100 apresentam taxas “elevadas” de coliformes fecais,além de anormalidade em outras variáveis de qualidade da água. O método de k – medoid também formou três grupos: o grupo 1 alocou muitas cisternas; já os grupos 2 e 3 ficaram com poucas observações,pois as cisternas C75, C64 e C53 são os centróides ou as cisternas que representam cada grupo respectivamente. Portanto, conclui-se que os métodos hierárquicos e não hierárquicos de agrupamento auxiliados pelo índice da estatística da silhueta podem,de forma bastante satisfatória, monitorar a qualidade da água de cisternas de placas em uma região semiárida do Nordeste Brasileiro. Método multivariado Análise de agrupamento Cisterna de placa Qualidade da água
45	Sistema de apoio a decisão medica em valvulopatias Ferreira, Jose Alves 08 October 2000 (has links) Orientador: Eduardo Tavares Costa / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-28T06:46:36Z (GMT). No. of bitstreams: 1 Ferreira_JoseAlves_M.pdf: 6253982 bytes, checksum: 60338f082eaf718fea4a1f0cef6876bc (MD5) Previous issue date: 2000 / Resumo: Uma das áreas mais complexas da tomada de decisão médica é o diagnóstico, pois este depende da análise de informações de diferentes naturezas e complexidades e é influenciado pela experiência anterior do médico e da sua intuição. É difícil formalizar esse conhecimento e representá-Io em um programa de computador, pois os mecanismos mentais e os processos de raciocínio pelo qual os clínicos chegam ao diagnóstico são ainda mal conhecidos. Há falta de padronização quanto aos termos e definições médicas, pois muitas vezes não existem opiniões consensuais por parte dos especialistas na área de estudo sobre como decidir em face de evidências conflitantes, além do fato do conhecimento estar espalhado em muitas publicações, lugares e cabeças. Nesta tese é desenvolvido um sistema de apoio à decisão médica utilizando um programa executado em um computador do tipo PC onde, através de respostas às perguntas dirigidas ao paciente, pelo médico e resultados de alguns exames clínicos pode-se chegar a uma confirmação de uma suspeita clínica na área de válvulas cardíacas, ou seja, estenose ou insuficiência valvular. O sistema desenvolvido utiliza teoria de subconjuntos nebulosos a fim de trabalhar com as imprecisões intrínsecas a este processo. Foi desenvolvido um programa de computador com interface amigável para o médico e determina o diagnóstico utilizando linguagem Visual Bàsic e linguagem C++. Nesta interface com o usuário são introduzidos todos os aspectos médicos necessários para a geração do diagnóstico e nesta mesma interface é visualizado o diagnóstico gerado pelo programa. Após a implementação do programa em computador, foi testado o conjunto de dados de um total de 178 fichas médicas com diagnósticos confirmados nos diversos tipos de valvulopatias, apresentando um acerto médio de 67%(diagnósticos totalmente corretos) 76% de acertos para as válvulas cardíacas, 81 % de acertos para o tipo. de doença (insuficiência ou estenose da válvula) e 85% de acertos para a gravidade (leve, moderada ou importante) e 5% de erros (diagnóstico gerado pelo programa totalmente incorreto). Portanto, o programa foi capaz de determinar o problema para a maioria das doenças (95% dos casos para acerto de pelo menos a válvula, tipo de doença ou gravidade) o que o toma uma ferramenta importante no apoio à decisão médica / Abstract: One of the most complex fields of medical decision making for a medical doctor is the diagnosis, as it depends on the analysis of information of different complexities and characteristics, and it can be influenced by the physician's previous experience and intuition. It is difficult to formalize this knowledge and represent it in a computational software, because the mental mechanisms and the reasoning process used by the physicians to reach a diagnosis are still not well known. There is no standardization of medical terms and definitions mainly due to the fact that, frequently, there is no consensual opinion of the experts on an area of study, there is difficulties in deciding when facing conflicting evidence from many different scientific journals, books, issues or just from different minds. In this thesis, a new computer program for medical decision support was developed and presented. The software runs on a personal compute r and, by means of the answers to questions made to the patient by his physician and by the results of physical examination and critical exams like X-rays and ECG, it is possible to confirm a clinical expectation concerning heart diseases (cardiac valve insufficiency or stenosis) The developed program utilizes fuzzy sets to deal with the intrinsic imprecision of this processo. It has also been developed a computer program that serves as an interface between the compute r and the medical user using Visual Basic and C++ languages. In the interface with the user it is introduced ali the medical aspects needed to generate and visualize the results. After computer implementation, the program has been tested with the data from 178 patient records with confirmed diagnosis of different cardiac valve diseases. The main correct results achieved by the program are: 67% of totally correct diagnosis; 76% for type of valve; 81 % type of disease (cardiac valve insufficiency or stenosis); 85% of severity of the disease (light, moderate, or severe). In summary, the program has achieved 95% of correct valvular disease (type of valve, disease and severity of the disease) and 5% of totally incorrect diagnosis, making it an important toei for the medical decision aid / Mestrado / Engenharia Biomedica / Mestre em Engenharia Elétrica Coração - Valvulas - Doenças Inteligência artificial Análise por agrupamento Computadores - Doenças - Diagnóstico Conjuntos fuzzy Medicina - Processo decisório
46	Identificação de regiões hidrologicamente homogêneas por agrupamento fuzzy c-means no estado do Paraná / Identification of hydrologically homogeneous regions by fuzzy c-means group in the state of Paraná Silva, Ana Claudia Guedes 07 February 2018 (has links) Submitted by Neusa Fagundes (neusa.fagundes@unioeste.br) on 2018-06-15T17:07:21Z No. of bitstreams: 2 Ana Claudia_Silva2018.pdf: 1741410 bytes, checksum: 83384ab7c02835c3d776f862defc84c1 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-06-15T17:07:21Z (GMT). No. of bitstreams: 2 Ana Claudia_Silva2018.pdf: 1741410 bytes, checksum: 83384ab7c02835c3d776f862defc84c1 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-02-07 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The design of hydrologically homogeneous regions (RHH) is an essential procedure to provide information essential to the modeling, planning, and management of water resources, especially when it is necessary to perform the regionalization of flows, aiming to estimate the water availability in sections without measurements. The definition of strategies for the management and conservation of natural resources depends on information obtained through the identification of RHH, also being one of the steps of a study of regionalization of flows. Thus, this work has the objective of identifying the RHH in the state of Paraná through the grouping method Fuzzy C-Means. A total of 9 variables were used for the 114 fluviometric stations, with 4 dependent variables related to the characteristic flows (annual average long-term flow (Qmld), minimum annual flow with seven days duration and 10-year return period (Q7,10), flow rates associated to the 95% (Q95) and 90% (Q90) permanencies) and 5 independent variables related to the morphometric characteristics of the station (drainage area (AD - m²), sum of drainage (SD - m) (LA - Lat and longitude - Long). From the principal components analysis (PCA), the variables Qmld, DD, Lat and Long were identified as the least representative, being discarded from the study, proceeding with the analysis using only the variables AD, SD, Q90, Q95, and Q7,10. The results were obtained using the Fuzzy C-Means for the chosen variables, and the smallest objective function was found for 4 Clusters in the study group, with index of and fuzzification (m) 1.7. Separating the fluviometric stations by clusters through degrees of pertinence, the largest number of stations were obtained in Cluster 3 (83 stations), followed by Cluster 4 (13 stations) and Clusters 1 and 2 (7 stations in each cluster), and only 4 stations were not inserted in any cluster, being classified as nebulae, where the groups were determined practically by the distribution of the AD and SD variables. The smaller areas of coverage, analyzed flows and the smaller amount of drainage in the coverage area of the stations were found in Cluster 3, considering they were well spread in the state of Paraná. Clusters 1 and 4 were intermediate among the other clusters in all parameters evaluated. The Fuzzy C-Means algorithm proved to be efficient for the grouping of fluviometric stations in the state of Paraná, where it was possible to find the characteristics of each cluster formed, without overlapping of data in the analyzed variables. / O delineamento de regiões hidrologicamente homogêneas (RHH) é um procedimento essencial para provimento de informações indispensáveis aos trabalhos de modelagem, planejamento e gestão de recursos hídricos, principalmente quando se tem a necessidade de realizar a regionalização de vazões, visando estimar a disponibilidade hídrica em seções desprovidas de medições. A definição de estratégias de manejo e conservação dos recursos naturais depende de informações obtidas por meio da identificação de RHH, sendo também um dos passos de um estudo de regionalização de vazões. Assim, este trabalho tem como objetivo a identificação das RHH no estado do Paraná através do método de agrupamento Fuzzy C-Means. Foram utilizadas 9 variáveis, individualizadas para as 114 estações fluviométricas adotadas, sendo 4 variáveis dependentes referentes às vazões características (vazão média anual de longa duração (Qmld), vazão mínima anual com sete dias de duração e período de retorno de 10 anos (Q7,10), vazões associadas às permanências de 95% (Q95) e 90% (Q90)) e 5 independentes referentes às características morfometrias da estação (área de drenagem (AD – m²), soma das drenagens (SD - m), densidade de drenagem (DD – 1/m) e a localização geográfica (latitude - Lat e longitude - Long). A partir da análise de componentes principais (ACP) identificou-se as variáveis Qmld, DD, Lat e Long como as menos representativas, sendo excluídas do estudo, dando procedência à análise de agrupamentos apenas com as variáveis AD, SD, Q90, Q95 e Q7,10. Aplicou-se o Fuzzy C-Means para as variáveis escolhidas, sendo que a menor função objetiva encontrada foi para 4 Clusters no índice de fuzzificação (m) 1,7. Separando as estações fluviométricas por clusters através dos graus de pertinência, obtivemos o maior número de estações no Cluster 3 (83 estações), seguidos do Cluster 4 (13 estações) e dos Clusters 1 e 2 (7 estações em cada cluster), e apenas 4 estações não foram inseridas em nenhum cluster, sendo classificadas como nebulosas, sendo que os grupos foram determinados praticamente pela distribuição das variáveis AD e SD. As menores áreas de abrangência, vazões analisadas e as menores quantidade de drenagens na área de cobertura das estações foram encontras no Cluster 3, que estão bem espalhadas no estado do Paraná. Já os Clusters 1 e 4 ficaram intermediários entre os demais clusters em todos os parâmetros avaliados. O algoritmo Fuzzy C-Means se mostrou eficiente para o agrupamento das estações fluviométricas no estado do Paraná, onde foi possível encontrar as características de cada cluster formado, sem haver sobreposição de dados nos intervalos das variáveis analisadas. Fuzzificação Vazão Análise de agrupamento Fuzzification Flow Cluster analysis CIENCIAS AGRARIAS::ENGENHARIA AGRICOLA
47	Finanças comportamentais : um estudo sobre o perfil do investidor, o senso de autocontrole e o grau de confiança nas decisões de investimentos no mercado de ações Diniz, Fabricio Bernardes 29 August 2013 (has links) Made available in DSpace on 2016-12-23T13:44:56Z (GMT). No. of bitstreams: 1 Fabricio Bernardes Diniz.pdf: 1968324 bytes, checksum: a414358e7137c6dc9de7be80d0bcadb4 (MD5) Previous issue date: 2013-08-29 / In several areas of business, it is common that a manager seeks to know the profile of their customers to offer products and services best suited to the needs of these customers. The managers who work in the financial market using a tool to identify the profile of the investor and at the same time adjust the supply of financial products and services in accordance with the capacity and willingness to take risks that investors, especially from that seen in the context of the stock market . This instrument, although not standard, following recommendations of regulatory bodies and associations of the capital market (in Brazil, Anbima - Brazilian Association of Financial and Capital). These instruments use for the evaluation of the risk profile, factors such as the investor s financial situation, investment objective, time horizon for achieving results, risk tolerance and investment experience of risk. Do not consider behavioral factors which according to theory, may affect the propensity to take risks. These factors include the sense of self, which leads to a distorted perception of control over outcomes, and the degree of confidence that in the end can lead to overconfidence or over-optimism about the expected results. Thus, through a survey of 59 customers of a stockbroker, the present study was to evaluate whether the risk profile of the investor calculated according to recommendations from regulatory agencies in the financial market, affects the sense of self and the degree of confidence of investors in their investment decisions in the stock market. And assess whether it is possible to target investors according to personal characteristics and factors that comprise its risk profile in order to better characterize them as the risks taken and returns from their investments in risky markets. Sought to identify factors that make up the assessment of the risk profile are most relevant for discriminating investors according to their personal characteristics and their propensity to take risks. From a cluster analysis (cluster analysis) the study identified three distinct groups of investors with different levels of knowledge and investment experience in the stock market and related groups such the risks assumed and achieved returns on their investments / Nas mais diversas áreas de negócios, é comum que um gestor busque conhecer o perfil de seus clientes para oferecer produtos e serviços mais adequados às necessidades desses clientes. Os gestores que atuam no mercado financeiro utilizam um instrumento para identificar o perfil do investidor e ao mesmo tempo adequar a oferta de produtos e serviços financeiros em conformidade com a capacidade e a propensão de assumir riscos desse investidor, sobretudo daquele inserido no contexto do mercado de ações. Esse instrumento, apesar de não ser padrão, segue recomendações de órgãos reguladores e de associações de entidades do mercado de capitais (no Brasil, a Anbima - Associação Brasileira das Entidades dos Mercados Financeiro e de Capitais). Esses instrumentos utilizam, para a avaliação do perfil de risco, fatores como situação financeira do investidor, objetivo do investimento, horizonte de tempo para obtenção de resultados, tolerância ao risco e experiência em investimentos de risco. Não consideram fatores comportamentais que segundo a teoria, podem afetar a propensão a assumir riscos. Dentre esses fatores estão o senso de autocontrole, que ocasiona uma percepção distorcida de controle sobre os resultados esperados, e o grau de autoconfiança que no extremo pode levar ao excesso de confiança ou excesso de otimismo quanto a resultados esperados. Sendo assim, por meio de uma pesquisa realizada com 59 clientes de uma corretora de ações, o presente estudo se propôs a avaliar se o perfil de risco do investidor calculado segundo recomendações de órgãos reguladores do mercado financeiro, afeta o senso de autocontrole e o grau de confiança dos investidores em suas decisões de investimentos no mercado de ações. E avaliar se é possível segmentar os investidores de acordo com características pessoais e fatores que compõem o seu perfil de risco de forma a mais bem caracterizá-los quanto a riscos assumidos e retornos obtidos em seus investimentos em mercados de risco. Buscou identificar quais fatores que compõem a avaliação do perfil de risco são mais relevantes para discriminar os investidores segundo suas características pessoais e sua propensão a assumir riscos. A partir de uma análise de conglomerados (cluster analysis) o estudo identificou três grupos distintos de investidores com diferentes níveis de conhecimento e experiência de investimentos no mercado de ações e relacionou esses grupos a riscos assumidos e retornos alcançados em seus investimentos Investidores (Finanças) Confiança Controle financeiro Finanças pessoais Risco (Economia) Lucros Análise por agrupamento Administração
48	Classificação automatica e analise de dados por redes neurais auto-organizaveis Costa, Jose Alfredo Ferreira 16 December 1999 (has links) Orientador: Marcio Luiz de Andrade Netto / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-25T20:20:48Z (GMT). No. of bitstreams: 1 Costa_JoseAlfredoFerreira_D.pdf: 26064111 bytes, checksum: 45919f0230fa64ef69e0d07ea0363d6c (MD5) Previous issue date: 1999 / Resumo: Esta tese apresenta extensões ao modelo básico de rede neural auto-organizável, a rede de Kohonen (SOM), viabilizando seu uso como ferramenta de análise de agrupamentos. O SOM define, via treinamento não supervisionado, um mapeamento de um espaço p-dimensional contínuo para um conjunto discreto de vetores referência, ou neurônios, geralmente dispostos na forma de uma matriz. Cada neurônio tem a mesma dimensão do espaço de entrada, p, e o objetivo principal do treinamento é reduzir imensionalidade ao mesmo tempo em que tenta-se preservar, ao máximo, a topologia do espaço de entrada. O algoritmo SL-SOM (Self-Labeling SOM) foi desenvolvido com o objetivo de particionar e rotular automaticamente um SOM treinado, baseando-se no gradiente dos p componentes, cuja informação é apresentada na Umatrix. Usa-se algoritmos de processamento de imagem para segmentar a U-matrix e o resultado são regiões conectadas de neurônios codificados sob o mesmo rótulo. Tais regiões definem no espaço de atributos geometrias complexas e não paramétricas, possibilitando também a classificação de novas amostras. A extensão do SL-SOM tem por objetivo descobrir e representar subclasses. O TS-SLSOM (Tree-Structured Self-Labeling SOM) gera sub-redes para cada região rotulada de neurônios na forma de uma árvore dinâmica. Não se especifica a priori o número de sub-redes para uma dada rede, e os parâmetros de cada sub-rede são funções dos parâmetros da rede 'pai', e do subconjunto de dados que será usado para treiná-Ia. Sub-redes que não apresentam subpartições são excluídas, e o conjunto de dados referente àquela sub-rede fica representado apenas pela região rotulada de neurônios na rede 'pai'. Arranjos de neurônios do SOM de dimensões elevadas não são usados na prática por que o objetivo principal do SOM na atualidade é a visualização dos dados. Com a automação da descoberta de conhecimento e relacionamentos entre dados descritas pelo SL-SOM e TSSL- SOM, pode-se usar um arranjo dimensão igualou menor que a dimensão do espaço de entrada, e fazer com que apenas os resultados finais sejam mostrados, na forma de subgrupos de dados, o relacionamento entre os subgrupos, etc. A principal motivação para o uso do SOM p-dimensional é a manutenção da topologia que geralmente é perdida quando diminuímos a dimensionalidade via mapeamento de um espaço p-dimensional para um espaço de menor dimensão. Define-se o U-array como uma extensão da U-matrix e propõe-se métodos de análise baseados nos métodos de segmentação utilizados em redes de dimensão I ou 2. Comparações de resultados para vários conjuntos de dados são efetuados em relação ao SOM convencional, ou alguns de seus variantes, e por métodos estatísticos e heurísticos para descoberta de agrupamentos, sendo o principal deles, o método de misturas de densidades de probabilidades usando o algoritmo Expectation Maximization. As aplicações dos resultados desta tese são inúmeras. Pode-se aplicar técnicas de análise de dados em qualquer área do conhecimento humano que possa coletar informações. Com a disponibilidade crescente de instrumentação eletrônica capacitando aplicações diversas adquirirem dados e armazená-los em computadores, ou mesmo a imensa massa de dados e informações não estruturadas na internet, ferramentas como as descritas nesta tese, com certeza, farão parte de softwares em um futuro não distante / Abstract: This thesis presents extensions to the most used self-organizing neural network model, the Kohonen network (SOM), enabling its usage as an effective tool for cluster analysis. The SOM network defines, via unsupervised learning, a mapping of a continuos p-dimensional space to a set of model vectors, or neurons, usually arranged as a 2-D array. Each neuron has the same dimension of the input space, p, and the main objective is dimensionality reduction while trying to preserve as much as possible the topology of the input space. The SL-SOM (Self-Labeling SOM) algorithm was developed for automatically partitioning and labeling a trained SOM network. It uses information of the p component gradient (distances) which is presented in the U-matrix. By using image processing algorithms, the obtained results are labeled and connected regions of neurons. Each region defines, in the input space, complex and nonparametric geometries which approximately describe the shape of the clusters. Classification of new objects can be performed using the established regions and the nearest neighbor rule. An extension of the SL-SOM algorithm aims to enhance the clustering process, enabling to discover sub-clusters. The TS-SL-SOM (Tree-Structured Self-Labeling SOM) algorithm generates a child network for each labeled region of the root network, and so on. The process can be seen as generation of a dynamic tree, where each node is a whole network, and which is data-driven. It is not necessary to specify the number of sub-networks for a given network in a given height of the tree. The parameters of the child network are functions of the parameters of the father network and of the subgroup of data used to train that network. A pruning strategy cuts sub-networks (leave nodes) which do not present further partitions. High dimension output SOM networks are not frequently used because the main application of SOM is visualization of data in a form of display. With the automation of knowledge discovery and data relations by the SL-SOM and TS-SL-SOM algorithms, we can use output dimensions higher than 2 and analyze only the final results, i.e., number of clusters and their components, relationships between groups, etc. The main advantage of using high dimension output SOMs is that topology preservation is usually lost when mapping a higher input space to a lower output space. The U-array is defined as an extension of the U-matrix and methods are proposed for its segmentation in a similar fashion of those presented in the SL-SOM algorithm. The thesis also presents results of the methods for synthetic and real data sets, and some comparisons with conventional clustering approachés, such as k-means and mixtures of probability density functions with the Expectation Maximization algorithm. Applications of the methods presented in this thesis are numerous. Virtually any area which possess data could be a candidate for using some kind of mapping and thus using any of these methods. With the increasingly availability of masses of data elsewhere, in applications ranging from business to scientific tasks, or even the immense mass of unstructured data available in the internet, and decreasingly cost of memory and computers, tools as the ones presented in this thesis will be important parts of softwares in a near future / Doutorado / Doutor em Engenharia Elétrica Sistemas de reconhecimento de padrões Análise por agrupamento Redes neurais (Computação) Inteligência artificial
49	Orientação produtiva na agropecuaria brasileira : uma analise comparativa entre 1970 e 1985, com base nas mesorregiões homogeneas Almeida, Luis Carlos Ferreira de 06 July 1995 (has links) Orientador: João Luiz Cardoso / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agricola / Made available in DSpace on 2018-07-20T10:54:15Z (GMT). No. of bitstreams: 1 Almeida_LuisCarlosFerreirade_M.pdf: 3019157 bytes, checksum: 7f09198cfa4bf65f309236228c258f20 (MD5) Previous issue date: 1995 / Resumo: o presente trabalho tem o objetivo principal de analisar a orientação produtiva da atividade agropecuária. tomando-se como base as Mesorregiões Geográficas do Brasil. De modo específico. busca-se estudar as possiveis mudanças ocoródas na agropecuáóa de 1970 para 1985. utilizando-se inclusive a formação de grupos de mesorregiões relativamente homogêneos. Os dados são provenientes dos Censos Agropecuáóos de 1970 e 1985 (da FIBGE) e se referem a 88 mesorregiões geográficas. Foram elaboradas 24 vaóáveis relacionadas a: estrutura fundiáóa. estrutura da produção. nivel tecnol6gico e indicadores s6cio-econômicos (com dados sobre pessoal ocupado). Além de análises descritivas foram utilizados os métodos de análise fatorial em componentes principais e a classificação automática hierárquica. Foram então constituidos 6 grupos de mesorregiões para 1970 e 5 grupos para 1985. Através da comparação dos dados dos Censos Agropecuáóos de 1970, 1975, 1980 e 1985 foi possivel constatar que houve reversão do dinamismo da agropecuáóa no periodo 1980/85. Várias atividades que vinham apresentando crescimento acentuado desde 1970 até 1980 mudam as tendências em 1980/85, chegando em alguns casos a voltar aos mesmos patamares de 1970. Os métodos empregados deixam claro a ocorrência de diversas particulaódades importantes, embora as caracteristicas gerais dos grupos de mesorregiões não mostrassem mudanças muito acentuadas quando efetuada a comparação entre os periodos / Mestrado / Planejamento e Produção Agropecuaria / Mestre em Engenharia Civil Planejamento agrícola Planejamento da produção Agropecuaria Análise de componentes principais Análise por agrupamento
50	Escolha de descritores mínimos e estabelecimento de coleções nucleares em Capsicum spp. / Choice of minimum descriptors and establishment of Capsicum spp. core collections SILVA, Waldir Camargos Júnior e 05 March 2008 (has links) Made available in DSpace on 2014-07-29T14:52:04Z (GMT). No. of bitstreams: 1 WALDIR CAMARGOS JuNIOR.pdf: 2631108 bytes, checksum: c08dda26b9fe6ea085335d05b2827a16 (MD5) Previous issue date: 2008-03-05 / The plant genetic diversity is a valuable guarantee for possible adversities that can be risking the survival of biological species. Brazil is one of the richest countries in biodiversity of plants, with about 20% of all the existing biodiversity on Earth and around 19% of the agricultural lands in the world. Genetic resources are studied in well-defined stages, such as collecting or introduction, multiplication, preservation/conservation, evaluation/characterization and use. In Brazil, the Empresa Brasileira de Pesquisa Agropecuária manages a national system of curatorship of genetic resources in which more than 250 thousand samples of plants, animals and microorganisms are preserved. The plants of the genus Capsicum (chilli and sweet peppers) are found throughout the national territory, presenting countless kinds, with a great phenotypic and genotypic diversity. Practically all the brazilian states have their own cultivars, but some of them, can be in fact, considered a mere duplicate because, sometimes, the same cultivar is known under different names. Thus, the morphological characterization is a task of great importance to this plant genus so, it is possible to avoid the conservation and maintenance of accessions of similar genomic patterns in germplasm banks. Embrapa Hortaliças has a collection of germplasm of sweet and chilli peppers (Capsicum spp.), which amounts to about 2,500 accessions. These mainly belong to the species C. annuum, C. baccatum, C. chinense and C. frutescens. The morphological characterization of most of these acessions (893) have been carried out in recent years for a series of characters (descriptors) which allow the investigation of the structure of their genetic variability and, from then the proposition of strategies to handle the collection. Considering the need of studies aiming to know, value and use the accessions of the Capsicum spp. Embrapa Hortaliças collection, this research was developed with the objective of describing the accessions and the descriptors available in this collection, in order to search for minimum descriptors and propose core collections for this germplasm bank. The study demonstrated that it is possible to reduce around 50% the number of descriptors currently used in the characterization of the accessions, without significant harm to the representation of the genetic variability of the collection. The factorial correspondence analysis showed to be appropriate for the selection of minimum descriptors, as well as to the proposition of core collections from germplasm banks, characterized, predominantly, by qualitative data. Variables related to the fruit showed great variability in all the germplasm collection, demonstrating that these attributes are important in the genetic discrimination among the accessions. The study also showed that the geographical origin, regardless of the species, is directly associated with the genetic divergence among the accessions in Capsicum spp. / A diversidade genética vegetal representa uma inestimável garantia às possíveis adversidades que estejam colocando em risco a sobrevivência das espécies biológicas. O Brasil é um dos países mais ricos em diversidade biológica de plantas, possuindo cerca de 20% de toda a biodiversidade existente no planeta e cerca de 19% dos solos agricultáveis do mundo. Os recursos genéticos são estudados em etapas bem definidas, tais como, coleta ou introdução, multiplicação, preservação/conservação, avaliação/caracterização e uso. No Brasil, a Empresa Brasileira de Pesquisa Agropecuária gerencia um sistema nacional de curadoria de recursos genéticos, em que mais de 250 mil amostras de plantas, animais e microrganismos são conservadas. As plantas do gênero Capsicum (pimentas e pimentões) são encontradas em todo território nacional, apresentando uma infinidade de formas, com grande diversidade fenotípica e genotípica. Praticamente todos os estados brasileiros possuem cultivares próprias, porém, muito provavelmente, parte do que se conhece pode tratar-se de mera duplicata, visto ocorrerem diversas cultivares iguais com nomes diferentes. Dessa forma, a caracterização morfológica constitui uma tarefa de grande importância para esse gênero vegetal, para evitar a conservação e manutenção de acessos de formas genômicas semelhantes em bancos de germoplasma. A Embrapa Hortaliças possui uma coleção de germoplasma de pimentas e pimentões (Capsicum spp.) que conta, atualmente, com cerca de dois mil e quinhentos acessos. Estes pertencem principalmente às espécies C. annuum, C. baccatum, C. chinense e C. frutescens. A caracterização morfológica de grande parte desses acessos (893 acessos) tem sido feita ao longo dos últimos anos, para uma série de caracteres (descritores) que permitem investigar a estrutura de sua variabilidade genética e, a partir daí, propor estratégias de manejo da coleção. Considerando-se a necessidade de estudos visando conhecer, valorizar e utilizar os acessos da coleção de Capsicum spp. da Embrapa Hortaliças, desenvolveu-se este trabalho com o objetivo de descrever os acessos e os descritores disponíveis nessa coleção, de forma a buscar descritores mínimos e propor coleções nucleares para o banco de germoplasma. O estudo demonstrou que é possível reduzir, em cerca de 50%, o número de descritores atualmente utilizados na caracterização dos acessos, sem prejuízo significativo à representação da variabilidade genética da coleção. A análise fatorial de correspondência demonstrou ser apropriada para a seleção de descritores mínimos, bem como para a proposição de coleções nucleares a partir de bancos de germoplasma que se encontram caracterizados, predominantemente, com dados de natureza qualitativa. As variáveis relacionadas ao fruto apresentaram grande variabilidade em toda a coleção de germoplasma, demonstrando-se que esses atributos são importantes na discriminação genética entre os acessos. O estudo revelou, também, que a origem geográfica, independentemente da espécie, tem associação direta com a divergência genética entre os acessos em Capsicum spp. pimenta germoplasma Capsicum análise de correspondência análise de agrupamento chilli pepper germplasm Capsicum correspondence analysis cluster analysis

Search results