Global ETD Search

191	Identificação de regiões hidrologicamente homogêneas por agrupamento fuzzy c-means no estado do Paraná / Identification of hydrologically homogeneous regions by fuzzy c-means group in the state of Paraná Silva, Ana Claudia Guedes 07 February 2018 (has links) Submitted by Neusa Fagundes (neusa.fagundes@unioeste.br) on 2018-06-15T17:07:21Z No. of bitstreams: 2 Ana Claudia_Silva2018.pdf: 1741410 bytes, checksum: 83384ab7c02835c3d776f862defc84c1 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-06-15T17:07:21Z (GMT). No. of bitstreams: 2 Ana Claudia_Silva2018.pdf: 1741410 bytes, checksum: 83384ab7c02835c3d776f862defc84c1 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-02-07 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / The design of hydrologically homogeneous regions (RHH) is an essential procedure to provide information essential to the modeling, planning, and management of water resources, especially when it is necessary to perform the regionalization of flows, aiming to estimate the water availability in sections without measurements. The definition of strategies for the management and conservation of natural resources depends on information obtained through the identification of RHH, also being one of the steps of a study of regionalization of flows. Thus, this work has the objective of identifying the RHH in the state of Paraná through the grouping method Fuzzy C-Means. A total of 9 variables were used for the 114 fluviometric stations, with 4 dependent variables related to the characteristic flows (annual average long-term flow (Qmld), minimum annual flow with seven days duration and 10-year return period (Q7,10), flow rates associated to the 95% (Q95) and 90% (Q90) permanencies) and 5 independent variables related to the morphometric characteristics of the station (drainage area (AD - m²), sum of drainage (SD - m) (LA - Lat and longitude - Long). From the principal components analysis (PCA), the variables Qmld, DD, Lat and Long were identified as the least representative, being discarded from the study, proceeding with the analysis using only the variables AD, SD, Q90, Q95, and Q7,10. The results were obtained using the Fuzzy C-Means for the chosen variables, and the smallest objective function was found for 4 Clusters in the study group, with index of and fuzzification (m) 1.7. Separating the fluviometric stations by clusters through degrees of pertinence, the largest number of stations were obtained in Cluster 3 (83 stations), followed by Cluster 4 (13 stations) and Clusters 1 and 2 (7 stations in each cluster), and only 4 stations were not inserted in any cluster, being classified as nebulae, where the groups were determined practically by the distribution of the AD and SD variables. The smaller areas of coverage, analyzed flows and the smaller amount of drainage in the coverage area of the stations were found in Cluster 3, considering they were well spread in the state of Paraná. Clusters 1 and 4 were intermediate among the other clusters in all parameters evaluated. The Fuzzy C-Means algorithm proved to be efficient for the grouping of fluviometric stations in the state of Paraná, where it was possible to find the characteristics of each cluster formed, without overlapping of data in the analyzed variables. / O delineamento de regiões hidrologicamente homogêneas (RHH) é um procedimento essencial para provimento de informações indispensáveis aos trabalhos de modelagem, planejamento e gestão de recursos hídricos, principalmente quando se tem a necessidade de realizar a regionalização de vazões, visando estimar a disponibilidade hídrica em seções desprovidas de medições. A definição de estratégias de manejo e conservação dos recursos naturais depende de informações obtidas por meio da identificação de RHH, sendo também um dos passos de um estudo de regionalização de vazões. Assim, este trabalho tem como objetivo a identificação das RHH no estado do Paraná através do método de agrupamento Fuzzy C-Means. Foram utilizadas 9 variáveis, individualizadas para as 114 estações fluviométricas adotadas, sendo 4 variáveis dependentes referentes às vazões características (vazão média anual de longa duração (Qmld), vazão mínima anual com sete dias de duração e período de retorno de 10 anos (Q7,10), vazões associadas às permanências de 95% (Q95) e 90% (Q90)) e 5 independentes referentes às características morfometrias da estação (área de drenagem (AD – m²), soma das drenagens (SD - m), densidade de drenagem (DD – 1/m) e a localização geográfica (latitude - Lat e longitude - Long). A partir da análise de componentes principais (ACP) identificou-se as variáveis Qmld, DD, Lat e Long como as menos representativas, sendo excluídas do estudo, dando procedência à análise de agrupamentos apenas com as variáveis AD, SD, Q90, Q95 e Q7,10. Aplicou-se o Fuzzy C-Means para as variáveis escolhidas, sendo que a menor função objetiva encontrada foi para 4 Clusters no índice de fuzzificação (m) 1,7. Separando as estações fluviométricas por clusters através dos graus de pertinência, obtivemos o maior número de estações no Cluster 3 (83 estações), seguidos do Cluster 4 (13 estações) e dos Clusters 1 e 2 (7 estações em cada cluster), e apenas 4 estações não foram inseridas em nenhum cluster, sendo classificadas como nebulosas, sendo que os grupos foram determinados praticamente pela distribuição das variáveis AD e SD. As menores áreas de abrangência, vazões analisadas e as menores quantidade de drenagens na área de cobertura das estações foram encontras no Cluster 3, que estão bem espalhadas no estado do Paraná. Já os Clusters 1 e 4 ficaram intermediários entre os demais clusters em todos os parâmetros avaliados. O algoritmo Fuzzy C-Means se mostrou eficiente para o agrupamento das estações fluviométricas no estado do Paraná, onde foi possível encontrar as características de cada cluster formado, sem haver sobreposição de dados nos intervalos das variáveis analisadas. Fuzzificação Vazão Análise de agrupamento Fuzzification Flow Cluster analysis CIENCIAS AGRARIAS::ENGENHARIA AGRICOLA
192	Agrupamento e classificação de dados utilizando um algoritmo inspirado no comportamento de abelhas Cruz, Dávila Patrícia Ferreira 17 June 2015 (has links) Made available in DSpace on 2016-03-15T19:37:57Z (GMT). No. of bitstreams: 1 DAVILA PATRICIA FERREIRA CRUZ.pdf: 3761174 bytes, checksum: 5bdf7491a01f52fa9d31b6f66eca7c87 (MD5) Previous issue date: 2015-06-17 / With the popularization of Internet, the advancement of electronic devices and the ease of storage, the volume of data stored and available at companies has increased substantially. Therefore, it becomes necessary to use intelligent techniques to extract useful information and knowledge from these data. In this context, Data Mining has been the aim of several researches by providing a set of intelligent techniques to the exploration of large volumes of data. The present project aims to research and develop new algorithms inspired by the collective behavior of bee colonies for solving complex clustering and classification tasks. More specifically, this project proposes adaptations of an optimization algorithm inspired by the behavior of bees so that it can be applied to solve clustering problems and also for positioning centers of RBF neural networks. The proposed approaches were applied to several benchmark problems with promising results. / Com a popularização da Internet, o avanço dos dispositivos eletrônicos e a facilidade de armazenamento, o volume de dados armazenados e disponibilizados por empresas de diversos ramos tem aumentado rapidamente. Com isso, torna-se necessária a utilização de técnicas avançadas capazes de extrair desses dados informações úteis e conhecimentos que, na maioria das vezes, estão implícitos. Nesse contexto, a Mineração de Dados tem sido alvo de diversas pesquisas por prover um conjunto de técnicas inteligentes para a exploração de grandes volumes de dados. O presente projeto visa à investigação e desenvolvimento de novos algoritmos inspirados no comportamento coletivo das colônias de abelhas para aplicação em problemas complexos de classificação e agrupamentos de dados, que são importantes tarefas da Mineração de Dados. Mais especificamente, esse projeto propõe adaptações de um algoritmo de otimização inspirado no comportamento de abelhas, sua aplicação em problemas de agrupamento de dados e para o posicionamento de centros de redes neurais do tipo RBF. Os resultados experimentais em bases de dados da literatura mostraram a viabilidade e benefícios das propostas, tanto para problemas de agrupamento, quanto para problemas de classificação. agrupamento classificação inteligência de enxame algoritmo bioinspirado clustering classification swarm intelligence bioinspired algorithms CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
193	Um algoritmo bioinspirado para agrupamento de dados David, Marcio Frayze 03 May 2010 (has links) Made available in DSpace on 2016-03-15T19:38:16Z (GMT). No. of bitstreams: 1 Marcio Frayze David.pdf: 699315 bytes, checksum: 587538708d29252e3c3a8f5c46cbaa53 (MD5) Previous issue date: 2010-05-03 / Fundo Mackenzie de Pesquisa / This dissertation discusses the use of bio-inspired algorithms for data clustering, with emphasis on a model of emergent collective behavior of agents and a new clustering algorithm called cBoids is presented. The cBoids algorithm is a variation of the classic Boids model. In this new algorithm, each Boid represents an object from the data base and the three original rules from the Boids model were modified so that the objects of the database have influence on the behaviour of the Boids. Two new rules have also been proposed, responsible for the creation and destruction of centroids, which represent the formed clusters. In the experiments conducted in this work the algorithm was successfully tested on four databases. / Esta dissertação aborda o uso de algoritmos bioinspirados para a tarefa de agrupamento de dados , com ênfase nos modelos de comportamentos emergentes coletivos de agentes e um novo algoritmo de agrupamento de dados chamado cBoids é apresentado. O algoritmo cBoids é uma variação do clássico modelo Boids. Neste novo algoritmo, cada Boid representa um objeto da base de dados e as três regras originais do modelo Boids foram alteradas para que os objetos da base de dados influenciem o comportamento dos Boids. Duas novas regras também foram propostas, responsáveis pela criação e destruição de centróides, que representam os clusters formados. Nos experimentos realizados nesta dissertação o algoritmo foi testado com sucesso em quatro bases de dados. agrupamento de dados computação natural Boid data clustering natural computation Boid
194	Tipificação dos fatores ligados ao manejo de ordenha e avaliação do seu impacto sobre a qualidade sanitária do leite / Types of factors related to the management of milking and evaluation of its impact on the quality of health milk Eckstein, Ilton Isandro 30 March 2012 (has links) Made available in DSpace on 2017-07-10T17:48:30Z (GMT). No. of bitstreams: 1 Ilton_Isandro_Eckstein.PDF: 1269135 bytes, checksum: 52bc33a50ce148953b29202d47265022 (MD5) Previous issue date: 2012-03-30 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Knowing the factors that affect the composition and quality of milk in Dairy Production Systems (SPL) is of utmost importance to the producer. The objective was to evaluate the characteristics of 32 SPL in the city of Toledo, together in partnership with a dairy. We performed the data collection of properties, with the aid of a semi-structured questionnaire, which collected information on the production traits, milk composition and quality, besides the technical and management practices carried out, mainly related to hygiene and management health of milking. Milk samples were analyzed for their composition (fat, protein, lactose and total solids), Somatic Cell Count (SCC), Total Bacterial Count (TBC), and also to the presence of total coliforms and fecal coliforms. Subsequently, data collection, the variables were selected and analyzed using multivariate techniques, using the principal component analysis (PCA) and analysis of Ascendant Hierarchical Classification (AHC). We analyzed variables related to production and milk quality, techniques and practices used at the time of milking, feeding management, milking system and socio-cultural variables related to the producer. The variables that best explained the differences in the PCA were related to the hygienic and sanitary practices (pre and post-dipping, use of detergents in alkaline and acid cleaning, testing for mastitis) held for milking, with the composition of milk and linked to the producer (age, education, length of service). It was found that the use of these practices can help to improve production and milk quality, ensuring a raw material with high commercial value. The grouping of production systems has shown that there is great diversity among the forms of production, allowing identifying the factors that can influence it, in order to form strategies that may result from gains in production and milk quality / Conhecer os fatores que afetam a composição e qualidade do leite em Sistemas de Produção Leiteiros (SPL) é de extrema importância ao produtor. Objetivou-se avaliar as características de 32 SPL, na cidade de Toledo, juntamente em parceria com um laticínio. Foi realizada a coleta de dados das propriedades, com o auxílio de um questionário semi-estruturado, onde se colheu informações acerca das características de produção, composição e qualidade do leite, além das técnicas e práticas de manejo realizadas, principalmente relacionadas ao manejo higiênico-sanitário de ordenha. As amostras de leite foram analisadas em relação a sua composição (gordura, proteína, lactose e sólidos totais), Contagem de Células Somáticas (CCS), Contagem Bacteriana Total (CBT), e também para presença de coliformes totais e coliformes termotolerantes. Posteriormente, a coleta de dados, as variáveis foram selecionadas e analisadas por meio de técnicas multivariadas, sendo utilizada a análise de Componentes Principais (ACP) e a análise de Classificação Hierárquica Ascendente (CHA). Foram analisadas variáveis relacionadas à produção e qualidade do leite, técnicas e práticas utilizadas no momento da ordenha, manejo alimentar, sistema de ordenha e variáveis sócio-culturais relacionadas ao produtor. As variáveis que melhor explicaram as diversidades das ACP foram as relacionadas com as práticas higiênico-sanitária (pré e pós-dipping, utilização dos detergentes alcalino e ácido na higienização, testes para detecção de mastite) realizadas na ordenha, com a composição de leite e vinculadas ao produtor (idade, escolaridade, tempo na atividade). Foi verificado que o uso destas práticas podem auxiliar para melhorar a produção e qualidade do leite, assegurando uma matéria-prima com maior valor comercial. O agrupamento dos sistemas de produção permitiu verificar a existência de grande diversidade entre as formas de produção, possibilitando identificar os fatores que podem influenciá-lo, a fim de formar estratégias que possam resultar ganhos em produção e qualidade do leite ACP Agrupamento CHA Composição Higiene Qualidade Propriedades ACH Composition Grouping Hygiene PCA Properties Quality CIÊNCIAS AGRÁRIAS:ZOOTECNIA
195	Aplicação de um sistema de informações geográficas SIG) no estudo da apicultura na região oeste do Paraná / Application ofaGeographic Information System(GIS) in the studyof beekeepingin westernParaná Camargo, Simone Cristina 14 December 2011 (has links) Made available in DSpace on 2017-07-10T17:48:32Z (GMT). No. of bitstreams: 1 Simone_Cristina_Camargo.PDF: 4565070 bytes, checksum: 022238b0dd53d591a68e8f2de97cc5c5 (MD5) Previous issue date: 2011-12-14 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Beekeeping has been established as one of the most important economically, socially and environmentally. However, there is a need for studies to improve honey production. This study aimed to develop a general methodology, through the use of Geographic Information System (GIS), which allows the storage of information and geographic location of apiaries in eight districts of the western region of Paraná, and the use of GIS to assessment of the overcrowded hives, its management, the local flora and land use on the quantitative and qualitative production of honey in the municipalities of Marechal Cândido Rondon and Santa Helena. With the survey data on the geographical locations of the eight municipalities of the apiaries were drawn circles of 3 km radius around the image of each point representing the apiaries georeferenced, allowing a diagnosis of their spatial distribution and selection of areas with highest and lowest overlap beehives in the municipalities of Marechal Cândido Rondon and Santa Helena, a total of four study areas. In each selected area were distributed 15 hives in them, totaling 60 hives of which were accompanied by the production of honey from the 2010 harvest, from which samples were collected for analysis of moisture, pH, total acidity, ash and color. Was also carried out an assessment of existing vegetation around these hives. Were registered and 383 126t beekeepers apiaries distributed across eight countries. In the municipality of Marechal Cândido Rondon 114 apiaries were georeferenced, with 1,661 bee hives belonging to 68 beekeepers with hives average of 14.57 and 24.42 per apiary hives per farmer. In the area of greatest overlap of apiaries in this city within a radius of 3 km 144 beehives were found in five apiaries. In the county of Santa Helena, 140 apiaries were georeferenced with 1,928 beehives belonging to 30 beekeepers. In the area of greatest overlap of apiaries within a radius of 3 km were 165 hives in 12 apiaries distributed, while the lower area of overlap, with the same radius, had 40 hives in two apiaries. According to the results of physical-chemical analysis, the 80 honey samples collected in four areas, all values were within the extent allowed by law. Multivariate analysis grouping the first extraction. Of the 60 hives available 16 groups were formed, while in the second extraction were evaluated 21 hives, which were divided into six groups. In the evaluation of all samples was the formation of five groups, indicating higher average production in the hives of the most populous area of St. Helena and lower in the most populated of Marechal Cândido Rondon. The Simpson diversity index of the four areas studied showed greater floristic diversity in the area of greatest overlap of hives of St. Helena, when compared with the area of overlap of the two largest counties,where the area of Marechal Cândido Rondon got a greater diversity that of Santa Helena. The grouping of the hives, the differences in the production of honey and floristic survey indicated that these differences may be associated with climatic differences recorded in the production period, the difference in handling and floristic diversity of the areas studied / A apicultura tem se consolidado como uma das atividades mais importantes do ponto de vista econômico, social e ambiental. Todavia, observa-se a necessidade de estudos para melhorar a produção de mel. Este trabalho teve por objetivo geral desenvolver uma metodologia, por meio do uso do Sistema de Informações Geográficas (SIG), que permita o armazenamento de informações e a localização geográfica de apiários em oito municípios da região oeste do Paraná, bem como da utilização deste SIG para avaliação da superlotação de colmeias, do seu manejo, da flora local e da ocupação do solo sobre a produção quantitativa e qualitativa de mel nos municípios de Marechal Cândido Rondon e Santa Helena. Com os dados do levantamento das posições geográficas dos apiários dos oito municípios, foram traçados círculos de 3 km de raio ao redor da imagem de cada ponto representando os apiários georreferenciados, possibilitando um diagnóstico de sua distribuição espacial e a seleção de áreas com maior e menor sobreposição de colmeias, nos municípios de Marechal Cândido Rondon e Santa Helena, totalizando quatro áreas de estudo. Em cada área foram selecionadas 15 colmeias nelas distribuídas, totalizando 60 colmeias das quais foi acompanhada a produção de mel da safra de 2010, das quais foram coletadas amostras para as análises de umidade, pH, acidez total, cinzas e cor. Também foi realizado um diagnóstico da vegetação existente aoredor dessas colmeias. Foram cadastrados 126 apicultores e 383 apiários distribuídos pelos oito municípios. No município de Marechal Cândido Rondon foram georreferenciados 114 apiários, com 1.661 colmeias pertencentes a 68 apicultores, com média de 14,57 colmeias por apiário e 24,42 colmeias por produtor. Na área com maior sobreposição de apiários nesse município, num raio de 3 km foram verificadas 144 colmeias distribuídas em 14 apiários, enquanto que na área de menor sobreposição, com o mesmo raio, foramverificadas 44 colmeias em 5 apiários. No município de Santa Helena, foram georreferenciados 140 apiários, com 1.928 colmeias pertencentes a 30 apicultores. Na área com maior sobreposição de apiários, num raio de 3 km haviam 165 colmeias distribuídas em 12 apiários, enquanto que a área de menor sobreposição, com o mesmo raio, apresentou 40 colmeias em 2 apiários. De acordo com os resultados das análises físico-químicas, das 80 amostras de mel coletadas nas quatro áreas, todas apresentaram valores dentro dopermitido pela legislação. Na análise multivariada de agrupamento da primeira extração, das 60 colmeias avaliadas 16 grupos foram formados, enquanto que na segunda extração foram avaliadas 21 colmeias, as quais dividiram-se em seis grupos. Na avaliação detodas as coletas houve a formação de cinco grupos, indicando maior produção média nas colméias da área mais povoada de Santa Helena e menor na área mais povoada de Marechal Cândido Rondon. O Índice de diversidade de Simpson das quatro áreas estudadas indicou maior diversidade florística, na área de maoir sobreposição de colmeias de Santa Helena, quando comparada com a área de maior sobreposição de Marechal Cândido Rondon. O inverso foi observado nas áreas de menor sobreposição dos dois municípios, onde a área de Marechal Cândido Rondon obteve uma maior diversidade que a de Santa Helena. O agrupamento das colmeias, as diferenças nas produções de mel e o levantamento florístico indicaram que essas diferenças podem estar associadas a diferenças climáticas registradas no período de produção, diferença de manejo e diversidade florística das áreas estudadas Sobreposição Produção de mel Biodiversidade Agrupamento Overlay Honey production Biodiversity Grouping CIÊNCIAS AGRÁRIAS:ZOOTECNIA
196	Hierarchical semi-supervised confidence-based active clustering and its application to the extraction of topic hierarchies from document collections / Agrupamento hierárquico semissupervisionado ativo baseado em confiança e sua aplicação para extração de hierarquias de tópicos a partir de coleções de documentos Bruno Magalhães Nogueira 16 December 2013 (has links) Topic hierarchies are efficient ways of organizing document collections. These structures help users to manage the knowledge contained in textual data. These hierarchies are usually obtained through unsupervised hierarchical clustering algorithms. By not considering the context of the user in the formation of the hierarchical groups, unsupervised topic hierarchies may not attend the user\'s expectations in some cases. One possible solution for this problem is to employ semi-supervised clustering algorithms. These algorithms incorporate the user\'s knowledge through the usage of constraints to the clustering process. However, in the context of semi-supervised hierarchical clustering, the works in the literature do not efficient explore the selection of cases (instances or cluster) to add constraints, neither the interaction of the user with the clustering process. In this sense, in this work we introduce two semi-supervised hierarchical clustering algorithms: HCAC (Hierarchical Confidence-based Active Clustering) and HCAC-LC (Hierarchical Confidence-based Active Clustering with Limited Constraints). These algorithms employ an active learning approach based in the confidence of cluster merges. When a low confidence merge is detected, the user is invited to decide, from a pool of candidate pairs of clusters, the best cluster merge in that point. In this work, we employ HCAC and HCAC-LC in the extraction of topic hierarchies through the SMITH framework, which is also proposed in this thesis. This framework provides a series of well defined activities that allow the user\'s interaction in the generation of topic hierarchies. The active learning approach used in the HCAC-based algorithms, the kind of queries employed in these algorithms, as well as the SMITH framework for the generation of semi-supervised topic hierarchies are innovations to the state of the art proposed in this thesis. Our experimental results indicate that HCAC and HCAC-LC outperform other semi-supervised hierarchical clustering algorithms in diverse scenarios. The results also indicate that semi-supervised topic hierarchies obtained through the SMITH framework are more intuitive and easier to navigate than unsupervised topic hierarchies / Hierarquias de tópicos são formas eficientes de organização de coleções de documentos, auxiliando usuários a gerir o conhecimento materializado nessas publicações textuais. Tais hierarquias são usualmente construídas por meio de algoritmos de agrupamento hierárquico não supervisionado. Entretanto, por não considerarem o contexto do usuário na formação dos grupos, hierarquias de tópicos não supervisionadas nem sempre conseguem atender as suas expectativas. Uma solução para este problema e o emprego de algoritmos de agrupamento semissupervisionado, os quais incorporam o conhecimento de domínio do usuário por meio de restrições. Entretanto, para o contexto de agrupamento hierárquico semissupervisionado, não são eficientemente explorados na literatura métodos de seleção de casos (instâncias ou grupos) para receber restrições, bem como não há formas eficientes de interação do usuário com o processo de agrupamento hierárquico. Dessa maneira, neste trabalho, dois algoritmos de agrupamento hierárquico semissupervisionado são propostos: HCAC (Hierarchical Confidence-based Active Clustering) e HCAC-LC (Hierarchical Confidence-based Active Clustering with Limited Constraints). Estes algoritmos empregam uma abordagem de aprendizado ativo baseado na confiança de uma junção de clusters. Quando uma junção de baixa confiança e detectada, o usuário e convidado a decidir, em um conjunto de pares de grupos candidatos, a melhor junção naquele ponto. Estes algoritmos são aqui utilizados na extração de hierarquias de tópicos por meio do framework SMITH, também proposto nesse trabalho. Este framework fornece uma série de atividades bem definidas que possibilitam a interação do usuário para a obtenção de hierarquias de tópicos. A abordagem de aprendizado ativo utilizado nos algoritmos HCAC e HCAC-LC, o tipo de restrição utilizada nestes algoritmos, bem como o framework SMITH para obtenção de hierarquias de tópicos semissupervisionadas são inovações ao estado da arte propostos neste trabalho. Os resultados obtidos indicam que os algoritmos HCAC e HCAC-LC superam o desempenho de outros algoritmos hierárquicos semissupervisionados em diversos cenários. Os resultados também indicam que hierarquias de tópico semissupervisionadas obtidas por meio do framework SMITH são mais intuitivas e fáceis de navegar do que aquelas não supervisionadas Agrupamento semissupervisionado Aprendizado ativo Hierarquias de tópicos Active learning Semi-supervised clustering Topic hierarchies
197	Finanças comportamentais : um estudo sobre o perfil do investidor, o senso de autocontrole e o grau de confiança nas decisões de investimentos no mercado de ações Diniz, Fabricio Bernardes 29 August 2013 (has links) Made available in DSpace on 2016-12-23T13:44:56Z (GMT). No. of bitstreams: 1 Fabricio Bernardes Diniz.pdf: 1968324 bytes, checksum: a414358e7137c6dc9de7be80d0bcadb4 (MD5) Previous issue date: 2013-08-29 / In several areas of business, it is common that a manager seeks to know the profile of their customers to offer products and services best suited to the needs of these customers. The managers who work in the financial market using a tool to identify the profile of the investor and at the same time adjust the supply of financial products and services in accordance with the capacity and willingness to take risks that investors, especially from that seen in the context of the stock market . This instrument, although not standard, following recommendations of regulatory bodies and associations of the capital market (in Brazil, Anbima - Brazilian Association of Financial and Capital). These instruments use for the evaluation of the risk profile, factors such as the investor s financial situation, investment objective, time horizon for achieving results, risk tolerance and investment experience of risk. Do not consider behavioral factors which according to theory, may affect the propensity to take risks. These factors include the sense of self, which leads to a distorted perception of control over outcomes, and the degree of confidence that in the end can lead to overconfidence or over-optimism about the expected results. Thus, through a survey of 59 customers of a stockbroker, the present study was to evaluate whether the risk profile of the investor calculated according to recommendations from regulatory agencies in the financial market, affects the sense of self and the degree of confidence of investors in their investment decisions in the stock market. And assess whether it is possible to target investors according to personal characteristics and factors that comprise its risk profile in order to better characterize them as the risks taken and returns from their investments in risky markets. Sought to identify factors that make up the assessment of the risk profile are most relevant for discriminating investors according to their personal characteristics and their propensity to take risks. From a cluster analysis (cluster analysis) the study identified three distinct groups of investors with different levels of knowledge and investment experience in the stock market and related groups such the risks assumed and achieved returns on their investments / Nas mais diversas áreas de negócios, é comum que um gestor busque conhecer o perfil de seus clientes para oferecer produtos e serviços mais adequados às necessidades desses clientes. Os gestores que atuam no mercado financeiro utilizam um instrumento para identificar o perfil do investidor e ao mesmo tempo adequar a oferta de produtos e serviços financeiros em conformidade com a capacidade e a propensão de assumir riscos desse investidor, sobretudo daquele inserido no contexto do mercado de ações. Esse instrumento, apesar de não ser padrão, segue recomendações de órgãos reguladores e de associações de entidades do mercado de capitais (no Brasil, a Anbima - Associação Brasileira das Entidades dos Mercados Financeiro e de Capitais). Esses instrumentos utilizam, para a avaliação do perfil de risco, fatores como situação financeira do investidor, objetivo do investimento, horizonte de tempo para obtenção de resultados, tolerância ao risco e experiência em investimentos de risco. Não consideram fatores comportamentais que segundo a teoria, podem afetar a propensão a assumir riscos. Dentre esses fatores estão o senso de autocontrole, que ocasiona uma percepção distorcida de controle sobre os resultados esperados, e o grau de autoconfiança que no extremo pode levar ao excesso de confiança ou excesso de otimismo quanto a resultados esperados. Sendo assim, por meio de uma pesquisa realizada com 59 clientes de uma corretora de ações, o presente estudo se propôs a avaliar se o perfil de risco do investidor calculado segundo recomendações de órgãos reguladores do mercado financeiro, afeta o senso de autocontrole e o grau de confiança dos investidores em suas decisões de investimentos no mercado de ações. E avaliar se é possível segmentar os investidores de acordo com características pessoais e fatores que compõem o seu perfil de risco de forma a mais bem caracterizá-los quanto a riscos assumidos e retornos obtidos em seus investimentos em mercados de risco. Buscou identificar quais fatores que compõem a avaliação do perfil de risco são mais relevantes para discriminar os investidores segundo suas características pessoais e sua propensão a assumir riscos. A partir de uma análise de conglomerados (cluster analysis) o estudo identificou três grupos distintos de investidores com diferentes níveis de conhecimento e experiência de investimentos no mercado de ações e relacionou esses grupos a riscos assumidos e retornos alcançados em seus investimentos Investidores (Finanças) Confiança Controle financeiro Finanças pessoais Risco (Economia) Lucros Análise por agrupamento Administração
198	Classificação automatica e analise de dados por redes neurais auto-organizaveis Costa, Jose Alfredo Ferreira 16 December 1999 (has links) Orientador: Marcio Luiz de Andrade Netto / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-25T20:20:48Z (GMT). No. of bitstreams: 1 Costa_JoseAlfredoFerreira_D.pdf: 26064111 bytes, checksum: 45919f0230fa64ef69e0d07ea0363d6c (MD5) Previous issue date: 1999 / Resumo: Esta tese apresenta extensões ao modelo básico de rede neural auto-organizável, a rede de Kohonen (SOM), viabilizando seu uso como ferramenta de análise de agrupamentos. O SOM define, via treinamento não supervisionado, um mapeamento de um espaço p-dimensional contínuo para um conjunto discreto de vetores referência, ou neurônios, geralmente dispostos na forma de uma matriz. Cada neurônio tem a mesma dimensão do espaço de entrada, p, e o objetivo principal do treinamento é reduzir imensionalidade ao mesmo tempo em que tenta-se preservar, ao máximo, a topologia do espaço de entrada. O algoritmo SL-SOM (Self-Labeling SOM) foi desenvolvido com o objetivo de particionar e rotular automaticamente um SOM treinado, baseando-se no gradiente dos p componentes, cuja informação é apresentada na Umatrix. Usa-se algoritmos de processamento de imagem para segmentar a U-matrix e o resultado são regiões conectadas de neurônios codificados sob o mesmo rótulo. Tais regiões definem no espaço de atributos geometrias complexas e não paramétricas, possibilitando também a classificação de novas amostras. A extensão do SL-SOM tem por objetivo descobrir e representar subclasses. O TS-SLSOM (Tree-Structured Self-Labeling SOM) gera sub-redes para cada região rotulada de neurônios na forma de uma árvore dinâmica. Não se especifica a priori o número de sub-redes para uma dada rede, e os parâmetros de cada sub-rede são funções dos parâmetros da rede 'pai', e do subconjunto de dados que será usado para treiná-Ia. Sub-redes que não apresentam subpartições são excluídas, e o conjunto de dados referente àquela sub-rede fica representado apenas pela região rotulada de neurônios na rede 'pai'. Arranjos de neurônios do SOM de dimensões elevadas não são usados na prática por que o objetivo principal do SOM na atualidade é a visualização dos dados. Com a automação da descoberta de conhecimento e relacionamentos entre dados descritas pelo SL-SOM e TSSL- SOM, pode-se usar um arranjo dimensão igualou menor que a dimensão do espaço de entrada, e fazer com que apenas os resultados finais sejam mostrados, na forma de subgrupos de dados, o relacionamento entre os subgrupos, etc. A principal motivação para o uso do SOM p-dimensional é a manutenção da topologia que geralmente é perdida quando diminuímos a dimensionalidade via mapeamento de um espaço p-dimensional para um espaço de menor dimensão. Define-se o U-array como uma extensão da U-matrix e propõe-se métodos de análise baseados nos métodos de segmentação utilizados em redes de dimensão I ou 2. Comparações de resultados para vários conjuntos de dados são efetuados em relação ao SOM convencional, ou alguns de seus variantes, e por métodos estatísticos e heurísticos para descoberta de agrupamentos, sendo o principal deles, o método de misturas de densidades de probabilidades usando o algoritmo Expectation Maximization. As aplicações dos resultados desta tese são inúmeras. Pode-se aplicar técnicas de análise de dados em qualquer área do conhecimento humano que possa coletar informações. Com a disponibilidade crescente de instrumentação eletrônica capacitando aplicações diversas adquirirem dados e armazená-los em computadores, ou mesmo a imensa massa de dados e informações não estruturadas na internet, ferramentas como as descritas nesta tese, com certeza, farão parte de softwares em um futuro não distante / Abstract: This thesis presents extensions to the most used self-organizing neural network model, the Kohonen network (SOM), enabling its usage as an effective tool for cluster analysis. The SOM network defines, via unsupervised learning, a mapping of a continuos p-dimensional space to a set of model vectors, or neurons, usually arranged as a 2-D array. Each neuron has the same dimension of the input space, p, and the main objective is dimensionality reduction while trying to preserve as much as possible the topology of the input space. The SL-SOM (Self-Labeling SOM) algorithm was developed for automatically partitioning and labeling a trained SOM network. It uses information of the p component gradient (distances) which is presented in the U-matrix. By using image processing algorithms, the obtained results are labeled and connected regions of neurons. Each region defines, in the input space, complex and nonparametric geometries which approximately describe the shape of the clusters. Classification of new objects can be performed using the established regions and the nearest neighbor rule. An extension of the SL-SOM algorithm aims to enhance the clustering process, enabling to discover sub-clusters. The TS-SL-SOM (Tree-Structured Self-Labeling SOM) algorithm generates a child network for each labeled region of the root network, and so on. The process can be seen as generation of a dynamic tree, where each node is a whole network, and which is data-driven. It is not necessary to specify the number of sub-networks for a given network in a given height of the tree. The parameters of the child network are functions of the parameters of the father network and of the subgroup of data used to train that network. A pruning strategy cuts sub-networks (leave nodes) which do not present further partitions. High dimension output SOM networks are not frequently used because the main application of SOM is visualization of data in a form of display. With the automation of knowledge discovery and data relations by the SL-SOM and TS-SL-SOM algorithms, we can use output dimensions higher than 2 and analyze only the final results, i.e., number of clusters and their components, relationships between groups, etc. The main advantage of using high dimension output SOMs is that topology preservation is usually lost when mapping a higher input space to a lower output space. The U-array is defined as an extension of the U-matrix and methods are proposed for its segmentation in a similar fashion of those presented in the SL-SOM algorithm. The thesis also presents results of the methods for synthetic and real data sets, and some comparisons with conventional clustering approachés, such as k-means and mixtures of probability density functions with the Expectation Maximization algorithm. Applications of the methods presented in this thesis are numerous. Virtually any area which possess data could be a candidate for using some kind of mapping and thus using any of these methods. With the increasingly availability of masses of data elsewhere, in applications ranging from business to scientific tasks, or even the immense mass of unstructured data available in the internet, and decreasingly cost of memory and computers, tools as the ones presented in this thesis will be important parts of softwares in a near future / Doutorado / Doutor em Engenharia Elétrica Sistemas de reconhecimento de padrões Análise por agrupamento Redes neurais (Computação) Inteligência artificial
199	Análise genômica e funcional da Nodularia spumigena CENA596 formadora de florações em tanques de produção de camarões / Genomic and functional analysis of the bloom-forming Nodularia spumigena CENA596 in shrimp production ponds Rafael Vicentini Popin 12 September 2017 (has links) Nodularia spumigena é uma espécie cianobacteriana conhecida como produtora da hepatotoxina nodularina. Essa cianotoxina é uma potente e irreversível inibidora de proteínas fosfatases da família serina/treonina (PP1 e PP2A) de células eucarióticas e é uma promotora tumoral e suspeita carcinogéna. Além da nodularina, a N. spumigena também é produtora de outros peptídeos não ribossômicos, tais como espumiginas, aeruginosinas e anabaenopeptinas. O primeiro relato de N. spumigena formadora de florações no Brasil ocorreu em 2011 em tanques de produção de camarões no Rio Grande, RS, e estimulou o interesse na obtenção de informações sobre o seu genoma e potencial biossíntético. Dessa forma, a objetivo deste estudo foi avaliar os aspectos genômicos e funcionais da linhagem Nodularia spumigena CENA596 isolada de um tanque de produção de camarões de Rio Grande. Para isso, uma cultura da linhagem N. spumigena CENA596 foi submetida a um tratamento com hipoclorito de sódio (2%) para eliminação de contaminantes e o DNA extraído das células tratadas foi sequenciado na plataforma MiSeq e analisado com ferramentas genômicas. O sequenciamento e a montagem do seu genoma originaram 291 sequências contíguas com percentual GC de 41,19 e tamanho total de 5.189.679 pb. A análise filogenética baseada na sequência do gene que codifica o 16S rRNA agrupou a linhagem CENA596 com outras de N. spumigena da Austrália e América do Norte. Na árvore filogenômica construída com as sequências concatenadas de 31 proteínas, a linhagem brasileira CENA596 agrupou-se com valor de reamostragem de 100% com a N. spumigena CCY9414 originária do mar Báltico. As análises comparativas entre os genomas dessas duas linhagens indicaram um grande número de genes compartilhados, os quais estão relacionados principalmente ao metabolismo primário das células. Por outro lado, foram encontrados genes específicos para cada uma delas que estão envolvidos em respostas celulares a estresses oxidativos, patógenos e antibióticos. A mineração do genoma da N. spumigena CENA596 revelou 13 agrupamentos gênicos hipoteticamente relacionados à síntese de metabólitos secundários, a maioria dos quais mostrou similaridade significativa com agrupamentos conhecidos. As análises químicas confirmaram a produção de duas variantes de nodularina, espumigina, namalida, aeruginosina e aminoácidos tipo micosporina, e uma variante de geosmina. A linhagem brasileira N. spumigena CENA596 mostrou-se capaz de produzir uma variedade significante de moléculas bioativas e seu genoma revelou-se ser consideravelmente conservado em relação ao genoma da linhagem CCY9414, a qual é conhecida por causar grandes florações tóxicas no Mar Báltico / Nodularia spumigena is a cyanobacterial species known as a producer of the hepatotoxin nodularin. This cyanotoxin is a potent and irreversible inhibitor of eukaryotic cell serine/threonine protein phosphatases (PP1 and PP2A) and is a tumor promoter and suspected carcinogen. In addition to nodularin, N. spumigena is also produces other non-ribosomal peptides, such as spumigins, aeruginosines and anabaenopeptins. The first report of bloom-forming N. spumigena in Brazil occurred in 2011 in shrimp production ponds, Rio Grande, RS, and stimulated interest in obtaining information on its genome and biosynthetic potential. Thus, the objective of this study was to evaluate the genomic and functional aspects of the strain N. spumigena CENA596 isolated from a shrimp production pond of the Rio Grande. For this, a culture of the strain N. spumigena CENA596 was submitted to a treatment with sodium hypochlorite (2%) to eliminate contaminants and the DNA extracted from treated cells was sequenced in a platform MiSeq and analyzed with genomic tools. Genome sequencing and assembly resulted in 291 contiguous sequences with GC percentage of 41.19 and total size of 5,187,679 bp. Phylogenetic analysis based on the gene sequence encoding the 16S rRNA grouped the strain CENA596 with other N. spumigena from Australia and North America. In the phylogenomic tree constructed with the concatenated sequences of 31 proteins, the Brazilian strain CENA596 grouped with a bootstrap value of 100% with the N. spumigena CCY9414 originating from the Baltic sea. Comparative analyses between the genomes of these two strains indicated a large number of shared genes, which are mainly related to the primary metabolism of the cells. Otherwise, genes specific for each of the two strains were identified as involved in cellular responses to oxidative stress, pathogens and antibiotics. Genome mining revealed 13 gene clusters hypothetically related to the synthesis of secondary metabolites, most of which showed significant similarity to known clusters. Chemical analyses confirmed the production of two variants of nodularin, spumigin, namalide, aeruginosin and mycosporine-like amino acid, and one variant of geosmin. The Brazilian strain N. spumigena CENA596 was able to produce a significant variety of bioactive molecules and its genome revealed to be considerably conserved in relation to the genome of the strain CCY9414, which is known to cause large toxic blooms in the Baltic Sea Agrupamento gênico Cianotoxinas Espectrometria de massas Genoma Genômica comparativa Comparative genomics Cyanotoxins Gene cluster Genome Mass spectrometry
200	Orientação produtiva na agropecuaria brasileira : uma analise comparativa entre 1970 e 1985, com base nas mesorregiões homogeneas Almeida, Luis Carlos Ferreira de 06 July 1995 (has links) Orientador: João Luiz Cardoso / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agricola / Made available in DSpace on 2018-07-20T10:54:15Z (GMT). No. of bitstreams: 1 Almeida_LuisCarlosFerreirade_M.pdf: 3019157 bytes, checksum: 7f09198cfa4bf65f309236228c258f20 (MD5) Previous issue date: 1995 / Resumo: o presente trabalho tem o objetivo principal de analisar a orientação produtiva da atividade agropecuária. tomando-se como base as Mesorregiões Geográficas do Brasil. De modo específico. busca-se estudar as possiveis mudanças ocoródas na agropecuáóa de 1970 para 1985. utilizando-se inclusive a formação de grupos de mesorregiões relativamente homogêneos. Os dados são provenientes dos Censos Agropecuáóos de 1970 e 1985 (da FIBGE) e se referem a 88 mesorregiões geográficas. Foram elaboradas 24 vaóáveis relacionadas a: estrutura fundiáóa. estrutura da produção. nivel tecnol6gico e indicadores s6cio-econômicos (com dados sobre pessoal ocupado). Além de análises descritivas foram utilizados os métodos de análise fatorial em componentes principais e a classificação automática hierárquica. Foram então constituidos 6 grupos de mesorregiões para 1970 e 5 grupos para 1985. Através da comparação dos dados dos Censos Agropecuáóos de 1970, 1975, 1980 e 1985 foi possivel constatar que houve reversão do dinamismo da agropecuáóa no periodo 1980/85. Várias atividades que vinham apresentando crescimento acentuado desde 1970 até 1980 mudam as tendências em 1980/85, chegando em alguns casos a voltar aos mesmos patamares de 1970. Os métodos empregados deixam claro a ocorrência de diversas particulaódades importantes, embora as caracteristicas gerais dos grupos de mesorregiões não mostrassem mudanças muito acentuadas quando efetuada a comparação entre os periodos / Mestrado / Planejamento e Produção Agropecuaria / Mestre em Engenharia Civil Planejamento agrícola Planejamento da produção Agropecuaria Análise de componentes principais Análise por agrupamento

Search results