Global ETD Search

51	Uma arquitetura para suporte à mineração de dados paralela e distribuída em ambientes de computação de alto desempenho Bernardi, Élder Francisco Fontana January 2010 (has links) Made available in DSpace on 2013-08-07T18:42:56Z (GMT). No. of bitstreams: 1 000431852-Texto+Completo-0.pdf: 1120851 bytes, checksum: 164e0d72a540ab33502e807a748407b1 (MD5) Previous issue date: 2010 / In this paper, we present an architecture to support the execution of data mining applications on high performance computing environments such as clusters, SMP and grids. This architecture automates the process of parallel applications sizing, presenting tools for automatic construction of parallel tasks, automatic scheduling, managing and execution of these applications on high performance computing environments. The mechanisms created for executing mining applications make it possible to explore both data and instruction parallelism. The main contributions of this work are the organization of the proposed architecture and the creation of an algorithm for mapping parallel data mining applications on heterogeneous computational environments. The support of multi-core resources is taken on account. Furthermore, we present the parallelization of a data mining algorithm for regression. / Este trabalho apresenta uma arquitetura para suporte à execução de tarefas de mineração de dados em ambientes de computação de alto desempenho, tais como: clusters, máquinas SMP e grades. Esta arquitetura automatiza o processo de dimensionamento da aplicação paralela, criando ferramentas para a construção automática de tarefas, mapeamento, gerência e execução dessas aplicações nos recursos computacionais disponíveis. Os mecanismos criados para a execução de aplicações de mineração possibilitam a combinação do paralelismo do fluxo de dados e de instruções. Como contribuição do trabalho, destaca-se a organização da arquitetura proposta e a criação de um algoritmo para mapeamento de aplicações de mineração paralelas em ambientes computacionais heterogêneos. Enfatiza-se o suporte ao aproveitamento de recursos com múltiplos núcleos de processamento (multi-cores). Além disso, apresenta-se a paralelização de um algoritmo de mineração de dados para regressão. INFORMÁTICA MINERAÇÃO DE DADOS (INFORMÁTICA) ARQUITETURA DE COMPUTADOR
52	Aplicação do processo de descoberta de conhecimento em banco de dados acadêmico utilizando as tarefas de agrupamento e classificação / Asseiss, Maraísa da Silva Guerra January 2017 (has links) Orientador: Alexandre Cesar Rodrigues da Silva / Resumo: Nos últimos anos a quantidade de dados armazenados diarimente em empresas e instituições aumentou consideravelmente e um dos motivos que contribuiu para isso é a crescente importân- cia dada à informação. De forma geral, esses dados são meramente armazenados e, portanto, subutilizados pelos seus detentores, enquanto poderiam ser estudados a fim de obter novos co- nhecimentos, informações e relacionamentos. Neste contexto, surge o processo de descoberta de conhecimento em banco de dados. Este trabalho apresenta uma introdução a banco de dados, uma revisão bibliográfica sobre o processo de descoberta de conhecimento em banco de dados, a descrição de cada etapa deste processo, uma explanação sobre as tarefas de agrupamento e classificação, além de resumir brevemente as técnicas de particionamento e árvore de decisão. É exposto um estudo sobre o sistema Weka, em que apresenta-se conceitos, funcionalidades e exemplifica-se diversas formas de utilização do sistema. O objetivo principal deste trabalho é propor uma metodologia para descoberta de novos conhecimentos em bancos de dados acadê- micos baseada no processo de descoberta de conhecimento em banco de dados, sendo esta uma metodologia mais simplificada e de execução mais direcionada. Como parte da metodologia este trabalho contribui ainda com uma aplicação desenvolvida em Python como forma de apoio a etapas da metodologia. A metodologia proposta conta com a ferramenta Weka para execução dos algoritmos de data mining e prevê a e... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre Agrupamento Classificação. Descoberta de conhecimento Estudo de caso Metodologia. Data mining Weka
53	Utilizando conceitos como descritores de textos para o processo de identificação de conglomerados (clustering) de documentos Wives, Leandro Krug January 2004 (has links) A descoberta e a análise de conglomerados textuais são processos muito importantes para a estruturação, organização e a recuperação de informações, assim como para a descoberta de conhecimento. Isto porque o ser humano coleta e armazena uma quantidade muito grande de dados textuais, que necessitam ser vasculhados, estudados, conhecidos e organizados de forma a fornecerem informações que lhe dêem o conhecimento para a execução de uma tarefa que exija a tomada de uma decisão. É justamente nesse ponto que os processos de descoberta e de análise de conglomerados (clustering) se insere, pois eles auxiliam na exploração e análise dos dados, permitindo conhecer melhor seu conteúdo e inter-relações. No entanto, esse processo, por ser aplicado em textos, está sujeito a sofrer interferências decorrentes de problemas da própria linguagem e do vocabulário utilizado nos mesmos, tais como erros ortográficos, sinonímia, homonímia, variações morfológicas e similares. Esta Tese apresenta uma solução para minimizar esses problemas, que consiste na utilização de “conceitos” (estruturas capazes de representar objetos e idéias presentes nos textos) na modelagem do conteúdo dos documentos. Para tanto, são apresentados os conceitos e as áreas relacionadas com o tema, os trabalhos correlatos (revisão bibliográfica), a metodologia proposta e alguns experimentos que permitem desenvolver determinados argumentos e comprovar algumas hipóteses sobre a proposta. As conclusões principais desta Tese indicam que a técnica de conceitos possui diversas vantagens, dentre elas a utilização de uma quantidade muito menor, porém mais representativa, de descritores para os documentos, o que torna o tempo e a complexidade do seu processamento muito menor, permitindo que uma quantidade muito maior deles seja analisada. Outra vantagem está no fato de o poder de expressão de conceitos permitir que os usuários analisem os aglomerados resultantes muito mais facilmente e compreendam melhor seu conteúdo e forma. Além do método e da metodologia proposta, esta Tese possui diversas contribuições, entre elas vários trabalhos e artigos desenvolvidos em parceria com outros pesquisadores e colegas. Armazenamento : Dados Recuperacao : Informacao Descoberta : Conhecimento Agrupamento : Informacao textual
54	Padr?o de crescimento, par?metros de desempenho e diverg?ncia gen?tica de gen?tipos de frangos tipo caipira / Growth pattern, performance parameters and genetic divergence of genotypes in Alternative strain of Broiler Chickens Veloso, Rog?rio de Carvalho 16 July 2012 (has links) Submitted by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2015-12-17T18:08:09Z No. of bitstreams: 2 rogerio_carvalho_veloso.pdf: 757216 bytes, checksum: fe993450a9e7686366dfe072342dd019 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2015-12-17T18:08:35Z (GMT) No. of bitstreams: 2 rogerio_carvalho_veloso.pdf: 757216 bytes, checksum: fe993450a9e7686366dfe072342dd019 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2015-12-17T18:08:35Z (GMT). No. of bitstreams: 2 rogerio_carvalho_veloso.pdf: 757216 bytes, checksum: fe993450a9e7686366dfe072342dd019 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2012 / Funda??o de Amparo ? Pesquisa do estado de Minas Gerais (FAPEMIG) / Conselho Nacional de Desenvolvimento Cient?fico e Tecnol?gico (CNPq) / Objetivou-se com este trabalho comparar o padr?o de crescimento, avaliar o desempenho, as caracter?sticas de carca?a e, verificar a diverg?ncia gen?tica por meio de t?cnicas de an?lise multivariada de diferentes gen?tipos de aves tipo caipira. Foram utilizados 840 pintos de um dia, machos, distribu?dos em delineamento inteiramente casualizado, dos seguintes gen?tipos: Caboclo, Carij?, Colorpak, Gigante Negro, Pesad?o Vermelho, Pesco?o Pelado e Tricolor. Para a determina??o das curvas de crescimento do peso corporal das aves, os dados coletados foram avaliados a partir dos modelos n?o-lineares: Brody, Gompertz, Log?stico, Richards e von Bertalanffy. Foi empregado o ?proc nlin? do SAS, utilizando o m?todo interativo de Gauss-Newton. Os crit?rios utilizados para escolha do modelo de melhor ajuste da curva de crescimento foram o coeficiente de determina??o, o desvio padr?o assint?tico, o desvio m?dio absoluto dos res?duos e o ?ndice assint?tico. O estudo do crescimento relativo dos cortes foi realizado mediante o modelo da equa??o alom?trica de Huxley. As caracter?sticas de desempenho (convers?o alimentar, ganho em peso m?dio di?rio, consumo de ra??o m?dio di?rio) foram avaliadas em quatro per?odos: 1 a 28, 1 a 56, 1 a 70 e 1 a 84 dias de idade. As caracter?sticas de carca?a (peso e rendimento de carca?a, peito e pernas) foram obtidas a partir do abate de 2 aves por boxe, aos 85 dias de idade. O peso corporal foi medido ao nascimento, 14, 28, 42, 56, 70 e 84 dias de idade. As an?lises estat?sticas foram realizadas utilizando-se o ?proc glm? do SAS. O desempenho dos gen?tipos tamb?m foi avaliado por meio da an?lise de vari?ncia multivariada e da fun??o discriminante linear de Fisher, usando os testes do maior autovalor de Roy e da uni?o-interse??o de Roy para as compara??es m?ltiplas. O estudo da diverg?ncia gen?tica foi feito por meio da an?lise por vari?veis can?nicas e pelo m?todo de otimiza??o de Tocher. Apenas as equa??es propostas por Gompertz, von Bertalanffy e Log?stico atingiram a converg?ncia, sendo que o modelo de von Bertalanffy o mais adequado para descrever o crescimento das aves. Todos os gen?tipos apresentaram crescimento alom?trico tardio, indicando que o crescimento do peito ? lento em rela??o ? carca?a. Verificou-se que em todos os per?odos, as aves do gen?tipo Colorpak apresentaram maior peso corporal, consumo de ra??o m?dio di?rio, ganho em peso m?dio di?rio e convers?o alimentar. Entretanto, os gen?tipos Caboclo e Gigante Negro apresentaram os piores desempenhos. Quanto ao rendimento de cortes pode ser observado que o gen?tipo Tricolor diferiu estatisticamente somente do Colorpak o para o rendimento de pernas. Para o rendimento de peito o Carij? e o Pesad?o Vermelho diferiu estatisticamente dos gen?tipos Caboclo e Gigante Negro, n?o diferindo dos demais. As duas primeiras vari?veis can?nicas explicaram 97,41% da varia??o entre os gen?tipos. A escolha do gen?tipo para cria??o deve ser feita de acordo com o interesse de mercado, pois h? diferen?as no desempenho e no rendimento de carca?a e dos cortes. A diverg?ncia gen?tica entre os gen?tipos avaliados permitiu a forma??o de quatro grupos com os seguintes gen?tipos: grupo 1 - Colorpak, grupo 2 - Pesad?o Vermelho e Pesco?o Pelado, grupo 3 - Carij? e Tricolor e grupo 4 - Caboclo e Gigante Negro. / Disserta??o (Mestrado) ? Programa de P?s-Gradua??o em Zootecnia, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2012 / ABSTRACT The objective of this work was to compare the growth pattern, evaluate performance, carcass characteristics, and verify the genetic diversity by means of multivariate analysis of different genotypes in alternative lines of broiler chickens. We used 840 day old chicks, males distributed in a completely randomized design, the following genotypes: Caboclo, Carij?, Colorpak, Gigante Negro, Pesad?o Vermelho, Pesco?o Pelado and Tricolor. To determine the growth curves of the body weight of birds, collected data were evaluated from the nonlinear models: Brody, Gompertz, Logistic, Richards and von Bertalanffy. Was used "proc nlin" of SAS, using the iterative method of Gauss-Newton. The criteria used to choose the best model of the growth curve were the coefficient of determination, the asymptotic standard deviation, the mean absolute deviation of the waste and the asymptotic index. The study of the relative growth of the sections was performed using the model of Huxley's allometric equation. The performance characteristics (feed conversion, average daily weight gain, average daily feed intake) were evaluated in four periods: 1-28, 1-56, 1-70 and 1-84 days old. The carcass traits (weight and carcass yield, breast and leg) were obtained from the slaughter of two birds per pen, at 84 days old. Body weight was measured at birth, 14, 28, 42, 56, 70 and 84 days of age. Statistical analyzes were performed using the "proc glm" SAS. The performance of genotypes was also evaluated by multivariate analysis of variance and Fisher's linear discriminant function, using the tests of the largest eigenvalue of Roy and the Roy union-intersection for multiple comparisons. The study of genetic diversity was done by canonical variate analysis and the method of Tocher. Only the equations proposed by Gompertz, von Bertalanffy and Logistic reached convergence, and the von Bertalanffy model more appropriate to describe the growth of the birds. All genotypes showed late allometric growth, indicating that breast growth is slow relative to the housing. It was found that in all periods, the birds Colorpak genotype had higher body weight, average daily feed intake, average daily weight gain and feed conversion. However, the genotypes Caboclo and Gigante Negro had the worst performances. The yield of the cuts can be seen that the genotype Tricolor significantly different only from Colorpak to yield the legs. For breast meat yield Carij? and the Pesad?o Vermelho significant different genotypes Caboclo and Gigante Negro, not differing from the others. The first two canonical variables accounted for 97.41% of the variation among genotypes. The choice of the genotype for breeding should be done according to market interest, because there are differences in performance and carcass yield and cuts. The genetic divergence between the genotypes allowed the formation of four groups with the following genotypes: group 1 - Colorpak, group 2 - Pesad?o Vermelho and Pesco?o Pelado, group 3 - Carij? and Tricolor and group 4 - Caboclo and Gigante Negro. Agrupamento Convers?o alimentar Curva de crescimento Frango colonial
55	Avalia??o de m?todos de agrupamento para a classifica??o da capacidade produtiva de um trecho da Floresta Nacional do Tapaj?s ? PA. / Clustering methods evaluation to classify the productive capacity of a forest stretch at Tapaj?s National Forest - PA. Ximenes, Lucas Cunha 21 October 2016 (has links) Submitted by Jos? Henrique Henrique (jose.neves@ufvjm.edu.br) on 2017-06-09T17:17:51Z No. of bitstreams: 2 lucas_cunha_ximenes.pdf: 2578435 bytes, checksum: 674c742b7551f13345ff22f59b8220c5 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2017-06-22T15:04:07Z (GMT) No. of bitstreams: 2 lucas_cunha_ximenes.pdf: 2578435 bytes, checksum: 674c742b7551f13345ff22f59b8220c5 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-06-22T15:04:07Z (GMT). No. of bitstreams: 2 lucas_cunha_ximenes.pdf: 2578435 bytes, checksum: 674c742b7551f13345ff22f59b8220c5 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2017 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / O estudo teve como objetivo definir a melhor combina??o de m?todo de agrupamento com medida de similaridade para a classificar a capacidade produtiva de um trecho na Floresta Nacional do Tapaj?s. O invent?rio florestal amostral foi realizado no ano de 2012 e para a loca??o das parcelas foram abertas 12 faixas de, aproximadamente, 1,5 m de largura, equidistantes 4,0 km, na dire??o leste-oeste, e com comprimento variando de 4 km a 13,75 km. A instala??o das parcelas, com dimens?es de 30 x 250 m, distribu?das sistematicamente por 500 m em cada linha. Foi levado em considera??o para a defini??o das classes de tamanho (CT): CT 1 (classe de regenera??o) - 10 cm ? DAP < 25 cm nos primeiros 50 m da parcela (30 m x 50 m); CT 2 (classe de crescimento) - 25 cm ? DAP < 50 cm nos primeiros 100 m (30 m x 100 m); e CT 3 (classe de colheita) - DAP ? 50 cm em toda a parcela (30 m x 250 m). Para a classifica??o da capacidade produtiva, realizou-se um filtro no banco de dados original por classe de tamanho, no qual foram selecionados os indiv?duos com qualidade de fuste 1 (fuste reto) e 2 (fuste com pequenas tortuosidades) e que t?m valor no mercado regional. As 204 parcelas foram agrupadas em grupos homog?neos, no qual foram produzidos 40 dendrogramas do tipo vertical para cada uma das 3 classes de tamanho (totalizando 120 dendrogramas), baseados na combina??o de 5 medidas de dist?ncia (Euclidiana Simples, Euclidiana Quadrada, Manhattan, Canberra e Mahalanobis), com 8 m?todos de agrupamento hier?rquicos, sendo: Ward1, Ward2 Liga??o Simples, Liga??o Completa, UPGMA, WPGMA, Mediana e Centroide. Com o intuito de verificar a valida??o dos m?todos de agrupamento testados, foram confeccionadas 120 tabelas de an?lise discriminante linear de Fisher, sendo 40 para cada classe de tamanho, contendo as probabilidades para cada classe de estoque, bem como a porcentagem de classifica??o das combina??es testadas na an?lise de agrupamento. As an?lises de agrupamento e discriminante possibilitaram estratificar as parcelas heterog?neas de uma floresta inequi?nea em ?reas com parcelas homog?neas em termos de volume, densidade b?sica da madeira e grupo de comercializa??o. A combina??o entre medida de dist?ncia de Manhattan e m?todo de Ward2 mostrou-se ser a mais eficiente para estratificar florestas inequi?neas em classes de estoque volum?trico. / Disserta??o (Mestrado) ? Programa de P?s-Gradua??o em Ci?ncia Florestal, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2016. / The study aimed to determine the best combination of clustering method with similarity measure to classify the productive capacity of a stretch at Tapaj?s National Forest. The sample forest inventory was carried out in 2012 and for plot allocations we opened 12 tracks of approximately 1.5 m wide, 4.0 km equidistant in east-west direction, and length ranging from 4 km to 13.75 km. The plot installation, with dimensions of 30 x 250 m, systematically distributed in 500 m in each row. We took into account for the definition of size classes (CT): CT 1 (regeneration class) - 10 cm ? DBH <25 cm in the first 50 m of the plot (30 m x 50 m); CT 2 (growth class) - 25 cm ? DBH <50 cm in the first 100 m (30 m x 100 m); and CT 3 (harvesting class) - DBH ? 50 cm in the whole plot (30 m x 250 m). For the classification of productive capacity, there was a filter in the original database by size class, in which individuals were selected with bole quality 1 (straight bole) and 2 (bole with small tortuosities) and which have value in the regional market. The 204 plots were grouped into homogeneous groups, which were produced 40 dendrograms of the vertical type for each of the three size classes (totaling 120 dendrograms), based on the combination of five measures of distance (Euclidean Simple, Squared Euclidean, Manhattan, Canberra and Mahalanobis) with 8 hierarchical clustering methods, namely: Ward1, Ward2 Simple Link, Complete Link, UPGMA, WPGMA, Median and Centroid. In order to check the validation of the tested clustering methods, we produced 120 Fisher linear discriminant analysis tables, with 40 for each size class containing the probabilities for each stock class as well as the percentage of the combinations tested in the cluster analysis. The cluster and discriminant analysis made it possible to stratify the heterogeneous plots of a native forest in areas with homogeneous portions in terms of volume, wood density and commercialization group. The combination of measure distance of Manhattan and Ward2 method proved to be the most efficient to stratify uneven-aged stands in forest stock volume classes. Estat?stica multivariada Classifica??o Agrupamento Multivariate statistics Classification Clustering
56	Identificação de outliers multivariados - Uma aplicação em dados de saúde / Outlier identification multivariate - An application for health data Barbosa, Josino José 17 February 2017 (has links) Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2017-04-11T14:32:01Z No. of bitstreams: 1 texto completo.pdf: 1609406 bytes, checksum: 9cedba288b402aa34f47d430c8a495cf (MD5) / Made available in DSpace on 2017-04-11T14:32:01Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1609406 bytes, checksum: 9cedba288b402aa34f47d430c8a495cf (MD5) Previous issue date: 2017-02-17 / A identificação de outliers desempenha um papel importante na análise estatística, pois tais observações podem conter informações importantes em relação aos dados. Se modelos estatísticos clássicos são cegamente aplicados a dados contendo valores atípicos, os resultados podem ser enganosos e decisões equivocadas podem ser tornadas. Além disso, em situações práticas, os próprios outliers são muitas vezes os pontos especiais de interesse e sua identificação pode ser o principal objetivo da investigação. Por isso, a finalidade desse trabalho é propor uma técnica de detecção de outliers multivariados, baseada em análise agrupamento e comparar essa técnica com o método de identificação de outliers via Distância de Mahalanobis. Para geração dos dados utilizou-se simulação através do Método de Monte Carlo e a técnica de mistura de distribuições normais multivariadas. Os resultados apresentados nas simulações mostram que o método proposto foi superior ao método de Mahalanobis tanto para sensibilidade quanto para especificidade, ou seja, ele apresenta maior capacidade de diagnosticar corretamente os indivíduos outliers e os não outliers. Além disso, a metodologia proposta foi ilustrada com uma aplicação em dados reais provenientes da área de saúde. / The identification of outliers plays an important role in statistical analysis, as such observations may contain important information regarding the data. If classical statistical models are blindly applied to data containing atypical values, the results may be misleading and mistaken decisions can be made. Moreover, in practical situations, the outliers themselves are often the special points of interest and their identification may be the main objective of the investigation. Therefore, the purpose of this work is to propose a technique of detection of multivariate outliers based on cluster analysis and to compare this technique with the method of identifying outliers via Mahalanobis Distance. For data generation, the Monte Carlo method and the mixed-multivariate normal distribution technique were used. The results presented in the simulations show that the proposed method was superior to the Mahalanobis method for both sensitivity and specificity, that is, it presents greater capacity to correctly diagnose outliers and non-outliers individuals. In addition, the proposed methodology was illustrated with an application in real data from the health area. Análise multivariada Análise por agrupamento Monte Carlo, Método de Ciências Agrárias
57	Caracterização química e diversidade genética entre acessos de tomateiro / Chemical characterization and genetic diversity among tomato accessions Silva, Natalia Oliveira 27 July 2017 (has links) Submitted by Reginaldo Soares de Freitas (reginaldo.freitas@ufv.br) on 2017-10-26T15:58:59Z No. of bitstreams: 1 texto completo.pdf: 447707 bytes, checksum: 66b1d7d8c5485f56036f54daad6f8de5 (MD5) / Made available in DSpace on 2017-10-26T15:58:59Z (GMT). No. of bitstreams: 1 texto completo.pdf: 447707 bytes, checksum: 66b1d7d8c5485f56036f54daad6f8de5 (MD5) Previous issue date: 2017-07-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A caracterização de atributos relacionados à qualidade nutricional de acessos de tomateiro presente em bancos de germoplasma é fundamental para a identificação de possíveis genitores que poderão ser usados em programas de melhoramento genético da cultura. Objetivou-se caracterizar acessos de S. lycopersicum provenientes do banco de germoplasma de hortaliças da Universidade Federal de Viçosa e determinar a diversidade genética entre os mesmos considerando atributos relacionados à qualidade nutricional dos frutos. O estudo foi realizado na Universidade Federal de Viçosa-Campus Rio Paranaíba, em dois cultivos (outono-inverno e primavera-verão). Os tratamentos foram 21 acessos de tomateiro do BGH-UFV, o híbrido Débora Plus e a cultivar Santa Clara. Os atributos avaliados foram: pH, sólidos solúveis (SS), acidez titulável (AT), relação entre SS e AT, ácido ascórbico, licopeno, carotenoides totais, peso médio de frutos, teor de água nos frutos, Ca, Mg, Na e K. Os dados foram submetidos à análise de variância, à distância euclidiana e de Mahalanobis (diversidade genética) e de agrupamento pelos métodos de UPGMA e Tocher. Todos os tratamentos apresentaram diferença estatística para todos os atributos avaliados. O agrupamento dos acessos de tomateiro pelo método de Tocher formou sete grupos para o cultivo de outono-inverno e cinco grupos para o cultivo de primavera-verão. Conclui-se que os acessos de tomateiro do BGH-UFV apresentam diversidade genética em estudo dos atributos relacionados à qualidade nutricional dos frutos. Os acessos 2064 (4), 985 (5) e 83 (17) podem ser usados como genitores em programas de melhoramento da cultura por apresentarem características semelhantes ao híbrido Débora Plus quando cultivados no período de outono inverno. / The characterization of attributes related to nutritional quality of tomato accessions present in germplasm banks is essential to the identification of possible genitors which could be used in genetical enhancement programs of the crop. The aim of this study was to characterize the S. lycopersicum accessions from the vegetables germplasm bank at Federal University of Viçosa and determine the genetic diversity among them considering attributes related to nutritional fruit quality. The study was conducted at Federal University of Viçosa - Rio Paranaíba Campus, in two cultivations (autumn-winter and spring-summer). The treatments used were 21 tomato accessions from BGH-UFV, Débora Plus hybrid and the Santa Clara cultivar. Were evaluated the following attributes: pH, soluble solids (SS), titratable acidity (TA), relation between SS and TA, ascorbic acid, lycopene, total carotenoids, fruit average weight, fruit water content, Ca, Mg, Na and K. The data were submitted to variance analysis, Euclidean and Mahalanobis (genetic diversity) distance, UPGMA and Tocher grouping methods. All treatments presented significantly statistical difference to all evaluated attributes. The tomato accessions grouping by Tocher method formed seven groups to the autumn-winter cultivation and five groups to the spring- summer cultivation. It was concluded that the tomato accessions from BGH-UFV presented genetic diversity in the attributes study related to the nutritional fruits quality. The 2064 (4), 985 (5) and 83 (17) accessions might be used as genitors in genetical enhancement programs of the crop for presenting similar characteristics to the Débora Plus hybrid when cultivated in the autumn-winter period. / Não foi localizado o currículo lattes do autor. Agrupamento de Tocher Atributos nutricionais Distância de Mahalanobis Melhoramento Vegetal
58	Arcabouço para detecção online de outliers para algoritmos de agrupamento em fluxos contínuos de dados / A framework for online detection of outliers in clusters of continuous data streaming Pereira, Mariana Alves 31 July 2017 (has links) Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2018-02-27T14:32:20Z No. of bitstreams: 1 texto completo.pdf: 1919837 bytes, checksum: 88b24ab33cb2eb64595fbfbf8ffeb254 (MD5) / Made available in DSpace on 2018-02-27T14:32:20Z (GMT). No. of bitstreams: 1 texto completo.pdf: 1919837 bytes, checksum: 88b24ab33cb2eb64595fbfbf8ffeb254 (MD5) Previous issue date: 2017-07-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Avanços da tecnologia acarretam na geração rápida e contínua de massivas quantida- des de dados. Tal cenário requer a criação de algoritmos de agrupamento incremen- tais para extração de conhecimento. Entre as restrições impostas a esses algoritmos, os mesmos devem ser capazes de detectar e tratar possíveis outliers que chegam ao fluxo. O arcabouço desenvolvido nesse trabalho apresenta uma estratégia para a restrição de tratamento e detecção de outliers na componente online dos algoritmos de agrupamento de fluxo de dados. A principal contribuição da proposta em estudo é a capacidade de validar possíveis outliers detectados previamente, com o intuito de manter um modelo sempre atualizado e com qualidade. Para isso, todos os potenci- ais outliers são armazenados em uma memória auxiliar que de tempos em tempos é verificada, agrupando seus objetos, validando os micro-grupos formados por inliers e inserindo-os no modelo. Todos os objetos restantes que não foram validados, são mantidos na memória auxiliar até que se tornem válidos ou obsoletos. Em seguida, objetos obsoletos são removidos. Este trabalho também propõe o CluStreamOD, uma extensão do algoritmo de agrupamento CluStream, que aplica a estratégia em estudo em sua componente online, para tratar outliers. Os experimentos realizados mostram a eficácia do CluStreamOD para detecção e tratamento online de outliers do fluxo em comparação com CluStream, e a potencialidade da abordagem proposta para ser aplicada em outros algoritmos de fluxo de dados baseados em micro-grupos. / Advances in technology have led to the rapid and continuous generation of massive amounts of data. Such a scenario requires the creation of incremental clustering algorithms for knowledge extraction. Among the constraints imposed on these al- gorithms, they must be able to detect and treat possible outliers that arrive at the flow. The framework developed in this work presents a strategy for the restriction of treatment and detection of outliers in the online component of the clustering algorithms in data stream. The main contribution of the proposal under study is the ability to validate possible outliers previously detected, in order to maintain a model that is always updated and with quality. For this, all the potential outliers are stored in an auxiliary memory when for time to time is verified, clustering its objects, validating the formed micro-clusters by inserting them into the model. All remaining objects that have not been validated are held in auxiliary memory until they become valid or obsolete. Then obsolete objects are removed. This work also proposes the CluStreamOD, an extension of the CluStream clustering algorithm, which applies the strategy under study in its component online, to treat outliers. Experiments carried out show the efficacy of the CluStreamOD for online detection and treatment of the outliers in the data streams compared to CluStream, and the potentiality of the proposed approach to be applied in other algorithms in data stream based on micro-clusters. Detecção de outliers Fluxos contínuos de dados Agrupamento Componente online Ciência da Computação
59	Algoritmo para agrupamento de descontinuidades em famílias baseado no Método Fuzzy K-Means. Klen, André Monteiro January 2015 (has links) Programa de Pós-Graduação em Geotecnia. Núcleo de Geotecnia, Escola de Minas, Universidade Federal de Ouro Preto. / Submitted by Oliveira Flávia (flavia@sisbin.ufop.br) on 2015-10-16T16:50:52Z No. of bitstreams: 2 license_rdf: 19418 bytes, checksum: 6dde0d96f18aca4c252a500311f54121 (MD5) TESE_AlgoritmoAgrupamentoDescontinuidades.pdf: 4101321 bytes, checksum: 68c6eec732bdc99941712e49b4cf8c3e (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2015-10-29T18:48:25Z (GMT) No. of bitstreams: 2 license_rdf: 19418 bytes, checksum: 6dde0d96f18aca4c252a500311f54121 (MD5) TESE_AlgoritmoAgrupamentoDescontinuidades.pdf: 4101321 bytes, checksum: 68c6eec732bdc99941712e49b4cf8c3e (MD5) / Made available in DSpace on 2015-10-29T18:48:25Z (GMT). No. of bitstreams: 2 license_rdf: 19418 bytes, checksum: 6dde0d96f18aca4c252a500311f54121 (MD5) TESE_AlgoritmoAgrupamentoDescontinuidades.pdf: 4101321 bytes, checksum: 68c6eec732bdc99941712e49b4cf8c3e (MD5) Previous issue date: 2015 / O agrupamento de descontinuidades em famílias nem sempre é uma tarefa trivial, particularmente quando se utiliza apenas o diagrama de frequência de polos, método clássico. Este, em alguns casos, apresenta caráter subjetivo, uma vez que o tamanho da área da célula de contagem, a sobreposição entre os agrupamentos e a presença de outliers dificultam a definição visual das famílias. Nestes casos, é útil a aplicação de métodos numéricos em conjunto com o método clássico. Para isso, este trabalho propõe um algoritmo baseado no método Fuzzy K-means que permite agrupar as descontinuidades em famílias sem a influência das fontes de erro do método clássico. Além disso, o trabalho traz, como principais contribuições, um novo método de inicialização do Fuzzy K-means, fundamentado na distribuição de probabilidades de Fisher para dados esféricos, que torna o algoritmo insensível a escolha dos centros iniciais, adaptação de quatro medidas de validação do Espaço Euclidiano para o Espaço Esférico a fim de auxiliar na definição do número de famílias e critérios para identificação de outliers e da região de sobreposição. Os resultados do algoritmo se mostraram satisfatórios quando comparados ao método clássico e aos principais métodos numéricos, utilizando, como referência, cinco conjuntos de fraturas estudados na literatura e aplicados por diversos autores para validação das técnicas numéricas de agrupamento de descontinuidades. _______________________________________________________________________________ / ABSTRACT: The clustering of discontinuity sets is not always a trivial task, especially when only the pole density diagram is used, the classical method. This process is subjective once the size of the counting circle, the pole overlapping and the presence of outliers between families make difficult the definition of their characteristics. In these cases, it is useful to apply numerical and classical methods together. For that, this work proposes an algorithm based on the Fuzzy K-means method, that allows the clustering of the discontinuities into families without the influence of sources errors of the classical method. In addition, this work brings as major contributions, a new initialization method of the Fuzzy K-means, based on the Fisher’s probability distribution for spherical data, which makes the algorithm insensitive to the selection of initial centers, the adaptation of four validation measures from Euclidean Space to Spherical Space in order to help the definition of the number of families and criteria for identification of outliers and the pole overlapping region. The algorithm results were satisfactory compared to the classical method and the main numerical methods, using as reference five fracture sets studied in the literature and applied by various authors for validation of numerical techniques of discontinuity clustering. Conjuntos difusos Lógica simbólica e matemática Algoritmo de agrupamento Geotecnia - metodos numéricos
60	Análise de agrupamentos para o reconhecimento de padrões de infestação de aracnídeos em zonas urbanas Biazi, Angelo Henrique [UNESP] 04 March 2015 (has links) (PDF) Made available in DSpace on 2015-07-13T12:10:13Z (GMT). No. of bitstreams: 0 Previous issue date: 2015-03-04. Added 1 bitstream(s) on 2015-07-13T12:25:35Z : No. of bitstreams: 1 000837376.pdf: 584934 bytes, checksum: 3127c9a134e21a27580716c819f09a4c (MD5) / Os aracnídeos conseguiram sucesso ao longo do processo evolutivo graças à alta capacidade de adaptação. Dentro deste grupo, as aranhas e escorpiões apresentam ampla distribuição no planeta, e podem trazer problemas de saúde aos seres humanos. Para avaliar os problemas de infestação provocados por estes animais é necessário o uso de ferramentas estatísticas que possam aferir quais são os fatores que favorecem ou perpetuam a aparição, presença e proliferação destes animais. Desta forma, este trabalho tem como objetivo apresentar a Análise de Agrupamentos para determinar padrões de infestação, fazendo com que locais aparentemente distintos possam ser reunidos em grupos semelhantes o que pode trazer benefícios para políticas de saúde. Os 25 pontos geográficos de coleta utilizados na amostragem foram reunidos em seis grupos com características distintas, dentre os quais, três foram formados por um único ponto de coleta (outliers). Os grupos obtidos apresentaram relação entre os pontos que os formam e as características ambientais dos locais, demonstrando que a distribuição das famílias de aracnídeos nos diferentes gradientes urbanos é influenciada pelas condições do ambiente. Assim, a ocupação dos espaços urbanizados por aracnídeos peçonhentos torna-se um problema para a saúde pública, necessitando de políticas de controle epidemiológico através de monitoramento e mapeamento das áreas de risco que podem ser melhor avaliadas com o uso da Análise de Agrupamentos. Palavras chave: Aranha, Escorpião, Epidemiologia, Análise de Agrupamentos / Arachnids have been successful along the evolutionary process thanks to their high adaptability. Within this group, spiders and scorpions are widely distributed on the planet and may affect human health. In order to evaluate the infestation problems caused by these animals, it is necessary to use statistical tools that can assess the factors that favor or perpetuate their appearance, presence and proliferation. Thus, this work aims to present cluster analysis in order to determine infestation patterns, allowing seemingly distinct sites to be grouped into similar clusters, which can benefit health policies. The 25 geographic collection sites used for sampling were divided into six groups with different characteristics, among which three were formed by a single collection point (outliers). The groups obtained showed a relationship with the environmental characteristics of the sites, indicating that the distribution of arachnid families in the different urban gradients is influenced by environmental conditions. Therefore, the occupation of urbanized areas by venomous arachnids becomes a problem for public health, requiring epidemiological control policies through monitoring and mapping of risk areas, which can be better assessed with the use of cluster analysis Aracnideo Aranha Escorpião Análise por agrupamento Epidemiologia Cluster analysis

Search results