71 |
PathSim : um algoritmo para calcular a similaridade entre caminhos XML / PathSim: A XML path similarity algorithmVinson, Alexander Richard January 2007 (has links)
Algoritmos de similaridade que comparam dados expressos em XML são importantes em diversas aplicações que manipulam informações armazenadas nesse padrão. Sistemas de integração de dados XML e de consulta a instâncias XML são exemplos dessas aplicações. A utilização de funções de similaridade para efetuar as comparações nessas aplicações melhora seus resultados finais. A melhora ocorre porque as funções de similaridade possibilitam encontrar estruturas não idênticas às apresentadas nos parâmetros das consultas mas que armazenam informações relevantes. Uma característica importante que pode ser utilizada para definir se dois elementos XML representam o mesmo objeto real é os caminhos que chegam a estes elementos nas suas respectivas árvores. No entanto, os nodos que representam um determinado objeto real em duas instâncias XML diferentes podem se acessados por caminhos distintos, devido a opções de modelagem dos documentos. Portanto um algoritmo para calcular a similaridade entre caminhos XML é importante para as aplicações descritas acima. Neste contexto, esta dissertação objetiva desenvolver um algoritmo de similaridade entre caminhos XML. O resultado principal do trabalho é um algoritmo de similaridade entre caminhos XML, nomeado PathSim, que efetua o cálculo de similaridade entre dois caminhos baseado no número mínimo de operações de edição (inserção, remoção e substituição de nomes de elementos) necessárias para transformar um caminho no outro. Além deste algoritmo, foram desenvolvidas três funções de pré-processamento para simplificar os caminhos XML e melhoram os resultados do algoritmo. Adicionalmente, duas variações do algoritmo PathSim são apresentadas, uma incrementada com comparações entre combinações de nomes de elementos, nomeada PathSimC, e a outra auxiliada por técnicas de alinhamento, nomeada PathSimA. Experimentos utilizando documentos XML criados por terceiros, validam empiricamente os algoritmos PathSim e PathSimC.Nos experimentos, os algoritmos foram comparados a uma abordagem para mensurar a similaridade entre caminhos encontrada na literatura. Os algoritmos apresentam melhores resultados que o baseline. Os ganhos variam de acordo com o ambiente onde os caminhos foram extraídos e com as funções de pré-processamento que foram aplicadas aos caminhos. / Similarity algorithms for comparing XML data are important in various applications that manipulate information stored according to this standard. XML data integration systems and XML instance querying systems are examples of such applications. The use of similarity functions to evaluate comparisons in these applications improves their final results. The improvement occurs because similarity functions allow finding structures that are not identical to the query parameter but store relevant information. One important feature that may be used to define if two XML elements represent the same real world object is the paths that lead to those objects in their corresponding trees. However, the nodes that represent a specific real world object in two different XML instances may be accessed by distinct paths, due to XML design decisions. Thus a method for assessing the similarity of XML paths is important in the applications described above. In this context, the goal of this dissertation is to develop a XML path similarity algorithm. The main contribution of this work is a XML path similarity algorithm, named Path- Sim, that calculates the similarity between two paths by computing the minimum number of edit operations (element name insertions, deletions and substitutions) required to transform one path into another. Besides the algorithm, three preprocessing functions were developed to simplify XML paths and improve the results of the algorithm. Additionally, two variations of PathSim algorithm are presented, one enhanced with comparisons among combinations of element names, named PathSimC, and the other one assisted by alignment techniques, named PathSimA. Experiments using XML documents created by third parties validate the algorithms PathSim and PathSimC empirically. On the experiments, the algorithms are compared to a path similarity algorithm found in the literature. The proposed algorithms presents better results than the baseline. The gains vary according to the environment from which the paths were extracted and to the preprocessing functions applied.
|
72 |
[en] CONCEPTUAL SCHEMA MATCHING BASED ON SIMILARITY HEURISTICS / [pt] ALINHAMENTO DE ESQUEMAS CONCEITUAIS BASEADO EM HEURÍSTICAS DE SIMILARIDADELUIZ ANDRE PORTES PAES LEME 07 January 2016 (has links)
[pt] Alinhamento de esquema é uma questão fundamental em aplicações de banco de dados, tais como mediação de consultas, integração de banco de dados e armazéns de dados. Nesta tese, abordamos inicialmente o alinhamento de catálogos. Um catálogo é um banco de dados simples que contém informações sobre conjuntos de objetos, tipicamente classificados usando-se termos de um dado tesauro. Inicialmente apresentamos uma técnica de alinhamento baseada na noção de similaridade, que se aplica a pares de tesauros e de listas de propriedades. Descrevemos, então, o alinhamento baseado na noção de informação mútua e introduzimos variações que exploram certas heurísticas. Ao final, discutimos resultados experimentais que avaliam a precisão do método e comparam a influência das heurísticas. Após as técnicas para alinhamento de catálogos, nos concentramos no problema mais complexo de alinhamento de dois esquemas descritos em um subconjunto de OWL. Adotamos uma técnica baseada em instâncias e, por isso, assumimos que conjuntos de instâncias de cada esquema estão disponíveis. Decompomos este problema nos subproblemas de alinhamento de vocabulário e de alinhamento de conceitos. Introduzimos também condições suficientes para garantir que o alinhamento de vocabulário induz um alinhamento de conceitos correto. Em seguida, descrevemos uma técnica de alinhamento de esquemas OWL baseada no conceito de similaridade. Finalmente, avaliamos a precisão da técnica usando dados disponíveis na Web. De forma diferente de outras técnicas anteriores baseadas em instâncias, o processo de alinhamento que descrevemos usa funções de similaridade para induzir alinhamento de vocabulários de uma forma não trivial. Ilustramos, também, que a estrutura de esquemas OWL pode nos levar a mapeamentos de conceitos errados e indicamos como evitar tais problemas. / [en] Schema matching is a fundamental issue in many database applications, such as query mediation, database integration, catalog matching and data warehousing. In this thesis, we first address hot to match catalogue schemas. A catalogue is a simple database that holds information about a set of objects, typically classified using terms taken from a given thesaurus. We introduce a matching approach, based on the notion of similarity, which applies to pairs of thesauri and to pairs of lists of properties. We then describe matchings based on cooccurrence of information and introduce variations that explore certain heuristics. Lastly, we discuss experimental results that evaluate the precision of the matchings introduced and that measure the influence of the heuristics. We then focus on the mre complex problem of matching two schemas that belong to an expressive OWL dialect. We adopt an instance-based approach and, therefore, assume that a set of instances from each schema is available. We first decompose the problem of OWL schema matching into the problem of vocabulary matching and the problem of concept mapping. We also introduce sufficient conditions guaranteeing that a vocabulary matching induces a correct concept mapping. Next, we describe OWL schema matching technique based on the notion of similarity. Lastly, we evaluate the precision of the technique using data available on the Web. Unlike any of the previous instance-based techniques, the matching process we describe uses similarity functions to induce vocabulary matchings in a non-trivial, coping with an expressive OWL dialect. We also illustrate, through a set of examples, that the structure of OWL schemas may lead to incorrect concept mappings and indicate how to avoid such pitfalls.
|
73 |
Diversidade microbiana em substratos descartados durante as fases do processo de produ??o de mudas clonais de eucaliptoSantos, Luana Martins dos January 2016 (has links)
Data de aprova??o ausente. / Submitted by Jos? Henrique Henrique (jose.neves@ufvjm.edu.br) on 2017-06-08T22:19:37Z
No. of bitstreams: 2
luana_martins_santos.pdf: 1170564 bytes, checksum: 215e11cc17c654f8760cc6085cca3464 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Rodrigo Martins Cruz (rodrigo.cruz@ufvjm.edu.br) on 2017-06-22T15:18:34Z (GMT) No. of bitstreams: 2
luana_martins_santos.pdf: 1170564 bytes, checksum: 215e11cc17c654f8760cc6085cca3464 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2017-06-22T15:18:34Z (GMT). No. of bitstreams: 2
luana_martins_santos.pdf: 1170564 bytes, checksum: 215e11cc17c654f8760cc6085cca3464 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2016 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior (CAPES) / A produ??o de muda ? uma etapa primordial e decisiva para a implanta??o de uma floresta. No entanto, devido a diversos fatores de ordem t?cnica, as perdas no setor de produ??o s?o bastante relevantes. Dentre estes fatores est? o descarte do substrato, que quando feito de forma err?nea favorece a prolifera??o de micro-organismos fitopatog?nicos em viveiro. Isso pode desencadear em perdas significativas e ainda se tornar um passivo ambiental. Raramente o substrato ? reutilizado nos viveiros comerciais, uma vez que presume-se que as caracter?sticas f?sica, qu?mica e biol?gicas formam perdidas durante a produ??o das mudas. Contudo, h? poucos estudos sobre micro-organismos em substratos. A import?ncia deste estudo fundamenta-se na escassez de pesquisa sobre essa problem?tica que afeta o setor de produ??o de mudas, bem como buscar alternativas sustent?veis que pressup?e a demanda de uso desse insumo. A aplica??o de t?cnicas moleculares vem sendo empregadas para detectar e identificar os micro-organismos em diversos ambientes. Neste contexto, o objetivo deste estudo foi detectar a diversidade microbiol?gica em amostras de substratos descartados pela t?cnica de PCR-RFLP. Foram coletados dez amostras de substratos em diferentes viveiros no estado de Minas Gerais em diferentes fases de produ??o e estado de tecnifica??o. O DNA gen?mico total foi extra?do e amplificado pela t?cnica de PCR com oligonucleot?deos espec?ficos para fungos, bact?ria e archaea. Os produtos amplificados foram submetidos ? clivagem com enzimas de restri??o HaeIII, BamHI, TaqI e HindIII, para detec??o de poss?veis polimorfismos entre as amostras por meio da t?cnica de PCR-RFLP. Foi poss?vel verificar diferen?as entre as amostras de substratos, tanto em rela??o ao tamanho da regi?o do DNA amplificada, bem como em rela??o ? presen?a de s?tios de restri??o. Com base no ?ndice de similaridade, detectou-se uma maior varia??o da diversidade dentro da amostra em diferentes fases do que nas amostras entre os diferentes viveiros. Portanto, estes resultados podem ser relevantes para o conhecimento da diversidade microbiol?gica em substrato. Por?m mais estudos se fazem necess?rios para maior compreens?o destes micro-organismos e sua fun??o no substrato. / Disserta??o (Mestrado) ? Programa de P?s-Gradua??o em Ci?ncia Florestal, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2016. / The production of changes is a crucial and decisive step for the implementation of a forest.
However, due to several technical factors, losses in the production sector are quite relevant. Among
these factors is the disposal of substrate, which when done wrongly favors the proliferation of
phytopathogenic microorganisms in nursery. This can trigger significant losses and still become a environmental liabilities. Rarely the substrate is reused in commercial nurseries, since it is assumed that the physical, chemical and biological characteristics were lost during the production of seedlings. However, there are few studies on microorganisms on substrates. The importance of this study is based on the scarcity of research on this issue that affects the production of seedlings, as well as seek sustainable alternatives that assumes the use of this raw material demand. The application of molecular techniques have been employed to detect and identify microorganisms in various environments. In this context, the objective of this study was to detect microbiological diversity in substrate samples dropped by PCR-RFLP technique. Ten samples were collected of substrates in different nurseries in the State of Minas Gerais in different stages of production and State of modern farms. Total genomic DNA was extracted and amplified by the PCR technique with specific oligonucleotides to fungi, bacteria and archaea. The amplified products were submitted to cleavage with HaeIII restriction enzymes, BamHI, HindIII, and TaqI for detection of possible polymorphisms between the samples by PCR-RFLP technique. It was possible to check differences between samples of substrates, both in relation to the size of the amplified DNA region as well as in relation to the presence of restriction sites. Based on the index of similarity, if a greater variation of diversity within the sample at different stages than in samples between different nurseries. Therefore, these results may be relevant to the knowledge of microbiological diversity in substrate. However more studies are needed to better understanding of these microorganisms and their role in the substrate.
|
74 |
Avaliação da qualidade de funções de similaridade no contexto de consultas por abrangência / Quality evaluation of similarity functions for range queriesStasiu, Raquel Kolitski January 2007 (has links)
Em sistemas reais, os dados armazenados tipicamente apresentam inconsistências causadas por erros de gra a, abreviações, caracteres trocados, entre outros. Isto faz com que diferentes representações do mesmo objeto do mundo real sejam registrados como elementos distintos, causando um problema no momento de consultar os dados. Portanto, o problema investigado nesta tese refere-se às consultas por abrangência, que procuram encontrar objetos que representam o mesmo objeto real consultado . Esse tipo de consulta não pode ser processado por coincidência exata, necessitando de um mecanismo de consulta com suporte à similaridade. Para cada consulta submetida a uma determinada coleção, a função de similaridade produz um ranking dos elementos dessa coleção ordenados pelo valor de similaridade entre cada elemento e o objeto consulta. Como somente os elementos que são variações do objeto consulta são relevantes e deveriam ser retornados, é necessário o uso de um limiar para delimitar o resultado. O primeiro desa o das consultas por abrangência é a de nição do limiar. Geralmente é o especialista humano que faz a estimativa manualmente através da identi - cação de elementos relevantes e irrelevantes para cada consulta e em seguida, utiliza uma medida como revocação e precisão (R&P). A alta dependência do especialista humano di culta o uso de consultas por abrangência na prática, principalmente em grandes coleções. Por esta razão, o método apresentado nesta tese tem por objetivo estimar R&P para vários limiares com baixa dependência do especialista humano. Como um sub-produto do método, também é possível selecionar o limiar mais adequado para uma função sobre uma determinada coleção. Considerando que as funções de similaridade são imperfeitas e que apresentam níveis diferentes de qualidade, é necessário avaliar a função de similaridade para cada coleção, pois o resultado é dependente dos dados. Um limiar para uma coleção pode ser totalmente inadequado para outra coleção, embora utilizando a mesma função de similaridade. Como forma de medir a qualidade de funções de similaridade no contexto de consultas por abrangência, esta tese apresenta a discernibilidade. Trata-se de uma medida que de ne a habilidade da função de similaridade de separar elementos relevantes e irrelevantes. Comparando com a precisão média, a discernibilidade captura variações que não são percebidas pela precisão média, o que mostra que a discernibilidade é mais apropriada para consultas por abrangência. Uma extensa avaliação experimental usando dados reais mostra a viabilidade tanto do método de estimativas como da medida de discernibilidade para consultas por abrangência. / In real systems, stored data typically have inconsistencies caused by typing errors, abbreviations, transposed characters, amongst others. For this reason, di erent representations of the same real world object are stored as distinct elements, causing problems during query processing. In this sense, this thesis investigates range queries which nd objects that represent the same real world object being queried . This type of query cannot be processed by exact matching, thus requiring the support for querying by similarity. For each query submitted to a given collection, the similarity function produces a ranked list of all elements in this collection. This ranked list is sorted decreasingly by the similarity score value with the query object. Only the variations of the query object should be part of the result as only those items are relevant. For this reason, it is necessary to apply a threshold value to properly split the ranking. The rst challenge of range queries is the de nition of a proper threshold. Usually, a human specialist makes the estimation manually through the identi cation of relevant and irrelevant elements for each query. Then, he/she uses measures such as recall and precision (R&P). The high dependency on the human specialist is the main di culty related to use of range queries in real situations, specially for large collections. In this sense, the method presented in this thesis has the objective of estimating R&P at several thresholds with low human intervention. As a by-product of this method, it is possible to select the optimal threshold for a similarity function in a given collection. Considering the fact that the similarity functions are imperfect and vary in quality, it is necessary to evaluate the similarity function for each collection as the result is domain dependent. A threshold value for a collection could be totally inappropriate for another, even though the same similarity function is applied. As a measure of quality of similarity functions for range queries, this thesis introduces discernability. This is a measure to quantify the ability of the similarity function in separating relevant and irrelevant elements. Comparing discernability and mean average precision, the rst one can capture variations that are not noticed by precision-based measures. This property shows that discernability presents better results for evaluating similarity functions for range queries. An extended experimental evaluation using real data shows the viability of both, the estimation method and the discernability measure, applied to range queries.
|
75 |
Automatizando o processo de estimativa de revocação e precisão de funções de similaridade / Automatizing the process of estimating recall and precision of similarity functionsSantos, Juliana Bonato dos January 2008 (has links)
Os mecanismos tradicionais de consulta a bases de dados, que utilizam o critério de igualdade, têm se tornado ineficazes quando os dados armazenados possuem variações tanto ortográficas quanto de formato. Nesses casos, torna-se necessário o uso de funções de similaridade ao invés dos operadores booleanos. Os mecanismos de consulta por similaridade retornam um ranking de elementos ordenados pelo seu valor de similaridade em relação ao objeto consultado. Para delimitar os elementos desse ranking que efetivamente fazem parte do resultado pode-se utilizar um limiar de similaridade. Entretanto, a definição do limiar de similaridade adequado é complexa, visto que este valor varia de acordo com a função de similaridade usada e a semântica dos dados consultados. Uma das formas de auxiliar na definição do limiar adequado é avaliar a qualidade do resultado de consultas que utilizam funções de similaridade para diferentes limiares sobre uma amostra da coleção de dados. Este trabalho apresenta um método automático de estimativa da qualidade de funções de similaridade através de medidas de revocação e precisão computadas para diferentes limiares. Os resultados obtidos a partir da aplicação desse método podem ser utilizados como metadados e, a partir dos requisitos de uma aplicação específica, auxiliar na definição do limiar mais adequado. Este processo automático utiliza métodos de agrupamento por similaridade, bem como medidas para validar os grupos formados por esses métodos, para eliminar a intervenção humana durante a estimativa de valores de revocação e precisão. / Traditional database query mechanisms, which use the equality criterion, have become inefficient when the stored data have spelling and format variations. In such cases, it's necessary to use similarity functions instead of boolean operators. Query mechanisms that use similarity functions return a ranking of elements ordered by their score in relation to the query object. To define the relevant elements that must be returned in this ranking, a threshold value can be used. However, the definition of the appropriated threshold value is complex, because it depends on the similarity function used and the semantics of the queried data. One way to help to choose an appropriate threshold is to evaluate the quality of similarity functions results using different thresholds values on a database sample. This work presents an automatic method to estimate the quality of similarity functions through recall and precision measures computed for different thresholds. The results obtained by this method can be used as metadata and, through the requirements of an specific application, assist in setting the appropriated threshold value. This process uses clustering methods and cluster validity measures to eliminate human intervention during the process of estimating recall and precision.
|
76 |
Impacto da resolução de atributos funcionais de hábito alimentar em padrões de diversidade funcional das assembleias de peixes tropicais / Impact of resolution of functional attributes of eating habits in functional diversity patterns of meetings of tropical fishFirmiano, Luana Paula Santos da silva 23 June 2016 (has links)
Community descriptors based on attributes have been widely used to make inferences about mounting rules in a community. The level of discrimination used to identify attributes (resolution) influence the estimates of diversity at the community level. Thus, the practical decisions about how the attributes are measured may have repercussions on the patterns of diversity and its correlation with forecast variables. We have developed a framework to evaluate: i) how much information is lost when the resolution on the measurement of performance is reduced, and; II) to what extent the morphological characteristics and phylogeny can be used as a substitute for strategy. We tested also the resolution on the measurement of attributes affects the ability to discriminate different functional diversity marine habitats. We used empirical data from the community of marine fish and correlate with the array of more detailed resolution diet (proportion of food items in the stomach contents of the collected specimens) with matrices (for par) on different resolutions of diet (trophic array based on secondary data; in primary data; primary data of presence and absence of diet food items; primary data as the 0 , 1 and 2 according to itensde foods of importance), eco-morphology and phylogeny. We will then use a functional diversity index (FD) between three regions (influenced by the reef, lagoon and estuary) using different resolutions of attributes, phylogeny and ecomorphology. Phylogeny and ecomorfológicas characteristics were not correlated with the food strategy of the species. However, there was a strong correlation (0.7) between maximum resolution and diet data obtained at the expense of lower resolutions data. Significantly, the resolution was the only one able to discriminate different tropical habitats. These results do not support the use of substitutes for trophic characteristics and highlights the importance the resolution of trophic attributes as a measure to be considered in studies of functional diversity. / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Descritores da comunidade baseada em atributos têm sido amplamente utilizados
para fazer inferências sobre regras de montagem em uma comunidade. O nível de
discriminação usado para identificar atributos (resolução) influencia as estimativas
de diversidade ao nível da comunidade. Assim, as decisões práticas sobre como os atributos serão medidos pode ter consequências sobre os padrões de diversidade e sua correlação com variáveis de previsão. Nós desenvolvemos um framework para avaliar: i) quanta informação é perdida quando a resolução na medição de características funcionais é reduzida, e; ii) até que ponto as características morfológicas e filogenia podem ser usados como substitutos de estratégia de alimentação. Nós testamos também se a resolução na medição de atributos afeta a capacidade da diversidade funcional em discriminar diferentes habitats marinhos. Foram utilizados dados empíricos da comunidade de peixes marinhos e correlacionamos com a matriz da resolução mais detalhada de dieta (proporção de itens alimentares no conteúdo estomacal dos exemplares coletados) com as matrizes (par a par) em diferentes resoluções da dieta (matriz trófica com base em dados secundários; em dados primários; dados primários de dieta com presença e ausência de itens alimentares; dados primários como a 0, 1 e 2 de acordo com itensde alimentos de importância), ecomorfologia e filogenia. Nós, então, utilizamos um índice de diversidade funcional (FD) entre três regiões marinhas (influenciado pelo recife, lagoa e estuário) usando diferentes resoluções de atributos, filogenia e ecomorfologia. Filogenia e características ecomorfológicas não foram correlacionadas com a estratégia alimentar das espécies. No entanto, houve uma forte correlação (0,7) entre resolução máxima e dieta obtida por dados, em detrimento a dados de resoluções mais baixas. Significativamente, a resolução foi a única capaz de discriminar diferentes habitats tropicais. Esses resultados não
suportam o uso de substitutos para características tróficas e destaca a importância
da resolução de atributos tróficos como medida a ser considerada em estudos de
diversidade funcional.
|
77 |
Oscilação genética e comparação de métodos de seleção tradicionais e associados a marcadores moleculares / Genetic drift and traditional selection methods comparison and associated to molecular markersCarneiro, Paulo Luiz Souza 05 July 2002 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2017-05-10T16:17:20Z
No. of bitstreams: 1
texto completo.pdf: 4372950 bytes, checksum: 0fa4d8beeadcf2be448d4d389bde28b9 (MD5) / Made available in DSpace on 2017-05-10T16:17:20Z (GMT). No. of bitstreams: 1
texto completo.pdf: 4372950 bytes, checksum: 0fa4d8beeadcf2be448d4d389bde28b9 (MD5)
Previous issue date: 2002-07-05 / Para avaliar o efeito da oscilação genética em populações sob seleção com diferentes tamanhos efetivos e comparar a seleção utilizando os valores genéticos preditos pelo BLUP Clássico, que utiliza matriz de parentesco calculada através dos coeficientes de parentesco, e o BLUP Marcadores, que utiliza matriz de similaridade genética calculada por meio de marcadores moleculares, foram simulados dados utilizando-se o programa GENESYS. A partir de um genoma de 2000 centimorgans de comprimento, constituído por 15 pares de cromossomos autossômicos, com 200 locos quantitativos polialélicos (8 alelos), e permitindo apenas efeitos aditivos dos genes, simulou-se uma população-base, com uma única característica quantitativa com herdabilidade 0,10. A partir desta população foi construída uma população inicial e em seguida foram formadas as populações de seleção, num total de seis, correspondendo a dois tamanhos efetivos de população (18,18 e 66,66) e três sistemas de acasalamento dos reprodutores selecionados para reprodução (Reprodutores Acasalados Aleatoriamente, Exclusão de Irmãos Completos e Exclusão de Irmãos Completos e Meio-Irmãos). A seleção foi praticada durante 20 gerações consecutivas, com base na Seleção Individual (SI), nos valores genéticos preditos pelo BLUP Clássico (BLUP) e pelo BLUP Marcadores (BLUPM) com 1, 10 e 30 repetições. Para se obter a matriz de similaridade genética utilizada no BLUP Marcadores foram usados 100 marcadores moleculares do tipo microssatélite (SSR – Simple Sequence Repeat), por meio de um coeficiente de similaridade correspondente à distância euclideana média para dados quantitativos. Para avaliar os efeitos da oscilação genética, nas diferentes estruturas de populações sob seleção, utilizou-se o valor fenotípico nos diferentes tamanhos efetivos, número de repetições e sistemas de acasalamento. Já para comparar os diferentes métodos de seleção utilizou-se apenas as populações com tamanho efetivo de 66,66 e média de 30 repetições, avaliando-se os seguintes parâmetros: valor fenotípico médio, endogamia média, perdas e ganhos pela fixação de alelos desfavoráveis e favoráveis, variância genética aditiva e limite da seleção. Observou-se grande variação nos valores fenotípicos obtidos pelos métodos ao longo das 20 gerações de seleção em função da oscilação genética, principalmente para a seleção baseada nos valores genéticos preditos pelo BLUP e BLUPM, e para as populações com tamanho efetivo menor (18,18). Este fato sugere que em programas de melhoramento, independente do método de seleção, os resultados são grandemente influenciados pela oscilação genética, que é responsável por grandes variações nos ganhos genéticos, e que em estudos de comparação de metodologias de seleção, utilizando simulação, deve-se trabalhar com a média de grande número de repetições. No estudo de comparação dos métodos de seleção, observou-se que os ganhos obtidos ao longo das 20 gerações de seleção foi maior para o BLUP em relação ao BLUPM, e este foi superior à SI. Entretanto, quando se considerou o ganho obtido apenas nas cinco primeiras gerações, o BLUPM apresentou ganhos semelhantes ao BLUP e estes superiores à SI. A fixação de alelos aumentou ao longo das 20 gerações, independente do método de seleção, provocando aumento da endogamia, redução na variância genética aditiva e redução no limite da seleção. A SI levou a menores taxas de fixação de alelos e o BLUPM e o BLUP foram os que apresentaram maiores taxas de fixação de alelos. A partir da sexta geração o BLUPM passou a fixar mais alelos desfavoráveis que o BLUP, prejudicando sua eficiência em promover ganhos genéticos. Os diferentes sistemas de acasalamento dos reprodutores selecionados não levaram a grandes diferenças em ganho genético para os métodos baseados no BLUP ao longo das 20 gerações de seleção. Com relação à endogamia média, os sistemas que excluem o acasalamento entre irmãos, ou seja, os tipos de acasalamento de mínimo parentesco, proporcionaram menores taxas. / Data were simulated using Genesys program to evaluate genetic drift effects on populations under selection with different effective sizes and to compare selection using genetic values predicted by classical BLUP, and BLUP markers that utilizes genetic similarity matrix calculated by molecular markers. It was simulated a one trait base population, considering only additive gene effects, with heritability value of 0,10, from a 2000 centimorgans length genome constituted by 15 pairs of autosomic chomosomes, with 200 polialelic quantitative loci (8 alleles) . Fom this population it was built na initial population and then, six selection populations with two effective population sizes (18,8 and 66,66) and three different mating systems for selected bulls: random mating, full sibs excluded, half-sibs excluded.Selection was practised for 20 generations based on individual selection (IS), on predicted genetic values (BLUP) and on BLUP markers (BLUPM), with 1, 10 and 30 replicates.The similarity genetic matrix was obtained by considering 100 molecular markers of microsatelite type (SSR – Simple Sequence Repeat), through a similarity coefficient correspondent to an average euclydiane distance for quantitative traits. To evaluate genetic drift effects in the different population structures under selection, it was used the phenotypic values in the different effective sizes, replicate numbers and mating systems. To compare different selection methods, only effective populations size of 66,66 and an average of 30 replicates were used. The following parameters were estimated: average phenotypic value, average inbreeding, gains and losses due to fixation of favorable and unfavorable alleles, additive genetic variance and selection limit. For 20 generations, it was observed, due to genetic drift, a great difference in phenotypic values obtained by the three different methods, mainly for selection based on breeding values predicted by BLUP and BLUPM, and for populations with smaller effective size (18,18). This suggests that in genetic improvement programs, independent of selection methods, genetic drift effects are important and that when comparing selection methodologies by simulated data the average of a great number of replicates must be used. In the selection method comparison it was observed that genetic gains, in twenty generations of selection, were greater for BLUP than for BLUPM and this one was superior to IS. BLUP and BLUPM had similar gains when it was considered only the fisrt five generations of selection. Alleles fixation increased along the twenty generations no matter which selection method was considered, resulting in an increased inbreeding, a reduction in the additive genetic variance and in the selection limit. Individual selection presented the smallest rates of allele fixation. From the sixth generation on, more unfavorable alleles were fixed by BLUPM than by BLUP, decreasing its efficiency in promoting genetic gains. When selection was based on BLUP, in 20 generations of selection studied, there were no great differences among the different mating systems. Systems that excluded full sibs matings presented the smallest rates of average inbreeding. / Tese importada do Alexandria
|
78 |
Florística e fitossociologia do estrato arbóreo de Floresta Atlântica interiorana, Araponga, Minas Gerais / Floristic and phytosociology of the arboreus stratum of inland Atlantic Forest, Araponga, Minas GeraisSoares, Michellia Pereira 18 February 2005 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-10-18T15:53:42Z
No. of bitstreams: 1
texto completo.pdf: 1056784 bytes, checksum: 20ea082eb41160aadba166ee8bfb38fb (MD5) / Made available in DSpace on 2016-10-18T15:53:42Z (GMT). No. of bitstreams: 1
texto completo.pdf: 1056784 bytes, checksum: 20ea082eb41160aadba166ee8bfb38fb (MD5)
Previous issue date: 2005-02-18 / A Serra do Brigadeiro faz parte do complexo da Mantiqueira, que, juntamente com a Serra do Mar, detêm grandes áreas dos remanescentes da Mata Atlântica. O ecoturismo é muito explorado na região por meio de trilhas. Os objetivos deste trabalho foram determinar a composição florística e estrutura de um fragmento de Floresta Atlântica interiorana e analisar a sua similaridade com outras áreas de Floresta Estacional Semidecidual Montana e Floresta Ombrófila Densa, com o intuito de classificar a tipologia florestal da área de estudo. Com os resultados obtidos e as observações realizadas durante as visitas ao local foram feitas recomendações para o uso e a conservação da trilha estudada. O presente trabalho foi realizado em uma trilha interpretativa na Pousada Serra D’Água (20o41'23.5”S e 42o29’46.7”W, 1100 m de altitude), região de entorno do Parque Estadual da Serra do Brigadeiro (PESB), município de Araponga, Minas Gerais. Foram alocados 150 pontos quadrantes perfazendo uma área amostral de 0,344 ha. O critério de inclusão utilizado foi de CAP > 15 cm. O índice de diversidade (H’) obtido foi de 4,377 e a equabilidade (J’) ficou em 0,877, indicando uma alta heterogeneidade da comunidade. Os 600 indivíduos amostrados foram distribuídos em 147 espécies, 98 gêneros e 50 famílias. As famílias com maior número de espécies foram: Melastomataceae (14), Leguminosae (11), Myrtaceae (10), Rubiaceae (8), Annonaceae (7), Flacourtiaceae (7), Lauraceae (7) e Meliaceae (6). As famílias que se destacaram quanto ao valor de importância (VI) foram: Euphorbiaceae, Rubiaceae, Vochysiaceae e Melastomataceae. Das espécies amostradas, a mais importante foi Alchornea triplinervia, seguida por Callisthene minor, Sapium glandulatum, Hieronyma alchorneoides, Cariniana estrellensis e Alsophila setosa. A análise de agrupamento demonstrou que o fragmento estudado apresenta alta similaridade florística com as Florestas Estacionais Semideciduais podendo ser classificada nessa mesma tipologia. Com os resultados da composição florística e estrutura fitossociológica do local, as informações repassadas aos turistas terão além do conhecimento popular o conhecimento teórico-científico. A qualidade da visitação poderá ainda ser maximizada seguindo-se as recomendações propostas como a construção de escadas e a fixação de placas ao longo do trajeto. / The Serra do Brigadeiro is part of the Mantiqueira mountains complex that together with the Serra do Mar holds great areas of Atlantic Forest remaining. The ecologic tourism is mainly made by means of trails. The objectives of this work was to determine the floristic composition and the structure of a Semideciduous Seasonal Forest fragment and to analyse its similarity with other areas of the Semideciduous Seasonal Forest and Dense Ombrophylous Forest, to classify the forest typology of this area. With the results obtained and the observations made during the visitations recommendations were made for the use and conservation of the trail studied. This work was done in an interpretative trail at the Pousada Serra D’Água (20o41'23.5”S e 42o29’46.7”W, 1100 m de altitude), in the region around of the Serra do Brigadeiro State Park (PESB), in the municipality of Araponga, Minas Gerais. A total of 150 quarter-centered points were established summing up a sampling area of 0,344 ha. The inclusion criterion used was of CBH > 15 cm. The diversity index obtained was of 4,377 and equability was of 0,877, indicating a high heterogeneity of the community. The 600 individuals sampled were distributed into 147 species, 98 geners and 50 families. The families with the greatest number of species were: Melastomataceae (14), Leguminosae (11), Myrtaceae (10), Rubiaceae (8), Annonaceae (7), Flacourtiaceae (7), Lauraceae (7) and Meliaceae (6). The families which outstood in importance value (VI) were: Euphorbiaceae, Rubiaceae, Vochysiaceae and Melastomataceae. For the species sampled, the most important was Alchornea triplinervia, followed by Callisthene minor, Sapium glandulatum, Hieronyma alchorneoides, Cariniana estrellensis and Alsophila setosa. The cluster analysis showed that the fragment studied shows high similarity with the Semideciduous Seasonal Forests can classified into this typology. With the results of floristic composition and phytosociologic structure of the forest, the information given to the tourist will contain popular and theoretic-scientific knowledge. The quality of visitation can be improved still further if the maintenance of the trail is followed such as building ladders and manufacturing plates along the path. / Dissertação importada do Alexandria
|
79 |
Métodos espectrais de agrupamento / Spectral clustering methodsDeise Mara Barbosa de Almeida 13 February 2012 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Os métodos espectrais são ferramentas úteis na análise de dados, sendo capazes de
fornecer informações sobre a estrutura organizacional de dados. O agrupamento de dados
utilizando métodos espectrais é comumente baseado em relações de similaridade definida
entre os dados. O objetivo deste trabalho é estudar a capacidade de agrupamento de métodos
espectrais e seu comportamento, em casos limites. Considera-se um conjunto de pontos no
plano e usa-se a similaridade entre os nós como sendo o inverso da distância Euclidiana.
Analisa-se a qual distância mínima, entre dois pontos centrais, o agrupamento espectral é
capaz de reagrupar os dados em dois grupos distintos. Acessoriamente, estuda-se a capacidade
de reagrupamento caso a dispersão entre os dados seja aumentada. Inicialmente foram
realizados experimentos considerando uma distância fixa entre dois pontos, a partir dos quais
os dados são gerados e, então, reduziu-se a distância entre estes pontos até que o método se
tornasse incapaz de efetuar a separação dos pontos em dois grupos distintos. Em seguida,
retomada a distância inicial, os dados foram gerados a partir da adição de uma perturbação
normal, com variância crescente, e observou-se até que valor de variância o método fez a
separação dos dados em dois grupos distintos de forma correta. A partir de um conjunto de
pontos obtidos com a execução do algoritmo de evolução diferencial, para resolver um
problema multimodal, testa-se a capacidade do método em separar os indivíduos em grupos
diferentes.
|
80 |
BORBOLETAS FRUGÍVORAS (LEPIDOPTERA: NYMPHALIDAE) EM FLORESTAS DE MATA ATLÂNTICA DO PARQUE NACIONAL DO IGUAÇU, PARANÁ, BRASIL / FRUIT-FEEDING BUTTERFLIES (LEPIDOPTERA: NYMPHALIDAE) IN ATLANTIC FORESTS OF IGUASSU NATIONAL PARK, PARANA, BRAZILGraciotim, Camila 28 March 2014 (has links)
Faunal studies, used as the main building blocks for conservation practices, have potential importance in minimizing environmental impacts. From this, this study sought to analyze the community of fruit-feeding butterflies of the Semideciduous Forest and Araucaria Forest of Iguassu National Park, promoting the comparison of composition, richness, abundance, dominance and similarity of the assemblages as their association with environmental descriptors evaluated in each phytophysiognomy. Field work was carried out monthly between November 2012 and May 2013, using Van Someren-Rydon traps with bait consisting of mashed banana in fermented sugarcane juice. In each phytophysiognomy, we used 15 traps in pre-defined transects that were revised each 24 h during five days per sampling occasion. At the end of six samplings and 900 traps/day as total effort, 1,127 individuals representing 69 species and four subfamilies of fruit-feeding butterflies were recorded. The sampled richness was lower than the Jacknife 1 and Bootstrap estimated values, indicating the importance of increasing the sampling effort. Satyrinae was the subfamily with greater richness and abundance in both areas. Among the total species registered, 11 were new records for the Iguassu National Park. Ordination analysis showed a low segregation of assemblages composition and a difference of 27.2 % between them. The influence of environmental descriptors showed that the set of variables: light, canopy cover and number of trees were the most important in structuring the assemblages of frugivorous butterflies sampled. The obtained results shall provide subsidies for a better knowledge of the diversity of the Atlantic Forest butterflies, contributing to the Management Plan of the Iguassu National Park. / Estudos de fauna, utilizados como principais alicerces para as práticas conservacionistas, são de importância potencial na minimização de impactos ambientais. A partir disso, este estudo buscou analisar a comunidade de borboletas frugívoras da Floresta Estacional Semidecídua e Floresta Ombrófila Mista do Parque Nacional do Iguaçu, promovendo a comparação da composição, riqueza, abundância, dominância e similaridade das assembléias, assim como sua associação com descritores ambientais avaliados em cada fitofisionomia. Para isso, foram realizadas amostragens mensais entre novembro de 2012 e maio de 2013, através de armadilhas atrativas do tipo Van Someren-Rydon com isca constituída de banana amassada fermentada em caldo de cana. Em cada fitofisionomia, utilizaram-se 15 armadilhas em transectos pré-definidos, revisadas a cada 24 h ao longo de cinco dias por ocasião amostral. Ao final de seis ocasiões amostrais, com esforço total de 900 armadilhas/dia, foram registrados 1.127 indivíduos pertencentes a 69 espécies e quatro subfamílias de borboletas frugívoras. A riqueza amostrada apresentou-se abaixo do valor estimado pelos estimadores Jacknife 1 e Bootstrap, indicando a importância de esforço amostral maior. Satyrinae foi a subfamília com maior riqueza e abundância em ambas as fitofisionomias. Dentre o total das espécies registradas, 11 constituíram-se em novos registros para o Parque Nacional do Iguaçu. A análise de ordenação mostrou baixa segregação quanto à composição das assembleias e uma diferença de 27,2% entre as mesmas. A influência dos descritores ambientais mostrou que o conjunto de variáveis: luminosidade, cobertura de dossel e número de árvores foram os mais importantes na estruturação das assembleias de borboletas frugívoras amostradas. Os resultados encontrados poderão fornecer subsídios para um melhor conhecimento da diversidade de borboletas da Mata Atlântica, contribuindo para o Plano de Manejo do Parque Nacional do Iguaçu.
|
Page generated in 0.0726 seconds