• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 606
  • 285
  • 85
  • 61
  • 40
  • 18
  • 17
  • 16
  • 16
  • 16
  • 15
  • 12
  • 6
  • 5
  • 5
  • Tagged with
  • 1351
  • 236
  • 168
  • 164
  • 140
  • 125
  • 110
  • 109
  • 103
  • 94
  • 91
  • 90
  • 89
  • 82
  • 81
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
771

Análise da evolução temporal de dados métricos

Fogaça, Isis Caroline Oliveira de Sousa 22 November 2016 (has links)
Submitted by Alison Vanceto (alison-vanceto@hotmail.com) on 2017-03-17T12:24:22Z No. of bitstreams: 1 DissCOSF.pdf: 3751345 bytes, checksum: 50050f093a497de77a404a0a957ad02c (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-04-24T13:10:09Z (GMT) No. of bitstreams: 1 DissCOSF.pdf: 3751345 bytes, checksum: 50050f093a497de77a404a0a957ad02c (MD5) / Approved for entry into archive by Ronildo Prado (ronisp@ufscar.br) on 2017-04-24T13:10:17Z (GMT) No. of bitstreams: 1 DissCOSF.pdf: 3751345 bytes, checksum: 50050f093a497de77a404a0a957ad02c (MD5) / Made available in DSpace on 2017-04-24T13:13:58Z (GMT). No. of bitstreams: 1 DissCOSF.pdf: 3751345 bytes, checksum: 50050f093a497de77a404a0a957ad02c (MD5) Previous issue date: 2016-11-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / The expansion of different areas of knowledge through many types of information brought the necessity to support complex data (images, sounds, videos, strings, DNA chains, etc.), that do not have a Total Order Relationship and need other management mechanisms, like the contentbased retrieval. In general, they are represented in metric space domains, where we have only the elements and the distances between them. Through the characteristics extracted from them, we perform the similarity search. Considering the necessity to associate temporal information on these data in many applications, this work aims to analyze the temporal evolve of metric data. One alternative for this is embedding them into a multidimensional space to allow trajectories estimates. We studied different methods of embedding and analyzed how this affected the data’s distribution and, consequently, the estimates. Two new methods were purposed to estimate an element’s status on a different time from that available in database, in order to reduce the number of non-relevant elements on search results. These methods are based on radius search reduction (range) and evaluation of retrieved element’s proximity by using an approximation of reverse k- NN. We performed experiments which showed that purposed methods could improve the estimate’s result, that used to be performed only using k-NN searches. / A expansão de diferentes áreas do conhecimento com os diversos tipos de informação tornou necessário o suporte a dados complexos (imagens, sons, vídeos, cadeias de DNA, entre outros), que por não possuírem uma Relação de Ordem Total (ROT), necessitam de outros mecanismos de gerenciamento, como a recuperação por conteúdo. Em geral, esses dados são representados em domínios de espaços métricos, onde apenas se tem os elementos e as distâncias entre eles. Através das características extraídas dos mesmos, realiza-se consultas por similaridade. Considerando a necessidade de associar a informação temporal a esses dados em muitas aplicações, este trabalho visa analisar a evolução temporal dos dados métricos. Para isso, uma alternativa é mapeá-los para um espaço multidimensional, a fim possibilitar a estimativa de trajetórias. Neste trabalho, foram estudados diferentes métodos de mapeamento, sendo também analisado como o mapeamento afetou a distribuição dos mesmos e, por conseguinte, a realização das estimativas. Foram propostos dois novos métodos para estimar o estado de um elemento em um tempo diferente daqueles disponíveis na base de dados, com o objetivo de reduzir no conjunto resposta a quantidade de elementos não relevantes. Os métodos propostos são baseados na redução do raio de consulta na região estimada pela delimitação do raio de consulta (range) e a avaliação da proximidade dos elementos retornados utilizando verificação (aproximação) do k-NN reverso. Foram realizados experimentos que mostraram que os métodos propostos melhoraram o resultado final das estimativas, que anteriormente eram realizadas apenas com consultas aos vizinhos mais próximos.
772

Uso da biodiversidade por popula??es humanas na caatinga e na Mata Atl?ntica, Rio Grande do Norte, Nordeste do Brasil

Torres, Denise de Freitas 14 June 2011 (has links)
Made available in DSpace on 2014-12-17T14:33:06Z (GMT). No. of bitstreams: 1 DeniseFT_DISSERT.pdf: 1310424 bytes, checksum: 17ccb9d111e545e28be32da0310c4d85 (MD5) Previous issue date: 2011-06-14 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior / The use of animals is a common activity but it can be really variable between human populations. This work analyzed the knowledge about useful animal species between human communities in Caatinga and Atlantic Forest considering the influence of socioeconomics and environmental factors on the species selection. Forty people were interviewed in Cara?bas community (Atlantic Forest) and thirty were interviewed in Barrocas community (Caatinga). A total of 193 animals were cited. The communities showed a low degree of similarity (20%) and the general diversity of mentioned species was significantly bigger in Cara?bas. Men cited a diversity of species greater than women for food category in Cara?bas and pet category in Cara?bas and Barrocas. Women cited greater species diversity for medicinal use in Cara?bas. In general, in both communities, the age group >60 years showed a greater knowledge than the others. The multiple regression analysis showed the age as the only socioeconomic factor which influenced significantly the knowledge about animals for the food category in both communities. Considering the richness of known species, there were differences only between gender for sum of uses and food category in Cara?bas and for the pet category in Barrocas with men showing a greater knowledge than women. The results showed that local environmental differences are fundamental at the species selection but they also showed that within communities there are other factors like gender and age that tend to influence the knowledge about species. It is important to consider cultural, economic, social and environmental factors to understand better the interactions between people and animals so that this information can be used to facilitate the implementation of conservation measures / O uso da fauna ? uma pr?tica comum, mas pode ser bastante vari?vel entre popula??es humanas. Este estudo analisou o conhecimento sobre as esp?cies de animais ?teis entre comunidades humanas na Caatinga e na Mata Atl?ntica, levando em considera??o a influ?ncia de fatores socioecon?micos e ambientais na sele??o das esp?cies. Quarenta pessoas foram entrevistadas na comunidade Cara?bas (Mata Atl?ntica) e trinta na comunidade Barrocas (Caatinga). Um total de 193 animais foi citado. As comunidades apresentaram um baixo grau de similaridade (20%) e a diversidade geral de esp?cies citadas foi significativamente maior em Cara?bas. Os homens mencionaram uma diversidade de esp?cies maior do que as mulheres para as categorias alimentar em Cara?bas e estima??o em Cara?bas e Barrocas. J? as mulheres citaram uma maior diversidade de esp?cies para o uso medicinal em Cara?bas. De maneira geral, nas duas comunidades, o grupo de idade >60 anos apresentou um conhecimento maior que os demais. A an?lise de regress?o m?ltipla mostrou que a idade foi o ?nico fator socioecon?mico que influenciou significativamente o conhecimento sobre os animais na categoria alimentar nas duas comunidades. Levando em considera??o a riqueza de esp?cies conhecidas, houve diferen?a apenas entre os g?neros para a categoria alimentar e para a soma dos usos em Cara?bas e para a categoria estima??o em Barrocas, com os homens apresentando um conhecimento mais representativo do que as mulheres. Os resultados mostraram que as diferen?as ambientais locais s?o fundamentais na sele??o das esp?cies, mas mostrou tamb?m que dentro das comunidades existem outros fatores como g?nero e a idade que tamb?m tendem a influenciar o conhecimento sobre as esp?cies. ? importante considerar fatores culturais, econ?micos, sociais e ambientais para melhor entender as intera??es existentes entre pessoas e animais, de forma que estas informa??es possam ser utilizadas para favorecer a implementa??o de medidas conservacionistas
773

Parâmetros genéticos populacionais como indicadores de sustentabilidade em populações naturais de pimenta rosa - Schinus terebinthifolius RADDI. (Anacardiaceae) no baixo curso do rio São Francisco - SE/AL / POPULATIONAL GENETIC PARAMETERS AS SUSTAINABILITY INDICATORS IN NATURAL POPULATIONS OF RED PEPPER Schinus terebinthifolius RADDI (Anacardiaceae), IN LOW SÃO FRANCISCO RIVER-SE/AL.

Carvalho, Sheila Valéria álvares 25 June 2009 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The conservation of forest species requires the prior knowledge of genetic parameters belonging to the population, to help to design strategies for this purpose. This study aimed to evaluate genetic parameters and suggest indicators of sustainability in populations of Schinus terebinthifolius Raddi. aiming the conservation and maintenance of diversity in this species. In analysis of the study area, were selected 20 descriptors, and these suggested 20 indicators of sustainability for the area. Tender vegetal leaves were sampled in five populations located on the shores and islands of São Francisco River, and the material collected from 15 individuals for each population. In the DNA extraction it was used tender leaves of individuals and 2% CTAB method. We applied 20 primers of 10 bases of arbitrary sequence in amplification, the products were separated in agarose gel at 1% submitted to horizontal electrophoresis, stained with ethidium bromide and visualized in ultraviolet light. The presence and absence of bands were used to construct a binary matrix for the analysis of genetic parameters. In each population the percentage of polymorphic loci ranged from 32.92% to 45.34%. The average gene diversity of Nei was 0.37. The total genetic variation observed, 63.60% corresponded to variation among populations, and 36.40% within populations. The gene flow (Nm) estimated was 0.28. Thus the conclusion is the populations are genetically isolated, and analyzed the genetic parameters can be used as indicators of sustainability of the area. / A conservação de espécies florestais requer o conhecimento prévio de parâmetros genéticos pertencentes às populações, para se traçar estratégias para este fim. Assim, este trabalho teve como objetivo avaliar parâmetros genéticos e sugerir indicadores de sustentabilidade em populações de Schinus terebinthifolius Raddi. visando à conservação e manutenção da diversidade nesta espécie. Em análise da área de estudo, foram selecionados 20 descritores, e destes sugeridos 20 indicadores de sustentabilidade da área. As amostragens foram realizadas em cinco populações localizadas nas margens e ilhas do Rio São Francisco, sendo coletado material de 15 indivíduos para cada uma das populações. Na extração do DNA, empregou-se folhas tenras dos indivíduos e o método CTAB 2%. Foram usados 20 oligonucleotídeos de 10 bases de sequência arbitrária nas amplificações, cujos produtos foram separados em gel de agarose 1% submetidos à eletroforese horizontal, corados com brometo de etídio e visualizados em luz ultravioleta. A presença e a ausência de bandas foi usada para a construção de uma matriz de binária para a análise dos parâmetros genéticos. Em cada população a porcentagem de locos polimórficos variou de 32,92 a 45,34%. A diversidade média gênica de Nei foi de 0,37. Da variação genética total observada, 63,60% correspondeu à variação entre as populações; e, 36,40% dentro das populações. O fluxo gênico (Nm) estimado foi de 0,28. Desta forma conclui-se que as populações encontram-se isoladas geneticamente e os parâmetros genéticos analisados podem ser utilizados como indicadores de sustentabilidade da área.
774

Composição florística e distribuição das espécies arbóreas em florestas paludosas interioranas do sudeste e centro-oeste do Brasil /

Teixeira, Aloysio de Padua. January 2008 (has links)
Orientador: Marco Antonio de Assis / Banca: Ricardo Roberto Rodrigues / Banca: Giselda Durigan / Banca: Bruno Machado T. Walter / Banca: Reinaldo Monteiro / Resumo: No presente estudo foi feita a caracterização florística e estrutural de três florestas paludosas localizadas no interior do Estado de São Paulo (Itirapina - 22o15'54''S, 47o40'51''W, Cristais Paulista - 20o25'58''S, 47o25'98''W e Jeriquara - 20o19'30''S, 47o37'10''W). Os objetivos foram: i) investigar as relações entre a estrutura da comunidade e a distribuição das espécies em relação às condições do substrato (propriedades químicas, granulometria e drenagem) e entrada de luz (abertura do dossel), para cada floresta; ii) avaliar as relações de similaridade e diferenças florísticas entre as florestas paludosas interioranas do sudeste e centro-oeste do Brasil. A floresta paludosa de Itirapina constitui-se de um capão naturalmente isolado de outras formações florestais, em meio a campos úmidos. As florestas de Cristais Paulista e Jeriquara são fragmentadas por ação antrópica, encontram-se em contato com manchas de cerrado (principalmente cerradão) e são caracterizadas por aclives no sentido interior-borda. Em cada floresta foram estabelecidas 60 parcelas de 10 x 10 m, onde foram quantificados e identificados os indivíduos com PAP > 10 cm, classificados os solos e avaliadas suas propriedades químicas, textura, drenagem e, ainda, estimada a abertura de dossel. Nas três florestas foram quantificados 9.725 indivíduos, distribuídos em 109 espécies. Observou-se uma relação positiva entre o número de classes de solos e o número de espécies amostradas em cada floresta, com 37 espécies encontradas em Itirapina (sobre apenas uma única classe de solo), 61 em Cristais Paulista (sobre duas classes) e 72 em Jeriquara (sobre três classes). Além das condições edáficas, o contato das florestas com cerradão em Cristais Paulista e Jeriquara, possibilita a coexistência de espécies higrófilas e de cerrado... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Floristics and structural characterization of three swamp forests located in the countryside of São Paulo state (municipalities of Itirapina - 22o15'54''S, 47o40'51''W, Cristais Paulista - 20o25'58''S, 47o25'98''W and Jeriquara - 20o19'30''S, 47o37'10''W) were conducted with the following objectives: i) to investigate the relationships between community structure, species distribution, substrate (chemical properties, texture and drainage) and light entrance (canopy openness) for each forest; ii) to evaluate floristics similarities and differences amongst the swamp forests in countryside of southeastern and central-western Brazil. The Itirapina swamp forest is naturally isolated from other forests formations, because it is surrounded by wet fields. Cristais Paulista and Jeriquara swamp forests were fragmented by human action and occur in contact with patches of cerrado (mainly cerradão). They were characterized by slope towards stream-edge. In each forest, 60 quadrats of 10 x 10 m were established, which all individuals with CBH > 10 cm were quantified and identified. Soil was classified and evaluated by its chemical properties, texture and drainage, and canopy openness was also estimated. On the three forests 9,725 individuals were sampled, distributed in 109 species. It was found a positive relationship between the number of soil's classes and the number of species in each forest, with 37 species found in Itirapina (on only one class of soil), 61 in Cristais Paulista (on two soil classes) and 72 in Jeriquara (on three classes). Apart from soil conditions, the contact with Cristais Paulista and Jeriquara swamp forests with cerradão allows the coexistence of hygrophilous and savannas species, which was not observed in Itirapina forest because of its spatial isolation. A Canonical correspondence analysis showed... (Complete abstract click electronic access below) / Doutor
775

Padrões e processos ecológicos do componente arbóreo em uma área de floresta estacional semidecidual (Araguari, MG) / Ecological Patterns and Processes on the Tree Layer in a Seasonal Semideciduous Forest (Araguari, MG)

Vale, Vagner Santiago do 19 February 2008 (has links)
Fundação de Amparo a Pesquisa do Estado de Minas Gerais / This thesis deals with the study of the tree component in a seasonal semideciduous forest (FES) with a good state of conservation. Initially, it was prepare a general introduction, showing the importance of the detailing study of forests well preserved, as comparative basis with disturbed forests. After this context, the thesis has been divided into two chapters. The first chapter tries to characterize the tree component of a hectare of FES, through the studies of floristic composition and horizontal and vertical structure, and the characterization of the soil. The species were classified accord the dominant stratum and in sucessional group. In this chapter were calculate the floristic similarities with other FES southeastern Brazil, based on the richness and abundance. In the second chapter was searched the formation of functional groups based on ecological attributes of the species. Therefore, it was used a similarity s dendrogram based on the presence/absence of attributes. The results showed that even in preserved forests have high spatial heterogeneity caused by natural gaps. The division of groups successional point to the concentration of late secondary species and low presence of pioneers in the strata. The similarity s analysis based on richness allowed the formation of four groups, and the similarity based on the abundance allowed closer areas with similar degree of conservation, even approaching the FES studied with other FESs in well conserved stage. These results demonstrate the high degree of maturity of the FES studied. In the delimitation of functional groups, four major groups were determined by their attributes: G1 - ornitocoric and light-demanding group; G2 - mastocoric and canopy light-demanding group; G3 - canopy, abiotic dispersion group and G4 - ornitocoric, shade-tolerant and the only group predominant in the understory. The G4 was the more abundant group. It was concluded that the tree community, although present natural gaps, is in a mature stage; the proximity between fragments of FES is a determinant factor in the floristic composition; fragments in similar conservation state have higher floristic similarity; the community tree has, at least, four big functional groups, which play different function in the ecosystem. The results obtained here have great contribution to the understanding of the ecological patterns and processes involved in these ecosystems. But there is a need for further studies that can for detail the communities tree structure and involves the formation of functional groups for better understanding of high diversity forests. / Esta dissertação trata do estudo do componente arbóreo em uma floresta estacional semidecidual (FES) em bom estado de conservação. Inicialmente, foi elaborada uma introdução geral, ressaltando a importância de estudos ecológicos detalhados em florestas preservadas, como base comparativa com florestas alteradas. Após esta contextualização, a dissertação foi dividida em dois capítulos. O primeiro buscou caracterizar, por meio da composição florística e da estrutura, horizontal e vertical, o componente arbóreo de um hectare de FES; além da caracterização do solo da área. As espécies foram classificadas conforme seu estrato dominante e quanto ao grupo sucessional. No mesmo capitulo, também foram calculadas similaridades florísticas, baseadas na riqueza e na abundância, com outras FES do sudeste brasileiro. No segundo capitulo buscou-se a formação de grupos funcionais baseados em atributos ecológicos das espécies. Para isso, foi utilizado um dendrograma de similaridade com base na presença/ausência dos atributos. Os resultados apontaram que mesmo florestas preservadas possuem alta heterogeneidade espacial, causada pelas clareiras naturais. A delimitação dos grupos sucessionais apontou para uma maior concentração de espécies secundárias tardias e pouca presença de pioneiras nos estratos formados. A análise de similaridade baseada na riqueza permitiu a formação de quatro grupos, e a similaridade baseado na abundância permitiu aproximar áreas com semelhante grau de conservação, inclusive aproximando a FES estudada com outras FESs em bom estágio de conservação. Foi possível, assim, determinar o elevado grau de maturidade da FES estudada. Na delimitação de grupos funcionais formaram-se quatro grandes grupos, determinados pelos seus atributos: G1 - grupo ornitocórico, demandante de luz direta, G2 - grupo mastocórico, de dossel demandante de luz direta, G3 - grupo formado por dispersão abiótica e do dossel e G4 - grupo ornitocórico, predominante do subdossel e sub-bosque e único grupo tolerante à sombra e o mais abundante em número de indivíduos. Concluiu-se que a comunidade arbórea, apesar de apresentar clareiras naturais, encontra-se em um estágio maduro; a proximidade entre fragmentos de FES é um fator importante na similaridade na composição florística; fragmentos em semelhante estado de conservação podem ter sua similaridade florística aproximada; a comunidade arbórea apresenta pelo menos quatro grandes grupos funcionais, que desempenham papeis distintos no ecossistema. Os resultados aqui obtidos trazem uma contribuição importante para o entendimento sobre os padrões e processos ecológicos envolvidos nesses ecossistemas, e reforça a necessidade de novos estudos, tanto para detalhamento da estrutura das comunidades arbóreas, quanto estudos que envolvam a formação de grupos funcionais para uma maior compreensão das florestas com alta diversidade. / Mestre em Ecologia e Conservação de Recursos Naturais
776

Como as exportações chinesas deslocaram as exportações brasileiras na América Latina no período 2000-2009 / How Chinese exports displaced Brazilian exports in Latin America on 2000-2009 period

Milena Maria Mariath Lugo 28 September 2010 (has links)
As exportações chinesas deslocam as exportações brasileiras? Esta dissertação avaliou se este fenômeno de fato ocorreu no mercado latino americano no período 2000-2009. Para identificar como se deu este deslocamento foram analisados o número de produtos exportados por ambos os países e os indicadores de similaridade, de qualidade e de variedade entre as pautas de exportação brasileira e chinesa. Ambos os países aumentaram o número de produtos exportados para a América Latina, mas a China aumentou numa maior proporção. O índice de similaridade entre as pautas de exportação brasileira e chinesa chegou a 28,9% em 2009, indicando que as pautas se tornaram mais similares. O índice de qualidade foi positivo durante todo o período, indicando que, em média, as exportações brasileiras foram de maior qualidade que as chinesas. O índice de variedade, também positivo durante todo o período, mostrou que a variedade dos produtos brasileiros é maior que dos produtos chineses, ou seja, que o Brasil exporta mais produtos que a China, entretanto, nos três últimos anos a tendência é de queda na variedade dos produtos. / Do Chinese exports displace Brazilian exports? This dissertation analyzes whether this actually occurred in the Latin American market during the 2000-2009 period. To identify how this shift occurred, the number of products exported by both countries and the indicators of similarity, quality and variety of exports between the Brazil and China were analyzed. Both countries have increased the number of products exported to Latin America market, however, China increased it in a greater proportion. The index of similarity between the Brazilian and Chinese exports basket reached 28.9% in 2009, indicating that the exports have become more similar. The quality index was positive during whole period, indicating that, on average, Brazilian exports were of better in quality than the Chinese exports. The positive variety rate during the whole period shows that the variety of Brazilian products is higher than the Chinese products, namely, that Brazil exports more goods than China, however, for the past three years the tendency is to fall in products variety.
777

Anylýza řešení úloh 2. kola 55. ročníku MO v Jihočeském kraji / The problems solutions analysis of the second round of 55-th year MO in South Bohemia region

KUČEROVÁ, Renata January 2009 (has links)
The aim of this diploma work is to analyse problems solving of the second round of the 55th year of the Mathematical Olympiad in South Bohemian region and to serve as a study material for further Mathematical Olympiads or as a collection of problems for talented students.
778

Um modelo de pontuação na busca de competências acadêmicas de pesquisadores / A score-based model for assessing academic researchers competences

Rech, Rodrigo Octavio January 2007 (has links)
Esta pesquisa descreve um modelo para descobrir e pontuar competências acadêmicas de pesquisadores, baseado na combinação de indicadores quantitativos que permitem mensurar a produção acadêmica dos cientistas. Um diferencial do modelo é a inclusão de indicadores quantitativos relacionados com a importância da produção bibliográfica dos pesquisadores. Estes indicadores possibilitam uma avaliação da produção considerando aspectos como repercussão na comunidade acadêmica e nível dos veículos de publicação. A pesquisa também contribui com a especificação de uma arquitetura flexível e extensível fundamentada em técnicas de extração de dados na Web e casamento aproximado de dados (através de funções de similaridade). A arquitetura foi implementada em um sistema Web cuja principal característica é a integração de diversas tecnologias open source. O sistema desenvolvido permite que qualquer pesquisador avalie quantitativamente sua produção científica, automatizando diversos aspectos relacionados à tarefa de avaliação, como a obtenção dos indicadores e a integração das diferentes bases de informações. / The present research describes a model that aims finding out and scoring academic researchers skills or competences based on the combination of quantitative indicators that make it possible to measure the production of academic scientists. A special feature concerning our model is the inclusion of quantitative indicators related to the importance of the researchers’ bibliographic production. These indicators allow the evaluation of the production considering both the outcome it has had in the academic community, and the quality level of the place it was published. The study also presents a flexible and extensible architecture specification based on techniques of web data extraction, and on approximate data matching (which is carried out through similarity functions). The architecture has been implemented in a web system whose main feature relies on the integration of several open-source technologies. The developed system allows any researcher to evaluate his/her own scientific production in quantitative terms, automating as well the so many aspects regarding the evaluation task, by making it easier to obtain the indicators and to integrate the different information databases, for instance.
779

Mesures de similarité pour cartes généralisées / Similarity measures between generalized maps

Combier, Camille 28 November 2012 (has links)
Une carte généralisée est un modèle topologique permettant de représenter implicitementun ensemble de cellules (sommets, arêtes, faces , volumes, . . .) ainsi que l’ensemblede leurs relations d’incidence et d’adjacence au moyen de brins et d’involutions. Les cartes généralisées sont notamment utilisées pour modéliser des images et objets3D. A ce jour il existe peu d’outils permettant l’analyse et la comparaison de cartes généralisées.Notre objectif est de définir un ensemble d’outils permettant la comparaisonde cartes généralisées.Nous définissons tout d’abord une mesure de similarité basée sur la taille de la partiecommune entre deux cartes généralisées, appelée plus grande sous-carte commune.Nous définissons deux types de sous-cartes, partielles et induites, la sous-carte induitedoit conserver toutes les involutions tandis que la sous-carte partielle autorise certaines involutions à ne pas être conservées. La sous-carte partielle autorise que les involutionsne soient pas toutes conservées en analogie au sous-graphe partiel pour lequelles arêtes peuvent ne pas être toutes présentes. Ensuite nous définissons un ensembled’opérations de modification de brins et de coutures pour les cartes généralisées ainsiqu’une distance d’édition. La distance d’édition est égale au coût minimal engendrépar toutes les successions d’opérations transformant une carte généralisée en une autrecarte généralisée. Cette distance permet la prise en compte d’étiquettes, grâce à l’opérationde substitution. Les étiquettes sont posées sur les brins et permettent d’ajouter del’information aux cartes généralisées. Nous montrons ensuite, que pour certains coûtsnotre distance d’édition peut être calculée directement à partir de la plus grande souscartecommune.Le calcul de la distance d’édition est un problème NP-difficile. Nous proposons unalgorithme glouton permettant de calculer en temps polynomial une approximation denotre distance d’édition de cartes. Nous proposons un ensemble d’heuristiques baséessur des descripteurs du voisinage des brins de la carte généralisée permettant de guiderl’algorithme glouton, et nous évaluons ces heuristiques sur des jeux de test générésaléatoirement, pour lesquels nous connaissons une borne de la distance.Nous proposons des pistes d’utilisation de nos mesures de similarités dans le domainede l’analyse d’image et de maillages. Nous comparons notre distance d’éditionde cartes généralisées avec la distance d’édition de graphes, souvent utilisée en reconnaissancede formes structurelles. Nous définissons également un ensemble d’heuristiquesprenant en compte les étiquettes de cartes généralisées modélisant des images etdes maillages. Nous mettons en évidence l’aspect qualitatif de notre appariement, permettantde mettre en correspondance des zones de l’image et des points du maillages. / A generalized map is a topological model that allows to represent implicitly differenttypes of cells (vertices, edges, volumes, . . . ) and their relationship by using a set of dartsand some involutions. Generalized maps are used to model 3D meshes and images.Anyway there exists only few tools to compare theses generalized maps. Our main goalis to define some tools tolerant to error to compare them.We define a similarity measure based on the size of the common part of two generalizedmaps, called maximum common submap. Then we define two types of submaps,partial and induced, the induced submap needs to preserve all the involutions whereasthe partial one can allow some involutions to be removed. Then we define a set of operationsto modify a generalized map into another and the associated edit distance. Theedit distance is equal to the minimal cost of all the sequences of operations that modifya generalized map into the other. This edit distance can use labels to consider additionalinformation, with the operation called ’substitution’. Labels are set on darts. Wenext showa relation between our edit distance and the distance based on the maximumcommon submap.Computing theses distance are aNP-hard problem.We propose a greedy algorithmcomputing an approximation of it. We also propose a set of heuristics based on thedescription of the neighborhoob of the darts to help the greedy algorithm.We try thesesheuristics on a set of generalized maps randomly generated where a lower bound of thedistance is known. We also propose some applications of our similarity measures inthe image analysis domain. We compare our edit distance on generalized maps withthe edit distance on graphs. We also define a set of labels specific on images and 3Dmeshes. And we show that the matching computed by our algorithm construct a linkbetween images’s areas.
780

Junções por similaridade com expressões complexas em ambientes distribuídos / Set similarity joins with complex expressions on distributed platforms

Oliveira, Diego Junior do Carmo 31 August 2018 (has links)
Submitted by Liliane Ferreira (ljuvencia30@gmail.com) on 2018-10-01T13:06:03Z No. of bitstreams: 2 Dissertação - Diego Junior do Carmo Oliveira - 2018.pdf: 2678764 bytes, checksum: c32f645ce8abd8a764bec1993d41337b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2018-10-01T14:48:43Z (GMT) No. of bitstreams: 2 Dissertação - Diego Junior do Carmo Oliveira - 2018.pdf: 2678764 bytes, checksum: c32f645ce8abd8a764bec1993d41337b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) / Made available in DSpace on 2018-10-01T14:48:43Z (GMT). No. of bitstreams: 2 Dissertação - Diego Junior do Carmo Oliveira - 2018.pdf: 2678764 bytes, checksum: c32f645ce8abd8a764bec1993d41337b (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2018-08-31 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / A recurrent problem that degrades the quality of the information in databases is the presence of duplicates, i.e., multiple representations of the same real-world entity. Despite being computationally expensive, the use of similarity operations is fundamental to identify duplicates. Furthermore, real-world data is typically composed of different attributes and each attribute represents a distinct type of information. The application of complex similarity expressions is important in this context because they allow considering the importance of each attribute in the similarity evaluation. However, due to a large amount of data present in Big Data applications, it has become crucial to perform these operations in parallel and distributed processing environments. In order to solve such problems of great relevance to organizations, this work proposes a novel strategy to identify duplicates in textual data by using similarity joins with complex expressions in a distributed environment. / Um problema recorrente que degrada a qualidade das informações em banco de dados é a presença de duplicatas, isto é, múltiplas representações de uma mesma entidade do mundo real. Apesar de ser computacionalmente oneroso, para realizar a identificação de duplicatas é fundamental o emprego operações de similaridade. Além disso, os dados atuais são tipicamente compostos por diferentes atributos, cada um destes contendo um tipo distinto de informação. A aplicação de expressões de similaridade complexas é importante neste contexto uma vez que permitem considerar a importância de cada atributo na avaliação da similaridade. No entanto, em virtude da grande quantidade de dados presentes em aplicações Big Data, fez-se necessário realizar o processamento destas operações em ambientes de programação paralelo ou distribuído. Visando solucionar estes problemas de grande relevância para as organizações, este trabalho propõe uma nova estratégia de processamento para identificação de duplicatas em dados textuais utilizando junções por similaridade com expressões complexas em um ambiente distribuído.

Page generated in 0.0475 seconds