Global ETD Search

11	Estimativa do volume de passageiros ao longo de uma linha de transporte público por ônibus a partir da Geoestatística / Estimation of passenger volume along a bus transit line using Geostatistics Marques, Samuel de França 15 February 2019 (has links) A modelagem clássica da demanda por transportes ignora um importante aspecto normalmente presente na estrutura das variáveis de interesse: a autocorrelação espacial. Pesquisas recentes reconhecem e incluem tal característica à estimativa da demanda, mas há limitações referentes aos elementos básicos de tratamento utilizados nas abordagens. No intuito de superar alguns problemas e restrições associados aos estudos anteriores, o presente trabalho utiliza a dependência espacial entre as observações de viagens no intuito de gerar estimativas do volume de Embarques e Desembarques por ponto de parada, bem como Carregamento nos trechos, ao longo de uma linha de transporte público. Dados de uma pesquisa sobe/desce, realizada em oito linhas de ônibus da cidade de São Paulo, foram disponibilizados pela SPTrans, sendo que, selecionou-se a linha 856R-10 para compor uma análise do desempenho da Geoestatística, ferramental adequado para a estimativa de valores de variáveis em locais não amostrados, sobretudo em bancos de dados espacialmente dependentes. O processo de estimação foi realizado por meio da Krigagem Ordinária com distâncias euclidianas, técnica de interpolação geoestatística que, para sua aplicação, exige apenas o valor da variável em pontos do espaço e suas respectivas coordenadas geográficas. Posteriormente, tal método foi comparado às estimativas obtidas por meio da utilização de distâncias em rede ao longo da linha de ônibus. Os resultados obtidos, a partir da validação cruzada e métricas de aderência, apontaram um ajuste considerável dos valores observados e estimados para ambos os tipos de distância. Dessa forma, a investigação proposta confirmou, com sucesso, a viabilidade de aplicação da Geoestatística às variáveis de demanda por transporte público ao longo de uma linha de ônibus. Além disso, uma vez que a pesquisa sobe/desce exige recursos elevados para sua realização, os resultados destacam o potencial dos interpoladores geoestatísticos em eliminar a necessidade de execução do referido levantamento em todo o percurso da linha de ônibus, já que a Geoestatística garante estimativas aproximadas aos valores da pesquisa completa. / The classical modeling of travel demand overlooks an important aspect normally found in the variables of interest: spatial autocorrelation. Recent researches recognize and include this characteristic in travel demand forecasting, but there are limitations regarding the basic elements of treatment used in the approaches. In order to overcome some of the problems and constraints associated with previous researches, the present study relies on the spatial dependence between the observations of trips in order to generate estimates of the Boarding and Alighting passenger volume per bus stop and Loading in the stretches, along a public transport line, that would not be sampled for the survey occasion. Data from a passenger Boarding and Alighting survey carried out on eight bus lines in the city of São Paulo were made available by SPTrans, and line 856R-10 was selected to compose an analysis of the performance of Geostatistics, a tool that deals with the problem of scarce data and estimation in non-sampled places in the forecast of variables of public transport demand, especially in spatially dependent databases. The estimation process was performed by means of Ordinary Kriging with Euclidian distances, a geostatistical interpolation technique that, for its application, only requires the value of the variable in points of the space and their respective geographical coordinates. Subsequently, this method was compared to the estimates obtained through the use of network distances along the bus line. The results obtained, from cross-validation and measures of goodness-of-fit, indicated a considerable adjustment of the observed values to the estimated ones for both types of distance. Thus, the proposed research successfully confirmed the feasibility of applying Geostatistics to the variables of public transport demand along a bus transit line. Moreover, since the boarding/alighting survey requires high resources for its realization, the results highlight the potential of the geostatistical interpolators in eliminating the need to carry out the survey in the whole course of the bus line, since Geostatistics provides estimates similar to the values of the complete survey. Boarding/alighting survey Demanda por transporte público Distâncias em rede Distâncias euclidianas Estatística espacial Euclidian distances Krigagem Kriging Network distances Pesquisa sobe/desce Public transport demand Spatial statistics
12	Medidores de distância por triangulação a laser. / Laser triangulation rangefinders. Mario Antonio Stefani 20 September 1995 (has links) Os Medidores de Distância por Triangulação a Laser são sistemas optoeletrônicos destinados à medição de pequenas distâncias ou deslocamentos, sem contato físico direto. Estes equipamentos possuem um grande campo de aplicações industriais. Este trabalho descreve as diversas configurações que este equipamento pode se apresentar, discutindo suas vantagens relativas. São estudadas também as suas partes e os componentes mais indicados. O projeto detalhado de um medidor usando sensor tipo CCD, e apresentado. Algumas aplicações industriais deste modelo são relatadas e diversos métodos e sugestões de uso são apresentadas, com base nas experiências realizadas pelo autor. / Laser Triangulation Rangefinders are non-contact, optoelectronic devices for measurement of small displacements or distances. These devices offer a broad range of industrial applications. This work explains common configurations, parts and main components, comparing their advantages. A detailed project on a CCD based Laser Rangefinder is presented. Some industrial applications for that project are related, discussing practical aspects based on authors experience. Some potential applications are also suggested. Aplicações laser Medidores de distâncias Telêmetros laser Triangulação laser Laser aplications Laser based rangefinders Laser triangulation Optical distance measurements Rangefinders
13	Modelos de custo e estatísticas para consultas por similaridade / Cost models and statistics for similarity searching Bêdo, Marcos Vinícius Naves 10 October 2017 (has links) Consultas por similaridade constituem um paradigma de busca que fornece suporte à diversas tarefas computacionais, tais como agrupamento, classificação e recuperação de informação. Neste contexto, medir a similaridade entre objetos requer comparar a distância entre eles, o que pode ser formalmente modelado pela teoria de espaços métricos. Recentemente, um grande esforço de pesquisa tem sido dedicado à inclusão de consultas por similaridade em Sistemas Gerenciadores de Bases de Dados (SGBDs), com o objetivo de (i) permitir a combinação de comparações por similaridade com as comparações por identidade e ordem já existentes em SGBDs e (ii) obter escalabilidade para grandes bases de dados. Nesta tese, procuramos dar um próximo passo ao estendermos também o otimizador de consultas de um SGBD. Em particular, propomos a ampliação de dois módulos do otimizador: o módulo de Espaço de Distribuição de Dados e o módulo de Modelo de Custo. Ainda que o módulo de Espaço de Distribuição de Dados permita representar os dados armazenados, essas representações são insuficientes para modelar o comportamento das comparações em espaços métricos, sendo necessário estender este módulo para contemplar distribuições de distância. De forma semelhante, o módulo Modelo de Custo precisa ser ampliado para dar suporte à modelos de custo que utilizem estimativas sobre distribuições de distância. Toda a investigação aqui conduzida se concentra em cinco contribuições. Primeiro, foi criada uma nova sinopse para distribuições de distância, o Histograma Compactado de Distância (CDH), de onde é possível inferir valores de seletividade e raios para consultas por similaridade. Uma comparação experimental permitiu mostrar os ganhos das estimativas da sinopse CDH com relação à diversos competidores. Também foi proposto um modelo de custo baseado na sinopse CDH, o modelo Stockpile, cujas estimativas se mostraram mais precisas na comparação com outros modelos. Os Histogramas-Omni são apresentados como a terceira contribuição desta tese. Estas estruturas de indexação, construídas a partir de restrições de particionamento de histogramas, permitem a execução otimizada de consultas que mesclam comparações por similaridade, identidade e ordem. A quarta contribuição de nossa investigação se refere ao modelo RVRM, que é capaz de indicar quanto é possível empregar as estimativas das sinopses de distância para otimizar consultas por similaridade em conjuntos de dados de alta dimensionalidade. O modelo RVRM se mostrou capaz de identificar intervalos de dimensões para os quais essas consultas podem ser executadas eficientes. Finalmente, a última contribuição desta tese propõe a integração das sinopses e modelos revisados em um sistema com sintaxe de alto nível que pode ser acoplado em um otimizador de consultas. / Similarity searching is a foundational paradigm for many modern computer applications, such as clustering, classification and information retrieval. Within this context, the meaning of similarity is related to the distance between objects, which can be formally expressed by the Metric Spaces Theory. Many studies have focused on the inclusion of similarity search into Database Management Systems (DBMSs) for (i) enabling similarity comparisons to be combined with the DBMSs identity and order comparisons and (ii) providing scalability for very large databases. As a step further, we propose the extension of the DBMS Query Optimizer and, particularly, the extension of two modules of the Query Optimizer, namely Data Distribution Space and Cost Model modules. Although the Data Distribution Space enables representations of stored data, such representations are unsuitable for modeling the behavior of similarity comparisons, which requires the extension of the module to support distance distributions. Likewise, the Cost Model module must be extended to support cost models that depend on distance distributions. Our study is based on five contributions. A new synopsis for distance distributions, called Compact-Distance Histogram (CDH), is proposed and enables radius and selectivity estimation for similarity searching. An experimental comparison showed the gains of the estimates drawn from CDH in comparison to several competitors. A cost model based on the CDH synopsis and with accurate estimates, called Stockpile, is also proposed. Omni-Histograms are presented as the third contribution of the thesis. Such indexing structures are constructed according to histogram partition constraints and enable the optimization of queries that combine similarity, identity and order comparisons. The fourth contribution refers to the model RVRM, which indicates the possible use of the estimates obtained from distance-based synopses for the query optimization of high-dimensional datasets and identifies intervals of dimensions where similarity searching can be efficiently executed. Finally, the thesis proposes the integration of the reviewed synopses and cost models into a single system with a high-level language that can be coupled to a DBMS Query Optimizer. Concentração de distâncias Consultas por similaridade Distance concentration Otimização de consultas Query optimization Similarity searching
14	O impacto das distâncias institucionais na sobrevivência de subsidiárias estrangeiras / The impact of institutional distances on the survival of foreign subsidiaries Souza, Fábio Cássio de 26 February 2016 (has links) Submitted by Adriana Alves Rodrigues (aalves@espm.br) on 2017-11-06T13:13:25Z No. of bitstreams: 1 Fabio Cássio de Souza.pdf: 1627330 bytes, checksum: 71873750a643ef670bbe26fb9724e15a (MD5) / Approved for entry into archive by Adriana Alves Rodrigues (aalves@espm.br) on 2017-11-06T13:14:58Z (GMT) No. of bitstreams: 1 Fabio Cássio de Souza.pdf: 1627330 bytes, checksum: 71873750a643ef670bbe26fb9724e15a (MD5) / Approved for entry into archive by Ana Cristina Ropero (ana@espm.br) on 2017-11-10T12:11:28Z (GMT) No. of bitstreams: 1 Fabio Cássio de Souza.pdf: 1627330 bytes, checksum: 71873750a643ef670bbe26fb9724e15a (MD5) / Made available in DSpace on 2017-11-10T12:13:32Z (GMT). No. of bitstreams: 1 Fabio Cássio de Souza.pdf: 1627330 bytes, checksum: 71873750a643ef670bbe26fb9724e15a (MD5) Previous issue date: 2016-02-26 / The survival of the subsidiary is an important indicator of the success of foreign investments. Several studies focus efforts on survival testing. The institutional approach emerges as an alternative research topic. However, they are generally restricted to few national institutional distances. This research is intended to contribute to the literature examining the impact of nine institutional distances (ID) on the survival of subsidiary in a different continent than the parent. In addition, it investigates the local experience and its reducing national institutional distances. The hypotheses were tested in 1,650 observations of subsidiaries in 36 countries, in a longitudinal study in the period of 2007-2014. The hazard ratio was implemented with the Cox Regression for the execution. The models indicated effectiveness with a high degree of significance. The results suggest that national DIs have a significant impact on survival. Between the nine DI examined, six evidence of survival risk related to administrative aspects, demographic, political, knowledge, global and cultural. Local experience also plays a relevant role for continuity, however, it is not able to moderate DI for the survival of the subsidiary. It is hoped that this evidence can provide important information for the strategic process and contribute to the success and survival of international operations. / A sobrevivência da subsidiária é importante indicador de sucesso de investimentos estrangeiros. Diversos estudos concentram esforços no exame da sobrevivência. A abordagem institucional surge como uma alternativa de investigação do tema. No entanto, são geralmente restritos a poucas distâncias institucionais nacionais. Esta investigação tem o intuito de contribuir para a literatura ao examinar o impacto de nove distâncias institucionais (DI) na sobrevivência da subsidiária em continente diferente da matriz. Além disto, investiga a experiência local e seu efeito moderador na redução das distâncias institucionais nacionais. As hipóteses foram testadas em 1.650 observações de subsidiárias em 36 países, em estudo longitudinal no período de 2007-2014. A Taxa de Risco (hazard ratio) foi implementada com a Regressão Cox para a execução. Os modelos indicaram efetividade com alto grau de significância. Os resultados sugerem que as DI nacionais impactam significativamente na sobrevivência. Entre as nove DI examinadas, seis evidenciam o risco à sobrevivência relacionados aos aspectos administrativos, demográficos, políticos, conhecimento, global e cultural. A experiência local também desempenha papel relevante para a continuidade, entretanto, não é capaz de moderar as DI para a sobrevivência da subsidiária. Espera-se que estas evidências possam fornecer importantes informações para o processo estratégico e contribuir para o sucesso e sobrevivência das operações internacionais.
15	Álgebra de Clifford aplicada ao cálculo de estruturas moleculares / Clifford algebras applied to molecular structure calculations Alves, Rafael Santos de Oliveira, 1982- 24 September 2018 (has links) Orientador: Carlile Campos Lavor / Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica / Made available in DSpace on 2018-09-24T19:32:19Z (GMT). No. of bitstreams: 1 Alves_RafaelSantosdeOliveira_D.pdf: 2213205 bytes, checksum: 67a1681eb02b103974e57e3047edc755 (MD5) Previous issue date: 2013 / Resumo: O Problema de Geometria de Distâncias Moleculares (PGDM) consiste em encontrar uma imersão tridimensional de um grafo simples, não orientado, de forma que o peso nas arestas corresponda às distâncias inter-atômicas de uma molécula. Este é um problema de busca em um espaço contínuo, mas que pode ser discretizado sob algumas exigências, dando origem ao PGDM discretizado (PGDMD), que é solucionado usando informações sobre distâncias entre alguns átomos da molécula através de um algoritmo Branch and Prune (BP). Caso as distâncias sejam dadas por um conjunto de limites inferiores e superiores, temos um novo problema: o PGDMD intervalar (iPGDMD). A partir da interpretação geométrica deste último, propomos uma nova abordagem utilizando a Álgebra de Clifford a fim de tornar o algoritmo BP mais eficiente e de poder tratar algebricamente os problemas relacionados ao tratamento das distâncias intervalares / Abstract: The Molecular Distance Geometry Problem (MDGP) consists in finding a three dimensional embedding of simple, weighted, undirected graph such that the weight in the edges correspond to the inter-atomic distances of a molecule. This is a continuous search problem which can be discretized under some assumptions, yielding the Discretized MDGP (DMDGP), which is solved by a Branch and Prune (BP) algorithm using information about the distances among some atoms of the molecule. If the distances are given by a set of lower and upper bounds, a new problem arises: the interval DMDGP (iDMDGP). From a geometric interpretation of this problem, we propose a new approach, using Clifford Algebras, in order to improve the BP efficiency and treat algebraically the issues related to interval distances / Doutorado / Matematica Aplicada / Doutor em Matemática Aplicada Clifford, Álgebra de Geometria molecular Geometria de distâncias Clifford Algebras Molecular structure Distance geometry
16	Esquemas de codificação Espácio -Temporal: análise de desempenho e enumeração do Espectro de Distâncias Guedes Caldeira, Luiz 31 January 2011 (has links) Made available in DSpace on 2014-06-12T17:36:37Z (GMT). No. of bitstreams: 2 arquivo7521_1.pdf: 415272 bytes, checksum: 498b2f1f5eea84d8a0551c47a04e77dc (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2011 / Esta tese apresenta uma técnica para calcular limitantes expurgados da probabilidade do primeiro evento erro de códigos espacio-temporais operando em canais com desvanecimento quase estático. Um novo método para identificação de eventos erro dominantes nestes canais é proposto. Um algoritmo para o cálculo do espectro de distâncias que manipula algebricamente os elementos da matriz adjacência destes códigos também é apresentado. Inicialmente este algoritmo é utilizado em esquemas com uma antena transmissora e uma antena receptora e depois é expandido para esquemas com múltiplas antenas. Na sequência, esta técnica é generalizada para códigos espácio-temporais concatenados em paralelo via um entrelaçador (STTuC - do inglês space time turbo codes). Para estes códigos é apresentado um algoritmo que incorpora à matriz adjacência o efeito da perfuração. Os limitantes expurgados obtidos com a técnica apresentada mostram-se robustos para códigos com diferentes critérios de construção e uma ampla faixa de relação sinal ruído Modulação codificada em treliça Códigos espácio-temporais Espectro de distâncias Função de transferência Códigos turbo Probabilidade de erro
17	O cálculo de distâncias entre pontos inacessíveis Souza Neto, Francisco Raimundo de 24 February 2015 (has links) Submitted by ANA KARLA PEREIRA RODRIGUES (anakarla_@hotmail.com) on 2017-09-04T16:08:47Z No. of bitstreams: 1 arquivototal.pdf: 4163313 bytes, checksum: e17d5ff7ad23d2c3b4250fd9d7cf56dc (MD5) / Approved for entry into archive by Viviane Lima da Cunha (viviane@biblioteca.ufpb.br) on 2017-09-05T11:04:13Z (GMT) No. of bitstreams: 1 arquivototal.pdf: 4163313 bytes, checksum: e17d5ff7ad23d2c3b4250fd9d7cf56dc (MD5) / Made available in DSpace on 2017-09-05T11:04:13Z (GMT). No. of bitstreams: 1 arquivototal.pdf: 4163313 bytes, checksum: e17d5ff7ad23d2c3b4250fd9d7cf56dc (MD5) Previous issue date: 2015-02-24 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Will be studied in this paper forms to calculate distances between inaccessible points using trigonometry concepts and definitions , spatial analytic geometry and spherical geometry . It will also be presented a historical approach to the main mathematical thinkers of ancient Greece. Still will be presented during the work settings , theorems and applications of the above themes. / Serão estudadas neste trabalho formas de calcular distâncias entre pontos inacessíveis, utilizando conceitos e definições de trigonometria, geometria analítica espacial e geometria esférica. Também será apresentada uma abordagem histórica dos principais pensadores matemáticos da antiga Grécia. Ainda serão apresentados no decorrer do trabalho definições, teoremas e aplicações dos temas acima citados. Distâncias Matemática Trigonometria Geometria Astronomia Distances Mathematics Trigonometry Geometry Astronomy MATEMATICA::MATEMATICA APLICADA
18	Modelos de custo e estatísticas para consultas por similaridade / Cost models and statistics for similarity searching Marcos Vinícius Naves Bêdo 10 October 2017 (has links) Consultas por similaridade constituem um paradigma de busca que fornece suporte à diversas tarefas computacionais, tais como agrupamento, classificação e recuperação de informação. Neste contexto, medir a similaridade entre objetos requer comparar a distância entre eles, o que pode ser formalmente modelado pela teoria de espaços métricos. Recentemente, um grande esforço de pesquisa tem sido dedicado à inclusão de consultas por similaridade em Sistemas Gerenciadores de Bases de Dados (SGBDs), com o objetivo de (i) permitir a combinação de comparações por similaridade com as comparações por identidade e ordem já existentes em SGBDs e (ii) obter escalabilidade para grandes bases de dados. Nesta tese, procuramos dar um próximo passo ao estendermos também o otimizador de consultas de um SGBD. Em particular, propomos a ampliação de dois módulos do otimizador: o módulo de Espaço de Distribuição de Dados e o módulo de Modelo de Custo. Ainda que o módulo de Espaço de Distribuição de Dados permita representar os dados armazenados, essas representações são insuficientes para modelar o comportamento das comparações em espaços métricos, sendo necessário estender este módulo para contemplar distribuições de distância. De forma semelhante, o módulo Modelo de Custo precisa ser ampliado para dar suporte à modelos de custo que utilizem estimativas sobre distribuições de distância. Toda a investigação aqui conduzida se concentra em cinco contribuições. Primeiro, foi criada uma nova sinopse para distribuições de distância, o Histograma Compactado de Distância (CDH), de onde é possível inferir valores de seletividade e raios para consultas por similaridade. Uma comparação experimental permitiu mostrar os ganhos das estimativas da sinopse CDH com relação à diversos competidores. Também foi proposto um modelo de custo baseado na sinopse CDH, o modelo Stockpile, cujas estimativas se mostraram mais precisas na comparação com outros modelos. Os Histogramas-Omni são apresentados como a terceira contribuição desta tese. Estas estruturas de indexação, construídas a partir de restrições de particionamento de histogramas, permitem a execução otimizada de consultas que mesclam comparações por similaridade, identidade e ordem. A quarta contribuição de nossa investigação se refere ao modelo RVRM, que é capaz de indicar quanto é possível empregar as estimativas das sinopses de distância para otimizar consultas por similaridade em conjuntos de dados de alta dimensionalidade. O modelo RVRM se mostrou capaz de identificar intervalos de dimensões para os quais essas consultas podem ser executadas eficientes. Finalmente, a última contribuição desta tese propõe a integração das sinopses e modelos revisados em um sistema com sintaxe de alto nível que pode ser acoplado em um otimizador de consultas. / Similarity searching is a foundational paradigm for many modern computer applications, such as clustering, classification and information retrieval. Within this context, the meaning of similarity is related to the distance between objects, which can be formally expressed by the Metric Spaces Theory. Many studies have focused on the inclusion of similarity search into Database Management Systems (DBMSs) for (i) enabling similarity comparisons to be combined with the DBMSs identity and order comparisons and (ii) providing scalability for very large databases. As a step further, we propose the extension of the DBMS Query Optimizer and, particularly, the extension of two modules of the Query Optimizer, namely Data Distribution Space and Cost Model modules. Although the Data Distribution Space enables representations of stored data, such representations are unsuitable for modeling the behavior of similarity comparisons, which requires the extension of the module to support distance distributions. Likewise, the Cost Model module must be extended to support cost models that depend on distance distributions. Our study is based on five contributions. A new synopsis for distance distributions, called Compact-Distance Histogram (CDH), is proposed and enables radius and selectivity estimation for similarity searching. An experimental comparison showed the gains of the estimates drawn from CDH in comparison to several competitors. A cost model based on the CDH synopsis and with accurate estimates, called Stockpile, is also proposed. Omni-Histograms are presented as the third contribution of the thesis. Such indexing structures are constructed according to histogram partition constraints and enable the optimization of queries that combine similarity, identity and order comparisons. The fourth contribution refers to the model RVRM, which indicates the possible use of the estimates obtained from distance-based synopses for the query optimization of high-dimensional datasets and identifies intervals of dimensions where similarity searching can be efficiently executed. Finally, the thesis proposes the integration of the reviewed synopses and cost models into a single system with a high-level language that can be coupled to a DBMS Query Optimizer. Concentração de distâncias Consultas por similaridade Otimização de consultas Distance concentration Query optimization Similarity searching
19	Agrupamento baseado em kernel com ponderação automática das variáveis via distâncias adaptativas FERREIRA, Marcelo Rodrigo Portela 22 July 2013 (has links) Submitted by João Arthur Martins (joao.arthur@ufpe.br) on 2015-03-12T19:12:53Z No. of bitstreams: 2 Tese MarceloFerreira.pdf: 1069107 bytes, checksum: 2595b3cb94f5f37295b6c52cdd1c905f (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-12T19:12:53Z (GMT). No. of bitstreams: 2 Tese MarceloFerreira.pdf: 1069107 bytes, checksum: 2595b3cb94f5f37295b6c52cdd1c905f (MD5) license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) Previous issue date: 2013-07-22 / Nesta tese de doutorado, propomos métodos de agrupamento baseados em funções kernel com ponderação automática das variáveis através de distâncias adaptativas onde medidas de dissimilaridade são obtidas como somas de distâncias Euclidianas entre padrões e protótipos calculadas individualmente para cada variável através de funções kernel. A principal vantagem da abordagem proposta sobre os métodos de agrupamento baseados em kernel convencionais é a possibilidade do uso de distâncias adaptativas, as quais mudam a cada iteração do algoritmo e podem ser a mesma para todos os grupos ou diferentes de um grupo para outro. Este tipo de medida de dissimilaridade é adequado ao aprendizado dos pesos das variáveis dinamicamente durante o processo de agrupamento, levando a uma melhora do desempenho dos algoritmos. Outra vantagem da abordagem proposta é que ela permite a introdução de diversas ferramentas para interpretação de partições e grupos. Experimentos com conjuntos de dados simulados e reais mostram a utilidade dos algoritmos propostos e o mérito das ferramentas de interpretação de partições e grupos. Kernel K-médias Ponderação automática das variáveis Distâncias adaptativas Indices de interpretação
20	Métodos de cluster para intervalos usando algoritmos do tipo nuvens dinâmicas Maria Cardoso Rodrigues de Souza, Renata January 2003 (has links) Made available in DSpace on 2014-06-12T15:53:04Z (GMT). No. of bitstreams: 2 arquivo4841_1.pdf: 1339242 bytes, checksum: 436434b8efc86d7d29ed2ccfa1e7d871 (MD5) license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5) Previous issue date: 2003 / A análise de dados simbólicos (Symbolic Data Analysis) é uma nova abordagem na área de descoberta automática de conhecimentos que visa desenvolver métodos para dados descritos por varáveis onde existem conjuntos de categorias, intervalos ou distribuições de probabilidade nas células das tabelas de dados. O objetivo deste trabalho é introduzir métodos de cluster para intervalos usando algoritmos de nuvens dinâmicas. Estes algoritmos consistem em obter, simultaneamente, uma partição em classes e identificar um conjunto de representantes das classes minimizando um critério que mede a adequação entre as classes e os protótipos. Os algoritmos de nuvens dinâmicas com distâncias adaptativas também encontram uma partição e um conjunto de representantes minimizando uma função critério, mas em cada interação existe uma distância diferente para comparar cada classe com o seu protótipo. A vantagem das distâncias adaptativas é que o algoritmo de agrupamento é capaz de reconhecer classes de formas e tamanhos diferentes. Neste trabalho, foi desenvolvido um método de nuvens dinâmicas usando a distância L1 para intervalos. Além deste método, foram também introduzidos três métodos com, respectivamente, as distâncias L1 (City-Block), L2 (Euclidiana) e L¥ (Máximo) adaptativas para intervalos. Para validar os métodos, foram realizados experimentos com um conjunto de espécies de peixes e dois conjuntos de dados artificiais de intervalos com diferentes graus de dificuldade de classificação. Os resultados fornecidos pelos métodos têm sido avaliados por um índice externo na estrutura de uma experiência Monte Carlo e testes estatísticos evidenciam que o desempenho dos métodos adaptativos é superior ao dos métodos não adaptativos Analise de Dados Simbolicos Algoritmos de Nuvens Dinâmicas Dados de Tipo Intervalo Distâncias Adaptativas

Search results