• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 464
  • 5
  • 3
  • Tagged with
  • 478
  • 188
  • 93
  • 83
  • 77
  • 76
  • 73
  • 65
  • 65
  • 65
  • 63
  • 61
  • 54
  • 49
  • 48
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
451

Aplicação de métodos geoestatísticos para identificação de dependência espacial na análise de dados de um experimento em delineamento sistemático tipo "leque" / Application of geostatistical methods to identify the spatial dependence in the data analysis of a fan systematic design experiment

Melissa Lombardi Oda 20 May 2005 (has links)
Os delineamentos sistemáticos são usados nas mais diversas áreas, como: florestal, horticultura, solos, etc. Na área florestal, os delineamentos sistemáticos são freqüentemente usados para estudos preliminares e têm o objetivo de testar o maior número de espaçamentos possíveis. No entanto, existem algumas limitações para a sua utilização. A primeira é o arranjo sistemático (não casualizado) das plantas, que não permite o uso das análises convencionais. A segunda é a alta sensibilidade para valores perdidos. Quando uma planta é perdida, o espaçamento das plantas vizinhas é alterado, assim esses valores não podem ser incluídos no conjunto de dados e informações consideráveis são excluídas das análises. O objetivo deste trabalho foi aplicar a metodologia geoestatística para identificação de dependência espacial em um experimento em delineamento sistemático tipo "leque", levando-se em consideração: a eliminação dos dados das plantas vizinhas aos valores perdidos e as informações de ocorrência de parcelas perdidas e o tempo que ocorreram. Os dados de volume sólido por planta utilizados neste trabalho são provenientes de um experimento de espaçamento de Eucalyptus dunnii em delineamento sistemático tipo "leque". Neste trabalho foram utilizados os dados referentes ao sexto ano, idade comercial de corte da espécie, com os seguintes procedimentos: eliminação dos dados das plantas vizinhas às plantas mortas (Modelo I); as informações de mortes das plantas foram consideradas como uma covariável no modelo (Modelo II) e além da covariável morte das plantas, também foi levado em consideração o tempo da ocorrência da morte (Modelo III). Os parâmetros do semivariograma foram estimados pelo método de máxima verossimilhança e para seleção de modelos, utilizou-se o Critério de Akaike (AIC). Os resultados obtidos permitem concluir que se identificou uma fraca dependência espacial, o que não justificaria considerá-la com a aplicação de um modelo geoestatístico. A função de correlação que apresentou melhor desempenho foi a Matérn com k = 2 para os três modelos considerados. Comparando-se esses modelos e seguindo o critério de Akaike, o modelo mais adequado foi o II, pois apresentou menor valor de AIC. / Systematic designs are utilized in many areas, such as: forestry, horticulture, soils, etc. In forestry, the systematic designs are frequently used for preliminary studies and they aim at evaluating the largest number of possible spacings. However, there are some limitations on their use. The first limitation is the systematic design (non-randomized) of plants, which does not allow the use of conventional analyses. The second is the high sensitivity to lost values. When a plant is lost, the neighboring plant spacings are altered, so these values cannot be added to the data collection, and a great sum of information is excluded from the analyses. This study aimed at applying geostatistical methods to identify the spatial dependence in the data analysis of a fan systematic design experiment, taking into account: the exclusion of neighboring plant data to the lost values and the information regarding the occurrence of lost parcels as well as the time of their occurrence. The plant solid volume data utilized in this study were taken from a fan systematic design Eucalyptus dunnii spacing study. The data utilized were referent to the sixth year, commercial age for cutting of the specie, with the following procedures exclusion of the data from a neighboring plant next to a dead tree (Model I); the information of tree mortality as covariable in the model (Model II); and the time of occurrence of tree mortality, besides the tree mortality covariable (Model III). The semivariogram parameters were estimated by the maximum likelihood method, and the model selection was done by the utilization of the Akaike's Information Criterion (AIC). It was possible to conclude from the result analyses that there is a weak spatial dependence, which does not justify neither taking it into account nor the utilization of a geostatistical model. The correlation function that showed the best performance was the Matérn, with kappa=2 for the three models considered. By the comparison of these three models and the utilization of the Akaike's Information Criterion, the most suitable model was Model II, as it showed lower AIC value.
452

Caracterização geotécnica do subsolo da porção nordeste do município de Fortaleza (CE) com base em geoestatística / Geotechnical characterization based on geostatistics of a northeastern area on Fortaleza county, northeastern Brazil

Helano Regis da Nobrega Fonteles 10 October 2003 (has links)
O presente trabalho resulta da aplicação de técnicas geoestatística de análise da variabilidade espacial e de estimativas de dados de sondagem de simples reconhecimento com standard penetration test (SPT) objetivando a caracterização geotécnica de uma área com 44 'KM POT.2', situada na porção nordeste do município de Fortaleza (CE). A caracterização geotécnica desta área compreendeu os seguintes processos: montagem de um banco de dados geotécnicos; aplicação de algoritmos de interpolação para elaboração do modelo digital de terreno (MDT); a aplicação de técnicas geoestatísticas de cokrigagem e krigagem ordinária na elaboração do mapa de superfície freática; a construção de um modelo geológico 3D de superfície; o mapeamento de uma superfície do impenetrável ao amostrador do SPT, auxiliado por geoestatística; a modelagem geoestatística 3D dos dados do índice de resistência à penetração (N) do amostrador do SPT, o que possibilitou a estimativa em bancadas por krigagem ordinária de blocos, do referido índice em diversos níveis altimétricos do terreno. Os dados estimados das bancadas foram tratados no programa ArcView 3.1 em ambiente de sistemas de informações geográficas (SIG) na elaboração de mapas de uso sugerido de fundações, os quais derivam de uma reclassificação, com base em diversos limites de impenetrável ao SPT, dos dados estimados de N, que permitiu a identificação de áreas favoráveis ao uso de um número finito de elementos estruturais de fundação. / This work results from the application of geostatistical techniques on standard penetration test (SPT) data to the geotechnical characterisation of an area with 44 'KM POT.2' situated on the northeastern region of Fortaleza county, northeastern Brazil. The geotechnical characterization involved the following steps: the geotechnical databank development; the performance of the interpolation algorithms and application to the digital elevation model (DEM); estimation and mapping the water table level with ordinary kriging and cokriging techniques; generation of a 3D surface geological model; geostatistical mapping the SPT maximum hard penetration surface; application of 3D geostatistical modeling techniques to SPT database providing bench estimates on blocks. The SPT estimated data were inserted and reclassified on the geographical information system based on the software ESRI ArcView 3.1 in order to produce the suggested foundation maps with references to SPT penetration limits.
453

EFICIÊNCIA DE MALHAS AMOSTRAIS UTILIZADAS NA CARACTERIZAÇÃO DE ATRIBUTOS QUÍMICOS EM LATOSSOLOS MANEJADOS COM AGRICULTURA DE PRECISÃO / EFFICIENCY OF SAMPLING GRIDS USED IN THE CHARACTERIZATION OF CHEMICAL ATTRIBUTES IN OXISOLS MANAGED WITH PRECISION AGRICULTURE

Cherubin, Maurício Roberto 07 January 2013 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The georeferenced soil sampling using sampling grids is the main strategy of precision agriculture (PA) to recognize the spatial variability of soil attributes, allowing manage them in site-specific. In this context, the objective of the work was to evaluate the efficiency of using different sizes of sampling grids in the characterization of spatial variability of chemical attributes in Oxisols managed with PA in Southern Brazil. Therefore, the work consists of three studies. In studies one and two were used 60 areas (6,046.55 ha), located in 23 counties of North region of Rio Grande do Sul (RS). The areas were sampled using regular grids of 100 x 100 m (20 areas), 142 x 142 m (20 areas) and 173 x 173 m (20 areas), being that 10 areas of each grid were collected from 0.00-0.10 m and 10 areas from 0.00-0.15 m. The spatial variability of acidity attributes (pHwater and base saturation) and bases related (Ca and Mg) (study one) and the levels of P and K (study two) were analyzed by descriptive statistics and geostatistics. In study three, was used an area of 41.96 ha, located in Boa Vista das Missões - RS, where was made the collect of soil in seven sizes of sample grids, 50 x 50 m, 75 m x 75, 100 x 100 m, 125 m x 125, 150 x 150 m, 175 m and 200 x 175 x 200 m, at depth of 0.00-0.10 m. The levels of P and K were analyzed by descriptive statistics and geostatistics, and the similarity of thematic maps was compared by the coefficient of relative deviation (CRD) and by Pearson correlation matrix (p <0.05). The areas of Oxisols managed with PA in RS, show moderate acidity and high fertility, with the exception of subareas that presents limiting P levels. Independently of the depth sampled, the grid sample sizes used in RS state, in general, are not efficient in capturing the different scales of variability in soil chemical properties. According as increase the sample grid the thematic maps of P (CRD: 24.0 to 36.2%) and K (CRD: 11.7 to 19.4%) show more dissimilar to those obtained in smaller grid (50 x 50 m) considered as reference. Thus, the reduction of sampling grid sizes increases the accuracy of the information generated through thematic maps, allowing to do prescriptions of lime and fertilizers on site-specific with greater efficiency, and should be recommended in future sampling plans of soil adopted in PA areas in Southern Brazil. / A amostragem georreferenciada de solo utilizando malhas regulares é a principal estratégia da agricultura de precisão (AP) para reconhecer a variabilidade espacial dos atributos de solo, possibilitando manejá-los em sítio-específico. Nesse contexto, o objetivo do trabalho foi avaliar a eficiência do uso de diferentes dimensões de malhas amostrais na caracterização da variabilidade espacial de atributos químicos em Latossolos Vermelhos manejados com AP no Sul do Brasil. Para tanto, o trabalho constitui-se de três estudos. Nos estudos um e dois utilizaram-se 60 áreas (6.046,55 ha), localizadas em 23 municípios da região Norte do Rio Grande do Sul (RS). As áreas foram amostradas utilizando malhas regulares de 100 x 100 m (20 áreas); 142 x 142 m (20 áreas) e 173 x 173 m (20 áreas), sendo que 10 áreas de cada malha foram coletadas de 0,00-0,10 m e 10 áreas de 0,00-0,15 m. A variabilidade espacial dos atributos de acidez (pHágua e saturação por bases) e bases relacionadas (Ca e Mg) (estudo um) e dos teores de P e K (estudo dois) foram analisadas por meio da estatística descritiva e geoestatística. No estudo três, utilizou-se uma área de 41,96 ha, localizada em Boa Vista das Missões RS, onde foi realizada a coleta de solo em sete dimensões de malha amostral, 50 x 50 m, 75 x 75 m, 100 x 100 m, 125 x 125 m, 150 x 150 m, 175 x 175 m e 200 x 200 m, na profundidade de 0,00-0,10 m. Os teores de P e K foram analisados por meio da estatística descritiva e da geoestatística, e a similaridade dos mapas temáticos foi comparada pelo coeficiente de desvio relativo (CDR) e pela matriz de correlação de Pearson (p <0,05). As áreas de Latossolos Vermelhos manejadas com AP no estado do RS apresentam moderada acidez e alta fertilidade, com exceção de locais que apresentam teores limitantes de P. Independente da profundidade amostrada, as dimensões das malhas amostrais utilizadas no RS, em geral, não são eficientes em captar as diferentes escalas de variabilidade dos atributos químicos do solo. À medida que aumenta a malha amostral os mapas temáticos de P (CDR: 24,0 a 36,2%) e K (CDR: 11,7 a 19,4%) mostram-se mais dissimilares aos obtidos na menor malha (50 x 50 m) considerada como referência. Desta forma, a redução da dimensão da malha amostral aumenta a acurácia das informações geradas por meio de mapas temáticos, permitindo realizar prescrições de corretivos e fertilizantes em sítio-específico com maior eficiência, e devem ser preconizadas em futuros planos de amostragem de solo adotados nas áreas de AP no Sul do Brasil.
454

Spatial crash prediction models: an evaluation of the impacts of enriched information on model performance and the suitability of different spatial modeling approaches / Modelos espaciais de previsão de acidentes: uma avaliação do desempenho dos modelos a partir da incorporação de informações aprimoradas e a adequação de diferentes abordagens de modelagem espacial

Gomes, Monique Martins 04 December 2018 (has links)
The unavailability of crash-related data has been a long lasting challenge in Brazil. In addition to the poor implementation and follow-up of road safety strategies, this drawback has hampered the development of studies that could contribute to national goals toward road safety. In contrast, developed countries have built their effective strategies on solid data basis, therefore, investing a considerable time and money in obtaining and creating pertinent information. In this research, we aim to assess the potential impacts of supplementary data on spatial model performance and the suitability of different spatial modeling approaches on crash prediction. The intention is to notify the authorities in Brazil and other developing countries, about the importance of having appropriate data. In this thesis, we set two specific objectives: (I) to investigate the spatial model prediction accuracy at unsampled subzones; (II) to evaluate the performance of spatial data analysis approaches on crash prediction. Firstly, we carry out a benchmarking based on Geographically Weighted Regression (GWR) models developed for Flanders, Belgium, and São Paulo, Brazil. Models are developed for two modes of transport: active (i.e. pedestrians and cyclists) and motorized transport (i.e. motorized vehicles occupants). Subsequently, we apply the repeated holdout method on the Flemish models, introducing two GWR validation approaches, named GWR holdout1 and GWR holdout2. While the former is based on the local coefficient estimates derived from the neighboring subzones and measures of the explanatory variables for the validation subzones, the latter uses the casualty estimates of the neighboring subzones directly to estimate outcomes for the missing subzones. Lastly, we compare the performance of GWR models with Mean Imputation (MEI), K-Nearest Neighbor (KNN) and Kriging with External Drift (KED). Findings showed that by adding the supplementary data, reductions of 20% and 25% for motorized transport, and 25% and 35% for active transport resulted in corrected Akaike Information Criterion (AICc) and Mean Squared Prediction Errors (MSPE), respectively. From a practical perspective, the results could help us identify hotspots and prioritize data collection strategies besides identify, implement and enforce appropriate countermeasures. Concerning the spatial approaches, GWR holdout2 out performed all other techniques and proved that GWR is an appropriate spatial technique for both prediction and impact analyses. Especially in countries where data availability has been an issue, this validation framework allows casualties or crash frequencies to be estimated while effectively capturing the spatial variation of the data. / A indisponibilidade de variáveis explicativas de acidentes de trânsito tem sido um desafio duradouro no Brasil. Além da má implementação e acompanhamento de estratégias de segurança viária, esse inconveniente tem dificultado o desenvolvimento de estudos que poderiam contribuir com as metas nacionais de segurança no trânsito. Em contraste, países desenvolvidos tem construído suas estratégias efetivas com base em dados sólidos, e portanto, investindo tempo e dinheiro consideráveis na obtenção e criação de informações pertinentes. O objetivo dessa pesquisa é avaliar os possíveis impactos de dados suplementares sobre o desempenho de modelos espaciais, e a adequação de diferentes abordagens de modelagem espacial na previsão de acidentes. A intenção é notificar as autoridades brasileiras e de outros países em desenvolvimento sobre a importância de dados adequados. Nesta tese, foram definidos dois objetivos específicos: (I) investigar a acurácia do modelo espacial em subzonas sem amostragem; (II) avaliar o desempenho de técnicas de análise espacial de dados na previsão de acidentes. Primeiramente, foi realizado um estudo comparativo, baseado em modelos desenvolvidos para Flandres (Bélgica) e São Paulo (Brasil), através do método de Regressão Geograficamente Ponderada (RGP). Os modelos foram desenvolvidos para dois modos de transporte: ativos (pedestres e ciclistas) e motorizados (ocupantes de veículos motorizados). Subsequentemente, foi aplicado o método de holdout repetido nos modelos Flamengos, introduzindo duas abordagens de validação para GWR, denominados RGP holdout1 e RGP holdout2. Enquanto o primeiro é baseado nas estimativas de coeficientes locais derivados das subzonas vizinhas e medidas das variáveis explicativas para as subzonas de validação, o último usa as estimativas de acidentes das subzonas vizinhas, diretamente, para estimar os resultados para as subzonas ausentes. Por fim, foi comparado o desempenho de modelos RGP e outras abordagens, tais como Imputação pela Média de dados faltantes (IM), K-vizinhos mais próximos (KNN) e Krigagem com Deriva Externa (KDE). Os resultados mostraram que, adicionando os dados suplementares, reduções de 20% e 25% para o transporte motorizado, e 25% e 35% para o transporte ativo, foram resultantes em termos de Critério de Informação de Akaike corrigido (AICc) e Erro Quadrático Médio da Predição (EQMP), respectivamente. Do ponto de vista prático, os resultados poderiam ajudar a identificar hotspots e priorizar estratégias de coleta de dados, além de identificar, implementar e aplicar contramedidas adequadas. No que diz respeito às abordagens espaciais, RGP holdout2 teve melhor desempenho em relação a todas as outras técnicas e, provou que a RGP é uma técnica espacial apropriada para ambas as análises de previsão e impactos. Especialmente em países onde a disponibilidade de dados tem sido um problema, essa estrutura de validação permite que as acidentes sejam estimados enquanto, capturando efetivamente a variação espacial dos dados.
455

Análise da influência da vizinhança no comportamento individual relativo a viagens através de dados em painel / Analysis of neighborhood influence on travel behaviour through panel data

Assirati, Lucas 04 September 2018 (has links)
O comportamento individual relativo a viagens sofre a influência de fatores individuais e do meio urbano. Assim, a vizinhança seria uma das variáveis a serem consideradas na análise comportamental relacionada aos deslocamentos. O objetivo principal deste trabalho é analisar a influência da vizinhança no comportamento individual relativo a viagens, através de dados em painel. Dados em painel constituem importante ferramenta em análises comportamentais subjacentes a viagens urbanas, uma vez que propiciam maior quantidade de informações quando comparados aos dados seccionais. Padrões de viagens são mais bem evidenciados, através de dados em painel, caracterizando as habituais rotinas de atividades e viagens, além de melhor identificar comportamentos atípicos. Todavia, a obtenção desses dados comumente não é atividade trivial, demandando recursos monetários e de tempo. Um dos objetivos secundários deste trabalho é apresentar uma maneira prática e pouco onerosa de obtenção de dados em painel através de Smartphones. Tais dados, posteriormente, são aplicados à classificação de indivíduos segundo comportamento relacionado às viagens. A potencialidade da proposta sugerida é validada por meio de um estudo de caso relativo aos estudantes universitários do município de São Carlos - SP, Brasil. Através dos dados em painel, fornecidos pelos estudantes, utilizou-se o algoritmo k-médias considerando quatro variáveis relativas aos deslocamentos. As três categorias obtidas apresentam estrutura espacial e, portanto, possibilitam análises espaciais exploratórias e confirmatórias, almejando a compreensão de influências da vizinhança nas dinâmicas cotidianas. Este trabalho atesta a existência de autocorrelação espacial do conjunto de dados por meio de dois indicadores: Moran e SivarG (Global Spatial Indicator Based on Variogram). A corroboração da dependência espacial, apontada pelos indicadores globais, é confirmada por meio de dois modelos de escolha discreta. Um contendo apenas variáveis originais da base de dados. Outro, análogo ao primeiro, porém adicionado de covariáveis regionais, obtidas por preceitos da geoestatística. A incorporação das covariáveis regionais aumenta a precisão do modelo e promove um incremento das taxas de acertos em validações cruzadas. / Individual travel behaviour is influenced by individual factors and the urban environment. Thus, the neighborhood influence would be one of the variables to be considered in travel behavior analysis related to urban displacements. The main objective of this work is to analyze the influence of neighborhood on travel behavior by panel data. Panel data is an important tool in urban travel behavioral analyzes, since they provide a greater amount of information when compared to sectional data. Travel patterns are more evident through panel data, characterizing the usual routines of activities, as well the atypical behaviors. However, obtaining these data is not a simple task, requiring monetary and time resources. Secondary goals of this work aim to present a practical and inexpensive way to obtain panel data through Smartphones. These data are then applied to the classification of individuals according to travel behavior. The potential of the proposal is validated by a case of study concerning undergraduate and PhD students from São Carlos - SP, Brazil. Using the data provided by the students, a k-means algorithm was used considering four variables regarding displacements. These three categories have spatial structure and allow exploratory and confirmatory spatial data analyzes aiming the comprehension of the nearby influence of data at daily dynamics. This work attests to the existence of spatial autocorrelation of the data set by two indicators: Moran and SivarG (Global Spatial Indicator Based on Variogram). Corroboration of spatial dependence, pointed by the global indicators, is confirmed by two discrete choice models. The first one includes just the original database variables. The second one, analogous to the first, but added of regional covariates obtained by geostatistical concepts. The addition of regional variables leads to a more accurate model, increasing cross-validations hit rates.
456

Segmentação multiresolução variográfica ótima. / Optimal variographic multiresolution segmentation.

Costa, Wilian França 12 August 2016 (has links)
O desenvolvimento de soluções que auxiliem na extração de informações de dados oriundos de sistemas de sensoriamento remoto e outras geotecnologias são essenciais em diversas atividades, por exemplo, a identificação de requisitos para o monitoramento ambiental; a definição de regiões de conservação; o planejamento e execução de atividades de verificação quanto ao cumprimento e uso do espaço; o gerenciamento de recursos naturais; a definição de áreas protegidas e ecossistemas; e o planejamento para aplicação e reposição de insumos agrícolas. Neste contexto, o presente trabalho apresenta um método para parametrizar um algoritmo segmentador Multiresolution, de forma que os segmentos obtidos sejam os maiores possíveis dentro de limites pré-estabelecidos de heterogeneidade para os dados avaliados. O método faz uso de variografia, uma ferramenta geoestatística que apresenta uma estimativa de quanto duas amostras variam em uma região espacial, de acordo com a distância relativa entre elas. Mostra-se também como a avaliação de múltiplos variogramas pode ser empregada na delimitação de regiões quando combinada a este algoritmo de segmentação, desde que os dados estejam dispostos em uma grade amostral regularmente espaçada. O método desenvolvido utiliza o efeito pepita estimado para os atributos dispostos em camadas sobrepostas e quantifica a segmentação em dois momentos (ou médias) para identificar o valor do parâmetro espacial ótimo a ser aplicado no segmentador. Apresenta-se, como exemplos de aplicabilidade do método, três casos típicos desta área: (i) definição de zonas de manejo para agricultura de precisão; (ii) seleção de regiões para estimativas de degradação ambiental na vizinhança de ponto de coleta/observação de espécies; e (iii) a identificação de regiões bioclimáticas que compõem uma Unidade de Conservação da biodiversidade. / Information extraction of data derived from remote sensing and other geotechnologies is important for many activities, e.g., the identification of environmental requirements, the definition of conservation areas, the planning and implementation of activities regarding compliance of correct land use; the management of natural resources, the definition of protected ecosystem areas, and the spatial planning of agricultural input reposition. This thesis presents a parameter optimisation method for the Multiresolution segmentation algorithm. The goal of the method is to obtain maximum sized segments within the established heterogeneity limits. The method makes use of variography, a geostatistical tool that gives a measure of how much two samples will vary in a region depending on the distance between each one of them. The variogram nugget effect is measured for each attribute layer and then averaged to obtain the optimal value for spatial segmentation with the Multiresolution algorithm. The segments thus obtained are superimposed on a regularly spaced sampled grid of georeferenced data to divide the region under study. To show the usefulnesss of this method, the following three case studies were performed: (i) the delineation of precision farming management zones; (ii) the selection of regions for environmental degradation estimates in the neighbourhood of species occurrence points; and (iii) the identification of bioclimatic regions that are present in biodiversity conservation units.
457

CORREÇÃO DE DADOS AGROMETEOROLÓGICOS UTILIZANDO MÉTODOS ESTATÍSTICOS

Baba, Ricardo Kazuo 31 July 2012 (has links)
Made available in DSpace on 2017-07-21T14:19:32Z (GMT). No. of bitstreams: 1 Ricardo Baba.pdf: 3642224 bytes, checksum: 81e8e78f554cdf870e6f9a554b71f87a (MD5) Previous issue date: 2012-07-31 / Climatic data are more and more important to predict climate phenomena or to evaluate historical data that serve as support for decision making especially for agriculture. Ensuring the quality of these data is crucial. These data are collected by the meteorological stations, during this process some data gaps and data inconsistent may be generated. Identify suspicious or inconsistent data is very important to ensure data quality. This paper presents an approach that uses statistical and geostatistical techniques to identify incorrect and suspicious data and estimate new values to fill gaps and errors. In this research, a spatial database was used to implement these techniques (statistical and geostatistical) and to test and evaluate the weather data. To evaluate these techniques we used data from stations located in Paraná State to evaluate the temperature variable. To check the results of the estimated data, we used the mean absolute error (MAE) and the root mean square error (RMSE). As a result, the uses of these techniques have proved to be suitable to identify basic errors and historical errors. The temporal validation showed a poor performance by overestimating the amount of incorrect data. Regarding the estimation techniques applied Kriging, Inverse of Distance Weighted and Linear Regression, all showed similar performance in the error analysis. / A análise de dados climáticos serve de suporte na previsão de fenômenos relacionados, na avaliação de seus dados históricos e para a tomada de decisões, em especial na área da agricultura. Garantir a sua qualidade é fundamental. O processo de coleta desses dados, através das estações meteorológicas, pode apresentar problemas, onde dados inconsistentes podem ser geridos ou obtidos. A identificação de dados inconsistentes ou suspeitos é de fundamental importância na garantia de qualidade dos dados. Este trabalho apresenta uma abordagem para solução do problema, utilizando técnicas estatísticas e geoestatísticas na identificação de dados inconsistentes e na estimativa de dados a serem corrigidos ou preenchidos. A implementação destas técnicas em um banco de dados espacial apresentou-se como um facilitador na identificação e no preenchimento desses dados. Para avaliação destas técnicas utilizou-se de dados das estações localizadas no Estado do Paraná, para análise da variável temperatura. Para avaliar os resultados, foram utilizados os erros médio e quadrático. Como resultado, destaca-se que as técnicas de identificação de erros mostraram-se adequadas na consistência de erros básicos e históricos. A validação espacial apresentou baixo desempenho por superestimar a quantidade de dados incorretos. Quanto as técnicas utilizadas na estimativa dos dados, Krigagem, Inverso da Distância e Regressão Linear, todas apresentaram desempenho semelhantes com relação à análise dos erros.
458

Métodos de estimação de parâmetros em modelos geoestatísticos com diferentes estruturas de covariâncias: uma aplicação ao teor de cálcio no solo. / Parameter estimation methods in geostatistic models with different covariance structures: an application to the calcium content in the soil.

Oliveira, Maria Cristina Neves de 17 March 2003 (has links)
A compreensão da dependência espacial das propriedades do solo vem sendo cada vez mais requerida por pesquisadores que objetivam melhorar a interpretação dos resultados de experimentos de campo fornecendo, assim, subsídios para novas pesquisas a custos reduzidos. Em geral, variáveis como, por exemplo, o teor de cálcio no solo, estudado neste trabalho, apresentam grande variabilidade impossibilitando, na maioria das vezes, a detecção de reais diferenças estatísticas entre os efeitos de tratamentos. A consideração de amostras georreferenciadas é uma abordagem importante na análise de dados desta natureza, uma vez que amostras mais próximas são mais similares do que as mais distantes e, assim, cada realização desta variável contém informação de sua vizinhança. Neste trabalho, métodos geoestatísticos que baseiam-se na modelagem da dependência espacial, nas pressuposições Gaussianas e nos estimadores de máxima verossimilhança são utilizados para analisar e interpretar a variabilidade do teor de cálcio no solo, resultado de um experimento realizado na Fazenda Angra localizada no Estado do Rio de Janeiro. A área experimental foi dividida em três regiões em função dos diferentes períodos de adubação realizadas. Neste estudo foram utilizados dados do teor de cálcio obtidos das camadas 0-20cm e 20-40cm do solo, de acordo com as coordenadas norte e leste. Modelos lineares mistos, apropriados para estudar dados com esta característica, e que permitem a utilização de diferentes estruturas de covariâncias e a incorporação da região e tendência linear das coordenadas foram usados. As estruturas de covariâncias utilizadas foram: a exponencial e a Matérn. Para estimar e avaliar a variabilidade dos parâmetros utilizaram-se os métodos de máxima verossimilhança, máxima verossimilhança restrita e o perfil de verossimilhança. A identificação da dependência e a predição foram realizadas por meio de variogramas e mapas de krigagem. Além disso, a seleção do modelo adequado foi feita pelo critério de informação de Akaike e o teste da razão de verossimilhanças. Observou-se, quando utilizado o método de máxima verossimilhança, o melhor modelo foi aquele com a covariável região e, com o método de máxima verossimilhança restrita, o modelo com a covariável região e tendência linear nas coordenadas (modelo 2). Com o teor de cálcio, na camada 0-20cm e considerando-se a estrutura de covariância exponencial foram obtidas as menores variâncias nugget e a maior variância espacial (sill - nugget). Com o método de máxima verossimilhança e com o modelo 2 foram observadas variâncias de predição mais precisas. Por meio do perfil de verossimilhança pode-se observar menor variabilidade dos parâmetros dos variogramas ajustados com o modelo 2. Utilizando-se vários modelos e estruturas de covariâncias, deve-se ser criterioso, pois a precisão das estimativas, depende do tamanho da amostra e da especificação do modelo para a média. Os resultados obtidos foram analisados, com a subrotina geoR desenvolvida por Ribeiro Junior & Diggle (2000), e por meio dela pode-se obter estimativas confiáveis para os parâmetros dos diferentes modelos estimados. / The understanding of the spatial dependence of the properties of the soil becomes more and more required by researchers that attempt to improve the interpretation of the results of field experiments supplying subsidies for new researches at reduced costs. In general, variables as, for example, the calcium content in the soil, studied in this work, present great variability disabling, most of the time, the detection of real statistical differences among the treatment effects. The consideration of georeferenced samples is an important approach in the analysis of data of this nature, because closer samples are more similar than the most distant ones and, thus, each realization of this variable contains information of its neighborhood. In this work, geostatistics methods that are based on the modeling of the spatial dependence, under the Gaussian assumptions and the maximum likelihood estimators, are used to analyze and to interpret the variability of calcium content in the soil, obtained from an experiment carried on at Fazenda Angra, located in Rio de Janeiro, Brazil. The experimental area was divided in three areas depending on the different periods of fertilization. In this study, data of the calcium soil content from the layers 0-20cm and 20-40cm, were used, according to the north and east coordinates. Mixed linear models, ideal to study data with this characteristic, and that allow the use of different covariance structures, and the incorporation of the region and linear tendency of the coordinates, were used. The covariance structures were: the exponential and the Matérn. Maximum likelihood, maximum restricted likelihood and the profile of likelihood methods were used to estimate and to evaluate the variability of the parameters. The identification of the dependence and the prediction were realized using variograms and krigging maps. Besides, the selection of the appropriate model was made through the Akaike information criterion and the likelihood ratio test. It was observed that when maximum likelihood method was used the most appropriate model was that with the region covariate and, with the maximum restricted likelihood method, the best model was the one with the region covariate and linear tendency in the coordinates (model 2). With the calcium content, in the layer 0-20cm and considering the exponential covariance structure, the smallest nugget variances and the largest spatial variance (sill - nugget) were obtained. With the maximum likelihood method and with the model 2 more precise prediction variances were observed. Through the profile of likelihood method, smaller variability of the adjusted variogram parameters can be observed with the model 2. With several models and covariance structures being used, one should be very critical, because the precision of the estimates depends on the size of the sample and on the specification of the model for the average. The obtained results were analyzed, with the subroutine geoR developed by Ribeiro Junior & Diggle (2000), and through this subroutine, reliable estimates for the parameters of the different estimated models can be obtained.
459

Spatial crash prediction models: an evaluation of the impacts of enriched information on model performance and the suitability of different spatial modeling approaches / Modelos espaciais de previsão de acidentes: uma avaliação do desempenho dos modelos a partir da incorporação de informações aprimoradas e a adequação de diferentes abordagens de modelagem espacial

Monique Martins Gomes 04 December 2018 (has links)
The unavailability of crash-related data has been a long lasting challenge in Brazil. In addition to the poor implementation and follow-up of road safety strategies, this drawback has hampered the development of studies that could contribute to national goals toward road safety. In contrast, developed countries have built their effective strategies on solid data basis, therefore, investing a considerable time and money in obtaining and creating pertinent information. In this research, we aim to assess the potential impacts of supplementary data on spatial model performance and the suitability of different spatial modeling approaches on crash prediction. The intention is to notify the authorities in Brazil and other developing countries, about the importance of having appropriate data. In this thesis, we set two specific objectives: (I) to investigate the spatial model prediction accuracy at unsampled subzones; (II) to evaluate the performance of spatial data analysis approaches on crash prediction. Firstly, we carry out a benchmarking based on Geographically Weighted Regression (GWR) models developed for Flanders, Belgium, and São Paulo, Brazil. Models are developed for two modes of transport: active (i.e. pedestrians and cyclists) and motorized transport (i.e. motorized vehicles occupants). Subsequently, we apply the repeated holdout method on the Flemish models, introducing two GWR validation approaches, named GWR holdout1 and GWR holdout2. While the former is based on the local coefficient estimates derived from the neighboring subzones and measures of the explanatory variables for the validation subzones, the latter uses the casualty estimates of the neighboring subzones directly to estimate outcomes for the missing subzones. Lastly, we compare the performance of GWR models with Mean Imputation (MEI), K-Nearest Neighbor (KNN) and Kriging with External Drift (KED). Findings showed that by adding the supplementary data, reductions of 20% and 25% for motorized transport, and 25% and 35% for active transport resulted in corrected Akaike Information Criterion (AICc) and Mean Squared Prediction Errors (MSPE), respectively. From a practical perspective, the results could help us identify hotspots and prioritize data collection strategies besides identify, implement and enforce appropriate countermeasures. Concerning the spatial approaches, GWR holdout2 out performed all other techniques and proved that GWR is an appropriate spatial technique for both prediction and impact analyses. Especially in countries where data availability has been an issue, this validation framework allows casualties or crash frequencies to be estimated while effectively capturing the spatial variation of the data. / A indisponibilidade de variáveis explicativas de acidentes de trânsito tem sido um desafio duradouro no Brasil. Além da má implementação e acompanhamento de estratégias de segurança viária, esse inconveniente tem dificultado o desenvolvimento de estudos que poderiam contribuir com as metas nacionais de segurança no trânsito. Em contraste, países desenvolvidos tem construído suas estratégias efetivas com base em dados sólidos, e portanto, investindo tempo e dinheiro consideráveis na obtenção e criação de informações pertinentes. O objetivo dessa pesquisa é avaliar os possíveis impactos de dados suplementares sobre o desempenho de modelos espaciais, e a adequação de diferentes abordagens de modelagem espacial na previsão de acidentes. A intenção é notificar as autoridades brasileiras e de outros países em desenvolvimento sobre a importância de dados adequados. Nesta tese, foram definidos dois objetivos específicos: (I) investigar a acurácia do modelo espacial em subzonas sem amostragem; (II) avaliar o desempenho de técnicas de análise espacial de dados na previsão de acidentes. Primeiramente, foi realizado um estudo comparativo, baseado em modelos desenvolvidos para Flandres (Bélgica) e São Paulo (Brasil), através do método de Regressão Geograficamente Ponderada (RGP). Os modelos foram desenvolvidos para dois modos de transporte: ativos (pedestres e ciclistas) e motorizados (ocupantes de veículos motorizados). Subsequentemente, foi aplicado o método de holdout repetido nos modelos Flamengos, introduzindo duas abordagens de validação para GWR, denominados RGP holdout1 e RGP holdout2. Enquanto o primeiro é baseado nas estimativas de coeficientes locais derivados das subzonas vizinhas e medidas das variáveis explicativas para as subzonas de validação, o último usa as estimativas de acidentes das subzonas vizinhas, diretamente, para estimar os resultados para as subzonas ausentes. Por fim, foi comparado o desempenho de modelos RGP e outras abordagens, tais como Imputação pela Média de dados faltantes (IM), K-vizinhos mais próximos (KNN) e Krigagem com Deriva Externa (KDE). Os resultados mostraram que, adicionando os dados suplementares, reduções de 20% e 25% para o transporte motorizado, e 25% e 35% para o transporte ativo, foram resultantes em termos de Critério de Informação de Akaike corrigido (AICc) e Erro Quadrático Médio da Predição (EQMP), respectivamente. Do ponto de vista prático, os resultados poderiam ajudar a identificar hotspots e priorizar estratégias de coleta de dados, além de identificar, implementar e aplicar contramedidas adequadas. No que diz respeito às abordagens espaciais, RGP holdout2 teve melhor desempenho em relação a todas as outras técnicas e, provou que a RGP é uma técnica espacial apropriada para ambas as análises de previsão e impactos. Especialmente em países onde a disponibilidade de dados tem sido um problema, essa estrutura de validação permite que as acidentes sejam estimados enquanto, capturando efetivamente a variação espacial dos dados.
460

Análise da influência da vizinhança no comportamento individual relativo a viagens através de dados em painel / Analysis of neighborhood influence on travel behaviour through panel data

Lucas Assirati 04 September 2018 (has links)
O comportamento individual relativo a viagens sofre a influência de fatores individuais e do meio urbano. Assim, a vizinhança seria uma das variáveis a serem consideradas na análise comportamental relacionada aos deslocamentos. O objetivo principal deste trabalho é analisar a influência da vizinhança no comportamento individual relativo a viagens, através de dados em painel. Dados em painel constituem importante ferramenta em análises comportamentais subjacentes a viagens urbanas, uma vez que propiciam maior quantidade de informações quando comparados aos dados seccionais. Padrões de viagens são mais bem evidenciados, através de dados em painel, caracterizando as habituais rotinas de atividades e viagens, além de melhor identificar comportamentos atípicos. Todavia, a obtenção desses dados comumente não é atividade trivial, demandando recursos monetários e de tempo. Um dos objetivos secundários deste trabalho é apresentar uma maneira prática e pouco onerosa de obtenção de dados em painel através de Smartphones. Tais dados, posteriormente, são aplicados à classificação de indivíduos segundo comportamento relacionado às viagens. A potencialidade da proposta sugerida é validada por meio de um estudo de caso relativo aos estudantes universitários do município de São Carlos - SP, Brasil. Através dos dados em painel, fornecidos pelos estudantes, utilizou-se o algoritmo k-médias considerando quatro variáveis relativas aos deslocamentos. As três categorias obtidas apresentam estrutura espacial e, portanto, possibilitam análises espaciais exploratórias e confirmatórias, almejando a compreensão de influências da vizinhança nas dinâmicas cotidianas. Este trabalho atesta a existência de autocorrelação espacial do conjunto de dados por meio de dois indicadores: Moran e SivarG (Global Spatial Indicator Based on Variogram). A corroboração da dependência espacial, apontada pelos indicadores globais, é confirmada por meio de dois modelos de escolha discreta. Um contendo apenas variáveis originais da base de dados. Outro, análogo ao primeiro, porém adicionado de covariáveis regionais, obtidas por preceitos da geoestatística. A incorporação das covariáveis regionais aumenta a precisão do modelo e promove um incremento das taxas de acertos em validações cruzadas. / Individual travel behaviour is influenced by individual factors and the urban environment. Thus, the neighborhood influence would be one of the variables to be considered in travel behavior analysis related to urban displacements. The main objective of this work is to analyze the influence of neighborhood on travel behavior by panel data. Panel data is an important tool in urban travel behavioral analyzes, since they provide a greater amount of information when compared to sectional data. Travel patterns are more evident through panel data, characterizing the usual routines of activities, as well the atypical behaviors. However, obtaining these data is not a simple task, requiring monetary and time resources. Secondary goals of this work aim to present a practical and inexpensive way to obtain panel data through Smartphones. These data are then applied to the classification of individuals according to travel behavior. The potential of the proposal is validated by a case of study concerning undergraduate and PhD students from São Carlos - SP, Brazil. Using the data provided by the students, a k-means algorithm was used considering four variables regarding displacements. These three categories have spatial structure and allow exploratory and confirmatory spatial data analyzes aiming the comprehension of the nearby influence of data at daily dynamics. This work attests to the existence of spatial autocorrelation of the data set by two indicators: Moran and SivarG (Global Spatial Indicator Based on Variogram). Corroboration of spatial dependence, pointed by the global indicators, is confirmed by two discrete choice models. The first one includes just the original database variables. The second one, analogous to the first, but added of regional covariates obtained by geostatistical concepts. The addition of regional variables leads to a more accurate model, increasing cross-validations hit rates.

Page generated in 0.0476 seconds