Spelling suggestions: "subject:"classificada"" "subject:"classificació""
1 |
[en] AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA / [pt] CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOSBERNARDO PEREIRA NUNES 14 October 2009 (has links)
[pt] O problema da classificação de dados remonta à criação de taxonomias visando cobrir áreas do conhecimento. Com o surgimento da Web, o volume de dados disponíveis aumentou várias ordens de magnitude, tornando praticamente impossível a organização de dados manualmente. Esta dissertação tem por objetivo organizar dados semi-estruturados, representados por frames, sem uma estrutura de classes prévia. A dissertação apresenta um algoritmo, baseado no K-Medóide, capaz de organizar um conjunto de frames em classes, estruturadas sob forma de uma hierarquia estrita. A classificação dos frames é feita a partir de um critério de proximidade que leva em conta os atributos e valores que cada frame possui. / [en] The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.
|
2 |
Mapeamento digital de solos com uso de árvores de decisão na microbacia córrego Tarumãzinho, Águas Frias, SC / Digital soil mapping using decision trees in tarumãzinho stream watershed, Águas Frias, SCCosta, José Janderson Ferreira January 2016 (has links)
O conhecimento detalhado sobre a distribuição espacial dos solos é fundamental para o monitoramento ambiental e gerenciamento da produção agrícola. Novas técnicas de modelagem espacial estão sendo utilizadas para melhor aproveitar os dados de solos existentes como a desagregação espacial dos polígonos a partir do refinamento das unidades de mapeamento combinadas em que dois ou mais tipos de solos estão representados. Este trabalho foi dividido em dois estudos. O estudo 1 teve como objetivo realizar a comparação de três algoritmos de árvores de decisão (AD) para predizer a ocorrência das unidades fisiográficas (UFs). Foram derivadas a partir do modelo digital de elevação (MDE) 12 variáveis ambientais utilizando o System for Automated Geoscientific Analyses (SAGA GIS). Os algoritmos testados foram: J48, Simple Chart, BFTree. As ADs foram construídas no programa Weka 3.6.3. As acurácias obtidas usando os três algoritmos foram semelhantes, sendo que o J48 foi superior, mostrando-se útil para predizer a ocorrência de unidades fisiográficas. O estudo 2 teve como objetivo desagregar os polígonos do mapa fisiográfico para individualizar as classes de solos até o segundo nível categórico. Para realizar a desagregação do mapa fisiográfico foram utilizadas 3 variáveis ambientais preditoras, derivadas do MDE, sendo que o mapa de geoforma foi derivado utilizando um conjunto de programas chamado LandMapr toolkit©. Os limites das UFs, os mapas de elevação, declividade e geoforma foram submetidos a uma tabulação cruzada para identificar em cada UF as combinações existentes entre suas classes. O uso da desagregação possibilitou a individualização e a espacialização das classes de solos, sendo útil para a produção de mapas de solos mais detalhados. / Detailed knowledge about the spatial distribution of the soil is essential for environmental monitoring and management of agricultural production. New spatial modeling techniques have used to make better use of data from existing soils and the polygons spatial disaggregation from the refinement of combined mapping units. This work was is divided two studies. The study 1 aimed to carry out a comparison of three decision trees algorithms to predict the occurrence of physiographic units (UFs). The System for Automated Geoscientific Analyses (SAGA GIS) was used to derive 12 environmental covariates from digital elevation model. Three algorithms were tested: J48, Simple Chart, BFTree. The program Weka 3.6.3 was used to built the decision trees. The accuracies obtained using the three algorithms were similar. The J48 accuracy was higher, proving to be useful to predict the occurrence of physiographic units. The study 2 aimed to disaggregate the physiographic map polygons, to individualize the soil classes by the second categorical level. Three environmental covariates were used to carry out the polygon disaggregation of physiographic unit map. The environmental covariates was derived from the MDE, and the map of geoforma was elaborated by a set of programs called LandMapr toolkit©. The limits of the UFs, maps of elevation, slope and geoforma underwent a cross-tab to identify existing combinations between classes, by each UF. The polygon disaggregation made possible the individualization and the spatialization of soils classes, being useful to production of more detailed soil maps.
|
3 |
Mapeamento digital de classes de solos : densidade de amostragem, seleção de variáveis e extrapolação para áreas fisiograficamente semelhantes / Digital soil class mapping : sampling density, variable selection and extrapolation to phisiographic similar areaBagatini, Tatiane January 2015 (has links)
Nas últimas décadas o Mapeamento Digital de Solos (MDS) está ganhando espaço devido ao aumento da disponibilidade de dados numéricos, entretanto algumas metodologias ainda precisam ser definidas, dentre elas, a densidade de amostras e as variáveis a serem utilizadas para a alimentação dos modelos. Assim, o objetivo deste trabalho foi testar diferentes densidades de amostragem, diferentes conjuntos de variáveis para avaliar a resposta dos modelos e, a partir disso, realizar a extrapolação de classes de solos em paisagens semelhantes. Esta tese é composta de três estudos que testam metodologias para a predição de ocorrência de classes de solos utilizando técnicas do MDS. No primeiro estudo, realizado nas bacias do Santo Cristo e do Lageado Grande foi testado o efeito de diferentes densidades de amostragens sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. Os modelos preditores foram treinados com dados dos atributos do terreno derivados do modelo digital de elevação e com informações de solos extraídas do mapa pedológico. De modo geral o aumento da densidade de amostragem resultou no aumento da concordância com os mapas de referências e no aumento do número de unidades de mapeamento preditas. No segundo estudo, realizado nas bacias do Santo Cristo e do Arroio Portão, foi testado o efeito de diferentes conjuntos de variáveis geomorfométricas sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. A partir do modelo digital de elevação foram geradas onze variáveis. As variáveis comprimento de fluxo, elevação do terreno e distância de rios foram as que mais influenciaram os resultados de acurácia e a quantidade de unidades de mapeamento preditas. O modelo gerado com somente as três variáveis gerou o modelo com resultados semelhantes ao modelo gerado com todas as variáveis. O terceiro estudo foi realizado em duas etapas. A primeira etapa foi realizada nas bacias do Santo Cristo e do Arroio Portão e a segunda nas bacias do Santo Cristo e na do Lageado Grande. Na primeira etapa dividiu-se as bacias em partes iguais, utilizando-se uma para o treinamento e a outra para a validação dos modelos. A acurácia foi maior na área de treinamento do que na área de validação, entretanto mostrou-se uma ferramenta interessante a ser utilizada para a elaboração de mapas. Na segunda etapa utilizou-se a bacia do Santo Cristo para o treinamento do modelo e a do Lageado Grande para a validação. Nesta fase os modelos não conseguiram gerar mapas com boas acurácias na área de validação. / In recent decades the digital soil mapping is gaining ground due to the increase of numerical data, but some methodologies have yet to be defined, among them, the density of sampling and the selection of attributes models training. The objective of this study was to evaluate the use of different methodologies and materials for data analysis and prediction of occurrence of soil classes. This thesis is composed of three studies testing methodologies for soil classes of occurrence of prediction using MDS techniques. In the first study, performed in the Santo Cristo and the Lageado Grande watersheds, it was tested the effect of different densities of samples on the capacity of models to predict the occurrence of soil classes. The predictive models were trained with data attributes derived from a digital terrain elevation model and information extracted from a legacy soil map. In general, the increase in sampling density resulted in an increase in accordance with the reference map and increase the number of predicted map units. In the second study, performed in the Santo Cristo and Arroio Portão watersheds, it was tested the effect of different sets of geomorphometric variables on the predictive ability of occurrence of prediction models of soil classes. From the digital elevation model were derivate eleven variables. The variables flow length, altitude and distance from rivers were the ones that more influenced the results of accuracy and number of predicted mapping units. The model generated with only this three variables generated the model with results similar to the model that used all variables. The third study was performed in two stages. The first step performed in the Santo Cristo and Arroio Portão watersheds, and the second in the Santo Cristo and Lageado Grande watersheds. In the first step the basins were divided into two equal parts using a part for model training and the other for model validation. The accuracy was greater in the training area than in the validation area; however the extrapolation to similar areas proved to be an interesting tool to be used for the preparation of maps. In the second step it was used the basin of the Santo Cristo for model training and the Lageado Grande for model validation. In this step the models were not able to generate maps with good accuracy in the validation area.
|
4 |
Predição de classes de solos em diferentes escalas na Serra Gaúcha usando mapeamento digital de solos a partir de dados legados / Prediction of soil classes at different scales in serra gaúcha using digital soil mapping from legacy dataSarmento, Eliana Casco January 2015 (has links)
Dados de levantamentos convencionais de solos têm sido muito usados como entrada em mapeamento digital de solos (MDS), frequentemente sem considerar a qualidade original. O objetivo desta pesquisa foi avaliar metodologias e ferramentas de MDS para predizer classes de solo a partir de levantamentos existentes. Um conjunto diversificado de mapas convencionais foi caracterizado com indicadores computados a partir das unidades de mapeamento (UM) e da legenda. Um procedimento de desagregação foi testado em um mapa semidetalhado, definindo-se áreas típicas das classes por UM a partir do relatório de levantamento e expedições em campo. 10% delas foram empregadas para treinar uma árvore de decisão (AD) e predizer classes em toda a área, usando 21 covariáveis. A predição em locais não mapeados (extrapolação) foi avaliada em um mapa detalhado, no qual três subáreas representativas foram usadas para gerar pontos com duas densidades e dois esquemas de distribuição espacial. Os pontos foram usados para treinar uma AD e predizer ordens e subordens em áreas não amostradas, com duas resoluções espaciais e variação do número e combinação de covariáveis. A desagregação possibilitou incrementar consideravelmente o detalhamento do mapa convencional de solos, sem perda de acurácia. A extrapolação possibilitou mapear áreas não visitadas com alta resolução espacial e acurácia equivalente à área de referência, notadamente com amostragem aleatória estratificada. Em ambos, a acurácia foi limitada pela qualidade dos dados legados, em geral inferior à presumida, o que demonstra a necessidade de levá-la em conta ao desenvolver e calibrar modelos de predição em MDS. / Conventional soil survey data have been widely used as inputs for digital soil mapping (DSM), often without regard to their original quality. The objective of this research was to evaluate DSM methodologies and tools for predicting soil classes from existing soil surveys. A diversified set of conventional soil maps was charachterized with indicators computed from mapping units (MU) and legend. A disaggregation procedure was tested on a semidetailed soil map, by defining typical areas of soil classes in each MU based on the soil survey report and field work. 10% of these areas were employed to train a decision tree (DT) and to predict soil classes throughout the area using 21 soil covariates. The prediction in unmapped areas (extrapolation) was evaluated on a detailed soil map, for which three representative subareas were used to generate points using two sampling densities and two spatial distribution schemes. These sampling points were used to train a DT and then to predict soil orders and suborders at non sampled areas, using two spatial resolutions and varying number and combination of covariates. Disaggregation allowed to increase considerably the details of the conventional soil map, without loss of accuracy. Extrapolation allowed mapping non visited areas with high spatial resolution and accuracy equivalent to the reference area, especially with stratified random sampling. In both cases, accuracy was limited by the quality of legacy soil data, in general lower than presumed, what demonstrates the need to take it into account when building and calibrating prediction models in DSM.
|
5 |
Mapeamento digital de classes de solos : densidade de amostragem, seleção de variáveis e extrapolação para áreas fisiograficamente semelhantes / Digital soil class mapping : sampling density, variable selection and extrapolation to phisiographic similar areaBagatini, Tatiane January 2015 (has links)
Nas últimas décadas o Mapeamento Digital de Solos (MDS) está ganhando espaço devido ao aumento da disponibilidade de dados numéricos, entretanto algumas metodologias ainda precisam ser definidas, dentre elas, a densidade de amostras e as variáveis a serem utilizadas para a alimentação dos modelos. Assim, o objetivo deste trabalho foi testar diferentes densidades de amostragem, diferentes conjuntos de variáveis para avaliar a resposta dos modelos e, a partir disso, realizar a extrapolação de classes de solos em paisagens semelhantes. Esta tese é composta de três estudos que testam metodologias para a predição de ocorrência de classes de solos utilizando técnicas do MDS. No primeiro estudo, realizado nas bacias do Santo Cristo e do Lageado Grande foi testado o efeito de diferentes densidades de amostragens sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. Os modelos preditores foram treinados com dados dos atributos do terreno derivados do modelo digital de elevação e com informações de solos extraídas do mapa pedológico. De modo geral o aumento da densidade de amostragem resultou no aumento da concordância com os mapas de referências e no aumento do número de unidades de mapeamento preditas. No segundo estudo, realizado nas bacias do Santo Cristo e do Arroio Portão, foi testado o efeito de diferentes conjuntos de variáveis geomorfométricas sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. A partir do modelo digital de elevação foram geradas onze variáveis. As variáveis comprimento de fluxo, elevação do terreno e distância de rios foram as que mais influenciaram os resultados de acurácia e a quantidade de unidades de mapeamento preditas. O modelo gerado com somente as três variáveis gerou o modelo com resultados semelhantes ao modelo gerado com todas as variáveis. O terceiro estudo foi realizado em duas etapas. A primeira etapa foi realizada nas bacias do Santo Cristo e do Arroio Portão e a segunda nas bacias do Santo Cristo e na do Lageado Grande. Na primeira etapa dividiu-se as bacias em partes iguais, utilizando-se uma para o treinamento e a outra para a validação dos modelos. A acurácia foi maior na área de treinamento do que na área de validação, entretanto mostrou-se uma ferramenta interessante a ser utilizada para a elaboração de mapas. Na segunda etapa utilizou-se a bacia do Santo Cristo para o treinamento do modelo e a do Lageado Grande para a validação. Nesta fase os modelos não conseguiram gerar mapas com boas acurácias na área de validação. / In recent decades the digital soil mapping is gaining ground due to the increase of numerical data, but some methodologies have yet to be defined, among them, the density of sampling and the selection of attributes models training. The objective of this study was to evaluate the use of different methodologies and materials for data analysis and prediction of occurrence of soil classes. This thesis is composed of three studies testing methodologies for soil classes of occurrence of prediction using MDS techniques. In the first study, performed in the Santo Cristo and the Lageado Grande watersheds, it was tested the effect of different densities of samples on the capacity of models to predict the occurrence of soil classes. The predictive models were trained with data attributes derived from a digital terrain elevation model and information extracted from a legacy soil map. In general, the increase in sampling density resulted in an increase in accordance with the reference map and increase the number of predicted map units. In the second study, performed in the Santo Cristo and Arroio Portão watersheds, it was tested the effect of different sets of geomorphometric variables on the predictive ability of occurrence of prediction models of soil classes. From the digital elevation model were derivate eleven variables. The variables flow length, altitude and distance from rivers were the ones that more influenced the results of accuracy and number of predicted mapping units. The model generated with only this three variables generated the model with results similar to the model that used all variables. The third study was performed in two stages. The first step performed in the Santo Cristo and Arroio Portão watersheds, and the second in the Santo Cristo and Lageado Grande watersheds. In the first step the basins were divided into two equal parts using a part for model training and the other for model validation. The accuracy was greater in the training area than in the validation area; however the extrapolation to similar areas proved to be an interesting tool to be used for the preparation of maps. In the second step it was used the basin of the Santo Cristo for model training and the Lageado Grande for model validation. In this step the models were not able to generate maps with good accuracy in the validation area.
|
6 |
Mapeamento digital de solos com uso de árvores de decisão na microbacia córrego Tarumãzinho, Águas Frias, SC / Digital soil mapping using decision trees in tarumãzinho stream watershed, Águas Frias, SCCosta, José Janderson Ferreira January 2016 (has links)
O conhecimento detalhado sobre a distribuição espacial dos solos é fundamental para o monitoramento ambiental e gerenciamento da produção agrícola. Novas técnicas de modelagem espacial estão sendo utilizadas para melhor aproveitar os dados de solos existentes como a desagregação espacial dos polígonos a partir do refinamento das unidades de mapeamento combinadas em que dois ou mais tipos de solos estão representados. Este trabalho foi dividido em dois estudos. O estudo 1 teve como objetivo realizar a comparação de três algoritmos de árvores de decisão (AD) para predizer a ocorrência das unidades fisiográficas (UFs). Foram derivadas a partir do modelo digital de elevação (MDE) 12 variáveis ambientais utilizando o System for Automated Geoscientific Analyses (SAGA GIS). Os algoritmos testados foram: J48, Simple Chart, BFTree. As ADs foram construídas no programa Weka 3.6.3. As acurácias obtidas usando os três algoritmos foram semelhantes, sendo que o J48 foi superior, mostrando-se útil para predizer a ocorrência de unidades fisiográficas. O estudo 2 teve como objetivo desagregar os polígonos do mapa fisiográfico para individualizar as classes de solos até o segundo nível categórico. Para realizar a desagregação do mapa fisiográfico foram utilizadas 3 variáveis ambientais preditoras, derivadas do MDE, sendo que o mapa de geoforma foi derivado utilizando um conjunto de programas chamado LandMapr toolkit©. Os limites das UFs, os mapas de elevação, declividade e geoforma foram submetidos a uma tabulação cruzada para identificar em cada UF as combinações existentes entre suas classes. O uso da desagregação possibilitou a individualização e a espacialização das classes de solos, sendo útil para a produção de mapas de solos mais detalhados. / Detailed knowledge about the spatial distribution of the soil is essential for environmental monitoring and management of agricultural production. New spatial modeling techniques have used to make better use of data from existing soils and the polygons spatial disaggregation from the refinement of combined mapping units. This work was is divided two studies. The study 1 aimed to carry out a comparison of three decision trees algorithms to predict the occurrence of physiographic units (UFs). The System for Automated Geoscientific Analyses (SAGA GIS) was used to derive 12 environmental covariates from digital elevation model. Three algorithms were tested: J48, Simple Chart, BFTree. The program Weka 3.6.3 was used to built the decision trees. The accuracies obtained using the three algorithms were similar. The J48 accuracy was higher, proving to be useful to predict the occurrence of physiographic units. The study 2 aimed to disaggregate the physiographic map polygons, to individualize the soil classes by the second categorical level. Three environmental covariates were used to carry out the polygon disaggregation of physiographic unit map. The environmental covariates was derived from the MDE, and the map of geoforma was elaborated by a set of programs called LandMapr toolkit©. The limits of the UFs, maps of elevation, slope and geoforma underwent a cross-tab to identify existing combinations between classes, by each UF. The polygon disaggregation made possible the individualization and the spatialization of soils classes, being useful to production of more detailed soil maps.
|
7 |
Mapeamento digital de solos com uso de árvores de decisão na microbacia córrego Tarumãzinho, Águas Frias, SC / Digital soil mapping using decision trees in tarumãzinho stream watershed, Águas Frias, SCCosta, José Janderson Ferreira January 2016 (has links)
O conhecimento detalhado sobre a distribuição espacial dos solos é fundamental para o monitoramento ambiental e gerenciamento da produção agrícola. Novas técnicas de modelagem espacial estão sendo utilizadas para melhor aproveitar os dados de solos existentes como a desagregação espacial dos polígonos a partir do refinamento das unidades de mapeamento combinadas em que dois ou mais tipos de solos estão representados. Este trabalho foi dividido em dois estudos. O estudo 1 teve como objetivo realizar a comparação de três algoritmos de árvores de decisão (AD) para predizer a ocorrência das unidades fisiográficas (UFs). Foram derivadas a partir do modelo digital de elevação (MDE) 12 variáveis ambientais utilizando o System for Automated Geoscientific Analyses (SAGA GIS). Os algoritmos testados foram: J48, Simple Chart, BFTree. As ADs foram construídas no programa Weka 3.6.3. As acurácias obtidas usando os três algoritmos foram semelhantes, sendo que o J48 foi superior, mostrando-se útil para predizer a ocorrência de unidades fisiográficas. O estudo 2 teve como objetivo desagregar os polígonos do mapa fisiográfico para individualizar as classes de solos até o segundo nível categórico. Para realizar a desagregação do mapa fisiográfico foram utilizadas 3 variáveis ambientais preditoras, derivadas do MDE, sendo que o mapa de geoforma foi derivado utilizando um conjunto de programas chamado LandMapr toolkit©. Os limites das UFs, os mapas de elevação, declividade e geoforma foram submetidos a uma tabulação cruzada para identificar em cada UF as combinações existentes entre suas classes. O uso da desagregação possibilitou a individualização e a espacialização das classes de solos, sendo útil para a produção de mapas de solos mais detalhados. / Detailed knowledge about the spatial distribution of the soil is essential for environmental monitoring and management of agricultural production. New spatial modeling techniques have used to make better use of data from existing soils and the polygons spatial disaggregation from the refinement of combined mapping units. This work was is divided two studies. The study 1 aimed to carry out a comparison of three decision trees algorithms to predict the occurrence of physiographic units (UFs). The System for Automated Geoscientific Analyses (SAGA GIS) was used to derive 12 environmental covariates from digital elevation model. Three algorithms were tested: J48, Simple Chart, BFTree. The program Weka 3.6.3 was used to built the decision trees. The accuracies obtained using the three algorithms were similar. The J48 accuracy was higher, proving to be useful to predict the occurrence of physiographic units. The study 2 aimed to disaggregate the physiographic map polygons, to individualize the soil classes by the second categorical level. Three environmental covariates were used to carry out the polygon disaggregation of physiographic unit map. The environmental covariates was derived from the MDE, and the map of geoforma was elaborated by a set of programs called LandMapr toolkit©. The limits of the UFs, maps of elevation, slope and geoforma underwent a cross-tab to identify existing combinations between classes, by each UF. The polygon disaggregation made possible the individualization and the spatialization of soils classes, being useful to production of more detailed soil maps.
|
8 |
Mapeamento digital de classes de solos : densidade de amostragem, seleção de variáveis e extrapolação para áreas fisiograficamente semelhantes / Digital soil class mapping : sampling density, variable selection and extrapolation to phisiographic similar areaBagatini, Tatiane January 2015 (has links)
Nas últimas décadas o Mapeamento Digital de Solos (MDS) está ganhando espaço devido ao aumento da disponibilidade de dados numéricos, entretanto algumas metodologias ainda precisam ser definidas, dentre elas, a densidade de amostras e as variáveis a serem utilizadas para a alimentação dos modelos. Assim, o objetivo deste trabalho foi testar diferentes densidades de amostragem, diferentes conjuntos de variáveis para avaliar a resposta dos modelos e, a partir disso, realizar a extrapolação de classes de solos em paisagens semelhantes. Esta tese é composta de três estudos que testam metodologias para a predição de ocorrência de classes de solos utilizando técnicas do MDS. No primeiro estudo, realizado nas bacias do Santo Cristo e do Lageado Grande foi testado o efeito de diferentes densidades de amostragens sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. Os modelos preditores foram treinados com dados dos atributos do terreno derivados do modelo digital de elevação e com informações de solos extraídas do mapa pedológico. De modo geral o aumento da densidade de amostragem resultou no aumento da concordância com os mapas de referências e no aumento do número de unidades de mapeamento preditas. No segundo estudo, realizado nas bacias do Santo Cristo e do Arroio Portão, foi testado o efeito de diferentes conjuntos de variáveis geomorfométricas sobre a capacidade preditiva dos modelos de predição de ocorrência de classes de solos. A partir do modelo digital de elevação foram geradas onze variáveis. As variáveis comprimento de fluxo, elevação do terreno e distância de rios foram as que mais influenciaram os resultados de acurácia e a quantidade de unidades de mapeamento preditas. O modelo gerado com somente as três variáveis gerou o modelo com resultados semelhantes ao modelo gerado com todas as variáveis. O terceiro estudo foi realizado em duas etapas. A primeira etapa foi realizada nas bacias do Santo Cristo e do Arroio Portão e a segunda nas bacias do Santo Cristo e na do Lageado Grande. Na primeira etapa dividiu-se as bacias em partes iguais, utilizando-se uma para o treinamento e a outra para a validação dos modelos. A acurácia foi maior na área de treinamento do que na área de validação, entretanto mostrou-se uma ferramenta interessante a ser utilizada para a elaboração de mapas. Na segunda etapa utilizou-se a bacia do Santo Cristo para o treinamento do modelo e a do Lageado Grande para a validação. Nesta fase os modelos não conseguiram gerar mapas com boas acurácias na área de validação. / In recent decades the digital soil mapping is gaining ground due to the increase of numerical data, but some methodologies have yet to be defined, among them, the density of sampling and the selection of attributes models training. The objective of this study was to evaluate the use of different methodologies and materials for data analysis and prediction of occurrence of soil classes. This thesis is composed of three studies testing methodologies for soil classes of occurrence of prediction using MDS techniques. In the first study, performed in the Santo Cristo and the Lageado Grande watersheds, it was tested the effect of different densities of samples on the capacity of models to predict the occurrence of soil classes. The predictive models were trained with data attributes derived from a digital terrain elevation model and information extracted from a legacy soil map. In general, the increase in sampling density resulted in an increase in accordance with the reference map and increase the number of predicted map units. In the second study, performed in the Santo Cristo and Arroio Portão watersheds, it was tested the effect of different sets of geomorphometric variables on the predictive ability of occurrence of prediction models of soil classes. From the digital elevation model were derivate eleven variables. The variables flow length, altitude and distance from rivers were the ones that more influenced the results of accuracy and number of predicted mapping units. The model generated with only this three variables generated the model with results similar to the model that used all variables. The third study was performed in two stages. The first step performed in the Santo Cristo and Arroio Portão watersheds, and the second in the Santo Cristo and Lageado Grande watersheds. In the first step the basins were divided into two equal parts using a part for model training and the other for model validation. The accuracy was greater in the training area than in the validation area; however the extrapolation to similar areas proved to be an interesting tool to be used for the preparation of maps. In the second step it was used the basin of the Santo Cristo for model training and the Lageado Grande for model validation. In this step the models were not able to generate maps with good accuracy in the validation area.
|
9 |
Predição de classes de solos em diferentes escalas na Serra Gaúcha usando mapeamento digital de solos a partir de dados legados / Prediction of soil classes at different scales in serra gaúcha using digital soil mapping from legacy dataSarmento, Eliana Casco January 2015 (has links)
Dados de levantamentos convencionais de solos têm sido muito usados como entrada em mapeamento digital de solos (MDS), frequentemente sem considerar a qualidade original. O objetivo desta pesquisa foi avaliar metodologias e ferramentas de MDS para predizer classes de solo a partir de levantamentos existentes. Um conjunto diversificado de mapas convencionais foi caracterizado com indicadores computados a partir das unidades de mapeamento (UM) e da legenda. Um procedimento de desagregação foi testado em um mapa semidetalhado, definindo-se áreas típicas das classes por UM a partir do relatório de levantamento e expedições em campo. 10% delas foram empregadas para treinar uma árvore de decisão (AD) e predizer classes em toda a área, usando 21 covariáveis. A predição em locais não mapeados (extrapolação) foi avaliada em um mapa detalhado, no qual três subáreas representativas foram usadas para gerar pontos com duas densidades e dois esquemas de distribuição espacial. Os pontos foram usados para treinar uma AD e predizer ordens e subordens em áreas não amostradas, com duas resoluções espaciais e variação do número e combinação de covariáveis. A desagregação possibilitou incrementar consideravelmente o detalhamento do mapa convencional de solos, sem perda de acurácia. A extrapolação possibilitou mapear áreas não visitadas com alta resolução espacial e acurácia equivalente à área de referência, notadamente com amostragem aleatória estratificada. Em ambos, a acurácia foi limitada pela qualidade dos dados legados, em geral inferior à presumida, o que demonstra a necessidade de levá-la em conta ao desenvolver e calibrar modelos de predição em MDS. / Conventional soil survey data have been widely used as inputs for digital soil mapping (DSM), often without regard to their original quality. The objective of this research was to evaluate DSM methodologies and tools for predicting soil classes from existing soil surveys. A diversified set of conventional soil maps was charachterized with indicators computed from mapping units (MU) and legend. A disaggregation procedure was tested on a semidetailed soil map, by defining typical areas of soil classes in each MU based on the soil survey report and field work. 10% of these areas were employed to train a decision tree (DT) and to predict soil classes throughout the area using 21 soil covariates. The prediction in unmapped areas (extrapolation) was evaluated on a detailed soil map, for which three representative subareas were used to generate points using two sampling densities and two spatial distribution schemes. These sampling points were used to train a DT and then to predict soil orders and suborders at non sampled areas, using two spatial resolutions and varying number and combination of covariates. Disaggregation allowed to increase considerably the details of the conventional soil map, without loss of accuracy. Extrapolation allowed mapping non visited areas with high spatial resolution and accuracy equivalent to the reference area, especially with stratified random sampling. In both cases, accuracy was limited by the quality of legacy soil data, in general lower than presumed, what demonstrates the need to take it into account when building and calibrating prediction models in DSM.
|
10 |
Predição de classes de solos em diferentes escalas na Serra Gaúcha usando mapeamento digital de solos a partir de dados legados / Prediction of soil classes at different scales in serra gaúcha using digital soil mapping from legacy dataSarmento, Eliana Casco January 2015 (has links)
Dados de levantamentos convencionais de solos têm sido muito usados como entrada em mapeamento digital de solos (MDS), frequentemente sem considerar a qualidade original. O objetivo desta pesquisa foi avaliar metodologias e ferramentas de MDS para predizer classes de solo a partir de levantamentos existentes. Um conjunto diversificado de mapas convencionais foi caracterizado com indicadores computados a partir das unidades de mapeamento (UM) e da legenda. Um procedimento de desagregação foi testado em um mapa semidetalhado, definindo-se áreas típicas das classes por UM a partir do relatório de levantamento e expedições em campo. 10% delas foram empregadas para treinar uma árvore de decisão (AD) e predizer classes em toda a área, usando 21 covariáveis. A predição em locais não mapeados (extrapolação) foi avaliada em um mapa detalhado, no qual três subáreas representativas foram usadas para gerar pontos com duas densidades e dois esquemas de distribuição espacial. Os pontos foram usados para treinar uma AD e predizer ordens e subordens em áreas não amostradas, com duas resoluções espaciais e variação do número e combinação de covariáveis. A desagregação possibilitou incrementar consideravelmente o detalhamento do mapa convencional de solos, sem perda de acurácia. A extrapolação possibilitou mapear áreas não visitadas com alta resolução espacial e acurácia equivalente à área de referência, notadamente com amostragem aleatória estratificada. Em ambos, a acurácia foi limitada pela qualidade dos dados legados, em geral inferior à presumida, o que demonstra a necessidade de levá-la em conta ao desenvolver e calibrar modelos de predição em MDS. / Conventional soil survey data have been widely used as inputs for digital soil mapping (DSM), often without regard to their original quality. The objective of this research was to evaluate DSM methodologies and tools for predicting soil classes from existing soil surveys. A diversified set of conventional soil maps was charachterized with indicators computed from mapping units (MU) and legend. A disaggregation procedure was tested on a semidetailed soil map, by defining typical areas of soil classes in each MU based on the soil survey report and field work. 10% of these areas were employed to train a decision tree (DT) and to predict soil classes throughout the area using 21 soil covariates. The prediction in unmapped areas (extrapolation) was evaluated on a detailed soil map, for which three representative subareas were used to generate points using two sampling densities and two spatial distribution schemes. These sampling points were used to train a DT and then to predict soil orders and suborders at non sampled areas, using two spatial resolutions and varying number and combination of covariates. Disaggregation allowed to increase considerably the details of the conventional soil map, without loss of accuracy. Extrapolation allowed mapping non visited areas with high spatial resolution and accuracy equivalent to the reference area, especially with stratified random sampling. In both cases, accuracy was limited by the quality of legacy soil data, in general lower than presumed, what demonstrates the need to take it into account when building and calibrating prediction models in DSM.
|
Page generated in 0.0557 seconds