Return to search

Redução da dimensionalidade para estimativa de teores de nutrientes em folhas e grãos de soja com espectroscopia no infravermelho

Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2017-11-30T19:05:51Z
No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5) / Made available in DSpace on 2017-11-30T19:05:51Z (GMT). No. of bitstreams: 2
license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)
Pablo Henrique Ferreira.pdf: 12205608 bytes, checksum: a2f75e7cec618577bfd7fddda3302b17 (MD5)
Previous issue date: 2017-04-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / A alta dimensionalidade em bases de dados é um problema que pode estar presente
em diversos segmentos, inclusive nas análises do estado de nutrientes em plantas.
Atualmente essas análises são baseadas em metodologias que demandam tempo e reagentes.
A espectroscopia do infravermelho próximo (NIR – NearInfrared) e médio (MIR –
MiddleInfrared) têm se mostrado uma alternativa mais rápida e limpa em relação a quantificação
simultânea de compostos. Os dados obtidos por esses equipamentos apresentam
alta dimensão. A leitura ocorre em comprimentos de onda gerando centenas atributos para
o NIR e milhares para o MIR. Uma das dificuldades está em identificar quais atributos são
mais relevantes para análise dos nutrientes. Este trabalho teve como objetivo verificar o
ganho de correlação obtido com o emprego de redução de dimensionalidade em dados
obtidos por espectroscopia NIR e MIR, para estimativa de teores de 11 nutrientes em
grãos e folhas de soja, sendo eles: Nitrogênio (N), Fósforo (P), Potássio (K), Cálcio (Ca),
Magnésio (Mg), Enxofre (S), Cobre (Cu), Manganês (Mn), Ferro (Fe), Zinco (Zn) e Boro
(B). Para isto, 231 amostras de folhas de soja e 285 de grãos de soja foram utilizadas para
geração de modelos de regressão, sendo os espectros obtidos através dos espectrofotômetros
NIR e MIR. Os modelos de regressão foram gerados pelos algoritmos de aprendizado
de máquina SMOReg que implementa a máquina de vetor de suporte para regressão, o algoritmo
baseado em árvores de decisão com funções de regressão M5Rules e o algoritmo
LinearRegression. Os resultados foram avaliados através do coeficiente de correlação (r)
e o erro quadrático (RRSE). A estimativa de nutrientes para folhas foi satisfatória tanto
para espectroscopia NIR e MIR, onde correlações acima de 0,80 foram obtidas para os
nutrientes P, K, Mg, S, Mn, Cu, Fe e Zn. Não houve correlações para B e Ca em folhas de
soja. A estimativa de teores de nutrientes foi também satisfatória para grãos de soja, mas
apenas em dados de espectroscopia NIR, onde correlações acima de 0,7 foram obtidas
para N, P, K, Ca e S. O uso da redução de dimensionalidade proporcionou os altos valores
para correlação de P, K e S em folhas de soja, fazendo uso do algoritmo LinearRegression.
Para os grãos de soja, a redução de dimensionalidade foi imprescindível na obtenção
de correlações satisfatórias, exceto para N, sempre utilizando o algoritmo LinearRegression.
Quando a redução da dimensionalidade não foi usada, os resultados satisfatórios
foram obtidos pelo algoritmo SMOREg a partir de dados foliares para os nutrientes N,
Mg, Cu, Mn, Fe e Zn. A utilização da redução de dimensionalidade junto ao algoritmo
LinearRegression auxiliou na obtenção de melhores correlações para três nutrientes em
folhas e para os índices satisfatórios de grãos. Os resultados observados demonstram uma
maior eficiência no uso do NIR para análises foliares do que para análises de grãos. As
técnicas computacionais SMOReg e LinearRegression obtiveram os melhores resultados,
sendo a SMOReg indicada para grandes quantidades de atributos e LinearRegression para
quantidades menores de atributos. / The high dimensionality in databases is a problem that can occur in several fields,
including the plants nutrients state analysis. These analyses are currently based on methodologies
that spend time and reagents. (NIR-NearInfrared) and (MIR-MiddleInfrared)
spectroscopy have been shown to be a faster and clean alternative to simultaneous quantification
of compounds. Since reading occurs at wavelengths generating hundreds attributes
for the NIR and thousands to the MIR the data obtained by such equipment have a high
dimensionality. One of the difficulties is to identify which attributes are more relevant for
the nutrient analysis. This work aimed to verify the correlation gain obtained with the use
of dimensionality reduction techniques with data obtained by NIR and MIR spectroscopy.
The goal is to estimated levels of 11 nutrients in grains and leaves of soybean: Nitrogen
(N), Phosphorus (P), Potassium (K), Calcium (Ca), Magnesium (Mg), Sulfur (S), Copper
(Cu), Manganese (Mn), Iron (Fe), Zinc (Zn) and Boron (B). For that, 231 soybean leaves
and 285 soybeans samples were analysed by spectroscopy in the mid-infrared and nearinfrared
region. The regression models were generated by machine learning algorithms:
SMOReg which implements the support vector machine for regression; M5Rules that is
based on decision trees with regression functions; and LinearRegression algorithm for linear
regression. The results were evaluated by correlation coefficient (r) and the quadratic
error (RRSE). Estimating leaf nutrients was satisfactory for both NIR and MIR spectroscopy,
where correlations of 0.80 above were obtained for P, K, Mg, S, Mn, Cu, Fe and Zn.
There were no correlations for B and Ca in soybean leaves. Estimating nutrient was also
satisfactory for soybeans, but only in NIR spectroscopy data, where correlations above
0.7 were obtained for N, P, K, Ca, and S. Using dimensionality reduction techniques provided
the high values for correlation of P, K, and S in soybean leaves, making use of the
LinearRegression algorithm. For soybeans, the dimensionality reduction was essential in
obtaining satisfactory correlations, except for N, always using the LinearRegression algorithm.
When reducing the dimensionality was not used, satisfactory results were obtained
by the SMOREg algorithm from foliar data to N, Mg, Cu, Mn, Fe, and Zn. Reducing
dimensionality associated to the use of LinearRegression algorithm resulted in better correlations
for three nutrients in leaves and satisfactory rates of grain. The observed results
demonstrate a greater efficiency in the use of the NIR for foliar analysis than for grain
analysis. SMOReg computational techniques and LinearRegression algorithm presented
the best results, being the SMOReg indicated for large quantities of attributes and Linear-
Regression for smaller quantities

Identiferoai:union.ndltd.org:IBICT/oai:tede2.uepg.br:prefix/2409
Date27 April 2017
CreatorsFerreira, Pablo Henrique
ContributorsGuimarães, Alaine Margarete, Caires, Eduardo Fávero, Rautenberg, Sandro
PublisherUniversidade Estadual de Ponta Grossa, Programa de Pós Graduação Computação Aplicada, UEPG, Brasil, Departamento de Informática
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UEPG, instname:Universidade Estadual de Ponta Grossa, instacron:UEPG
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0022 seconds