Prévia do material em texto
Mapeamento de carbono orgânico do solo em escala nacional baseado em aprendizagem profunda com Dados do Sentinela-3 ABSTRATOINFORMAÇÕES DO ARTIGO Geoderma Disciplina de Geografia, Escola de Ciências Agrárias, da Terra e Ambientais, Universidade de KwaZulu-Natal, Private Bag X01, Scottsville, Pietermaritzburg 3209, Carbono orgânico do solo África do Sul Sentinela-3 Palavras-chave: Rede neural profunda Sensoriamento remoto Editor de manipulação: Budiman Minasny Além disso, o SOC fornece informações valiosas sobre a fertilidade do solo, a capacidade de troca de aniões/cátions, a acumulação do solo, a degradação do solo, a capacidade de retenção de água e as alterações na disponibilidade de nutrientes que promovem o crescimento da vegetação (Wang et al., 2018) . No entanto, o mapeamento fiável do stock SOC continua a ser um grande desafio, geralmente devido a; (1) o número limitado de pontos de dados disponíveis, especialmente em escala de paisagem, (2) o tipo de informação auxiliar usada na simulação SOC, e (3) a potência e precisão das técnicas de interpolação ou algoritmo adotado (Phachomphon et al . , 2010; Angelopoulou et al., 2019). Os avanços na detecção remota (RS) anunciaram uma nova era de big data, onde os satélites de observação da Terra estão a ser lançados a um ritmo recorde, levando à disponibilidade de uma grande quantidade de conjuntos de dados diversos (Madi leng et al., 2020; Kumar e Mutanga , 2018; Odindi et al., 2016). Isto abriu uma alternativa adequada às estratégias de determinação do SOC em campo e em laboratório (Mngadi et al., 2020; Ben Hamida et al., 2018; Yang página inicial da revista: www.elsevier.com/locate/geoderma 1. Introdução Listas de conteúdos disponíveis em ScienceDirect O aumento das emissões de carbono e os seus efeitos em diferentes ecossistemas têm atraído a atenção global (Wang et al., 2021). Os países membros do Painel Intergovernamental sobre Alterações Climáticas (IPCC) têm a tarefa de quantificar e monitorizar continuamente as emissões de carbono. Consequentemente, os reservatórios de carbono, incluindo o carbono orgânico do solo (SOC), estão a atrair cada vez mais interesse de investigação como forma de assimilar o carbono emitido e mitigar os impactos adversos associados (Odebiri et al., 2020b). Sendo o maior reservatório terrestre de carbono, o SOC é responsável por cerca de 50% a 80% do armazenamento global de carbono e aproximadamente 2 e 3 vezes mais do que o conteúdo de carbono da atmosfera e da biosfera, respectivamente (Li et al., 2021; Sahoo et al . ., 2019). Como tal, uma pequena alteração nas reservas SOC pode afetar significativamente o ciclo global do carbono e as propriedades físicas, químicas e biológicas do solo (Lamichhane et al., 2019). Omosalewa Odebiri Onísimo Mutanga, John Odindi, Endereço de e-mail: odebsconstant@gmail.com (O. Odebiri). https://doi.org/10.1016/j.geoderma.2022.115695 Recebido em 25 de setembro de 2021; Recebido em formato revisado em 29 de dezembro de 2021; Aceito em 4 de janeiro de 2022. Disponível online em 10 de janeiro de 2022. 0016-7061/© 2022 Elsevier BV Todos os direitos reservados. O mapeamento do carbono orgânico do solo (SOC) a nível regional é fundamental para a política de alterações climáticas e para a mitigação dos seus efeitos adversos. No entanto, estimativas SOC confiáveis, particularmente em grande medida, continuam a ser um grande desafio devido, entre outros, aos pontos de amostragem limitados, à qualidade dos dados de simulação e ao algoritmo adotado. As estratégias de sensoriamento remoto (RS) surgiram como uma alternativa adequada para a determinação do SOC em campo e laboratório, especialmente em grande extensão espacial. O uso do sensor Sentinel-3, o mais recente da série Sentinel, é mínimo e não foi totalmente desenvolvido, apesar de seus impressionantes atributos que incluem alta resolução espectral-temporal e grande cobertura. Em comparação com os modelos de ML lineares e clássicos, os modelos de aprendizagem profunda (DL) oferecem uma melhoria considerável na análise de dados devido à sua capacidade de extrair características mais representativas e identificar padrões espaciais complexos associados a big data. No entanto, há escassez na literatura sobre a aplicação de estratégias de sensoriamento remoto baseadas em DL para previsão de SOC. Consequentemente, este estudo adotou uma rede neural profunda (DNN) para prever o SOC em escala nacional, usando a imagem Sentinel-3, e comparou os resultados com floresta aleatória (RF), máquina de vetores de suporte (SVM) e rede neural artificial (ANN) modelos. Os modelos foram treinados com base na validação cruzada de 10 vezes com 1.936 amostras de solo e 31 preditores. O modelo DNN gerou o melhor resultado com um erro quadrático médio (RMSE) de 10,35 t/ha (26% da média), seguido por RF (RMSE = 11,2 t/ha), ANN (RMSE = 11,6 t/ha) e SVM (RMSE = 13,6 t/ha). A capacidade analítica da DNN, juntamente com a sua capacidade de lidar com big data, aprendendo padrões através de uma série de camadas ocultas (10) para tirar conclusões, confere-lhe uma vantagem sobre outros modelos clássicos de ML. O estudo concluiu que o modelo DNN com dados do Sentinel-3 é promissor e fornece uma estrutura eficaz para modelagem SOC contínua em nível nacional. * Autor correspondente. Geoderma 411 (2022) 115695 * Machine Translated by Google https://www.elsevier.com/locate/geoderma www.sciencedirect.com/science/journal/00167061 mailto:odebsconstant@gmail.com https://doi.org/10.1016/j.geoderma.2022.115695 https://doi.org/10.1016/j.geoderma.2022.115695 Geoderma 411 (2022) 115695 2 Figura 1. Localização da África do Sul mostrando os limites das nove províncias e a distribuição espacial das amostras de solo. A Agência Espacial Europeia (ESA) é o mais recente da série Sentinel. É composto por quatro satélites multifuncionais (ou seja, 3A, 3B, 3C e 3D). Este estudo foi realizado na África do Sul (Fig. 1), cobrindo uma área de 1.221.037 quilómetros quadrados. O país está localizado numa zona de clima temperado delimitada pelos oceanos Índico e Atlântico, com a Namíbia a noroeste, Moçambique e Suazilândia a nordeste e leste, e Botswana e Zimbabué a norte e o cerco completo do Lesoto como países limítrofes (Departamento de Ambiente Assuntos, 2017). O país é composto por nove províncias, incluindo Cabo Norte, Cabo Ocidental, Cabo Oriental, Noroeste, Estado Livre, KwaZulu Natal, Gauteng, Mpumalanga e Limpopo. Com uma média de 8 a 10 horas de sol por dia, a África do Sul é um dos países mais ensolarados de África. A temperatura média diária no verão e no inverno é de cerca de 20 ÿC e 15 ÿC (Scott e Lesch, 1997). A maior parte do interior do país é um planalto relativamente plano com uma altitude entre 1.000 e 2.100 m (Mzinyane et al., 2015). A sua precipitação média anual é de cerca de 464 mm, o que é considerado baixo em comparação com a média globalde 786 mm (Schulze e Schütte, 2020). As condições semidesérticas, áridas e semiáridas do país significam que o teor de carbono do solo é menor, em comparação com países com cobertura vegetal abundante (Schulze e Schütte, 2020). 2.1. Site de estudo Recentemente, os modelos de aprendizagem profunda (DL) ganharam interesse na área de RS porque são bem adequados para lidar com big data e sua heterogeneidade associada (Zhang et al., 2019). DL é uma técnica de aprendizagem de representação que contém muitas camadas (entrada, oculta e saída) nas quais as informações são derivadas das camadas inferiores para as superiores por meio de módulos não lineares (Zhu et al., 2019). A DL provou ser uma melhoria notável em relação aos modelos clássicos de ML e uma ferramenta excepcionalmente poderosa em muitos campos (Odebiri et al., 2021). Em contraste com os modelos clássicos de ML, os modelos DL são capazes de extrair automaticamente características invariantes e abstratas dos dados RS para melhorar a precisão. De acordo com Ho Tong Minh et al. (2018), as arquiteturas de EAD podem ajudar a melhorar os procedimentos de aprendizagem, especialmente quando as relações entre diferentes propriedades ambientais são complexas e não lineares. Além disso, os múltiplos hiperparâmetros inerentes incorporados aos modelos DL oferecem aos usuários a oportunidade de ajustar os procedimentos de aprendizagem para melhorar a precisão (Odebiri et al., 2021). Embora existam estas vantagens da DL, faltam pesquisas sobre a aplicação de estratégias de RS baseadas na DL para a previsão do SOC e a maioria dos estudos existentes são localizados com pouco impacto global, uma vez que a DL só foi introduzida recentemente (Odebiri et al., 2021; Padarian et al. , 2020a). Para este fim, aproveitar a abundância de dados RS e a capacidade analítica das arquitecturas DL poderia oferecer um grande potencial para estimativas rápidas, contínuas e fiáveis do SOC à escala nacional, informando assim as políticas climáticas nacionais e a gestão do solo. Além disso, o SOC dentro e entre regiões exibe grande variabilidade devido à sua mistura complexa de componentes orgânicos e inorgânicos, portanto, os modelos clássicos de ML podem ser incapazes de prever com precisão o comportamento de um fenômeno tão complexo, especialmente em grandes escalas espaciais (Ma et al . , 2019; Padarian et al., 2019; Kumar et al., 2016). O Instrumento Sentinel-3 Ocean and Land Color (OLCI) do 2. Métodos e materiais Vários modelos geoestatísticos e clássicos de ML foram investigados para vincular o SOC medido em campo às métricas de RS (Padarian et al., 2020a; Wang et al., 2021). Por exemplo, Phachomphon et al. (2010) utilizaram várias técnicas geoestatísticas para estimar o SOC no Laos, utilizando cokrigagem ordinária (OCK), produzindo uma precisão R2 = 0,42. Da mesma forma, Zhang et al. (2021), usaram variáveis derivadas do Sentinel-2 e MODIS para examinar o desempenho da floresta aleatória (RF), da máquina de vetores de suporte (SVM) e da rede neural artificial (ANN) na previsão do SOC na planície de Songnen, no norte da China. O FR apresentou o menor RMSE (0,68%) e o maior R2 de todos os grupos (0,67). Embora estes modelos tenham fornecido precisões aceitáveis, também demonstraram ser limitados na sua capacidade de extrair elementos abstratos não lineares mais complicados, necessários para modelos preditivos melhorados (Wang et al., 2021; Wadoux et al., 2019). Na maioria dos casos, modelos de aprendizagem profunda (DL) para mapeamento SOC são adotados por meio de imagens hiperespectrais (Odebiri et al., 2021). Por exemplo, uma revisão da literatura feita por Ma et al. (2019) mostraram que mais de 85% do mapeamento SOC baseado em DL existente é realizado usando dados hiperespectrais com uma resolução espacial média de 2 m. No entanto, os dados hiperespectrais continuam a ser caros, especialmente para aplicações com ampla cobertura, e são difíceis de obter em muitas regiões, incluindo África (Mutanga e Ismail, 2015). Sensores como a série Sentinel, disponíveis gratuitamente, são excelentes alternativas que ainda não foram totalmente exploradas com os modelos DL. Os sensores sentinela têm resoluções espaciais e espectrais relativamente altas, bem como bandas sensíveis ao SOC estrategicamente posicionadas (Odebiri et al., 2020a). Embora uma série de estudos DL tenham sido conduzidos com dados multiespectrais, como Sentinel-2 (Taghizadeh-Mehr jardi et al., 2020) e Landsat 8 (Wu et al., 2019), há pouca ou nenhuma exploração dos últimos Dados do Sentinel-3 que são críticos para o mapeamento à escala nacional e regional (Zhou et al., 2021). Entre eles, o Sentinel 3A e 3B foram lançados em 16 de fevereiro de 2016 e 25 de abril de 2018, respectivamente. Ao contrário do Sentinel-2, que possui 13 bandas espectrais variando de comprimentos de onda de 443 nm a 2190 nm e um ciclo de revisita de 5 dias, o Sentinel-3 tem melhor resolução espectral, com 21 bandas espectrais (400–1020 nm) e um tempo de revisita mais curto de menos de 2 dias (Li e Roy, 2017; Kokhanovsky et al., 2019). Comparado com o Sentinel-2 (290 km), o Sentinel-3 tem uma largura de faixa mais ampla (1270 km), permitindo a captura de uma grande extensão espacial num viaduto. No entanto, o primeiro tem uma resolução espacial melhor (10 m) do que o último (300 m) e tem sido utilizado com sucesso como uma única fonte de dados para muitas tarefas de mapeamento SOC (Vaudour et al., 2019). Apesar das vantagens espectrais e temporais do Sentinel-3, ele ainda é novo e não tem sido amplamente utilizado para simular propriedades do solo, incluindo o SOC. Portanto, este estudo explorou uma abordagem DL para modelagem SOC em toda a África do Sul usando dados do Sentinel-3. Também foi feita uma comparação entre os resultados do método DL e os de outros modelos ML (RF, ANN e SVM) comumente utilizados no mapeamento digital de solos. e outros, 2016). Além disso, Guo et al. (2020), observa que quando a relação entre os fatores tradicionais de formação do solo e as propriedades do solo é fraca ou insignificante, os dados relevantes do RS podem fornecer informações suplementares ricas para um mapeamento digital confiável do solo (DSM). Embora os benefícios mencionados acima dos dados RS para a modelagem SOC sejam empolgantes, sua natureza diversificada, juntamente com volumes muito grandes e sempre crescentes, exige técnicas analíticas rápidas e transferíveis para mineração de informações geoespaciais em grande escala, a fim de maximizar seu potencial ( Gupta e outros, 2018). A principal morfologia dos solos do país é classificada localmente como lítica, cumúlica e oxídica; enquanto os principais usos da terra são formas variadas de agricultura que ocupam cerca de 79% (Venter et al., 2021). O. Odebiri et al. Machine Translated byGoogle º 3 Geoderma 411 (2022) 115695 ÿN 2 + bL) , bi ]L+1eu=1 eu=1 Z1 = ÿ1 ( W1 X + b1) , + b2) ZL = ÿL ( wLz Lÿ 1 1 tabela 1 Especificação espectral de dados do Sentinel-3. Uma análise de regressão para recuperação de SOC foi realizada com base em uma estrutura de rede neural profunda (DNN). O desempenho da DNN foi então comparado com três algoritmos clássicos de aprendizado de máquina (ML) comumente usados no mapeamento digital do solo (ou seja, floresta aleatória -RF, máquina de vetores de suporte -SVM e rede neural artificial -ANN) (Odebiri et al., 2021; Zhou et al., 2021; Zhou et al., 2021; Zhou et al . al., 2020). Como modelos não paramétricos, esses algoritmos (SVM, RF e RNA) têm sido amplamente utilizados na literatura para modelar relações não lineares entre SOC e vários preditores de covariáveis (Somarathna et al., 2017). Além disso, cada um dos modelos selecionados neste estudo contém hiperparâmetros em sua estrutura, que quando configurados corretamente, podem ter um efeito importante no desempenho do modelo (Chen et al., 2019). Portanto, conduzimos a otimização de hiperparâmetros usando uma técnica de pesquisa aleatória e uma validação cruzada de 10 vezes com uma divisão de treinamento/validação/teste para cada modelo para produzir o melhor resultado possível. (1) (2) O ISRIC é uma fundação científica independente cuja missão é fornecer informações de alta qualidade sobre diferentes propriedades do solo (incluindo SOC) à escala global através da cooperação com diferentes países. O atual banco de dados de solos ISRIC foi atualizado pela última vez em 2020 (https://www.isric. org/) e contém mais de 150.000 pontos de amostragem em 173 países, recolhidos em diferentes momentos (Batjes et al., 2020). Uma vez que os métodos de determinação do teor de carbono SOC podem variar de país para país (Venter et al., 2021; Hengl et al., 2017), o ISRIC implementou um procedimento padronizado para tornar os dados de entrada do perfil do solo uniformes e disponíveis para uso público (https :// www.isric.org/explore/wosis/access ing-wosis-derived-datasets). Os pontos de amostragem que abrangem a África do Sul e o seu conteúdo SOC equivalente, juntamente com a densidade aparente, foram filtrados da base de dados ISRIC, além dos dados disponíveis obtidos do SAEES. O estoque de SOC em cada ponto foi determinado usando a fórmula: estoque de SOC (t/h) = concentração de SOC × densidade aparente × profundidade do solo (Pearson et al., 2007). No total, foram utilizados 1.936 pontos amostrais para a variável alvo na profundidade de 30 cm. Os dados do solo foram obtidos de duas fontes; 1.736 pontos do Centro Internacional de Referência e Informação sobre Solos (ISRIC) e os restantes (200) do Departamento de Ciências Agrícolas, da Terra e Ambientais (SAEES), Universidade de KwaZulu-Natal, África do Sul. S Além disso, diferentes combinações de bandas das vinte e uma bandas espectrais do Sentinel-3 foram utilizadas para gerar índices de vegetação espectral relevantes utilizados neste estudo. A literatura tem demonstrado que os índices de vegetação podem ser usados para explicar a distribuição e a variabilidade do SOC (Wang et al., 2021; Odebiri et al., 2020b; Guo et al., 2020; Dotto et al., 2018). Dez índices de vegetação popularmente usados foram gerados juntamente com as 21 bandas espectrais do Sentienl-3 como variáveis independentes para usando o erro quadrático médio (MSE) representado como; modelo SOC. A especificação e justificativa para a utilização desses índices estão resumidas na Tabela 2. Os dados do Sentinel 3 OLCI (Tabela 1) baixados da Agência Espacial Europeia (ESA) entre março e abril de 2021, com menos de 10% de cobertura de nuvens, foram utilizados neste estudo. O Sentinel-3 é caracterizado por uma grande largura de faixa (1270 km), eliminando a necessidade demorada de numerosos downloads e ladrilhos para cobrir todo o país. Quatro blocos de imagens foram baixados para cobrir todo o país. Cada um desses blocos de imagens foi pré-processado para correção geométrica, radiométrica e atmosférica usando a Plataforma de Aplicação Sentinel (SNAP v. 6.0). O software ENVI 5.2 foi usado para fazer o mosaico das imagens pré-processadas em um único bloco e o shape-file do país foi usado para extrair seus limites. = Wl+1 ZL + bL, ÿ = [ Wi , MSEDATA = L(ÿ) = O uso de arquiteturas DNN em diferentes aplicações aumentou nos últimos anos, incluindo observação da Terra, reconhecimento de imagem, direção automatizada e reconhecimento de fala (Pudeÿko e Chodak, 2020; Dong et al., 2019; Novoa et al., 2018). ;). Essencialmente, a DNN é um modelo aproximado eficaz e confiável que fornece informações sobre as relações complexas entre as variáveis alvo e explicativas (Wang et al., 2020). Entre as camadas de entrada, oculta e de saída há muitos neurônios, de modo que os neurônios de uma camada estão ligados aos neurônios da próxima camada até o neurônio final previsto (saída). DNN geralmente usa a arquitetura perceptron multicamadas (MLP), mas difere por suas muitas camadas ocultas incorporadas e hiperparâmetros (ver Tabela 3), o que lhe confere uma vantagem sobre outros modelos clássicos de ML (Taghizadeh-Mehrjardi et al., 2020). No entanto, deve-se ter cuidado ao treinar o modelo para evitar overfitting (Liu et al., 2018). Nesses casos, uma técnica de regularização de dropout pode ser aplicada a cada uma das camadas ocultas, cujos neurônios são posteriormente calculados para previsão (Taghizadeh-Mehrjardi et al., 2020). Uma representação matemática simples de DNN para uma determinada camada de entrada (vetor X) com uma camada oculta L e uma camada de saída (vetor Y) pode ser representada da seguinte forma ( Wang et al., 2020); Z2 = ÿ2 ( W2 z 2.2. Dados do solo |NN(Xi; ÿ)ÿ Yi| 2.3. Aquisição de dados de imagem 2.4.1. Redes neurais profundas (DNN) N A função de perda L da variável de saída e entrada pode ser examinada Onde N é a soma total dos dados rotulados e L é a função de perda que pode ser minimizada usando um algoritmo de otimização (Wang et al., 2020). A Figura 2 mostra a representação esquemática da arquitetura DNN. Um total de 31 variáveis de entrada geradas a partir do Sentinel-3 OLCI foram utilizadas para construir o modelo neste estudo. O conjunto de dados completo foi dividido em dez partes iguais e usado para treinamento e teste em ordem sequencial. Para garantir que cada ponto de dados fosse utilizado como 2.4. Modelos analíticos camada respectivamente. L + 1 indica a camada de saída (ou seja, Y = N (X; ÿ)) e ÿi é a função de ativação que pode ser sigmóide, softmax, unidade linear retificada (ReLU), tangente hiperbólica (Tanh) entre outras. 1 A análise foi realizada utilizando a linguagem de programação python (versão 3.8) dentro do notebook jupyter. Uma breve descrição dos quatro algoritmosjuntamente com um resumo dos hiperparâmetros utilizados é apresentada na Tabela 3. Onde Wi e bi são pesos e tendências do i 10 9 3 Banda Não. 7,5 2,5 16 40 665 10 7,5 2061 4 5 761,25 10 10 707 865 15 13 305 6 10 940 203 15 Largura de banda 17 764.375 395 308 10 1280 Comprimento de onda (nm) 400 330 673,75 785 605 1811 490 510 1 7 2,5 1020 10 14 745 560 SNR (na Lref) 18 19 10 11 997 412,5 152 O. Odebiri et al. 20 812 10 10 681,25 767,5 20 3,75 20 15 10 885 900 7,5 2 8 232 620 708,25 753,75 2188 21 883 778,75 442,5 12 666 1541 1488 Machine Translated by Google https://www.isric.org/ https://www.isric.org/ https://www.isric.org/explore/wosis/accessing-wosis-derived-datasets https://www.isric.org/explore/wosis/accessing-wosis-derived-datasets Huété (1988) Richardson e 1–20 ÿ Receptivo à vegetação e ao conteúdo de clorofila das plantas SVM Tamanho do nó 0,01–100 Razão de uso B17 Vegetação de diferença renormalizada Número de camadas ocultas Número de árvores Calcule a densidade da vegetação separando o solo da vegetação e reduza o impacto do terreno. 100–1000 ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ B17- B8 Função de base radial 2,5 × (B17 + 6 × B8 - 7,5 × B6 + 1) 0,001–0,05 Fórmula Baret e Guyot (1991) Índice (RDVI) Número de nós (neurônios) nas camadas ocultas ANN Ajusta o brilho do solo onde há menos vegetação presente Vegetação Otimizada Ajustada ao Solo Wiegand (1977) uniforme/ele normal 0,001–0,05 Vegetação de diferença normalizada (B17 + B8) 3–20 Número de iterações de treinamento Qi et al. (1994) Roujean e Breon (1995) Índice de Vegetação Diferencial (DVI) Tentar RBF Número de iterações de treinamento 2 áreas DNN Número das variáveis de entrada Índice (NDVI) Índice de Vegetação Ajustado ao Solo (SAVI) Deering (1975) Ntree Retifica áreas onde a superfície do solo está altamente exposta Distingue entre solo e vegetação B17- B8 Indica quantidade de vegetação Camada oculta 0,01–100 Índice (NDVI) ÿ + 0,5 100–500 Melhorar o sinal e a sensibilidade da vegetação em alta biomassa usado Regularização de abandono O. Odebiri et al. Referência (B17- B8) Ajuste os pesos da rede 10–100 ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ RF Índice (MSAVI) (2B17 + 1) B17- B6 C Regulador de peso Rouse et al. (1974) /2 Épocas Neurônios caíram aleatoriamente durante o treinamento para reduzir o overfitting Épocas B17 + B8 + 0,5 (1 + 0,16)(B17 - B8)/(B17 + B8 + 0,16) Jamalabad e Abkar (2004) Sensível e indicativo de vegetação Pode se adaptar a maiores mudanças no solo B17 + B6 1 Nós ou unidades na camada oculta ÿ 8(B17 ÿ B8) Huete et al. (1999) Descrição do parâmetro Diferença Normalizada Verde Especificação de penalidade Índice de Vegetação Aprimorado (EVI) Hiperparâmetros do algoritmo Inicialização de peso de rede Índice de Vegetação Transformada (TVI) Pesos inicializados das camadas da entrada à saída 2–10 Decair B17 + B8 B17 ÿ B8 Gitelson e Merzlyak (1998) 0,2–0,3 Tamanho do nó Índice (OSAVI) Especificação de largura de banda Índice de Vegetação Razão (RVI) Parâmetro como Taxa de Aprendizagem B17- B8 B8 Tamanho (1 +0,5) Lineariza a ligação entre o índice e os parâmetros biofísicos 100–1000 Tipo de kernel Vegetação modificada ajustada ao solo 2B17 + 1- Índice de Vegetação (GNDVI) ÿ 2 1 OOB e, b )2eu eu=1 ÿn Figura 2. Uma ilustração gráfica da estrutura da rede neural profunda (DNN). Tabela 2 Índices de vegetação espectral derivados do Sentinel-3. Tabela 3 Algoritmos definiram hiperparâmetros. OOB eu 4 Geoderma 411 (2022) 115695 RF é um algoritmo de aprendizado de máquina popular e amplamente adotado para tarefas de regressão e classificação (Sibanda et al., 2021). É um algoritmo de conjunto não paramétrico baseado em árvore que é capaz de lidar com pequenos e grandes dados (Rasaei e Bogaert, 2019). Durante o treinamento, o RF usa uma média das grandes árvores de decisão combinada com uma amostragem bootstrap exclusiva para obter resultados previstos (Odebiri et al., 2020a). O modelo RF também contém uma função importante (impureza de Gini) em sua estrutura que ajuda o usuário a determinar como cada variável preditora contribui para o sucesso geral do modelo. (Breiman, 2001). Os hiperparâmetros incluindo ntree, mtry e o tamanho do nó do RF podem ser otimizados para produzir melhores resultados preditivos (Tabela 3). Além disso, o bootstrapping reduz o efeito do overfitting em RF e permite uma estimativa precisa dos erros das amostras fora do saco (OOB) (Were et al., 2015). O erro quadrático médio OOB (MSEOOB) é expresso como a soma das previsões de todas as árvores como segue (Zhou et al., 2020); 1 validação pelo menos uma vez, o DNN foi calibrado dez vezes. Após repetidos ajustes usando uma otimização de busca aleatória com validação cruzada de 10 vezes, 500 épocas, dez camadas ocultas, o otimizador “adam” e a função de ativação ReLU foram usados para o melhor resultado. 2.4.2. Floresta aleatória (RF) ||w||2 , styi ( wTxi + b ) ÿ 1, i = 1, 2, 3, ÿÿ.m. (4) (3) 2.4.3. Máquina de vetores de suporte (SVM) ( zi ÿ ÿz 1 Assim como a RF, o SVM também é amplamente utilizado para tarefas de regressão e classificação em aplicações de sensoriamento remoto (Forkuor et al., 2017). SVM é um modelo não paramétrico que funciona construindo um conjunto de hiperplanos em um espaço de dimensão infinita (hiperespaço) com o auxílio de uma função kernel (Were et al., 2015). O uso e a escolha da função kernel, incluindo sigmóide, polinomial, função de base radial (RBF) e linear, são essenciais para o desempenho geral do SVM (Jeong et al., 2017). Dado um conjunto de variáveis preditoras (x) para simular a variável alvo (y), o princípio básico do SVM pode ser simplesmente expresso da seguinte forma (Guo et al., 2020); n Onde n é o número de observações e é a previsão OOB para a observação zi. O modelo de RF neste estudo foi calibrado dividindo os dados em 10 partes iguais usadas para treinamento e teste sequencialmente com um conjunto definido de hiperparâmetros, conforme mostrado na Tabela 3 . min Onde xi e yi são os preditores e a variável alvo respectivamente; w e b são o vetor do hiperplano e viés. A função kernel RBF foi selecionada para este estudo porque é comumente usada no mapeamento de solos e tem melhor desempenho do que outros kernels. (Zhou et al., 2020; Guo et al., 2020; Keskin et al., 2019). Também definimos MSEOOB = 2 ÿ Machine Translated by Google eu=1 2 2rÿoÿp p ÿn 2 p ( XO,i ÿ XP,i )2 R2 = 1 ÿ [ÿn i=1 2 2 5 Geoderma 411 (2022) 115695 R2 Resultados de redes neurais profundas (DNN), florestas aleatórias (RF), redes neurais artificiais (RNA) e máquinas de vetores de suporte (SVM); RMSE: raiz do erro quadrático médio; R2 : coeficiente de determinação; LCCC: coeficiente de correlação de concordância de lin (média ± desvio padrão). Tabela 4 ÿ ' (7) ÿn i=1(XO ÿ Oÿ ) ) 3. Resultados Onde n significa o número de observações, XOe XP são os valores SOC medidos e previstos. O' e P' representam médias do SOC medido e previsto, enquanto ÿo e ÿp são as respectivas variâncias do valor medido e previsto. Além disso, para evitar viés de amostragem, uma validação cruzada de 10 vezes foi realizada dividindo os dados em 10 conjuntos iguais e passados sequencialmente em conjuntos de dados de calibração e validação, de modo que cada conjunto fosse usado pelo menos uma vez. Geralmente, um modelo mais bem ajustado é definido por um R2 e LCCC mais elevados, juntamente com um RMSE mais baixo. Os resultados médios para os quatro modelos (ou seja, DNN, RF, ANN e SVM) usando validação cruzada de 10 vezes são apresentados na Tabela 4. Entre os quatro modelos treinados, o modelo DNN mostrou a robustez mais forte na previsão da variabilidade SOC, indicando uma valor de 10,35 t/ha (26% da média) para RMSE, 67,3 para R2 REQM = CCCC = ÿ2 e otimizou dois outros parâmetros RBF importantes (ou seja, penalidade — custo, sigma — largura do kernel) usando a técnica de pesquisa aleatória na API Python 3.8. Onde K representa a função do kernel definida pelo usuário (RBF), x indica o vetor de entrada e ÿ é o sigma (Jeong et al., 2017). O particionamento de dados para a análise SVM foi semelhante ao modelo RF especificado acima. 3.1. Estatísticas resumidas Além disso, avaliou-se a importância das variáveis preditoras para avaliar a sua contribuição para o desempenho global de cada modelo. ÿÿÿÿÿ 2.4.4. Rede neural artificial (RNA) ] + [O' - P' ] ÿxi + xj Além de avaliar o desempenho de um modelo, é uma boa prática quantificar sua incerteza (Abdar et al., 2021). Na investigação orientada para a decisão, caracterizar a incerteza e avaliar a robustez das conclusões da investigação são cruciais para alcançar a qualidade e credibilidade da análise (Hamel e Bryant, 2017). A quantificação da incerteza fornece os limites superior e inferior para as variáveis de produto estimadas (Abdar et al., 2021). Neste estudo, os limites superior e inferior dos mapas SOC gerados por cada modelo foram determinados usando o desvio padrão comum (DP) ± 1,64 com um nível de significância correspondente de intervalo de confiança de 90% (C1) (Rudiyanto et al . , 2016). Isso foi feito usando uma validação cruzada de 10 vezes sob a suposição de que os quatro modelos seguem uma distribuição normal para cada célula raster (Emadi et al., 2020). Posteriormente, foram recuperados os percentis 5 e 95 juntamente com o valor médio previsto de cada pixel. Por fim, foi gerado um mapa de distribuição espacial para a média calculada, intervalo de confiança inferior (5%) e superior (95%) para os quatro modelos. , ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ (XO ÿ p) (5) 2.5. Métricas de avaliação do modelo ÿ| 2.6. Quantificação da incerteza modelo, incluindo “DeepExplainer” para DL e ANN, “TreeExplainer” para qualquer modelo baseado em árvore (RF) e “KernelExplainer” para outros tipos de modelos (SVM). As vantagens do SHAP sobre outras estratégias incluem, entre outras, a interpretabilidade global e local (para mais detalhes sobre o SHAP, ver Padarian et al., 2020b, e Lundberg e Lee, 2017). Uma comparação entre o valor SHAP e a impureza RF Gini produziu o mesmo resultado, portanto, foi utilizado como método unificado para medida de importância de característica neste estudo. A análise estatística foi conduzida para descrever os dados SOC alvo (1936 amostras) para as previsões. Os dados variam entre 5,3 t/ha e 149 t/ha, com média e desvio padrão de 39,8 t/ha e 17,3 t/ha, respectivamente. O coeficiente de variação (43%) é calculado como a razão entre o desvio padrão e a média, indicando uma variação relativamente elevada nos dados SOC. Os dados também apresentaram forte assimetria (1,9) e curtose (5,2), o que anulou a regra de distribuição normal (Hair et al., 2016). Para melhorar a distribuição normal, aplicamos uma transformação de logaritmo natural aos dados SOC, resultando em assimetria e curtose de 0,41 e 0,68, respectivamente. Os dados SOC convertidos foram transformados inversamente para restaurar os dados à sua escala original após a análise de previsão. n O ajuste e a generalização dos modelos construídos neste estudo foram avaliados por meio de três métricas, a saber: raiz do erro quadrático médio (RMSE), coeficiente de determinação (R2) e coeficiente de correlação de concordância de Lin (LCCC). Essas métricas são expressas como; (6) K ( xi, xj ) = exp(ÿ ÿ| ÿ 3.2. Avaliação e desempenho de modelos (8) ANN é uma rede neural clássica usada principalmente para classificação e análise de regressão (Wang et al., 2021). Sua capacidade única e vigorosa de modelagem de dados ajuda a detectar padrões e extrair resultados, podendo assim ser aplicado para simular propriedades complexas do solo, como SOC (Xu et al., 2020). A RNA consiste em camadas de entrada, oculta e de saída (Wei et al., 2021; Falahatkar et al., 2016). A camada de entrada (xi) recebe o sinal (ou seja, dados), após o qual a camada oculta realiza uma combinação linear ponderada de múltiplas variáveis independentes e armazena os parâmetros do modelo, como peso e viés (Gruszczynski, 2019). Antes de fazer a previsão final (camada de saída yi), uma função de ativação não linear é aplicada para limitar a influência de outliers (Chen et al., 2019). A função de ativação ReLU foi utilizada com uma única camada oculta neste estudo (Kuang et al., 2015). A RNA neste estudo foi feita definindo a taxa de aprendizagem, o número de nós na camada oculta e épocas em 0,001–0,05, 2–10 e 10–100, respectivamente, conforme mostrado na Tabela 3 . Enquanto o modelo RF possui uma função (impureza de Gini) em sua estrutura para medir a importância das variáveis, outros algoritmos não. Especificamente, os modelos de aprendizagem profunda (DL) muitas vezes não conseguem alcançar a interpretabilidade porque não conseguem quantificar a importância das variáveis para tarefas de regressão ou classificação, razão pela qual são chamados de caixa preta (Padarian et al., 2019) . Para tanto, diversas técnicas foram recentemente propostas para ajudar os usuários a interpretar as previsões de DL (Pento´s, 2016). Um dos métodos são as explicações SHApely Additive (SHAP) usadas neste estudo. O princípio de funcionamento do SHAP é atribuir um valor médio específico a cada variável para mostrar a magnitude do seu impacto na saída do modelo. SHAP possui função especial para cada tipo de ML + ÿ2 e 84,3 para LCCC. O desempenho de outro modelo em ordem de classificação foi RF com pontuação RMSE de 11,2 t/ha 58±5,03 10,35±5,05 11,2±4,03 63,4±5,0 LCCC 13,6±5,07 REQM (t/ha) SVM 11,6±6,02 Modelo ANN O. Odebiri et al. RF DNN 79,6±6,02 77,5±7,08 84,3±6,05 80,5±6,02 67,3±5,01 64,7±5,03 Machine Translated by Google 6 Geoderma 411 (2022) 115695 4. Discussão plantações.Isto não é surpreendente, porque as variáveis mais importantes (B8, NDVI, B11, EVI e RVI) para o desempenho global dos modelos são todas sensíveis à vegetação. Além disso, a Tabela 5 mostra a percentagem de observação que se enquadra no IC definido (ou seja, 5 e 95%) para os quatro modelos, retratando assim a sua incerteza. Em teoria, 90% das observações deveriam estar dentro do intervalo especificado (Rudiyanto et al., 2016). O modelo DNN produziu a incerteza mais confiável, com 88% das observações dentro do IC definido, seguido por RF e ANN com incerteza semelhante em cerca de ~ 79%. O SVM também produziu uma incerteza relativa aos outros modelos de ~ 69%. Embora os modelos representem uma boa medida de incerteza, podem não representar a situação real no terreno, porque a quantificação da incerteza neste estudo é baseada nos parâmetros dos modelos e não na incerteza espacial dos dados. Figura 5 A distribuição espacial do carbono orgânico do solo (SOC) para rede neural profunda (DNN), floresta aleatória (RF), rede neural artificial (RNA) e máquina de vetores de suporte (SVM) no limite inferior (5%), média, e limite superior (95%) usando dados OLCI do Sentinel 3 (28% da média), 64,7 para R2 e 80,5 para LCCC; a RNA com pontuações de 11,6 t/ha (29% da média), 63,4 e 79,6, para RMSE, R2 e LCCC respectivamente; e o SVM foi o menos robusto, denotando uma pontuação RMSE de 13,6 t/ha (34% da média), 58 para R2 e 77,5 para LCCC, respetivamente. A Figura 3 mostra a correlação entre o SOC observado e o estimado para os modelos construídos. A fácil aquisição e o rápido crescimento de vários dados de sensoriamento remoto baseados na refletância espectral levaram a um aumento nos estudos sobre características da paisagem, incluindo SOC (Wang et al., 2021). Algoritmos poderosos baseados em dados, como aprendizagem profunda (DL), estão sendo cada vez mais adotados no campo de sensoriamento remoto devido à proliferação de big data (Ma et al., 2019). Comparado aos modelos clássicos de ML, o DL se adapta às mudanças ambientais e melhora os modelos baseados em feedback contínuo (Ho Tong Minh et al., 2018). Além disso, a DL é facilitada por redes neurais, múltiplos hiperparâmetros e arquitetura de múltiplas camadas capazes de melhorar a precisão (Zhu et al., 2019). É uma forma avançada de aprendizado de máquina (ML) que coleta dados, aprende A Figura 5 e a Tabela 5 mostram a distribuição espacial e a quantificação da incerteza do SOC previsto para a África do Sul no limite superior (95%), na média e no limite inferior (5%), calculado com IC de 90%. Os mapas gerados por cada modelo (Fig. 5) mostram um nível significativo de concordância do limite superior ao limite inferior. A concentração de SOC é maior em áreas com vegetação densa em comparação com áreas com vegetação esparsa ou sem vegetação. Por exemplo, as partes nordeste e sudeste com cores mais escuras são dominadas por florestas naturais densas e A Figura 4 mostra a importância relativa e a contribuição das vinte covariáveis de melhor desempenho usando a abordagem SHAP. A figura mostra que a melhor variável explicativa para os modelos DNN e ANN foi a Banda 8 (665 nm), enquanto o NDVI foi a variável mais importante nos modelos RF e SVM. Com exceção do modelo SVM, a classificação de importância das variáveis nos demais modelos foi relativamente uniforme. Por exemplo, os primeiros cinco preditores do modelo DNN, incluindo B8, NDVI, EVI, B11 e RVI, foram os mesmos para RF e ANN, com uma ligeira diferença nas suas classificações. Uma análise mais detalhada dos números mostra que o NDVI e a Banda 8 estavam entre os três primeiros em todos os modelos. Além disso, a influência das cinco primeiras variáveis no melhor modelo (DNN) foi maior quando comparada aos demais modelos. 3.4. Estimativa espacial de SOC e quantificação de incerteza 3.3. Avaliação de importância variável dos modelos O. Odebiri et al. 3. Previsto em relação ao carbono orgânico do solo (SOC) observado usando quatro modelos: (A) DNN = rede neural profunda, (B) RF = floresta aleatória, (C) ANN = rede neural artificial, (D) SVM = vetor de suporte máquina. Machine Translated by Google 7 Geoderma 411 (2022) 115695 a partir dele e otimiza o modelo (Li et al., 2021). Neste estudo, examinamos uma abordagem de aprendizagem profunda (DNN) para prever a distribuição espacial do SOC em escala nacional usando Sentinel-3 OLCI e seus derivados. O resultado e o desempenho do DNN foram comparados com outros modelos populares de ML usados no mapeamento digital do solo (ou seja, RF, ANN e SVM). fontes e horário de coleta, o modelo DNN (10 camadas ocultas) foi mais preciso que outros métodos, indicando sua robustez na modelagem de dados complexos. 708,25 nm), EVI e RVI. Curiosamente, estas variáveis também foram significativas em outros modelos que ocupam as seis primeiras posições nos rankings (Fig. 4). A variável mais importante (B8) do modelo DNN está dentro do espectro vermelho visível (625–700 nm). Muitos estudos demonstraram a sensibilidade da faixa vermelha ao SOC (Gholizadeh et al., 2018; Mondal et al., 2017). Por exemplo, Odebiri et al. (2020a) destacaram recentemente a importância da faixa vermelha dos dados do Landsat-8 para estimar o conteúdo SOC dentro da mesma área de estudo (África do Sul). De acordo com o estudo, a região da faixa vermelha foi altamente responsiva aos atributos da vegetação, como o teor de clorofila, o que fornece informações importantes sobre o estado fisiológico da vegetação relacionado ao SOC. Além disso, NDVI, EVI e RVI também melhoram a detecção e sensibilidade da vegetação em regiões de alta biomassa, indicando densidade e distribuição da vegetação, que por sua vez informam a variabilidade do SOC ( Kumar et al., 2016; Matsushita et al., 2007). O B11 cobre as regiões estratégicas do espectro eletromagnético sensível à vegetação (borda vermelha). De acordo com Mngadi et al. (2019), a região da borda vermelha fornece informações sobre uma ampla gama de atributos da vegetação, incluindo biomassa, estrutura da copa e conteúdo de clorofila. Estudos anteriores (por exemplo, Zhang et al., 2019; Aryal et al., 2017; Nabiollahi et al., 2019; Forkuor et al., 2017) relataram que a concentração de SOC é altamente dependente da intensidade da vegetação e dos resíduos. O mesmo se aplica ao nosso modelo SOC (Fig. 5), uma vez que a densidade da vegetação e a concentração de SOC foram positivamente correlacionadas, apoiando a hipótese de que a vegetação pode ser utilizada como um substituto para a estimativa do SOC, uma vez que ambas respondem aos mesmos gatilhos físicos e ambientais ( Bhunia e outros, 2017). O modelo DNN produziu os melhores resultados para distribuição SOC com um nível considerável de precisão quando comparado aos demais modelos (Tabela4). Isto é consistente com a literatura existente. Um estudo recente de Emadi et al. (2020) mostraram a superioridade do DNN sobre outros modelos, como RF, ANN e SVM no mapeamento da variabilidade do SOC na província de Mazandaran, no norte do Irã, com R2 de 65, 58, 55 e 53, respectivamente. Da mesma forma, Taghizadeh-Mehrjardi et al. (2020) desenvolveram um modelo DNN de sete camadas ocultas para prever o conteúdo SOC em seis profundidades padrão em dois locais contrastantes no centro e norte do Irã, e obtiveram um resultado melhor em todas as profundidades em comparação com outros modelos de aprendizado de máquina. Além disso, os resultados (R2 = 67,3) obtidos neste estudo exibiram um melhor desempenho em comparação com outros estudos recentes de SOC em escala nacional realizados por Venter et al. (2021), que utilizaram o modelo RF, e Schulze e Schütte (2020) que calcularam o % SOC utilizando ponderação de área, com pontuação R2 de 65,9 e 20,3 respectivamente. É importante notar que os pontos amostrais de solo utilizados em ambos os estudos foram três a quatro vezes maiores que neste estudo, mas o modelo DNN ainda produziu uma melhor precisão. A vantagem do modelo DNN sobre outros modelos é baseada em sua capacidade de aprender e extrair recursos mais representativos dos dados SOC por meio de suas muitas camadas e neurônios ocultos. Cada neurônio na rede representa um aspecto dos dados e, juntos, fornecem uma representação completa dos dados. As camadas ocultas (no nosso caso 10) são ponderadas para indicar a força da sua relação com a produção (ou seja, SOC), e à medida que o modelo se desenvolve durante o treinamento, os pesos são ajustados para melhorar a precisão. Além disso, a DNN pode aproximar com precisão a complicada relação não linear entre SOC e covariáveis, capturando assim a associação potencial entre eles (Yuan et al., 2020). Considerando a incerteza espacial dos dados SOC alvo devido a múltiplas escalas de variação, bem como às diferentes amostragens Este estudo também avaliou a importância dos preditores utilizados para explicar a variabilidade do SOC. Foi adotada a técnica de valor SHAP com uma capacidade especial de revelar a importância dos preditores para qualquer máquina ou modelo de aprendizagem profunda (ver Seção 2.4). As cinco principais variáveis no modelo DNN foram Banda 8 (B8 = 665 nm), NDVI, Banda 11 (B11 = Figura 4. Classificação de importância das variáveis utilizadas para a simulação do carbono orgânico do solo na África do Sul. DNN: rede neural profunda, RF: floresta aleatória, RNA: rede neural artificial, SVM: máquina de vetores de suporte. O. Odebiri et al. Machine Translated by Google 8 Geoderma 411 (2022) 115695 O Sentinel-3 adquire dados na região do comprimento de onda do visível (VIS) ao infravermelho próximo (NIR) do espectro eletromagnético (400 a 1020 nm). Esta região de comprimento de onda VIS-NIR fornece informações críticas de refletância no SOC e é considerada a região mais sensível para determinar o conteúdo do SOC (Lin et al., 2020; Volkan Bilgili et al., 2010). Considerando que a sua resolução espacial é baixa (300 m), o curto período de revisita e a grande cobertura fornecem informações abrangentes para a estimativa do SOC em No geral, a partir dos mapas de resultados, o SOC é mais prevalente no norte e sudeste do país, enquanto o oeste desértico, árido e semi-árido tem menor concentração. Isto ocorre porque as áreas de maior concentração de SOC são dominadas por densas plantações naturais e exóticas caracterizadas por uma elevada cobertura de copa e altura variando entre 10 e 75% e 2,5–6 m, respetivamente (SANLC, 2020) . As áreas com vegetação densa são capazes de promover o metabolismo acelerado do solo através da queda contínua de serapilheira e matéria morta, resultando numa acumulação adicional de SOC (Muchena, 2017). Além disso, as áreas com vegetação densa do país recebem maior precipitação (>600 mm) do que o deserto e o oeste árido (<300 mm). A precipitação influencia a humidade do solo, os processos hidrológicos (incluindo escoamento superficial e infiltração de águas subterrâneas), a densidade da vegetação e a decomposição, o que apoia o sequestro do COS (Zhou et al., 2008; O'Brien et al., 2010; Chen et al., 2015) . Como exemplo, o Os dados do Sentinel-3 tiveram um bom desempenho em uma modelagem SOC nacional. a província do cabo norte do país (Fig. 1), que tem a concentração mais baixa de SOC (Fig. 5), é caracterizada por uma precipitação anual baixa e errática de longo prazo, com menos de 175 mm (Paterson, 2014). Da mesma forma, os solos desta área são em grande parte dominados por solos arenosos muito rasos com baixa capacidade de retenção de água e areias sopradas pelo vento (dunas), levando a uma baixa acumulação de carbono orgânico no solo. 5. A distribuição espacial do carbono orgânico do solo (SOC) para rede neural profunda (DNN), floresta aleatória (RF), rede neural artificial (RNA) e máquina de vetores de suporte (SVM) no limite inferior (5%), média e limite superior (95%) usando dados OLCI do Sentinel 3. Tabela 5 Número e percentagem de amostras SOC dentro do intervalo de confiança definido (90%). Número de observações 15.56 5–95% SVM 95 79,6 69,1 4.9 Expresso em porcentagem (%) <5 1936 247 O. Odebiri et al. 88.07 12h75 1936 Fora do CI 217 78,9 301 7DNN 1541 8h35 Observações 1338 95% ANN Dentro do CIFora do CIDentro do CI >95% 1936 178 <5 161 15h34 136 9.2 1936 Modelos 297 RF 11.2 5–95% 1705 1528 Machine Translated by Google 9 Geoderma 411 (2022) 115695 Aryal, DR, De Jong, BHJ, Mendoza-Vega, J., Ochoa-Gaona, S., Esparza-Olguín, L., 2017. Estoques de carbono orgânico do solo e respiração do solo em florestas secundárias tropicais no sul do México. In: Segurança global do solo. Springer, pp. 295–309. técnicas de detecção para estimativa de carbono orgânico do solo: uma revisão. Sensor Remoto 11 (6), 676. Documento de base teórica do algoritmo 3, 213. Huete, AR, 1988. Um índice de vegetação ajustado ao solo (SAVI). Sensoriamento Remoto Meio Ambiente. 25 (3), Baret, F., Guyot, G., 1991. Potenciais e limites dos índices de vegetação para avaliação LAI e APAR. Sensoriamento Remoto Meio Ambiente. 35 (2-3), 161–173. Este estudo foi apoiado pelo Projeto Big Data for Science and Society (BDSS), financiado pelo UKZN, e pela Cátedra NRF em Planejamento e Gestão do Uso do Solo (Grant nº 84157). Os autores declaram que não têm interesses financeiros concorrentes ou relações pessoais conhecidas que possam ter influenciado o trabalho relatado neste artigo. 5. Conclusão O estudo concluiu que as múltiplas bandas espectrais (21) do Sentinel-3 podem complementar a sua baixa resolução espacial, resultando numa melhor previsão do SOC. Além disso, de acordo com a classificação de importância da abordagem de valor SHAP utilizada nesteestudo, as seguintes bandas Sentinel-3 foram importantes para a previsão do SOC; B8 (665 nm) B11 (708,25 nm), B17 (865 nm), B19 (900 nm), B9 (673,75), B12 (753,75 nm), B13 (761,25 nm), B18 (885 nm), B6 (560 nm ) e B7 (620 nm), respectivamente. Recomendamos que essas regiões de bandas sejam anotadas para estudos futuros. Declaração de interesse concorrente nível de país (Li et al., 2021). Alguns estudos examinaram a capacidade dos dados do Sentinel-3 para estimar o SOC. Por exemplo, Lin et al. (2020) compararam o desempenho do Sentinel-3 e 2 para prever o conteúdo SOC na China e alcançaram diferentes precisões de R2 = 55 e 59, respectivamente. Bhunia, GS, Kumar Shit, P., Pourghasemi, HR, 2017. Mapeamento de carbono orgânico do solo usando técnicas de sensoriamento remoto e modelo de regressão multivariada. Geocarto Int. 34, 1–12. Referências Reconhecimentos Neste estudo, uma estimativa nacional de SOC foi conduzida usando uma abordagem de aprendizagem profunda (DNN) e dados OLCI do Sentinel-3. O modelo DNN teve melhor desempenho que RF, RNA e SVM, indicando sua capacidade de extrair características mais abstratas dos dados, aumentando assim a precisão. Também adotamos a técnica SHAP que ajudou a desvendar a falta de interpretabilidade associada aos modelos de aprendizagem profunda. Banda 8, NDVI, Banda 11, EVI e RVI foram as variáveis mais importantes no modelo DNN para determinar a variabilidade SOC na área de estudo. No entanto, deve-se ter cuidado ao construir o modelo DNN para evitar overfitting; um fenômeno comum a estruturas de aprendizagem profunda devido a muitos hiperparâmetros. Além disso, este estudo estabeleceu a capacidade dos dados do Sentinel-3 de prever o SOC em escala regional/nacional. Isto é importante para avaliar a sua competitividade em referência a outros sensores comumente usados, como Landsat e MODIS, proporcionando assim aos usuários finais a oportunidade de escolher a imagem apropriada adequada em diferentes escalas de mapeamento. Este estudo é o primeiro mapeamento SOC baseado em DL desenvolvido na África do Sul e fornece uma estrutura valiosa para uma melhor contabilidade nacional de carbono. No entanto, o custo e o tamanho da amostra devem ser colocados em perspectiva porque os modelos DL exigem muito poder de computação, bem como big data. Apesar disso, o modelo DNN teve um bom desempenho e pode ser melhorado em estudos futuros. Por exemplo, este estudo não considerou uma estratégia de seleção de variáveis para reduzir a possível multicolinearidade entre preditores, o que poderia potencialmente reduzir a precisão. Além disso, estudos futuros podem incorporar dados nacionais do solo, se disponíveis, em oposição aos dados globais genéricos utilizados neste estudo. Breiman, L., 2001. Florestas aleatórias. Mach. Aprender. 45 (1), 5–32. Emadi, M., Taghizadeh-Mehrjardi, R., Cherati, A., Danesh, M., Mosavi, A., Scholten, T., 2020. Previsão e mapeamento do carbono orgânico do solo usando algoritmos de aprendizado de máquina no norte do Irã. Sensor Remoto 12 (14), 2234. Gitelson, AA, Merzlyak, MN, 1998. Sensoriamento remoto da concentração de clorofila nas folhas superiores das plantas. Av. Espaço Res. 22 (5), 689–692. Huete, A., Justice, C., Van Leeuwen, W., 1999. Índice de vegetação MODIS (MOD13). Angelopoulou, T., Tziolas, N., Balafoutis, A., Zalidis, G., Bochtis, D., 2019. Remoto Guo, L., Fu, P., Shi, T., Chen, Y., Zhang, H., Meng, R., Wang, S., 2020. Mapeamento de carbono orgânico do solo em escala de campo com sistemas de aeronaves não tripuladas adquiridos imagens multiespectrais de séries temporais. Cultivo do Solo Res. 196, 104477. https://doi.org/ 10.1016/j. ainda.2019.104477. formulários. In: Instituto Multidisciplinar de Editoração Digital. densidade de carbono orgânico usando variáveis ambientais auxiliares no norte do Irã. ' O. Odebiri et al. Hair Jr, JF, Hult, GTM, Ringle, C., Sarstedt, M., 2016. Uma cartilha sobre modelagem de equações estruturais de mínimos quadrados parciais (PLS-SEM). Publicações Sábias. precipitação nas frações de carbono orgânico do solo em três florestas subtropicais no sul da China. J. Planta Ecol. 9 (1), 10–19. Forkuor, G., Hounkpatin, OKL, Welp, G., Thiel, M., Hui, D., 2017. Alta resolução Ben Hamida, A., Benoit, A., Lambert, P., Ben Amar, C., 2018. Abordagem de aprendizagem profunda 3-D para classificação de imagens de sensoriamento remoto. IEEE Trans. Geociências. Sensor Remoto 56 (8), 4420–4434. Batjes, NH, Ribeiro, E., Oostrum, Av, 2020. Dados padronizados do perfil do solo para apoiar o mapeamento e modelagem global (Snapshot WoSIS 2019). Sistema Terra. Ciência. Dados 12 (1), 299–320. Departamento de Assuntos Ambientais, 2017. Avaliação Nacional de sumidouros de carbono terrestre. Departamento de Assuntos Ambientais, Pretória, África do Sul. Dotto, AC, Dalmolin, RSD, ten Caten, A., Grunwald, S., 2018. Um estudo sistemático sobre a aplicação de pré-processamento corretivo de dispersão e derivado espectral para previsão multivariada de carbono orgânico do solo por espectros Vis-NIR. Geoderma 314, 262–274. Volkan Bilgili, A., van Es, HM, Akbas, F., Durak, A., Hively, WD, 2010. Espectroscopia de refletância no infravermelho próximo visível para avaliação das propriedades do solo em uma área semiárida da Turquia. J. Ambiente Árido. 74 (2), 229–238. Abdar, M., Pourpanah, F., Hussain, S., Rezazadegan, D., Liu, Li, Ghavamzadeh, M., Fieguth, P., Cao, X., Khosravi, A., Acharya, UR, Makarenkov, V., Nahavandi, S., 2021. Uma revisão da quantificação da incerteza na aprendizagem profunda: técnicas, aplicações e desafios. Informar. Fusão 76, 243–297. SoilGrids250m: Informações globais do solo em grade baseadas em aprendizado de máquina. PLoS UM 12 (2), e0169748. https://doi.org/10.1371/journal.pone.016974810.1371/ journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal . pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal. pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal. pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal. pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal. pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal. pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal. pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal. pone.0169748.t00310.1371/journal.pone.0169748.t004. Gholizadeh, A., Zi ÿzala, D., Saberioon, M., Borÿvka, L., 2018. Recuperação e mapeamento de carbono orgânico e textura do solo usando imagens espectrais proximais, aéreas e Sentinel-2 . Sensoriamento Remoto Meio Ambiente. 218, 89–103. Jamalabad, M., Abkar, A., 2004. Monitoramento da densidade do dossel florestal, usando imagens de satélite. Congresso ISPRS, Istambul. Em. Chen, X., Zhang, D., Liang, G., Qiu, Q., Liu, J., Zhou, G., Yan, J., 2015. Efeitos de Falahatkar, S., Hosseini, SM, Ayoubi, S., Salmanmahiny, A., 2016. Previsão do solo Chen, C.-H., Kung, H.-Y., Hwang, F.-J., 2019. Técnicasde aprendizagem profunda para agronomia Gruszczynski, S., 2019. Previsão de propriedades do solo com modelos de aprendizado de máquina baseados na resposta espectral de amostras de solo na faixa do infravermelho próximo. Ciência do Solo. Anual 70 (4), 298–313. ÿ Deering, D., 1975. Medição da “produção de forragem” de unidades de pastagem a partir de dados Landsat MSS. Artigo apresentado nos Anais do Décimo Simpósio Internacional de Sensoriamento Remoto do Meio Ambiente. Hamel, P., Bryant, BP, 2017. Avaliação da incerteza nas análises de serviços ecossistêmicos: sete desafios e respostas práticas. Ecossistema. Servir. 24, 1–15. Arco. Agro. Ciência do Solo. 62 (3), 375–393. Gupta, S., Kar, AK, Baabdullah, A., Al-Khowaiter, WAA, 2018. Big data com computação cognitiva: uma revisão para o futuro. Internacional J. Inf. Gerenciar. 42, 78–89. Hengl, T., Mendes de Jesus, J., Heuvelink, GBM, Ruiperez Gonzalez, M., Kilibarda, M., Blagotí c, A., Shangguan, W., Wright, MN, Geng, X., Bauer- Marschallinger, B., Guevara, MA, Vargas, R., MacMillan, RA, Batjes, NH, Leenaars, JGB, Ribeiro, E., Wheeler, I., Mantel, S., Kempen, B., Bond-Lamberty, B., 2017. Dong, Z., Zhou, Z., Li, Z., Liu, C., Huang, P., Liu, L., Liu, X., Kang, J., 2019. Redes neurais convolucionais baseadas em dispositivos RRAM para reconhecimento de imagem e tarefas de aprendizagem on-line. IEEE Trans. Desenvolvimento de elétrons. 66 (1), 793–801. mapeamento das propriedades do solo usando variáveis de sensoriamento remoto no sudoeste de Burkina Faso: uma comparação entre aprendizado de máquina e modelos de regressão linear múltipla. PLoS UM 12 (1), e0170478. https://doi.org/10.1371/journal.pone.017047810.1371/ journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal . pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal. pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal. pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal. pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal. pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal. telefone.0170478.s003. Machine Translated by Google http://refhub.elsevier.com/S0016-7061(22)00002-7/h0015 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0015 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0015 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0140 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0010 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0010 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0135 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0140 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0020 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0020 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0030 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0030 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0030 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0040 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0075 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0075 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0075 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0095 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0095 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0135 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0010 https://doi.org/10.1016/j.still.2019.104477 https://doi.org/10.1016/j.still.2019.104477 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0080 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0100 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0115 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0115 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0050 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0050 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0125 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0125 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0125 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0025 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0025 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0025 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0060 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0060 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0070 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0070 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0070 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0070 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0035 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0035 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0035 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0005 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0005 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0005 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0005 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0090 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 https://doi.org/10.1371/journal.pone.016974810.1371/journal.pone.0169748.g00110.1371/journal.pone.0169748.g00210.1371/journal.pone.0169748.g00310.1371/journal.pone.0169748.g00410.1371/journal.pone.0169748.g00510.1371/journal.pone.0169748.g00610.1371/journal.pone.0169748.g00710.1371/journal.pone.0169748.g00810.1371/journal.pone.0169748.g00910.1371/journal.pone.0169748.g01010.1371/journal.pone.0169748.g01110.1371/journal.pone.0169748.g01210.1371/journal.pone.0169748.g01310.1371/journal.pone.0169748.g01410.1371/journal.pone.0169748.t00110.1371/journal.pone.0169748.t00210.1371/journal.pone.0169748.t00310.1371/journal.pone.0169748.t004 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0090 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0090 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0050 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0080 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0100 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0100 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0100 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0055 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0055 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0055 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0120 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0120 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0080 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0110 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0110 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0090 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0065 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0065 http://refhub.elsevier.com/S0016-7061(22)00002-7/h0065 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 https://doi.org/10.1371/journal.pone.017047810.1371/journal.pone.0170478.g00110.1371/journal.pone.0170478.g00210.1371/journal.pone.0170478.t00110.1371/journal.pone.0170478.t00210.1371/journal.pone.0170478.t00310.1371/journal.pone.0170478.t00410.1371/journal.pone.0170478.t00510.1371/journal.pone.0170478.t00610.1371/journal.pone.0170478.t00710.1371/journal.pone.0170478.t00810.1371/journal.pone.0170478.s00110.1371/journal.pone.0170478.s00210.1371/journal.pone.0170478.s003 mapeamento de resolução dos estoques de carbono orgânico do solo usando variáveis de sensoriamento remoto nas pastagens semiáridas do leste da Austrália. Ciência. Meio Ambiente Total. 630, 367-378. mapeamento usando aprendizagem profunda. Solo 5 (1), 107–119. Wang, Y., Zhang, Z., Feng, L., Du, Q., Runge, T., 2020. Combinando dados de múltiplas fontes e abordagens de aprendizado de máquina para prever a produção de trigo de inverno nos Estados Unidos contíguos. Sensor Remoto 12 (8), 1232. Wang, K., Qi, Y., Guo, W., Zhang, J., Chang, Q., 2021. Recuperação e mapeamento do solo 450–463. Wang, B., Waters, C., Orgill, S., Gray, J., Cowie, A., Clark, A., Liu, DL, 2018. Alto Odebiri, O., Mutanga, O., Odindi, J., Peerbhay, K., Dovey, S., Ismail, R., 2020b. Estimativa dos estoques de carbono orgânico do solo sob silvicultura comercial usando variáveis topoclimáticas em KwaZulu-Natal, África do Sul. S. África. J. Ciência. 116 (3–4), 1–8. Wadoux, AMJ, Padarian, J.,