文章摘要
农田土壤有机碳反演的变量筛选及算法组合优化:以泾河流域为例
Variable selection and algorithm combination optimization for farmland soil organic carbon inversion: A case study of the Jinghe River Basin
投稿时间:2025-05-27  修订日期:2025-08-20
DOI:
中文关键词: 土壤有机碳  反演模型  机器学习  变量筛选  SHAP分析
英文关键词: Soil organic carbon  Inversion model  Machine learning  Variable screening  SHAP analysis
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目)
作者单位邮编
张方滟 西安交通大学 710049
吴一平* 西安交通大学 710049
阴晓伟 西安交通大学 
孟泽昕 西安交通大学 
李汇文 西安交通大学 
张广创 西安交通大学 
韩磊 长安大学 
邱临静 西安交通大学 
赵富波 西安交通大学 
覃蔡清 西安交通大学 
窦欣 东北农业大学 
摘要点击次数: 510
全文下载次数: 0
中文摘要:
      为实现快速、高精度的农田土壤有机碳(SOC)反演并探讨不同变量筛选方法与机器学习算法的适宜组合方式,本研究以黄土高原典型丘陵沟壑区泾河流域农田土壤为对象。基于SOC采样数据,整合了包括MODIS多光谱数据及相关环境变量在内的126个变量,探究了全部变量集、竞争性自适应重加权采样法(CARS)筛选变量集、相关系数筛选变量集这3种变量集分别与支持向量机(SVM)、随机森林(RF)、反向传播神经网络(BPNN)和极端梯度提升树(XGBoost)这4种算法组合对模型精度的影响。结果表明,经过相关系数筛选后的11个特征变量与4种机器学习算法组合的模型精度显著优于全部变量集和CARS筛选变量集,其中与SVM算法的组合表现最优(验证集:R2 = 0.86,RMSE = 0.95,MAE = 0.76,RPD = 2.66),其次为XGBoost、BPNN和RF模型。SHAP分析显示,地形变量(DEM、地形起伏度、剖面曲率)贡献度达28.41%,在地形复杂多变、耕地较为破碎的泾河流域农田SOC反演中扮演着重要的角色,其次为遥感指数(23.18%)和经纬度(20.21%)。相关系数筛选与SVM算法组合的反演结果表明,流域农田SOC范围为0.00~39.94 g·kg-1,其高值区集中在研究区域的西部边缘,低值区集中在东北部,中值区和低值区在中部和南部交错分布,平均SOC值为8.38 g·kg-1,其含量远低于全国农田SOC的平均水平。
英文摘要:
      本研究以黄土高原典型半干旱区的泾河流域为对象,聚焦于低SOC含量区域的反演精度提升问题,构建涵盖MODIS遥感数据与多源环境因子的多维变量集,系统比较了三种变量集与四类主流机器学习算法的组合效果,明确了相关系数筛选与SVM模型组合的最优性能,引入SHAP方法定量揭示主控变量的贡献机制,发现地形因子在地形破碎区域中对SOC反演具有主导作用,研究成果为干旱区、半干旱区因子选择优化、高效SOC反演及农田碳库评估提供了新方法与科学依据。
HTML   View Fulltext   查看/发表评论  下载PDF阅读器
关闭