快速检索        
  农业资源与环境学报  2021, Vol. 38 Issue (6): 967-979  DOI: 10.13254/j.jare.2021.0504
0

引用本文  

任向宁, 王璐, 林赋英, 等. 基于分层多元复合模型的广东省农田土壤有机碳高精度制图[J]. 农业资源与环境学报, 2021, 38(6): 967-979.
REN Xiangning, WANG Lu, LIN Fuying, et al. High precision mapping of soil organic carbon based on multivariate composite model in Guangdong Province[J]. Journal of Agricultural Resources and Environment, 2021, 38(6): 967-979.

基金项目

国家重点研发计划课题(2020YFD1100205);国家自然科学基金项目(U1901601)

Project supported

The National Key R & D Program of China(2020YFD1100205); The National Natural Science Foundation of China(U1901601)

通信作者

王璐  E-mail: selinapple@163.com

作者简介

任向宁(1978-), 男, 河北正定人, 讲师, 研究方向为土地资源开发利用与保护。E-mail: xnren@scau.edu.cn

文章历史

收稿日期: 2021-08-10
录用日期: 2021-10-26
基于分层多元复合模型的广东省农田土壤有机碳高精度制图
任向宁1,2 , 王璐1,3,4 , 林赋英1 , 陈淑莹1 , 胡月明1,2,3,4,5     
1. 华南农业大学资源环境学院, 广州 510642;
2. 广东省土地利用与整治重点实验室, 广州 510642;
3. 广东省土地信息工程技术研究中心, 广州 510642;
4. 自然资源部建设用地再开发重点实验室, 广州 510642;
5. 青海-广东自然资源监测与评价重点实验室, 西宁 810016
摘要: 农田有机碳库是唯一可在较短时间尺度上通过合理利用而进行适度调节的碳库,农田土壤有机碳高精度制图对进一步明析地理环境背景,提升区域土壤固碳潜力,促进碳交易、碳中和等具有重要的意义。本研究以广东省为研究区,在中大空间尺度区域综合特征分区的基础上,基于地理探测器确定农田土壤有机碳空间分异的变量结构,分区构建分层多元复合模型,根据208 503个土壤采样点数据编制研究区高精度农田土壤有机碳密度空间分布图。结果表明:耦合自然地理特征和社会经济特征,引入多距离空间聚类进行中大空间尺度综合特征分区,能够显著收敛样本离散程度,土壤有机碳样本标准偏差均值、方差均值较未分区前分别下降0.55、3.53,Moran's I指数上升0.08。受自然环境与人为扰动双重影响,农田土壤有机碳空间变异的变量众多,且不同综合特征分区内变量结构差异较大,年均降水量、海拔高度、地形坡度等变量在不同特征分区的影响力存在显著差异,土地利用方式及土壤理化性质等变量对不同特征分区均存在较大的影响力。基于地理探测器构建的分层多元复合模型,较好地解决了中大尺度和复杂情景下土壤有机碳空间分异规律与空间突变的同步表达矛盾,抑制了多变量插值噪声增加,其综合精度较地理加权回归模型(GWRK)、径向基函数神经网络(RBFNN)和普通克里格(OK)分别提升6.45%、10.45%和7.50%。在大密度样本集支持下,综合区域综合特征分区、地理探测器、分层多元复合模型等技术手段编制的广东省高精度农田土壤有机碳空间分布图,预测结果准确,空间细节表达清晰,为编制大空间尺度的土壤有机碳分布图探索了有效路径。
关键词: 农田    土壤有机碳    地理探测器    分层多元复合模型    高精度制图    广东省    
High precision mapping of soil organic carbon based on multivariate composite model in Guangdong Province
REN Xiangning1,2 , WANG Lu1,3,4 , LIN Fuying1 , CHEN Shuying1 , HU Yueming1,2,3,4,5     
1. College of Natural Resources and Environment, South China Agricultural University, Guangzhou 510642, China;
2. Guangdong Provincial Key Laboratory of Land Use and Consolidation, Guangzhou 510642, China;
3. Guangdong Province Engineering Research Center for Land Information Technology, Guangzhou 510642, China;
4. Key Laboratory of the Ministry of Natural Resources for Construction Land Transformation, Guangzhou 510642, China;
5. Qinghai-Guangdong Joint Key Laboratory of Natural Resource Monitoring and Evaluation, Xining 810016, China
Abstract: The soil organic carbon pool of farmland is the only carbon pool that can be appropriately adjusted by rational utilization in a short time scale. High precision mapping of soil organic carbon is helpful to further enhance the potential of regional soil carbon sequestration, analyze the geographical environment background, and promote carbon trading and carbon neutralization. This study, The study took Guangdong Province as the study area, which was divided into 13 comprehensive characteristic zones on medium and large spatial scale. The variable structure of soil organic carbon spatial differentiation in farmland was determined by Geodetector, and hierarchical multivariate composite models(MCM) was constructed. According to the data of 208 503 soil sampling points, we chart a highprecision spatial distribution map of soil organic carbon density in the study area. The results show that comprehensive feature zoning on a medium and large spatial scale, which was carried out by coupling natural geographical characteristics with socio-economic characteristics, and introducing multidistance spatial clustering, can significantly converge the degree of sample dispersion.The mean standard deviation and mean variance of soil organic carbon samples decrease by 0.55 and 3.53 respectively, and Moran's I index increase by 0.08. Under the dual influence of natural environment and human disturbance, there are many variables of spatial variation of soil organic carbon in farmland, and the variable structure in different comprehensive characteristic zones is quite different. Average annual precipitation, altitude, terrain slope and other variables play a significant role in mountainous and hilly areas, but not in plain and hilly areas. However, variables such as land use modes and soil physical and chemical properties have extensive and significant influence on different characteristic zoning. The hierarchical multivariate composite model based on Geodetector better solves the contradiction between the synchronous expression of spatial differentiation law and spatial mutation of soil organic carbon in medium and large-scale and complex scenarios, and suppresses the increase of multivariable interpolation noise. Its comprehensive accuracy is 6.45%, 10.45% and 7.50% higher than geographically weighted regression model-Kriging(GWRK), radial basis function neural network(RBFNN), ordinary Kriging (OK)respectively. With the support of high-density sample set, the high precision soil organic carbon map of Guangdong Province integrates the methods of regional comprehensive feature zoning, Geodetector and hierarchical multivariate composite models. Its prediction results are accurate and the spatial details are clearly expressed, which explores an effective path for compiling the large-scale spatial soil organic carbon distribution map.
Keywords: farmland    soil organic carbon    Geodetector    hierarchical multivariate composite model    high precision mapping    Guangdong Province    

高精度土壤有机碳(Soil organic carbon,SOC)制图是准确测度土壤固碳能力和土壤碳储量的基础,对研究SOC时空变异规律具有重要意义。目前,受样本数量与制图方法制约,高精度SOC制图研究主要集中在空间小尺度上。而对区域碳管理、碳交易等宏观需求更迫切的国家级、省级中大尺度SOC制图精度总体不高[1]。为此,中大尺度高精度SOC制图方法的研究显得至关重要。

农田土壤作为自然土壤的衍生物,其发生发育过程必然符合地理第一定律。同时在长期农耕过程下,农田土壤发生发育过程中受到更为频繁的人工干预与扰动,导致其强空间变异度[2]。因此,农田SOC高精度制图难度远远大于自然土壤。当前,国内外对于土壤有机碳制图的方法主要分为4类:第一类为基于土壤属性的土壤类型连接法[3];第二类方法为地统计学法[4];第三类为多元线性回归方法、空间地理回归等相关关系统计法[5];第四类方法为人工神经网络模型、分类回归树、随机森林、支持向量机等机器学习算法模型[6]。其中土壤类型连接法适用于空间尺度较大且土壤类型比较单一的区域[7],但对土壤类型的多样性反映不足[8]。地统计学法与相关关系统计法则较为依赖空间关联性[9-10],在情景复杂、局部变异较强的地区,其空间特征表达能力和预测精度较差[9-13]。机器学习算法模型的预测精度对空间尺度和采样密度的依赖性较强,大尺度复杂情景下测算误差较大[14]。因此,有关学者针对大尺度复杂农田土壤环境,作出了非插值算法的探索,如构建基于因子自组织映射聚类的土壤有机质与相关因子之间的非线性关系[15],通过Cubist模型引入了相对坡位、高程等变量的贡献率等,以此避免辅助因素增加后插值测算模型复杂化和结果偏离度的增加,降低插值噪声强度等[16]。基于非插值算法的思路,通过测定区域SOC空间变异的变量结构,协同不同变量分层进行克里格插值,依据变量贡献力大小通过构建分层多元复合模型[17]编制SOC空间分布图。该方法突破了一般插值预测方法对协同变量的数量限制,能够充分体现大尺度环境中多维复杂变量的影响,提升了拟合精度。同时,通过引入变量贡献力与分层协同克里格插值,降低了复杂变量相互干扰导致的插值噪声,具有更好的制图精度和空间表达效果。

本研究以广东省为研究区,协同区域综合特征分区及大密度样本数据集,采用地理探测器确定农田SOC的变量结构,构建分层多元复合模型(Hierarchical multivariate composite model,MCM),编制研究区农田SOC高精度分布图,为理清复杂情景下中大尺度农田SOC空间分布,探究提升区域农田固碳潜力提供了科学基础。

1 材料与方法 1.1 研究区域

研究区位于中国大陆南部广东省,濒临中国南海,地处20°13′ ~25°31′ N、109°39′ ~117°19′ E之间,北回归线横穿研究区,陆地面积约1.8×105 km2。研究区地势总体为北高南低,最高海拔1 902 m,最低为-52 m[18]。地貌类型复杂多样,包括山地、丘陵、台地和平原等,其中山地和丘陵占研究区总面积的50% 以上。研究区属南亚热带季风气候,常年平均气温21.9 ℃,日照时间1 755 h,年均降雨量1 790 mm。受地势变化与距海远近影响,研究区北部山区和南部临海平原区的年平均气温相差4.5 ℃(19.6~24.1 ℃),日照时间相差1 108 h(1 316~2 424 h),降水量相差2 084 mm(1 099~3 183 mm)。研究区天然水系发育旺盛,河渠纵横,水网稠密。2018年研究区地表水资源量1.885× 1011 m3,集雨面积在100 km2以上的干支流543条,河流总长2.86×104 km。根据第二次土壤普查结果,研究区陆地农田土壤包括水稻土、赤红壤、潮土等16个土类,212个土种。在复杂气候、地形、水文、植被、成土母质及人工活动耦合作用下,研究区土壤类型的空间分布具有显著的空间地带性和复合区域性,由北向南水平地带分布红壤、赤红壤、砖红壤的铁铝土土纲系列,以及平原地区、红岩盆地和石灰岩山地3种复合区域土壤组合类型。2018年末研究区常住人口1.14亿,其中珠三角核心区、沿海经济带(东西两翼)和北部生态发展区分别占研究区总人口的55.53%、29.60% 和14.87%。研究区主要包括北部山地农业、中部南亚热带农业、西南部热带农业3个农业空间带,农田面积2.259 ×105 hm2,其中水田占61.89%,水浇地占28.24%,旱地占9.87%。

研究区具有显著的南北气候差异,复杂的地貌、水文、土壤等地理环境背景及不同人口压力下的农田利用方式及扰动频率,是复杂情景下农田SOC高精度制图极具代表性的研究区域。

1.2 数据来源

本研究数据来源主要包括区域地理环境数据和农田实地采样数据,其中区域地理环境数据中土地利用/覆被数据、河流沟渠及行政区划界线主要根据研究区2018年土地利用现状变更调查成果分离、解析取得。DEM数据采用ASTER GDEM数据(国家基础数据中心),用于研究区海拔高度、地形坡度、坡向等信息提取,空间分辨率30 m。农田样点土壤有机质含量(Soil organic matter, SOM)、土壤类型、表土质地、土壤容重、砾石含量、土壤pH等土壤理化属性及当地降水量等数据则采集于2010—2018年广东省耕地地力评价调查与耕地质量年度更新调查数据集,共采集208 768个样点数据。样点布设密度按照大田每6.67×105 m2(1 000亩)、蔬菜地每3.33×105 m2(500亩)~6.67×105 m2(1 000亩)布设一个,并根据地貌类型、土壤类型、利用方式及质量等级等条件适当增加样点密度,采样深度约20 cm。

经分析,剔除离群无效样点265个,根据筛选出的样点构建研究区208 503个有效农田土壤有机碳高精度制图样本集(表 1图 1)。从样本集中随机抽取70% 的样本(145 952个,不含最高值和最低值)作为空间插值集,剩余的30%(62 551个,空间不连续)作为验证集,验证制图精度。

表 1 研究区农田土壤有机质含量样本统计表 Table 1 Statistical table of SOM samples of typical paddy fields in the study area
图 1 研究区农田土壤有机碳样点分布图 Figure 1 Distribution map of field survey sample points of SOC in the study area
1.3 研究方法 1.3.1 土壤有机碳的测度

农田土壤有机碳包括土壤耕层有机碳含量(Soil organic carbon content, SOCC)和土壤耕层有机碳密度(SOCD),其中SOCC在国际上普遍采用58% 作为SOM中碳含量的转换系数,因此本研究中采用公式(1)测算SOCC。样本数据集中样本采样深度基本为20 cm,故统一选取耕层厚度为20 cm,本研究中采用公式(2)测算SOCD。

(1)
(2)

式中:SOCD20为农田耕层(20 cm)土壤有机碳密度,kg·m-2;SOCC为土壤有机碳含量,g·kg-1;BD为土壤容重,g·cm-3H为耕层土壤厚度,本研究取20 cm;g为>2 mm石砾含量,%。

1.3.2 区域综合特征分区方法

由于人类长期频繁扰动与自然地理要素的耦合作用,形成了研究区农田土壤复杂的系统环境。综合区划通过耦合自然、经济、社会系统要素,叠加上区域划分方法[19],有利于收敛研究区内农田SOC空间差异,为构建稳定的研究模型奠定基础。目前,空间分区方法主要分为定性、定量和GIS空间模型三大类。其中定性方法有特尔斐法、主导因素法等,其精度主要取决于专家知识与经验判断,指标及其重要性的判断离散度较大。定量方法有空间叠置法、矩阵判断法[20]、状态空间法[21]、聚类分析法[22]等,其对分区影响要素的空间表达细微、准确,但分区结果的空间连续性较差。GIS空间模型法则融合了各分区要素的空间统计、分析与处理,具有优秀的空间数据处理和分析能力,逐渐成为综合分区发展的重要方向。

本研究采用定量分析与GIS空间模型相结合的方法,通过分析比较生态、经济、社会各子系统中主要影响因素的关系及其重要性,构建综合区划的多层次结构体系[23]。继而采用变异系数法和熵值法测算综合区划主导因子影响权重,引入基于加权Ripley′s K函数的多距离空间聚类进行分区。空间聚类中空间约束选择“Contiguity_Edges_Corners”,距离算法选择“Eucludean”,分组分析使用K均值算法。

1.3.3 地理探测器

地理探测器[24]是研究某现象空间分布不一,即空间变异性的统计学理论方法。该模型假设自变量对因变量产生了影响,在空间上的分布就会相应产生一定的相关性;主要包括分异及因子探测、交互作用探测、风险区探测和生态探测4个探测器,其中分异及因子探测器即是探测地理属性Y的空间变异性和探测因子X1X2……对Y空间变异的解释力(即贡献力),用q值度量。其分异及因子探测的表达式为:

(3)

式中:L表示因子X的分层,即自变量分类分级;NhN分别为层h和全区的单元数;σ2 hσ2分别为层h和全区Y值的方差。SSW和SST分别为层内方差之和和全区总方差。q∈[0, 1],q值越大表示自变量X对属性Y的解释力越强,反之则越弱。

地理探测器现已被广泛应用于地理空间相似性与分异性研究中,如地理空间影响因素识别[25]、区域分异与空间优化[26]、生态环境与公共健康[27]等。地理探测器擅长分析类型变量,可用于测度地理环境、土壤类型、土壤理化性质及农田利用方式等类型变量对农田SOC空间变异的贡献力,较主成分分析、多元回归等传统线性统计分析方法更为直观和快捷。

1.3.4 区域土壤有机碳空间测算方法

(1)基于地理探测器的多元复合模型

区域农田土壤类型复杂、农田利用方式多样性和多变性强[28],导致SOC空间分异的变量众多,且各变量对SOC空间分异的贡献力不同。为实现区域农田SOC高精度制图的目标,以协同克里格[29]为基础构建分层多元复合模型。选择高程、坡度、降水量、土壤类型、农田利用方式等因子[30-32]作为协同变量,分别进行协同克里格插值。同时,采用地理探测器探测不同变量贡献力大小,并根据影响力大小确定各综合特征分区主导变量及其权重系数。采用加权求和法,综合各变量协同克里格插值结果测算出SOCC[17]。其公式表达为:

(4)

式中:Z0, ck (x0)为x0处最终的SOCC估算值;Zi (x0)为x0处第i个协同变量(影响因子)克里格插值的SOCC估算值;λi为第i个协同变量的权重系数。

(2)传统区域插值预测方法

普通克里格(Ordinary Kriging, OK)、地理加权回归模型插值(Geographically weighted regression model− Kriging, GWRK)和径向基函数神经网络(Radial basis function neural network, RBFNN)是目前应用频率最高和精度较高的3种传统区域插值预测方法。其中,OK利用区域化变量的原始数据和变异函数的结构特点,能够实现空间预测值的线性无偏最优估计[33]。本研究采用ArcGIS 10.4空间分析模块直接进行OK空间插值预测制图。GWRK是对地理加权回归模型[34]的延伸与扩展,本研究通过将SOCC不同结构变量代入地理加权模型,以邻近样本的值和距离预测SOCC,重构插值集后进行空间插值预测制图。RBFNN同样是一种较为有效且精确的空间插值方法[35],与BP神经网络相比,结构简单、训练简洁,具有较快的学习速度和逼近能力。RBFNN不仅能处理数值型变量,也能有效处理类型变量,同时能够避免过拟合,正逐渐被应用到土壤空间信息等研究中。本研究采用SPSS 22.0中的RBFNN模型分析,输入SOCC及其结构变量,选择自组织学习方法作为径向基函数(RBF)中心的确定方法,选择一般径向基函数(即高斯函数模型)作为隐含层激活函数,模型输出预测SOCC值后绘制预测结果图。

2 结果与分析 2.1 农田土壤有机碳高精度制图的区域综合特征分区

面向农田SOC高精度制图的综合特征分区主要由主题层、目标层、指标层三级构成。其中主题层包括自然地理特征和社会经济特征;目标层中自然地理特征主要包括气候状况、地形、土壤状况和水文条件等4个因素;社会经济特征主要包括人口聚集度、土地资源状况、区位状况、交通状况、社会发展水平和经济发展水平等6个影响因素。为避免因素间,尤其是社会经济要素之间的多重线性干扰,对指标因素进行降维收敛处理。指标层主要确定为海拔高度、土壤类型、水网密度、人口密度和耕地占比5个主导分区因子。根据变异系数法和熵值法测算分区因子贡献度,继而采用算数平均法测算出最终的分区因子综合权重,海拔高度、土壤类型、水网密度、人口密度、耕地占比的综合权重分别为0.19、0.07、0.20、0.38、0.16(表 2)。

表 2 研究区综合特征分区因子综合权重(贡献力)测算表 Table 2 Calculation table of index comprehensive weight of comprehensive characteristic zoning in the study area

以研究区内1 624个行政乡镇(街道)为综合特征分区的基本单元,采用基于加权Ripley′s K函数的多距离空间聚类进行分区。通过对农田SOC高精度制图样本集比较,分析不同分区策略(7~15个区)的SOC样本集统计特征,结果显示:当研究区划分为13个区时,样本标准偏差均值为5.17,小于其他分区策略。样本方差均值27.91,小于大部分分区策略,Moran′ s I指数0.29,大于其他分区策略(表 3)。综合比较结果,确定13个分区策略为最终综合特征分区结果,其SOC标准偏差均值、方差均值较未分区前分别下降0.55、3.53,Moran′ s I指数上升0.08。13个综合特征分区中,各分区面积在0.27×104~3.36×104 km2之间,占研究区总面积的1.50%~18.66%(图 2)。

表 3 不同聚类分区策略中土壤有机质含量样本统计特征表 Table 3 Statistical characteristics of SOM samples in different clustering zoning strategies
图 2 研究区农田综合特征分区结果 Figure 2 The result of comprehensive characteristic zoning of farmland in the study area
2.2 基于地理探测器的农田土壤有机碳结构变量影响力探测

农田SOC空间变异受自然和人为因素的耦合影响,其结构变量(影响因子)复杂多样,采用文献法遴选中大空间尺度SOC空间分异影响因子。其中气候因素中主要选取区域降雨量因子,地形条件选取海拔高度、地形坡度、坡向3个影响因子,土壤属性选取土壤类型、表土质地、土壤pH 3个影响因子,人类活动则主要选取土地利用方式因子。地理探测器擅长分析类别变量,将以上8个变量进行分类分级(表 4)。

表 4 研究区农田土壤有机碳结构变量(影响因子)分级分类表 Table 4 Classification table of SOC structure variables(influencing factors)in the study area

以农田SOCC样本为因变量(Y),采用地理探测器进行探测。结果显示,8个影响因子之间的相关性在0.001~0.095之间,各因子间都呈增强型非线性弱质边缘相关,排除共线可能性。13个综合特征分区内8个因子的SOC影响力(q值)在0.000~0.186之间。各分区内同一因子的影响力差异较大,剔除各分区内影响力较小的干扰因子,每个分区保留5~7个具有显示度的影响因子作为该区内农田SOC的结构变量(表 5)。

表 5 不同分区内农田土壤有机碳影响因子影响力汇总表 Table 5 Influences of soil organic carbon structure variables in different zones
2.3 基于分层多元复合模型的农田土壤有机碳高精度制图

根据地理探测器探测结果,综合遴选出的SOC空间变异结构变量构建不同综合特征分区内农田SOC的多元复合模型(MCM)(表 6)。在研究区内划分230 m×230 m栅格单元3.33×106个,根据13个分区的MCM及208 503个SOC样本数据,绘制农田SOCD高精度空间分布图(图 3)。结果显示研究区农田SOCD最小值为1.56 kg·m-2,最大值为6.19 kg·m-2,平均值为3.64 kg·m-2。粤北清远市、梅州市的山地丘陵区农田SOCD较高,均值在4.20 kg·m-2以上;南部滨海平原台地区农田SOCD较低,均值在3.00 kg·m-2以下(表 7)。采用自然断点法将研究区农田SOCD划分为高(≥4.08 kg · m-2)、中(3.33 kg · m-2≤SOCD < 4.08 kg · m-2)、低(< 3.33 kg·m-2)三个等级。其中低等级农田面积1.155 5 × 106 hm2,占研究区农田总面积的33.86%,具有较大的农田SOC储存提升潜力。

表 6 分区农田土壤有机碳样本及分层多元复合模型 Table 6 Sample status of SOC and multivarible composite model in different zones
图 3 广东省农田土壤有机碳密度高精度分布图 Figure 3 High precision distribution map of SOCD in Guangdong Province
表 7 基于高精度空间分布图的农田土壤有机碳密度统计分析表 Table 7 Statistical analysis of SOCD based on high-precision spatial distribution map
2.4 与传统方法制图结果的对比分析

采用MCM和传统方法分别进行区域SOC预测制图,基于地理探测器构建的MCM与OK的区域农田SOCC预测图的预测细节较丰富;GWRK得到的空间分布模拟结果更为平滑,而RBFNN预测图的细节表达不够清晰(图 4)。同时根据样本验证集的验证结果,以OK插值结果为基准进行比较(表 8)。其中GWRK、RBFNN、OK的综合误差较MCM增大了6.07%、9.04% 和4.77%,Pearson相关系数(r)降低了6.78%、11.86% 和10.17%,MCM的综合精度相对GWRK、RBFNN和OK分别提升了6.45%、10.45% 和7.50%。在中大空间尺度上MCM的区域农田SOC预测结果的综合相对精度较GWRK、RBFNN和OK都有较大幅度的提升。

图 4 研究区农田土壤有机碳不同方法的预测结果 Figure 4 Prediction results of different methods of farmland SOC in the study area
表 8 分层多元复合模型与传统方法对比验证 Table 8 Comparison and verification between multivarible composite model and traditional methods

同时,观察验证集样本实测值与预测值的普通Q-Q图,MCM与OK、GWRK的实测值与预测值较为接近直线,表达农田SOC空间分异特征的稳定性更强。RBFNN则与直线偏离较大,说明其实测值与预测值的空间线性相关性低于其他三种方法,空间表达的随机性较强。MCM尾部更接近直线,其预测误差相对更为准确(图 5)。OK与GWRK均存在“翘尾”现象,尾部预测值误差较大。RBFNN预测结果误差也相对较大,且预测高值和低值数据时偏差较大,预测值偏向于实测值的平均值和中位值。

图 5 验证集中样本实测值与预测值的普通Q-Q图 Figure 5 General Q-Q diagram of measured and predicted values of samples in the verification set
3 讨论

综合可操作性、预测精度及空间表达力,MCM有效体现了农田SOC空间变异的多因性及不同变量的影响力差异,可以作为大尺度复杂地理情景下区域SOC预测的优先模型。

农田SOC空间变异的影响变量众多[17],如海拔高度和地形坡度影响不同地貌部位SOC的累积和流失速度[36],不同利用方式驱动下土壤改良、施肥策略、耕耙等人为扰动,及由其导致的土壤理化性质变化对农田SOC时空变化的影响等[37]。目前研究多是通过加大采样密度[38]、复杂化预测模型与强化模型训练[11, 39]等途径,实现农田SOC制图的精度要求。但是,受地理环境与人为利用方式影响,大尺度复杂情景下农田SOC空间变异更加剧烈,单一线性模型或小尺度机器学习训练模型难以满足精度要求。通过区域综合特征分区进一步聚合区内相似性与区间差异性,降低了农田SOC空间预测的难度。同时,通过地理探测器对各影响变量的有效测度,在不同特征分区的测算模型中建立了变量贡献力序列,避免了因素间的相互干扰,抑制了插值噪声[19]。经对比,RBFNN对环境特征和训练样本依赖性较强,空间移植性较差[39]。在大空间尺度下,OK插值预测结果较GWRK和RBFNN具有更好的内在空间关联性和精确性[40]。MCM则清晰地将分层单变量协同克里格插值结果与基于变量影响力序列融入统一的模型,相比OK、GWRK和RBFNN传统方法,其测算结果综合误差最小,精度提升最显著。MCM能够在农田SOC空间预测过程中协同更多易获取的辅助变量,同时体现不同变量对空间变异的贡献力,兼顾了测算过程中的秩序与协同,降低了预测结果的不确定性。

对于大尺度复杂情景下的农田SOC空间预测,通过集合区域综合特征分区、地理探测器、分层多元复合模型等技术手段,辅助大数据样本集[41],可以取得较好的农田SOC制图精度。但在构建面向农田土壤有机碳高精度制图的综合特征分区指标体系、识别SOC结构变量及其分类分级中仍有进一步改善的空间。广东省农田SOC高精度制图,为编制更大空间尺度的农田SOC分布图探索了有效路径,为提升区域土壤固碳潜力,促进碳交易、碳中和奠定了基础。

4 结论

(1)通过构建综合区划的多层次结构体系,引入基于加权Ripley′ s K函数的多距离空间聚类进行中大空间尺度综合特征分区,能够更加突显分区之间SOC空间差异性,收敛分区内部SOC样本的离散程度。分区后SOC样本的标准偏差均值、方差均值较未分区前分别下降0.55、3.53,Moran′s I指数上升0.08。

(2)地理探测器探测结果表明导致农田SOC空间变异的变量众多,且不同综合特征分区内结构差异较大。年均降水量、海拔高度、坡度等变量对山地丘陵区SOC空间分异作用显著,对平原岗地区作用不显著,土地利用方式及土壤理化性质等变量对不同特征分区均具有较大的影响力。

(3)在大密度样本集支持下,协同区域综合特征分区与基于地理探测器构建的分层多元复合模型编制的高精度农田SOC空间分布图,较好地解决了中大尺度和复杂情景下SOC空间分异规律与空间突变的同步表达矛盾,抑制了多变量插值噪声增加,其综合精度较GWRK、RBFNN和OK分别提升6.45%、10.45% 和7.50%,预测结果更为准确,空间细节表达更为清晰。

参考文献
[1]
周银, 刘丽雅, 卢艳丽, 等. 星地多源数据的区域土壤有机质数字制图[J]. 遥感学报, 2015, 19(6): 998-1006.
ZHOU Y, LIU L Y, LU Y L, et al. Regional scale mapping of soil organic matter using remote sensing and visible-near infrared spectroscopy[J]. Journal of Remote Sensing, 2015, 19(6): 998-1006.
[2]
赵彦锋, 李豪杰, 陈杰, 等. 基于土壤变异解释力的几种土壤制图方法的对比研究——以南阳市1 m土体土壤有机碳密度制图为例[J]. 土壤学报, 2018, 55(1): 43-53.
ZHAO Y F, LI H J, CHEN J, et al. Comparison between soil mapping approaches based on their ability explaining soil variability: A case of mapping soil organic carbon density of soil(0~1 m) in Nanyang District[J]. Acta Pedologica Sinica, 2018, 55(1): 43-53.
[3]
吴子豪, 刘艳芳, 陈奕云, 等. 综合土地利用及空间异质性的土壤有机碳空间插值模型[J]. 应用生态学报, 2018, 29(1): 238-246.
WU Z H, LIU Y F, CHEN Y Y, et al. Spatial interpolation model of soil organic carbon density considering land-use and spatial heterogeneity[J]. Chinese Journal of Applied Ecology, 2018, 29(1): 238-246.
[4]
吴才武, 张月丛, 夏建新. 基于地统计与遥感反演相结合的有机质预测制图研究[J]. 土壤学报, 2016, 53(6): 1568-1575.
WU C W, ZHANG Y C, XIA J X. Prediction and mapping of soil organic matter based on geostatistics and remote sensing inversion[J]. Acta Pedologica Sinica, 2016, 53(6): 1568-1575.
[5]
黄安, 杨联安, 杜挺, 等. 基于多元成土因素的土壤有机质空间分布分析[J]. 干旱区地理, 2015, 38(5): 994-1003.
HUANG A, YANG L A, DU T, et al. Spatial distribution of the soil organic matter based on multiple soil factors[J]. Arid Land Geography, 2015, 38(5): 994-1003.
[6]
张振华, 丁建丽, 王敬哲, 等. 集成土壤-环境关系与机器学习的干旱区土壤属性数字制图[J]. 中国农业科学, 2020, 53(3): 563-573.
ZHANG Z H, DING J L, WANG J Z, et al. Digital soil properties mapping by ensembling soil-environment relationship and machine learning in arid regions[J]. Scientia Agricultura Sinica, 2020, 53(3): 563-573.
[7]
张勇, 史学正, 于东升, 等. 属性数据与空间数据连接对土壤有机碳储量估算的影响[J]. 地球科学进展, 2008, 4(8): 840-847.
ZHANG Y, SHI X Z, YU D S, et al. Effect of the linkage between spatial data on esimates of soil organic carbon[J]. Advance in Earth Science, 2008, 4(8): 840-847. DOI:10.3321/j.issn:1001-8166.2008.08.007
[8]
周涛, 史培军, 王绍强. 气候变化及人类活动对中国土壤有机碳储量的影响[J]. 地理学报, 2003, 58(5): 727-734.
ZHOU T, SHI P J, WANG S Q. Impacts of climate change and human activities on soil carbon storage in China[J]. Acta Geographica Sinica, 2003, 58(5): 727-734. DOI:10.3321/j.issn:0375-5444.2003.05.011
[9]
SONAM R S, DAVID W W, HAROLD M E. Sampling and data analysis optimization for estimating soil organic carbon stocks in agroecosystems[J]. Soil Science Society of America Journal, 2016, 80(5): 1377-1392. DOI:10.2136/sssaj2016.04.0113
[10]
GOURI S B, PRAVAT K S, RAMKRISHNA M. Comparison of GISbased interpolation methods for spatial distribution of soil organic carbon(SOC)[J]. Journal of the Saudi Society of Agricultural Sciences, 2018, 17(2): 114-126. DOI:10.1016/j.jssas.2016.02.001
[11]
任必武, 陈瀚阅, 张黎明, 等. 机器学习用于耕地土壤有机碳空间预测对比研究——以亚热带复杂地貌区为例[J]. 中国生态农业学报(中英文), 2021, 29(6): 1042-1050.
REN B W, CHEN H Y, ZHANG L M, et al. Comparison of machine learning for predicting and mapping soil organic carbon in cultivated land in a subtropical complex geomorphic region[J]. Chinese Journal of Eco-Agriculture, 2021, 29(6): 1042-1050.
[12]
邵月红, 潘剑君, 许信旺, 等. 浅谈土壤有机碳密度及储量的估算方法[J]. 土壤通报, 2006, 4(5): 1007-1011.
SHAO Y H, PAN J J, XU X W, et al. Discussion on the methods for estimating soil organic carbon density and storage[J]. Chinese Journal of Soil Science, 2006, 4(5): 1007-1011. DOI:10.3321/j.issn:0564-3945.2006.05.039
[13]
赵广帅, 李发东, 李运生, 等. GIS空间插值模拟法与土壤类型法估算比较土壤碳储[J]. 农业工程学报, 2014, 30(20): 155-162.
ZHAO G S, LI F D, LI Y S, et al. GIS spatial interpolation compared with soil type method for estimating soil carbon storage[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(20): 155-162. DOI:10.3969/j.issn.1002-6819.2014.20.019
[14]
EMAMGHOLIZADEH S, SHAHSAVANI S, ESLAMI M A. Comparison of artificial neural networks, geographically weighted regression and Cokriging methods for predicting the spatial distribution of soil macronutrients(N, P, and K)[J]. Chinese Geographical Science, 2017, 27(5): 747-759. DOI:10.1007/s11769-017-0906-6
[15]
HUANG Y J, YE H C, ZHANG L P, et al. Prediction of soil organic matter using ordinary Kriging combined with the clustering of self-organizing map: A case study in Pinggu District, Beijing, China[J]. Soil Science, 2017, 182(2): 52-62. DOI:10.1097/SS.0000000000000196
[16]
郭治兴, 袁宇志, 郭颖, 等. 基于地形因子的土壤有机碳最优估算模型[J]. 土壤学报, 2017, 54(2): 331-343.
GUO Z X, YUAN Y Z, GUO Y, et al. Optimal estimation model of soil organic carbon based on the terrain factor[J]. Acta Pedologica Sinica, 2017, 54(2): 331-343.
[17]
任向宁, 董玉祥. 基于地理探测器的区域土壤耕层有机碳含量多元复合模型构建——以珠三角核心区为例[J]. 热带地理, 2018, 38(4): 546-556.
REN X N, DONG Y X. Construction of multivariate composite calculation model of soil organic carbon content in Plough Horizon based on Geodetector[J]. Tropical Geography, 2018, 38(4): 546-556.
[18]
李见賢. 广东省的地貌类型[J]. 中山大学学报(自然科学版), 1961, 4(4): 70-81.
LI J X. The types of landforms in Guangdong Province[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 1961, 4(4): 70-81.
[19]
黄秉维. 中国综合自然区划的初步草案[J]. 地理学报, 1958(4): 348-365.
HUANG B W. Preliminary draft of comprehensive natural zoning in China[J]. Acta Geographica Sinica, 1958(4): 348-365.
[20]
陈雯, 段学军, 陈江龙, 等. 空间开发功能区划的方法[J]. 地理学报, 2004(S1): 53-58.
CHEN W, DUAN X J, CHEN J L, et al. The methods of spatial development function regionalization[J]. Acta Geographica Sinica, 2004(S1): 53-58.
[21]
张广海, 李雪. 山东省主体功能区划分研究[J]. 地理与地理信息科学, 2007(4): 57-61.
ZHANG G H, LI X. A study on the division of main-functional zones in Shandong Province[J]. Geography and GeoInformation Science, 2007(4): 57-61. DOI:10.3969/j.issn.1672-0504.2007.04.015
[22]
赵荣钦, 黄贤金, 钟太洋, 等. 聚类分析在江苏沿海地区土地利用分区中的应用[J]. 农业工程学报, 2010, 26(6): 310-314.
ZHAO R Q, HUANG X J, ZHONG T Y, et al. Application of clustering analysis to land use zoning of coastal region in Jiangsu Province[J]. Transactions of the CSAE, 2010, 26(6): 310-314. DOI:10.3969/j.issn.1002-6819.2010.06.054
[23]
侯雪, 米文宝. 西北地区主体功能区划方法研究[J]. 经济地理, 2009, 29(10): 1640-1643.
HOU X, MI W B. A study on method of principal function regions planning in northwest of China[J]. Economic Geography, 2009, 29(10): 1640-1643.
[24]
王劲峰, 徐成东. 地理探测器: 原理与展望[J]. 地理学报, 2017, 72(1): 116-134.
WANG J F, XU C D. Geodetector: Principle and prospective[J]. Acta Geographica Sinica, 2017, 72(1): 116-134.
[25]
WANG J F, LI X H, CHRISTAKOS G, et al. Geographical detectorsbased health risk assessment and its application in the neural tube defects study of the Heshun region, China[J]. International Journal of Geographical Information Science, 2017, 24(1): 107-127.
[26]
董玉祥, 徐茜, 杨忍, 等. 基于地理探测器的中国陆地热带北界探讨[J]. 地理学报, 2017, 72(1): 135-147.
DONG Y X, XU Q, YANG R, et al. Delineation of the northern border of the tropical zone of China's mainland using Geodetector[J]. Acta Geographica Sinica, 2017, 72(1): 135-147.
[27]
SHEN J, ZHANG N, GEXIGEDUREN, et al. Construction of a GeogDetector-based model system to indicate the potential occurrence of grasshoppers in Inner Mongolia steppe habitats[J]. Bulletin of Entomological Research, 2015, 105(3): 135-147.
[28]
刘红宜, 陈冲, 卢瑛, 等. 珠江三角洲平原农田土壤有机碳组分及剖面分布特征[J]. 土壤通报, 2017, 48(2): 399-405.
LIU H Y, CHEN C, LU Y, et al. Characteristics of organic carbon fractions and its distribution in soil profiles of cultivated land in Pearl River Delta Plain[J]. Chinese Journal of Soil Science, 2017, 48(2): 399-405.
[29]
张仁铎. 空间变异理论及应用[M]. 北京: 科学出版社, 2005: 57-58.
ZHANG R D. Theory and application of spatial variation[M]. Beijing: Science Press, 2005: 57-58.
[30]
ANDERSON D W, COLEMAN D C. The dynamics of organic matter in grassland soils[J]. Journal of Soil and Water Conservation, 1985, 40: 211-216.
[31]
BAYER C, LOVATO T, DIECKOW J, et al. A method for estimating coefficients of soil organic matter dynamics based on long-term experiments[J]. Soil & Tillage Research, 2006, 91: 217-226.
[32]
LI X J, ZHANG X Z, ZHANG Y J. Modeling the effects of climate change and elevated CO2 on soil organic carbon in an alpine steppe[J]. Journal of Resources and Ecology, 2011, 2(2): 168-174.
[33]
汤国安, 杨昕. ArcGIS地理信息系统空间分析实验教程[M]. 2版. 北京: 科学出版社, 2015.
TANG G A, YANG X. Spatial analysis experimental course of geography information system based on ArcGIS[M]. 2nd edition. Beijing: Science Press, 2015.
[34]
BRUNSDON C, FOTHERINGHAM A S, CHARLTON M E. Geographically weighted regression: A method for exploring spatial nonstationarity[J]. Geographical Analysis, 2010, 28(4): 281-298. DOI:10.1111/j.1538-4632.1996.tb00936.x
[35]
GHOSH-DASTIDAR S, ADELI H, DADMEHR N. Principal component analysis-enhanced cosine radial basis function neural network for robust epilepsy and seizure detection[J]. IEEE Transactions on Bio-medical Engineering, 2008, 55: 512-518. DOI:10.1109/TBME.2007.905490
[36]
李珊, 李启权, 王昌全, 等. 盐源县耕层土壤有机碳时空变化及影响因素显著性变化分析[J]. 土壤通报, 2015, 46(5): 1063-1070.
LI S, LI Q Q, WANG C Q, et al. Spatio-temporal variation of soil organic carbon and significant changes in its impact factors: A case study in Yanyuan County, southwest Sichuan[J]. Chinese Journal of Soil Science, 2015, 46(5): 1063-1070.
[37]
易亚男, 尹力初, 张蕾, 等. 施肥对不同地下水位水稻土团聚体组成及有机碳分布的影响[J]. 水土保持学报, 2013, 27(5): 144-153.
YI Y N, YIN L C, ZHANG L, et al. Effects of fertilization on aggregate composition and organic carbon distribution in paddy soil under different groundwater level[J]. Journal of Soil and Water Conservation, 2013, 27(5): 144-153.
[38]
巫振富, 赵彦锋, 程道全, 等. 样点数量与空间分布对县域尺度土壤属性空间预测效果的影响[J]. 土壤学报, 2019, 56(6): 1321-1335.
WU Z F, ZHAO Y F, CHENG D Q, et al. Influences of sample size and spatial distribution on accuracy of predictive soil mapping on a county scale[J]. Acta Pedologica Sinica, 2019, 56(6): 1321-1335.
[39]
胡贵贵, 杨粉莉, 杨联安, 等. 基于主成分和机器学习的土壤有机质含量空间预测建模[J]. 干旱区地理, 2021, 44(4): 1114-1124.
HU G G, YANG F L, YANG L A, et al. Spatial prediction modeling of soil organic matter content based on principal components and machine learning[J]. Arid Land Geography, 2021, 44(4): 1114-1124.
[40]
GOURI S B, PRAVAT K S, RAMKRISHNA M. Comparison of GISbased interpolation methods for spatial distribution of soil organic carbon(SOC)[J]. Journal of the Saudi Society of Agricultural Sciences, 2018, 17(2): 114-126. DOI:10.1016/j.jssas.2016.02.001
[41]
ZHANG P F, LI S H, HE Z, et al. Collaborative mapping rice planting areas using multisource remote sensing data[C]. 2021 IEEE International Geoscience and Remote Sensing Symposium IGARSS, 2021, 5969-5972.