Special issue: Spatial Econometric Model: Empirical Applications and Theoretical Advance

Recent Advances in Bayesian Spatial Econometric Models: Assessing Estimation Accuracy and Computational Efficiency

  • LING Yuheng , 1, 2 ,
  • MA Donglai , 1, 2 ,
  • GUI Yu , 1, 2
Expand
  • 1. School of Geography and Environmental Sciences, Hainan Normal University, Haikou, China
  • 2. Key Laboratory of Tropical Island Land Surface Processes and Environmental Changes of Hainan Province, Haikou, China

Received date: 2025-01-03

  Revised date: 2025-03-05

  Online published: 2025-06-18

Abstract

Spatial econometric models can be used to capture spatial dependence within data. These models have found extensive application in disciplines such as economics, management and network analyses. Bayesian methods, such as Markov Chain Monte Carlo algorithms, have addressed many limitations of classical approaches, hence significantly advancing both theoretical and applied research. With the growing availability of large datasets and advancements in computational methods, Bayesian estimation methods are required not only to provide accurate estimates but also to balance computational efficiency. This study examines three state-of-the-art Bayesian methods, i.e., Hamiltonian Monte Carlo (HMC), Integrated Nested Laplace Approximations (INLA), and Variational Inference (VI). Various Monte Carlo simulation experiments were conducted to evaluate the performance of them under different sample sizes and key parameters. The results demonstrate that all three methods exhibit good performance. HMC excels for small sample sizes, whereas INLA demonstrates superior computational efficiency for large datasets. The VI method serves as an effective complement to the first two methods. This study provides theoretical guidance for researchers applying Bayesian techniques to spatial econometric models and practical insights for empirical analysts selecting suitable estimation methods based on computational constraints.

Cite this article

LING Yuheng , MA Donglai , GUI Yu . Recent Advances in Bayesian Spatial Econometric Models: Assessing Estimation Accuracy and Computational Efficiency[J]. South China Geographical Journal, 2025 , 3(1) : 24 -37 . DOI: 10.20125/j.2097-2245.202501002

0 引言

空间计量模型,作为计量经济模型的一个重要分支,起源于区域经济学与计量经济学的交叉融合。由于截面数据或面板数据中常隐含着空间结构,或变量间存在着空间相依作用。为了精准捕捉这些变量间的相互关系,Whittle1巧妙地采用了空间自回归(simultaneous autoregression)模拟空间交互效应。该方法不仅使空间计量模型能够直观展现空间依赖性,还通过在其误差项中引入特殊的方差-协方差结构,有效减小了模型估计的偏误。
空间自回归模型(SLM)与空间误差模型(SEM)是最为常见的两种空间计量模型2。近20年来,该模型在经济、管理和教育等领域得到广泛应用,包括研究区域经济增长、集聚效应、溢出效应、金融传染效应和同群效应等前沿课题3-5
然而,空间计量模型的参数估计却并非易事。空间自回归模型的特殊结构导致空间滞后项(wy)与随机扰动项( ε)相互依赖,使得普通最小二乘估计产生偏误。而在空间误差模型中,残差中空间滞后项的存在则削弱了普通最小二乘估计的有效性。为破解这一难题,学者们纷纷探索出(拟)极大似然估计法(MLE、QMLE)、空间两阶段最小二乘法(spatial 2SLS)、广义矩(GMM)以及贝叶斯马尔科夫链蒙特卡罗(Markov chain Monte Carlo,MCMC)方法等多种参数估计方法。其中,Kelejian和Prucha6在1999年提出了计算简便的工具变量和矩估计方法,为空间计量模型的参数估计开辟了新路径。随后,Lee7在2004年提出了拟极大似然估计方法,进一步丰富了参数估计的方法体系。此后,Lee8又在2007年拓展了Kelejian和Prucha6的矩条件,提出了广义矩估计方法,并严谨证明了其估计量的一致收敛性及渐近正态性。
随着计算机技术的飞速发展和贝叶斯理论研究的不断深入,贝叶斯方法逐渐成为空间计量模型参数估计领域的新兴焦点。1979年,Hepple9将贝叶斯方法应用于空间计量建模;1980年,Anselin10也进行了相关 探索;1997年,LeSage11更是将马尔可夫链蒙特卡罗方法引入空间计量模型的参数估计中,为贝叶斯方法在空间计量领域的应用奠定了坚定基础;2009年,LeSage和Pace12系统阐述了空间计量模型中参数估计的贝叶斯方法,进一步推动了该领域的发展;2004年,Smith和LeSage13还将贝叶斯估计方法拓展至因变量为高斯分布的一系列模型中,如 二次散离变量或计数变量等,极大地丰富了叶贝斯方法在空间计量模型中的应用场景。
与传统MLE、IV和GMM方法相比,贝叶斯估计方法展现出三大显著优势。首先,它能够充分利用先验知识。在贝叶斯估计中,除了样本数据外,还可以融入先验信息,特别是在样本数量有限的情形下,这一优势尤为突出14。通过结合先验信息,贝叶斯方法能够对参数进行更为准确的估计,其效果往往优于IV和GMM方法。其次,在面对复杂的模型设定时,MLE方法需要处理高维积分问题,这通常难以通过解析方式求解,而需借助数值优化算法。然而,在求解非线性最优化问题时,估计的稳健性往往面临严峻挑战。相比之下,常见的贝叶斯方法,如Metropolis-Hastings(M-H)采样算法则通过接受-拒绝步骤对空间参数施加稳定性约束,从而能够更直接、更稳健地实现参数估计。最后,贝叶斯方法得到的结果不是一个预测值,而是一个完整的概率分布,比其他方法产生的结果更加有用15-17
尽管以M-H算法和Gibbs采样为代表的MCMC方法能保证对空间计量模型中的参数进行精确推断,但计算复杂度并未降低。就模型本身而言,MCMC计算的简化主要聚焦于大型稀疏矩阵的行列式和逆矩阵计算(求解似然函数中的雅可比行列式)18。然而,MCMC方法作为抽样技术,仍存在3个显著局限:(1)计算成本高昂。其在高维空间中进行积分估计需要大量迭代计算。特别是对于空间计数数据模型,因为泊松和负二项回归的参数没有已知的共轭先验,若M-H采样调整不当,将引发低效问题。随着大数据时代的到来,样本量激增,MCMC方法的计算时间愈发漫长。(2)马尔科夫链收敛性问题。为确保估计结果的精确性,MCMC方法需经历充分的预烧期(burn-in),使马尔科夫链达到稳态,并采集足够样本以代表后验分布。(3)后验抽样中的存储难题。在采样过程中,每一次迭代都可能产生一个新的样本。复杂模型如空间计量模型,每次采样后的样本均需存储,导致存储空间需求巨大。
为克服MCMC方法在空间计量模型估计中的局限,近年来,学者们开始探索将优化算法融入贝叶斯计算。集成嵌套拉普拉斯近似(Integrated nested Laplace Aapproximation,INLA)和变分贝叶斯(Variational Inference,VI)便是两种备受瞩目的贝叶斯优化算法19。当未知参数或数据维度庞大时,这两种方法尤为高效。Gomez-rubio等20提出利用INLA方法对空间计量模型进行参数估计,通过将模型参数分为潜变量和超参数,并使用拉普拉斯近似方法对潜变量进行后验推断,显著缩短了估计时间,并直接得出边际后验概率分布,简化了计算流程。此外,INLA不受马尔科夫链收敛性影响,进一步提升了其应用价值。相较于INLA方法,VI则是针对联合后验概率分布式进行替代近似的一种方法,且已成为MCMC方法的一种极具前景的替代21。而VI方法则通过最小化近似变分分布与目标后验分布之间的概率距离,将贝叶斯推断转化为优化问题,从而加快了估计速度,降低了存储需求。
目前关于贝叶斯方法在空间计量模型领域的应用,其理论层面的探索主要集中于以上两篇关键性研究20-21。对于空间计量模型中几种常见的类型,在样本量大小不一,尤其是在小样本及大样本等实际应用场景下,这些估计方法在估计精确度与计算效率方面的表现如何,现有文献尚缺乏深入的探讨与分析。针对以上不足,本文系统性地比较了INLA方法、VI方法以及一种新颖MCMC抽样算法(哈密顿蒙特卡罗(Hamiltonian Monte Carlo,HMC)算法22)在空间计量模型中的表现,特别是在空间自回归和空间误差模型下的参数估计精确度与计算效率。一方面,我们通过设定不同样本量(包括小样本和大样本),分析了这3种贝叶斯估计方法的计算效率如何随样本量变化而变化。另一方法,在不同样本量条件下引入多种数据生成过程,我们深入探究了自回归系数及其方差的变化如何影响这3种估计方法的计算精确度。基于以上模拟实验结果,本文明确了在不同样本量和实际应用场景下最为适宜的贝叶斯估计方法及其适用条件,为研究人员和从业者在实际操作中选择合适的贝叶斯估计方法提供了科学建议。

1 空间计量模型的两种常见形式

在常见的空间计量模型中,以空间误差和空间滞后两类模型最为基本。空间误差模型的基本形式可以描述为:
y = X β + μ ; μ = ρ W μ + ε , ε M V N ( 0 , σ 2 I n )   ,
其中, y = ( y 1 , , y n ) '代表观测值向量, X为一个 n × p阶矩阵, β = ( β 1 , , β p ) '为未知系数向量, I n表示 n维单位矩阵, W是行标准化处理后的邻接矩阵, ρ是空间自回归参数,随机误差项 μ被表达为一个空间自回归的形式,残差项 ε遵循多元标准正态分布( M V N)来刻画。Lesage和Pace23曾深入探讨了该误差项的异方差结构,基于此,空间误差模型可进一步扩展为:
y = X β + ε ' , ε ' M V N ( 0 , σ 2 ( I n - ρ W ' ) ( I n - ρ W ) - 1 )  
此时,该模型实质上是一个在误差项上具有特殊方差-协方差矩阵的线性回归模型。
与空间误差模型不同,空间滞后模型的因变量采用了空间自回归的形式,并包含一个自变量的线性项:
y = λ W y + X β + ε , ε M V N ( 0 , σ 2 I n )  
由于空间滞后模型中包含了内生变量( λ W y),因此该模型可以改写为:
y = I n - λ W - 1 X β + ε ' , ε ' M V N ( 0 , σ 2 ( I n - λ W ' ) ( I n - λ W ) - 1 )  
空间滞后模型可以认为是对空间误差模型的一种泛化,即对空间误差模型的自变量进行了 ( I n - λ W ) - 1的非线性变换。鉴于此,下文均以空间滞后模型为例,其似然函数可表示为:
π ( D β , σ , ρ ) = ( 2 π σ 2 ) - n 2   A e x p   - 1 2 σ 2 ( A y - X β ) ' ( A y - X β )   ,
其中 A = ( I n - ρ W )代表雅可比矩阵。

2 基于贝叶斯方法的空间计量模型推断理论

本部分将详细阐述贝叶斯推断理论在空间滞后模型参数后验分布推断中的具体应用。首先,我们假定空间滞后模型中的参数 ρ β σ是相互独立的。基于这一假设,根据贝叶斯理论,可以推导出各参数的联合后验分布形式。具体来说,该联合后验分布与似然函数 π ( D |   β , σ , ρ )以及各参数的先验分布 π ( β , σ )
π ( β , σ , ρ D ) π ( D β , σ , ρ ) π ( β , σ ) π ( ρ ) σ - n - 1 A e x p   - 1 2 σ 2 ( A y - X β ) ' ( A y - X β ) π ( ρ )
在贝叶斯方法中,先验信息的引入是一个重要特征。参考Hepple9的设定,我们为 β σ 2 ρ设定了弱信息先验。具体而言, β服从 N (0,100)的正态分布;精度 τ(即 τ = 1 / σ 2)服从 G a m m a (1,0.000 5)的伽玛分布; ρ服从 U n i f (-1,1)的均匀分布。本研究将依次介绍基于模拟HMC方法,基于贝叶斯优化的INLA与VI方法。

2.1 基于模拟的MCMC方法——HMC

MCMC抽样算法是通过构造马尔科夫链来对变量进行抽样模拟的。由于这些样本生成于同一条马尔科夫链,因此样本是相依的。当构造的马尔科夫链收敛至目标分布(即后验分布)时,可以根据稳态分布中的样本点来计算Monte Carlo积分。MCMC抽样算法的关键在于如何从稳态后验分布的概率密度函数中进行有效抽样24。如果样本量足够大,则可以通过核密度估计或直方图来近似这个概率密度。
M-H抽样算法是MCMC方法中的一种常见算法,其核心抽样过程巧妙地分为“建议”与“修正”两个步骤25。在“建议”步骤,算法会对当前状态施加一个随机的扰动,生成一个新的建议点。而“修正”步骤则负责确保这个建议点不会过分偏离目标分布的典型区域。具体来说,对于当前状态 q t,其建议点 q *的接受概率判别公式为:
a ( q * | q t ) = m i n 1 , Q ( q t | q * ) π ( q * ) Q ( q * | q t ) π ( q t )
q t + 1 = q *,否则 q t + 1 = q t
M-H算法因其简洁易懂的实现方式而广受欢迎,特别是在建议点的转移倾向于高概率区域时,算法能够高效地探索这些区域。然而,随着目标分布维度和复杂性的不断增加,M-H算法的性能可能会显著下降。尽管通过调整建议分布的尺度可以在一定程度上提高接受率,但这种做法往往会导致算法在探索过程中失去随机性,产生高度偏置的估计量,或者需要生成极长的马尔科夫链才能达到所需的精度。为了更有效地探索高维概率空间并加速马尔科夫链的收敛,本文引入了HMC算法。
HMC算法是一类基于汉密尔顿动力学原理的MCMC方法。与M-H算法基于随机游走的抽样方式不同,HMC将概率空间视为物理空间,并将生成平稳分布的过程看作分子动力学中的汉密尔顿动力系统。在汉密尔顿动力学中,封闭系统的总能量(包括势能和动能)是保持不变的26。利用汉密尔顿动力学的若干特性,我们可以构造出能够收敛至高维概率分布的马尔科夫链。
HMC抽样分为以下两个步骤:首先,从先验分布中随机抽取待估参数的新值 q *,从平均数为0的高斯分布中抽取 p *值;然后,使用汉密尔顿动力方程来更新势能 U ( q * )和动能 K ( p * ),这一过程通常通过Leapfrog迭代方法来实现,迭代次数为L,步长为 Δ。经过L次迭代后,我们可以构建转移核,并计算HMC抽样的接受概率:
a ( q * q t ) = m i n 1 , e x p   ( H ( q * , p * ) - H ( q t , p t ) ) = m i n 1 , e x p   ( U ( q * ) - U ( q t ) + K ( p * ) - K ( p t ) )
其中, H ( q * , p * )是指 t + 1时刻总能量的状态, H ( q t , p t )是指t时刻总能量的状态。根据接受概率则可以判断概率是否转移,从而构建马尔科夫链27。HMC由于其特性,能够快速的在多维空间中找到合适的后验分布。

2.2 基于优化的贝叶斯方法其一——INLA

Rue等28开创性地提出了一种基于拉普拉斯近似法的贝叶斯替代近似方法,旨在直接估算高斯隐变量模型(Latent Gaussian model)中参数的后验边际分布。高斯隐变量模型具有结构化可加性(Structured Addition),且大多数的广义加性模型以及广义加性混合模型均是该模型的子集。由于本文中提到的两种空间计量模型均可看作是在高斯连接函数下,通过对空间自回归参数( λ ρ)的特定约束,带有随机效应的广义加性模型,进而均属于高斯隐变量模型。
对于任意高斯隐变量模型,我们假设由 n个观测值组成的向量 Y = ( y 1 , , y n )服从指数族分布,其均值 μ i通过连接函数 g ( )与结构化可加因子(Structured Additive Predictor) η i相联系,即 g ( μ i ) = η i。这里的结构化可加因子涵盖了固定效应、随机效应以及多种形式的非线性协变量等。对于空间滞后模型,其结构化可加因子具体表达为:
η i = ( I n - λ W ) - 1 X β + ε '
其中,隐参数集 Φ = β , ε '被赋予高斯先验,并构成了一个具有稀疏精度矩阵 Q ( θ 2 )的高斯马尔可夫随机场。 θ 2 = λ , σ 2是控制此高斯马尔可夫随机场的超参数向量。该模型的后验分布可表述为:
π Φ , θ | Y = π Y | Φ , θ π Φ , θ π Y π Y | Φ , θ π Φ , θ ,
其中, π Y | Φ , θ表示似然函数,且观测值 Y在给定隐参数 Φ和超参数 θ 1下是相互独立的。此时,似然函数可以重新表述为:
π Y | Φ , θ = i = 1 n   π ( y i | Φ i , θ )
基于条件概率公式,隐参数与超参数的联合分布 π Φ , θ可以分解为 π Φ | θ π θ。由于 Φ遵循高斯马尔可夫随机场的特性,在给定超参数后,其后验分布呈现为:
π Φ | θ Q θ 1 2 e x p - 1 2 Φ T Q θ Φ
π θ代表所有超参数 θ的先验分布,通常是几个单变量先验的乘积。综上所述,模型的后验分布可以重新定义为:
π Φ , θ | Y i = 1 n π y i | Φ i , θ π Φ | θ π θ π θ Q θ 1 / 2 e x p - 1 2 Φ T Q θ Φ i = 1 n π y i | Φ i , θ π θ Q θ 1 / 2 e x p - 1 2 Φ T Q θ Φ + i = 1 n l o g ( π ( y i | Φ i , θ ) )
不同于MCMC方法直接估计 π Φ , θ | Y,INLA聚焦于单个隐变量和超参数的后验边际分布。对于隐变量,其后验分布通过积分得到:
π Φ i | Y = π Φ i | θ , Y π θ | Y d θ
类似的,超参数的后验分布为:
π θ k | Y = π θ | Y d θ - k
其中, θ - k表示除 θ k外的超参数向量。为求解这两个积分,首先需近似 π θ | Y。Rue等29通过下式近似 θ的后验联合分布:
π ˜ θ | Y π Φ , θ | Y π ˜ G Φ | θ , Y | Φ = Φ * θ
这里, π ˜ G Φ | θ , Y是隐变量满条件分布的高斯近似,而 Φ * θ是在给定超参数向量 θ时,满条件分布的众数。超参数的后验边际分布可以通过对之前的近似 π ˜ θ | Y再积掉 θ - k所获得。类似地,利用数值积分技术,我们可以近似得到后验边际分布 π Φ i | Y,但是这需要对 π Φ i | θ , Y的良好近似。尽管可用以上步骤中的高斯近似,Rue等28仍然提出了包括拉普拉斯近似与简化拉普拉斯近似的方法,以求获得了更好的近似结果。

2.3 基于优化的贝叶斯方法其二——VI

在当今大数据与大模型(如隐变量模型)日益盛行的时代,变分推断同样也成为贝叶斯近似推断的主要方法之一29。这一方法巧妙地将原本需要通过抽样来推断参数后验分布的复杂过程,转化为寻找具有最优参数的近似分布问题,从而极大地提升了推断速度。
传统上,像MCMC这样的抽样方法在计算隐变量或模型参数的后验分布 π Φ , θ | Y时,往往需要求解棘手的高维积分,这一过程需要消耗大量的计算资源。而变分推断则另辟蹊径,它并不直接计算这个高维积分,而是选择一个更简单、带参数的分布 q Ψ来近似后验 π Ψ | Y。这里, q Ψ被称为变分分布, Ψ则是变分参数,且 q Ψ是一个预先选定的分布族。我们的目标是在这个分布族中找到与真实后验最接近的分布。当 q Ψ π Ψ | Y之间的差异足够小时,我们便可以认为 q Ψ就是 π Ψ | Y的推断结果。由于 q Ψ是一个带参数的分布,因此变分推断问题进一步简化为寻找 Ψ的最优解30
为了量化 q Ψ π Ψ | Y的接近程度,我们引入了信息论中的Kullback-Leibler(KL)。KL散度是衡量两个概率分布差异程度的一种指标,其公式为:
K L ( q ( Ψ ) | | π Ψ | Y ) = = q Ψ l o g q Ψ π Ψ | Y d Ψ
对于所有 q ( Ψ ) π Ψ | Y,KL散度均非负,且仅当 q Ψ = π Ψ | Y,KL散度为零。然而,在实践中,直接最小化KL散度并不可行,因为KL散度公式中包含目标分布,并涉及到难以处理的边缘似然问题。为此,变分推断通过优化一个相关的目标函数——变分下界(Evidence Lower Bound,ELBO)来避免这个难题。ELBO的定义为:
E L B O = E [ l o g   π Ψ , Y ] - E [ l o g   q ( Ψ ) ] = E l o g   π Y | Ψ - K L ( q ( Ψ )   π Ψ | Y )
上式中,ELBO被拆解为了两项:第一项是似然的期望;第二项是变分分布与先验的负散度项。最大化ELBO间接地最小化了KL散度,从而确保 q ( Ψ )成为 π Ψ的良好近似。
在定义了ELBO之后,对于 q ( Ψ )的参数 Ψ进行优化。这一优化过程通常利用自动微分框架(Automatic differentiation)31来高效最大化ELBO的值,从而进一步提升推断的效率和准确性。

3 蒙特卡罗数值模拟

下文主要通过蒙特卡罗数值模拟对上文提到的几种贝叶斯方法在估计空间计量模型参数的准确性、稳健性以及计算效率方面进行验证。

3.1 数据生成过程

对于空间滞后模型(式(3)式(4))和空间误差模型(式(1)式(2)),假设其外生自变量 X = { x 1 , x 2 }由相互独立的高斯分布生成,具体为 x 1 N ( 2,1 ) x 2 N ( 7,1 )。对应的系数设定为 β 1 = 3 β 2 = 6。扰动项 ε源自正态分布,标准差 σ S L M设为1, σ S E M设为2。模型采用Rook型的空间邻接矩阵 1,并进行了行标准化处理。
对于空间自回归系数 λ ρ,本文均考虑了3种取值:0.2、0.5和0.8。同时,本文也考虑了4种不同规模的样本(见附录图1),样本量分别为 n = 49,102,254,3   107。即分别代表49个美国的州,伊利诺伊州的102个郡,德克萨斯州的254个郡以及美国大陆上的3 107个郡。这些样本数据均取自R包“usmap”。结合空间自回归系数与样本结构的变化,本研究共考察了12种不同情形,旨在比较在给定空间自回归系数下,参数在不同样本结构中的模拟表现。
图1 对空间滞后模型,500次重复试验所得的主要参数估计结果

Fig.1 Results of 500 times Monte Carlo experiment for spatial lag models

3.2 模拟结果

基于上述数据生成机制,本文开展了如下蒙特卡罗模拟实验。针对给定的空间权重矩阵、样本结构和参数真值,我们进行了500次蒙特卡罗模拟 2,以对比不同随机数据生成情境下前文3种贝叶斯方法的估计精度和稳健性。每次实验中,参数的后验分布均值被视作参数的点估计值。若500次实验中参数的点估计值的均值接近真值,则表明该贝叶斯方法具有较高的估计精度和稳健性。具体地,我们通过计算参数后验均值、参数标准差、均方根误差、相对均方根误差和平均绝对误差来评估模拟结果。
此外,在所有情形中,我们为模型参数选择了弱信息性、条件共轭先验分布:
π β N 0,100 , π σ 2 I G 0.1,0.005 , π ρ U n i f - 1,1
最后,关于HMC方法,每次实验中,我们均将HMC的马尔科夫链长度设定为2 000,预烧期长度为500。
图1展示了在空间滞后模型下,经过500次重复试验所得的各参数估计结果。当样本量 n = 49 λ取不同设定值时,3种方法均展现出了良好的估计性能。具体来说,在参数标准差、均方根误差以及平均绝对误差这3个评价指标上,HMC与VI的估计表现相当,且略优于INLA。此外,随着 λ值的增大,这3种贝叶斯方法所得的点估计值的均值及相对均方根误差均呈现出一定的减小趋势,这一特点在INLA的估计结果上体现的更加明显。另一方面,在 λ值固定的情况下,对于所有参数而言,各项评价指标均随样本量 n的增大而减小。例如,当 n从49增加至3 107时,参数标准差、均方根误差及平均绝对误差均显著减小,同时 λ的点估计值的均值也更为接近其真实值。然而,值得注意的是,在 n = 49的情况下,INLA对 σ的点估计值的均值略高于其真实值,并且这一偏高现象并未随 n的增大而得到改善。
图2呈现了空间误差模型在500次重复试验下的各参数估计结果 3。无论样本量大小或自回归系数如何变化,3种方法均表现出了良好的估计能力。具体而言,在参数标准差、均方根误差、相对均方根误差及平均绝对误差这4个评价指标上,HMC与VI的估计表现旗鼓相当,但略逊于INLA。然而,INLA的点估计值的均值相较于HMC与VI,其偏离真实值的程度略高一些。与空间滞后模型的模拟结果相似,随着 λ值的增大,这3种贝叶斯方法所得的点估计值均值及相对均方根误差均呈现出一定的减小趋势。特别地,当样本量 n从49增加至102时,后验均值外,所有评价指标均有所下降,但幅度较小。而当 n从102增加至254时,评价指标并未出现系统性的下降。但当 n进一步增加至3 107时,所有评价指标均显著下降。在估计空间误差模型的参数时,INLA对 σ的点估计值均值的偏离程度略高于HMC与VI的估计结果,并且这一现象并未随 n的增大而得到缓解。然而,对于 σ估计值的其他评价指标,如标准差、均方根误差及平均绝对误差,均随着 n的增大而得到改善。
图2 对空间误差模型,500次重复试验所得的主要参数估计结果

Fig.2 Results of 500 times Monte Carlo experiment for spatial error models

在评估了以上3种贝叶斯方法在空间计量模型参数估计中的准确性与稳健性后,这些方法的计算效率见图3。对于空间滞后模型,我们发现HMC的计算效率相对较低。在样本量较小的情况下,VI表现出最高的计算效率。然而,随着样本量的增加,INLA逐渐展现出其优势,计算速度超越了VI。具体来说,在样本量为49时,HMC完成2 000次迭代达到收敛状态需要约3秒,而INLA的计算时间仅为0.6 s,VI更是仅需0.2 s左右。当样本量达到254时,VI的计算时间首次超过了INLA。而当样本量增加至3 107时,VI的计算时间长达300 s,而INLA则仅需3.5 s。对于空间误差模型的参数估计,3种方法的计算效率呈现出与空间滞后模型不同的趋势,但总体而言,INLA的计算效率依然领先。在样本量为49时,尽管3种贝叶斯方法的计算时间均较短,未超过5 s,但INLA依然是最快的,其次是HMC,而VI的计算效率在此情景最低。然而,当样本量增加至254时,这一格局发生了明显变化,HMC的计算时间超过了VI。当样本量进一步增加至3 107时,HMC的计算时间远远超过了VI和INLA。最后,这几种方法的计算效率并不受空间自回归系数大小的影响。
图3 每个模拟场景中每种方法的单位计算时间

Fig.3 Running time in seconds per simulation for two models using different Bayesian methods across various scenarios

4 讨论

通过蒙特卡罗模拟实验可知,空间滞后与空间误差两类模型的参数均可以用HMC、INLA及VI方法进行估计。就3种估计方法本身而言,不同的贝叶斯方法对于参数的后验分布的估计所依赖的条件与计算过程大不相同。HMC方法仅仅依赖于数据本身与模型的参数关系的抽样,进一步而言,与其他MCMC抽样算法类似,HMC方法也是把参数的直接估计转换为参数后验分布的抽样。INLA方法则独具匠心,通过构造高斯马尔可夫随机场,并结合拉普拉斯近似与数值积分,直接对超参数与模型参数的边缘后验分布进行推断。而VI方法则选择简单的分布族来近似后验分布,以证据下界为优化目标,通过KL散度在数据拟合和正则化之间找到平衡点。优化后的变分分布即可用于近似参数的后验分布。总而言之,HMC方法依赖于从后验分布中采样,这在计算上有一定要求,并且可能需要仔细调整参数以确保收敛。INLA方法提供了后验分布的闭式近似,大大缩短了计算时间,但其适用范围限于隐高斯模型。VI方法则以简单分布族近似后验分布,避免了直接采样,通过优化ELBO快速求解,但其表现受限于所选变分分布族,可能低估参数的不确定性。
此外,对于空间滞后与空间误差模型空间计量模型,当观测值数量较少( n < 500)时,HMC、INLA及VI 3种贝叶斯方法均表现出适用性。其中,HMC方法在计算效率可接受的情况下,提供了最为准确的模型参数后验分布估计。而当观测值数量较大时,INLA方法尽管在σ参数的点估计上相较于HMC略偏高,但其显著的计算效率优势使得其成为了一个颇具吸引力的选择。VI方法则在计算的准确性和效率之间取得了一定的平衡,可以作为INLA方法的一个有效补充。

5 结论

空间计量自20世纪80年代诞生以来,便受到了计量经济学界的广泛关注,经历了从萌芽到成熟、从边缘到主流的飞跃。众多统计学、经济学和计算科学的学者们,为空间计量学方法体系的构建、发展与完善做出了巨大努力。其中,贝叶斯方法的引入,更是为空间计量模型的研究注入了新的活力。
作为常见的两类空间计量模型,空间滞后模型与空间误差模型在处理和拟合空间数据方面展现出了极大的灵活性。然而,这种灵活性的背后,是模型复杂度的显著提升,这给计算带来了一定的困难和挑战。为此,本文将几种前沿的贝叶斯方法——基于优化的INLA与VI,以及基于模拟的HMC引入进来,用于对这两类空间计量模型的参数进行估计。
在现有研究对以上几种前沿方法缺乏系统比较的情况下,本文通过蒙特卡洛模拟实验,对这3种贝叶斯方法的准确性、稳健性以及计算效率进行了全面验证。研究得出以下结论:首先,3种方法在有限样本及大样本条件下均表现出了良好的性能,但并未发现其中任意一种方法具有系统性的优势;其次,在有限样本情形下,建议优先选择HMC方法进行估计;而在大样本情形下,则建议优先选择INLA方法。VI方法则作为以上两种方法在不同样本大小情况下的有力补充。此外,值得一提的是,这几种方法的计算效率与空间自回归系数的大小并无显著关联。由于本文所研究问题的特性,未涉及这些前沿方法在实际问题中的应用;同时,对于因变量为非高斯分布的空间计量模型,本研究也尚未涉及。这些将是后续努力研究的方向。

图1 4种不同空间结构(A、B、C、D)中基于“车”准则的空间临近关系示意图,样本量依次从小到大排列

Fig.1 A schematic diagram of spatial proximity based on the 'rook' criterion in four different spatial structures (A, B, C, D) in the simulation

表1 样本量 n = 49 , 102 , 254 , 3107的情况下HMC、VI、INLA对空间滞后模型的模拟结果

Tab.1 Simulation results for SLM using HMC, VI, and INLA across different sample sizes n = 49 , 102 , 254 , 3107

估计方法 参数真实值 n = 49 n = 102 n = 254 n = 3107
Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD
HMC λ 0.201 0.042 0.012 0.062 0.017 0.200 0.030 0.008 0.038 0.008 0.200 0.019 0.006 0.029 0.006 0.200 0.014 0.005 0.027 0.003
σ 1.010 0.108 0.092 0.092 0.074 0.996 0.072 0.073 0.073 0.057 1.003 0.045 0.046 0.046 0.037 1.001 0.042 0.043 0.043 0.036
β 1 3.020 0.150 0.151 0.050 0.119 3.001 0.101 0.105 0.035 0.084 2.996 0.063 0.059 0.020 0.048 2.999 0.055 0.050 0.017 0.046
β 2 5.955 0.152 0.158 0.026 0.125 5.990 0.101 0.098 0.016 0.075 6.004 0.064 0.070 0.012 0.054 6.000 0.061 0.066 0.010 0.049
λ 0.499 0.040 0.011 0.023 0.017 0.500 0.024 0.007 0.014 0.008 0.500 0.015 0.005 0.009 0.005 0.500 0.011 0.003 0.006 0.002
σ 1.004 0.107 0.114 0.114 0.091 1.005 0.072 0.066 0.066 0.052 1.004 0.045 0.050 0.050 0.039 1.002 0.045 0.050 0.050 0.034
β 1 3.031 0.151 0.145 0.048 0.116 2.999 0.103 0.105 0.035 0.083 2.992 0.064 0.064 0.021 0.049 2.998 0.060 0.054 0.019 0.047
β 2 5.998 0.202 0.205 0.034 0.160 5.994 0.103 0.110 0.018 0.091 5.988 0.065 0.067 0.011 0.052 5.998 0.065 0.060 0.011 0.049
λ 0.800 0.014 0.004 0.005 0.008 0.800 0.014 0.004 0.005 0.006 0.800 0.009 0.003 0.003 0.003 0.800 0.008 0.002 0.003 0.000
σ 1.006 0.107 0.108 0.108 0.085 0.995 0.072 0.070 0.070 0.055 1.003 0.045 0.050 0.050 0.040 1.002 0.045 0.048 0.048 0.032
β 1 3.002 0.150 0.153 0.051 0.119 2.978 0.102 0.104 0.035 0.081 3.002 0.064 0.064 0.021 0.051 3.000 0.063 0.063 0.019 0.041
β 2 6.009 0.100 0.105 0.017 0.082 6.007 0.102 0.089 0.015 0.070 6.010 0.066 0.060 0.010 0.050 6.007 0.057 0.057 0.009 0.044
VI λ 0.200 0.041 0.017 0.086 0.015 0.200 0.030 0.011 0.057 0.010 0.200 0.019 0.008 0.038 0.007 0.200 0.005 0.005 0.027 0.004
σ 0.996 0.103 0.107 0.107 0.087 1.002 0.071 0.066 0.066 0.052 0.996 0.044 0.048 0.048 0.039 1.000 0.013 0.013 0.013 0.011
β 1 2.980 0.149 0.148 0.049 0.118 2.997 0.101 0.102 0.034 0.077 3.010 0.063 0.064 0.021 0.051 3.000 0.018 0.016 0.005 0.013
β 2 6.010 0.149 0.150 0.025 0.120 6.002 0.101 0.109 0.018 0.086 6.001 0.063 0.063 0.010 0.051 6.003 0.018 0.016 0.003 0.013
λ 0.499 0.033 0.012 0.024 0.011 0.500 0.024 0.010 0.020 0.008 0.500 0.015 0.006 0.012 0.005 0.500 0.004 0.004 0.008 0.003
σ 0.989 0.103 0.104 0.104 0.082 0.997 0.071 0.067 0.067 0.056 1.000 0.045 0.047 0.047 0.037 0.999 0.013 0.012 0.012 0.009
β 1 2.995 0.148 0.154 0.051 0.121 2.995 0.100 0.105 0.035 0.084 3.001 0.063 0.061 0.020 0.049 3.001 0.018 0.018 0.006 0.015
β 2 6.014 0.148 0.158 0.026 0.125 6.000 0.102 0.099 0.016 0.078 6.001 0.064 0.061 0.010 0.049 6.002 0.018 0.017 0.003 0.014
λ 0.799 0.019 0.008 0.010 0.007 0.798 0.014 0.015 0.019 0.012 0.800 0.009 0.003 0.004 0.003 0.800 0.003 0.003 0.003 0.002
σ 0.988 0.101 0.110 0.110 0.088 0.995 0.071 0.071 0.071 0.056 1.000 0.045 0.045 0.045 0.036 1.002 0.013 0.013 0.013 0.010
β 1 2.998 0.146 0.148 0.049 0.116 2.998 0.100 0.104 0.035 0.084 2.995 0.063 0.066 0.022 0.054 2.998 0.018 0.020 0.007 0.016
β 2 6.001 0.149 0.140 0.023 0.110 5.998 0.102 0.105 0.018 0.082 6.002 0.065 0.062 0.010 0.049 6.001 0.018 0.018 0.003 0.015
INLA λ 0.212 0.097 0.096 0.480 0.017 0.201 0.073 0.089 0.450 0.015 0.200 0.047 0.088 0.440 0.009 0.200 0.013 0.021 0.104 0.003
σ 1.180 0.274 0.201 0.201 0.142 1.031 0.279 0.346 0.346 0.130 1.073 0.111 0.125 0.125 0.045 1.024 0.033 0.092 0.092 0.015
β 1 3.264 1.423 0.275 0.092 0.236 3.144 1.061 0.307 0.102 0.264 3.058 0.644 0.162 0.054 0.135 3.015 0.168 0.073 0.024 0.060
β 2 6.379 2.380 0.360 0.060 0.306 6.210 1.914 0.379 0.063 0.324 6.177 1.101 0.272 0.045 0.228 6.091 0.308 0.110 0.018 0.086
λ 0.502 0.043 0.018 0.035 0.015 0.498 0.044 0.013 0.026 0.011 0.501 0.021 0.009 0.017 0.007 0.501 0.007 0.004 0.008 0.003
σ 1.057 0.262 0.136 0.136 0.109 1.055 0.175 0.091 0.091 0.059 1.033 0.106 0.063 0.063 0.043 1.003 0.032 0.034 0.034 0.011
β 1 3.020 0.496 0.114 0.038 0.099 3.036 0.463 0.108 0.036 0.093 2.996 0.221 0.080 0.027 0.068 2.996 0.073 0.061 0.020 0.051
β 2 6.055 0.765 0.298 0.050 0.261 6.081 0.752 0.198 0.033 0.171 6.001 0.356 0.134 0.022 0.113 5.987 0.108 0.074 0.012 0.062
λ 0.800 0.016 0.008 0.010 0.006 0.801 0.017 0.010 0.012 0.008 0.800 0.007 0.003 0.004 0.003 0.800 0.002 0.001 0.001 0.001
σ 1.056 0.262 0.100 0.100 0.068 1.030 0.170 0.062 0.062 0.046 1.032 0.106 0.050 0.050 0.032 1.013 0.033 0.014 0.014 0.011
β 1 2.999 0.256 0.093 0.031 0.080 3.009 0.236 0.075 0.025 0.064 3.009 0.138 0.074 0.025 0.062 2.997 0.036 0.033 0.011 0.026
β 2 6.008 0.302 0.141 0.023 0.121 5.991 0.253 0.131 0.022 0.106 5.997 0.136 0.093 0.016 0.073 5.996 0.038 0.030 0.005 0.024
表2 样本量 n = 49 , 102 , 254 , 3107的情况下HMC、VI、INLA对空间误差模型的模拟结果

Tab.2 Simulation results for SEM using HMC, VI, and INLA across different sample sizes n = 49 , 102 , 254 , 3107

估计方法 参数真实值 n = 49 n = 102 n = 254 n = 3107
Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD Mean SD RMSE RRMSE MAD
HMC ρ 0.199 0.201 0.053 0.272 0.045 0.204 0.146 0.053 0.268 0.043 0.204 0.093 0.027 0.134 0.023 0.201 0.085 0.019 0.098 0.016
σ 2.007 0.213 0.207 0.104 0.158 2.004 0.144 0.125 0.063 0.101 2.004 0.090 0.086 0.043 0.068 2.002 0.085 0.086 0.040 0.066
β 1 3.007 0.298 0.298 0.099 0.240 3.002 0.201 0.205 0.068 0.162 3.001 0.126 0.115 0.038 0.094 3.002 0.125 0.111 0.037 0.090
β 2 6.007 0.298 0.299 0.050 0.233 6.010 0.202 0.223 0.037 0.185 6.007 0.126 0.13 0.022 0.105 6.005 0.121 0.124 0.019 0.098
ρ 0.495 0.160 0.037 0.073 0.031 0.501 0.116 0.040 0.082 0.035 0.502 0.074 0.020 0.040 0.016 0.501 0.071 0.013 0.028 0.011
σ 2.024 0.220 0.221 0.110 0.171 1.985 0.145 0.147 0.074 0.116 2.005 0.092 0.088 0.044 0.068 2.002 0.090 0.068 0.034 0.062
β 1 2.945 0.292 0.288 0.096 0.231 2.995 0.193 0.196 0.065 0.158 2.998 0.123 0.110 0.037 0.088 2.999 0.117 0.110 0.031 0.080
β 2 5.968 0.293 0.298 0.050 0.234 5.982 0.196 0.184 0.031 0.149 6.012 0.124 0.118 0.020 0.092 6.010 0.121 0.106 0.018 0.086
ρ 0.803 0.088 0.024 0.032 0.021 0.798 0.068 0.028 0.034 0.024 0.796 0.043 0.016 0.019 0.013 0.798 0.042 0.016 0.018 0.013
σ 1.969 0.221 0.219 0.110 0.176 2.009 0.150 0.141 0.070 0.113 1.993 0.094 0.093 0.046 0.073 1.995 0.091 0.077 0.038 0.071
β 1 3.033 0.270 0.295 0.098 0.213 2.997 0.191 0.212 0.071 0.168 3.002 0.118 0.107 0.036 0.087 3.000 0.116 0.103 0.034 0.087
β 2 6.018 0.268 0.263 0.044 0.205 6.013 0.191 0.151 0.025 0.122 6.010 0.120 0.109 0.018 0.088 6.008 0.119 0.105 0.017 0.077
VI ρ 0.197 0.196 0.077 0.392 0.066 0.199 0.147 0.053 0.269 0.045 0.203 0.093 0.037 0.185 0.032 0.198 0.027 0.027 0.137 0.023
σ 2.004 0.210 0.201 0.100 0.158 2.006 0.144 0.144 0.072 0.113 2.003 0.09 0.089 0.044 0.070 2.001 0.025 0.021 0.010 0.016
β 1 2.996 0.298 0.291 0.097 0.226 3.002 0.202 0.203 0.068 0.164 2.999 0.127 0.121 0.040 0.097 3.001 0.036 0.032 0.011 0.027
β 2 6.028 0.298 0.321 0.054 0.256 6.000 0.202 0.207 0.034 0.167 5.994 0.126 0.129 0.022 0.102 5.999 0.036 0.034 0.006 0.028
ρ 0.502 0.158 0.058 0.119 0.050 0.502 0.116 0.043 0.087 0.037 0.501 0.073 0.029 0.058 0.025 0.499 0.022 0.023 0.046 0.018
σ 2.013 0.219 0.219 0.109 0.177 2.005 0.147 0.138 0.069 0.111 2.009 0.092 0.092 0.046 0.072 2.004 0.026 0.027 0.014 0.022
β 1 2.986 0.290 0.294 0.098 0.236 3.004 0.197 0.187 0.062 0.149 3.001 0.124 0.128 0.043 0.102 3.002 0.035 0.032 0.011 0.025
β 2 5.971 0.292 0.292 0.049 0.235 6.003 0.198 0.197 0.033 0.156 6.003 0.124 0.126 0.021 0.100 5.996 0.035 0.031 0.005 0.025
ρ 0.801 0.088 0.034 0.043 0.029 0.802 0.067 0.026 0.033 0.023 0.800 0.042 0.016 0.020 0.013 0.800 0.013 0.011 0.014 0.009
σ 2.012 0.226 0.201 0.101 0.162 2.001 0.150 0.136 0.068 0.107 1.997 0.094 0.084 0.042 0.066 2.001 0.026 0.023 0.011 0.018
β 1 3.009 0.277 0.261 0.087 0.209 2.991 0.191 0.191 0.064 0.153 3.005 0.119 0.112 0.037 0.088 2.999 0.034 0.034 0.011 0.026
β 2 5.985 0.278 0.282 0.047 0.220 6.008 0.189 0.185 0.031 0.149 5.991 0.119 0.124 0.021 0.097 5.996 0.034 0.034 0.006 0.027
INLA ρ 0.204 0.125 0.043 0.215 0.037 0.201 0.105 0.037 0.187 0.032 0.201 0.074 0.029 0.147 0.025 0.195 0.022 0.049 0.244 0.029
σ 1.967 0.203 0.200 0.100 0.158 1.973 0.139 0.140 0.070 0.107 1.992 0.089 0.089 0.045 0.070 1.999 0.026 0.027 0.013 0.021
β 1 2.981 0.262 0.328 0.109 0.263 3.009 0.200 0.199 0.066 0.159 2.997 0.113 0.132 0.044 0.103 3.001 0.052 0.035 0.012 0.029
β 2 6.003 0.270 0.317 0.053 0.251 6.025 0.199 0.208 0.035 0.166 5.996 0.121 0.129 0.022 0.102 6.003 0.061 0.034 0.006 0.028
ρ 0.498 0.131 0.051 0.103 0.045 0.500 0.104 0.038 0.077 0.033 0.501 0.069 0.027 0.054 0.023 0.493 0.02 0.024 0.047 0.019
σ 1.966 0.206 0.212 0.106 0.168 1.991 0.143 0.147 0.073 0.116 1.993 0.090 0.095 0.048 0.076 2.006 0.026 0.027 0.013 0.021
β 1 2.996 0.258 0.303 0.101 0.244 3.002 0.192 0.221 0.074 0.177 3.006 0.109 0.124 0.041 0.099 3.001 0.045 0.035 0.012 0.027
β 2 5.986 0.261 0.260 0.043 0.207 6.000 0.199 0.184 0.031 0.147 5.994 0.119 0.140 0.023 0.112 6.002 0.058 0.033 0.005 0.025
ρ 0.775 0.080 0.047 0.058 0.032 0.794 0.061 0.030 0.037 0.025 0.795 0.040 0.019 0.023 0.015 0.772 0.013 0.030 0.037 0.008
σ 2.096 0.224 0.280 0.140 0.209 2.034 0.149 0.152 0.076 0.116 2.026 0.093 0.098 0.049 0.075 2.047 0.027 0.055 0.027 0.022
β 1 2.977 0.255 0.347 0.116 0.277 2.993 0.191 0.172 0.057 0.136 3.003 0.102 0.118 0.039 0.094 3.001 0.048 0.034 0.011 0.027
β 2 5.988 0.259 0.283 0.047 0.226 5.995 0.193 0.181 0.030 0.142 6.009 0.111 0.108 0.018 0.087 6.004 0.051 0.030 0.005 0.024

1 Rook型与Queen型在模拟中的表现相近。

2 本文中的蒙特卡罗模拟实验均在R-4.2.2平台下完成。INLA方法使用R-INLA程序包;HMC与VI方法使用cmdstanr程序包。

3 图1和图2对应的原始表格已呈现在附件1中。

1
Whittle P. On stationary processes in the plane [J]. Biometrika, 1954, 41(3): 434-449.

2
Anselin L. Thirty years of spatial econometrics [J]. Papers in Regional Science, 2010, 89(1): 3-25.

3
李军, 冼凡几, 何莽. 中国康养旅游发展潜力的时空演化格局及空间效应分析 [J]. 华南地理学报, 2023, 1(1): 78-91.

LI J, XIAN F J, HE M. Spatio-temporal evolution pattern and spatial effect analysis of the development potential of health tourism in China [J]. South China Geographical Journal, 2023, 1(1): 78-91.

4
方远平, 肖亚儿, 宋雅玲, 等. 珠三角地区电子信息产业空间格局及影响因素——基于企业POI数据的分析 [J]. 华南地理学报, 2023, 1(2): 15-26.

FANG Y P, XIAO Y E, SONG Y L, et al. The spatial pattern and influencing factors of electronic information industry in Pearl River Delta region: The analysis based on enterprise POI data [J]. South China Geographical Journal, 2023, 1(2): 15-26.

5
粟娟, 刘蕾, 王艳. 武陵山片区乡村旅游对乡村经济发展的空间溢出效应研究 [J]. 华南地理学报, 2023, 1(3): 65-80.

SU J, LIU L, WANG Y. Study on the spatial spillover effect of rural tourism on rural economic development in Wuling Mountain area [J]. South China Geographical Journal, 2023, 1(3): 65-80.

6
Kelejian H, Prucha I. A generalized moments estimator for the autoregressive parameter in a spatial model [J]. International Economic Review, 1999, 40(2): 509-536.

7
Lee L. Asymptotic distributions of quasi-maximum likelihood estimators for spatial autoregressive models [J]. Econometrica, 2004, 72(6): 1899-1925.

8
Lee L. GMM and 2SLS estimation of mixed regressive, spatial autoregressive models [J]. Journal of Econometrics, 2007, 137(2): 489-514.

9
Hepple L. Bayesian analysis of the linear model with spatial dependence [M]// Bartels A, Ketellapper H. Exploratory and explanatory statistical analysis of spatial data. Dordrecht, Netherlands: Springer, 1979: 179-199.

10
Anselin L. Estimation methods for spatial autoregressive structures: A study in spatial econometrics [D]. New York: Cornell University, 1980.

11
LeSage J. Bayesian estimation of spatial autoregressive models [J]. International Regional Science Review, 1997, 20(1): 113-129.

12
LeSage J, Pace K. Introduction to spatial econometrics [M]. New York: Chapman and Hall/CRC, 2009.

13
Smith T, LeSage J. A Bayesian probit model with spatial dependencies [M]// LeSage J, Pace K P. Spatial and spatiotemporal econometrics. Leeds, UK: Emerald Publishing, 2004: 127-160.

14
Hsiao C, Pesaran M, Tahmiscioglu A. Bayes estimation of short-run coefficients in dynamic panel data models [M]// Hsiao C, Pesaran M, Lahiri K et al. Analysis of panels and limited dependent variable models. Cambridge, UK: Cambridge University Press, 1999: 268-296.

15
Kellner R, Rösch D. A Bayesian re-interpretation of "significant" empirical financial research [J]. Finance Research Letters, 2021, 38: 101402.

16
Martin G, Frazier D, Maneesoonthorn W, et al. Bayesian forecasting in economics and finance: A modern review [J]. International Journal of Forecasting, 2024, 40(2): 811-839.

17
Kruschke J. Bayesian analysis reporting guidelines [J]. Nature Human Behaviour, 2021, 5(10): 1282-1291.

18
Bivand R, Hauke J, Kossowski T. Computing the Jacobian in Gaussian spatial autoregressive models: An illustrated comparison of available methods [J]. Geographical Analysis, 2013, 45(2): 150-179.

19
Martin G, Frazier D, Robert C. Approximating Bayes in the 21st century [J]. Statistical Science, 2023, 1(1): 1-26.

20
Gómez-Rubio V, Bivand R, Rue H. Estimating spatial econometrics models with integrated nested Laplace approximation [J]. Mathematics, 2021, 9(17): 20-44.

21
Wu G. Fast and scalable variational Bayes estimation of spatial econometric models for Gaussian data [J]. Spatial Statistics, 2018, 24: 32-53.

22
Betancourt M. The convergence of Markov chain Monte Carlo methods: From the Metropolis method to Hamiltonian Monte Carlo [J]. Annalen der Physik, 2019, 531(3): 1700214.

23
LeSage J, Pace K. Bayesian spatial econometric models [M]// LeSage J, Pace K. Introduction to spatial econometrics. New York: Chapman and Hall/CRC, 2009: 123-153.

24
Van Ravenzwaaij D, Cassey P, Brown S. A simple introduction to Markov Chain Monte Carlo sampling [J]. Psychonomic Bulletin & Review, 2018, 25(1): 143-154.

25
Chib S, Greenberg E. Understanding the Metropolis-Hastings algorithm [J]. The American Statistician, 1995, 49(4): 327-335.

26
Betancourt M, Byrne S, Livingstone S, et al. The geometric foundations of Hamiltonian Monte Carlo [J]. Bernoulli, 2017, 23(4): 2257-2298.

27
Thomas S, Tu W. Learning Hamiltonian Monte Carlo in R [J]. The American Statistician, 2021, 75(4): 403-413.

28
Rue H, Martino S, Chopin N. Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace approximations [J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2009, 71(2): 319-392.

29
Wainwright M, Jordan M. Graphical models, exponential families, and variational inference [J]. Foundations and Trends in Machine Learning, 2008, 1(1): 1-305.

30
Blei D, Kucukelbir A, McAuliffe J. Variational inference: A review for statisticians [J]. Journal of the American Statistical Association, 2017, 112(518): 859-877.

31
Kucukelbir A, Tran D, Ranganath R, et al. Automatic differentiation variational inference [J]. Journal of Machine Learning Research, 2017, 18(14): 1-45.

Outlines

/