Double robust inference for continuous updating GMM¶

作者: Frank Kleibergen, Zhaoguo Zhan
来源: Quantitative Economics
主题: 经济理论 / 应用
相关性: 7/10
机构绿灯: University of Amsterdam（US News 前 50，免分进入精读）
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向专注于广义矩方法（GMM）在存在“弱识别”和/或“模型误设定”时的统计推断问题。核心问题是：当矩条件（moment conditions）对结构参数提供的信息较弱（弱工具变量/弱识别），或当矩条件在真实参数处不完全成立（模型误设定）时，传统的GMM检验（如Wald、LM、J-test）的渐近分布不再可靠，导致过度拒绝或检验水平扭曲。该方向的目标是开发对上述两种问题都具有稳健性的推断程序，特别是保持检验的正确渐近大小（size）。

发展脉络¶

奠基工作：经典GMM与弱识别问题的发现
Hansen (1982)：建立了GMM的经典渐近理论，假设矩条件在真实参数处成立，且识别强度足够。这是整个领域的起点。
Staiger and Stock (1997)：在IV回归的语境下，使用“局部趋零”（local-to-zero）的弱工具变量渐近序列，正式刻画了弱识别问题。他们发现当工具变量很弱时，Wald、LM等检验的分布不再服从标准卡方分布，导致严重的水平扭曲。
Stock and Wright (2000)：将弱识别概念推广到非线性GMM，提出了连续更新估计量（CUE）并在弱识别下分析了其性质。
主要进展：弱识别下的稳健检验
Kleibergen (2002, 2005)：提出了著名的K统计量（Kleibergen's K test），其核心思想是在CUE的一阶条件上构造一个“得分”检验，该检验在弱识别下仍能保持正确的渐近大小，且对冗余参数（nuisance parameters）进行了有效投影。
Moreira (2003)：在条件似然比（CLR）框架下，提出了对弱工具变量稳健的检验，该检验在条件上最优。
Andrews and Mikusheva (2016a, 2016b)：从“几何”角度处理非线性模型的弱识别问题，利用模型曲率构造了有限样本界，从而构建了渐近有效的检验。作者在文中引用其为“巨大的进展”（huge progress）。
对模型误设定的关注
Hall and Inoue (2003)：正式研究了GMM在模型误设定下的渐近理论。他们引入了“伪真值”（pseudo-true value）的概念，即使总体GMM目标函数最小化的参数值。他们发现，在误设定下，传统GMM方差估计量不一致，导致检验水平扭曲。
Hansen and Lee (2021)：针对迭代GMM，发展了在允许“温和误设定”条件下的推断方法，并证明了如何一致地估计正确的渐近方差矩阵。这是本文直接引用的关键方法来源之一。本文的主要结果“在所有条件下均适用”（It applies under the conditions listed in Hall and Inoue (2003) and Hansen and Lee (2021)）。
当前前沿与本文的定位
当前的前沿是：能否构造一个同时对“弱识别”和“模型误设定”稳健的单一检验统计量？已有的稳健检验（如Kleibergen的K检验）对弱识别是稳健的，但它们的性质在误设定下尚未明确。而针对误设定的稳健方法（如Hansen and Lee 2021）又依赖于标准的（非弱）识别假设。
本文（Kleibergen and Zhan, 2024） 直接填补了这个缺口，提出了“双稳健拉格朗日乘子（DRLM）统计量”。作者声称其极限分布为χ²，且对弱识别和误设定均具有稳健性。

子线索聚类¶

线索一：弱识别下的稳健推断方法
代表人物：Staiger & Stock (1997), Stock & Wright (2000), Kleibergen (2002, 2005), Moreira (2003), Andrews & Mikusheva (2016), Andrews, Stock & Sun (2019)。
核心工作：提出了一系列在弱工具变量条件下保持正确大小的检验（如K检验、CLR检验、AR检验）。这些方法通常基于对识别强度不敏感的统计量（如得分、似然比）构造。
本文关系：本文的DRLM统计量是在Kleibergen（2002）的得分检验基础上的直接推广，旨在解决其在误设定下的失效问题。
线索二：模型误设定下的推断与伪真值理论
代表人物：Hall & Inoue (2003), Hansen & Lee (2021), Lee (2018)。
核心工作：当矩条件不完全成立时，定义了伪真值，并推导了估计量在该值下的渐近分布，并发展了正确的方差估计（例如，处理“多LATE”问题导致的矩条件误设定）。
本文关系：本文的DRLM统计量正是基于对伪真值的假设检验，其核心目标就是在误设定下仍能有效工作。文中引用的Hansen & Lee (2021)给出了一致估计方差的方法，是本文的技术基石之一。
线索三：应用导向的实证诊断与工具变量汇总
代表人物：Mavroeidis, Plagborg-Møller & Stock (2014), Andrews, Stock & Sun (2019), Gospodinov & Robotti (2021), Cheng, Dou & Liao (2021)。
核心工作：在具体的实证问题（如新凯恩斯菲利普斯曲线、资产定价）中考察弱识别和误设定的严重性，并提出实用的诊断方法和建议。这些工作通常强调在实践中，弱识别和误设定常常并存。
本文关系：本文的实证应用部分（Adrian et al., He et al.的风险溢价）正是这类工作的延续，用新方法重新审视已发表的结果，突出了“双稳健”检验在实证中的必要性。

核心追问与当前瓶颈¶

核心问题1：如何构造一个在弱识别、模型误设定、或两者皆有时，都能提供准确推断（特别是保持检验的正确大小）的检验统计量？
核心问题2：当局部的“弱识别”与全局的“误设定”交织时，统计推断的极限是什么？能否用一个统一的渐近分布来描述？
核心问题3：对于非线性GMM模型（如资产定价中的常数相对风险厌恶模型），如何有效进行稳健推断？其识别强度如何诊断？
当前瓶颈：已有的稳健检验（Kleibergen 2002, Andrews & Mikusheva 2016）对弱识别稳健，但对误设定不稳健；而误设定下的稳健方法（Hansen & Lee 2021）需要强识别。同时应对两者的方法缺失，导致实证研究者在面对复杂模型时缺乏可靠的推断工具。

⚠️ 作者的framing¶

作者的说法：作者将当前的缺口frame成：“现有的弱识别稳健检验（如Kleibergen的K统计量）依赖于模型正确设定来保持其大小，而现有的误设定稳健方法需要强识别。”因此，DRLM作为“显然的下一步”是合理的——它试图用一个统计量同时解决这两个问题，其命名“双稳健”也直接指向这个核心卖点。
被淡化的竞争路线：作者没有过多讨论Andrews & Mikusheva (2016)的几何方法是否可以通过某种修正（如对目标函数进行“去误设定”的调整）来达到同样的稳健性。作者似乎更专注于在CUE的得分检验框架内进行修正，而非从更一般的几何或高维视角切入。
什么被回避了？：作者没有深入讨论稳健置信区间集（即像Kleibergen 2002那样构建无界或半无界置信区间）的构造。DRLM只提供一个检验统计量，但如何在此基础上构造像CLR那样的条件最优检验，本文未涉及。而且，文中对异方差和自相关（HAC）稳健方差估计的讨论相对简略，尽管在实证应用中这是关键。
明显该被引但缺失的：本文应引用Andrews (1999)关于GMM模型选择/矩条件选择的文献，因为误设定问题天然地与矩条件的选择有关。未讨论“哪个矩条件导致误设定”也是一个显著缺口。

张力¶

未见明显对立引用。所有被引工作基本是互补的：一部分处理“弱识别”，一部分处理“误设定”，本文则试图统一这两种处理。没有发现两篇被引论文在略不同条件下得出相反结论的情况。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据¶

符号:
θ: 结构参数 (structural parameter)，一个p维向量。这是研究者关心的、要估计和检验的目标。
g(z, θ): 矩函数 (moment function)，一个m维的向量函数。在参数θ下，理论上应该满足E[g(z, θ)] = 0，其中z是包含内生变量、工具变量、外生变量等的观测数据。m >= p（过度识别）。
f_T(θ): 样本矩 (sample moment)，一个m维的向量。f_T(θ) = (1/T) Σ_t g(z_t, θ)，是总体矩E[g(z, θ)]的样本估计。
W_T(θ): 最优权重矩阵 (optimal weighting matrix)，在连续更新GMM中，它是样本矩的协方差矩阵的逆[Var(f_T(θ))]^{-1}，且依赖于θ。这是CUE与标准两步GMM的关键区别。
Q_T(θ): 连续更新目标函数 (continuous updating objective function)，Q_T(θ) = T * f_T(θ)' * W_T(θ) * f_T(θ)。CUE估计量就是最小化这个函数的θ。
θ*: 伪真值 (pseudo-true value)，总体连续更新目标函数Q_p(θ) = E[Q_T(θ)]的最小化者。在模型正确设定下，θ*等于真实参数θ_0（因为此时E[g(z, θ_0)] = 0，所以Q_p(θ_0)=0最小）。在误设定下，θ*是使得总体矩“最接近”0的参数。
μ_f(θ): 总体样本矩，E[f_T(θ)]。在伪真值θ*处，它通常不为0。
D(θ) & Ω(θ): D(θ)是样本矩对θ的雅可比矩阵的期望，Ω(θ)是样本矩的协方差矩阵。W(θ) = Ω(θ)^{-1}。
estimand (目标参数)：本文要检验的假设是H0: θ = θ*？不对，实际上检验的是θ = θ_0（真实参数），但作者巧妙地将问题转化为检验零假设H0: θ = θ_h，其中θ_h是任意假设值。DRLM检验的是：在给定假设值θ_h下，θ_h是否等于伪真值θ*。正确设定下，θ* = θ_0。
模型:
数据生成机制：我们有一个随机样本{z_t}_{t=1}^T，服从某个未知分布。在这个分布下，存在一个矩条件E[g(z, θ_0)] = 0，但模型可能错误设定（即对任意θ，E[g(z, θ)] ≠ 0）。
模型结构：连续更新GMM（CUE）模型。面对数据z_t，实证研究者选择一系列矩函数g（代表理论模型的预测），形成一个过度识别的系统。通过最小化连续更新目标函数Q_T(θ)来估计θ。
可观测数据:
能观测到的：研究者能观察到所有z_t（内生变量、工具变量、外生变量等）以及计算出的g(z_t, θ)。他们可以计算任意θ下的样本矩f_T(θ)、权重矩阵W_T(θ)和目标函数Q_T(θ)。
观测不到且想知道的：真实参数θ_0（如果存在且唯一），伪真值θ*，以及模型是否被正确设定。研究者只能通过渐近理论去推断θ_0（或θ*）的性质。识别强度（D(θ)的秩）是未知的，是导致推断困难的核心原因。

第二步：最小内核——线性IV回归的双稳健检验¶

最简特例：考虑最简单、最常见的一步GMM设定：线性IV回归模型，且只有一个内生变量（p=1）和多个工具变量（m=k）。

模型：
内生变量：x (标量)
误差项：u
工具变量：w (k×1 向量)
矩条件：E[ w * (x * θ_0 + u) ] = 0？不，标准模型是y = x θ_0 + u，所以矩条件是E[ w * (y - xθ_0) ] = 0。
为了聚焦本文核心，假设我们有一个“结构方程”，不存在y，我们直接有矩条件。最简形式：我们想检验θ是否等于某个特定值θ_h，通过工具变量w。
可观测数据：时间序列{x_t, w_t, y_t}_{t=1}^T。但为了简化，我们直接看矩条件E[ g(w, x, θ) ] = E[ w * (xθ) ] = 0？不，这是矩条件的错误形式。正确的矩条件是：在θ_0处，E[ w * (y - xθ_0) ] = 0。
我们检验H0: θ = θ_h。在零假设下，我们期望f_T(θ_h) = (1/T) Σ_t w_t (y_t - x_t θ_h) = 0。

现在：弱识别 vs. 误设定: - 弱识别：如果E[ w * x ]很小（工具变量与内生变量相关性很弱），那么雅可比矩阵D(θ) = -E[ w * x ]的范数接近于0。此时，即使θ偏离θ_0很远，样本矩f_T(θ)也可能接近于0。这使得任何基于“f_T(θ)接近0”来拒绝H0的检验（如AR检验）都没有效力（power）。 - 误设定：如果矩条件不完全成立（例如，存在一个遗漏的非线性项），那么在真实参数θ_0处，E[ w * (y - xθ_0) ] ≠ 0。这表现为总体矩μ_f(θ_0) ≠ 0。传统的得分检验（如Kleibergen 2002的K检验）会错误地将这个非零的常数当成抽样误差，从而拒绝一个正确的θ_0。

本文双稳健检验的最小内核: 得分统计量是基于CUE的一阶条件：S_T(θ) = f_T(θ)' * W_T(θ) * D_T(θ)。我们需要在θ = θ_h处检验。在强识别且正确设定下，S_T是渐近正态的，但方差估计很复杂。

Kleibergen (2002)的K检验 解决了弱识别问题：它不直接使用S_T，而是构造了一个新统计量K(θ_h)。在θ_h = θ_0（且正确设定）时，即使弱识别，K(θ_h)的极限分布也是χ²_q（q是参数维数，这里q=1）。其神奇之处在于，它利用了D_T(θ_h)的估计在弱识别下虽然不稳定，但与f_T(θ_h)构造的特定统计量对消了不稳定因素。

本文的DRLM 则进一步处理误设定。当θ_h = θ*（伪真值）但模型误设定时（即E[g(z, θ*)] ≠ 0），传统得分统计量的极限会受到一个漂移项（漂移）的影响，不再是中心化的，从而无法用简单的卡方分布近似。

关键想法：作者发现，这个漂移项来源于总体雅可比矩阵D(θ*)和总体样本矩μ_f(θ*)的交互作用。作者提出对方差估计进行“双稳健”修正。他们推导出，即使存在弱识别和误设定，经过特定修正的方差估计可以使校正后的得分统计量再次收敛到χ²分布。
直观理解：修正后的方差不仅考虑了f_T和D_T的抽样方差，还精准地“抵消”了因为误设定在θ*处引入的非零总体矩导致的漂移。这使得检验在θ=θ*时，无论识别强弱、无论模型是否设定正确，其渐近大小都是正确的。

三、这篇论文做了什么¶

三句话¶

研究的核心问题：在连续更新GMM（CUE）框架下，如何构建一个检验统计量，使得在弱识别和/或模型误设定下，对结构参数（即总体CUE目标函数的伪真值）的假设检验能保持正确的渐近水平（大小）？
核心工具/方法：提出了双稳健拉格朗日乘子（DRLM）统计量，它基于CUE的一阶条件（得分）构造，并采用经过“双稳健”修正的方差估计。该方差估计对弱识别导致的雅可比矩阵不稳定和误设定导致的非零总体矩都具有稳健性。
主要结论：DRLM统计量的极限分布为χ²，其自由度等于被检验参数的数量（q）。这个结果在弱识别（使用局部趋零渐近序列）和/或模型误设定（允许总体矩在伪真值处非零）下均成立。蒙特卡洛模拟验证了其有限样本性能；实证应用（Adrian et al. 2014, He et al. 2017的风险溢价分析及非线性CRRA资产定价模型）展示了其在实践中修正了传统LM检验的过度拒绝问题。

关键设定与假设¶

在第二节最简符号基础上，补充完整设定：

假设1（矩条件的温和正则性）：E[g(z, θ)]关于θ可微，且满足一定的高阶矩和相依性条件（如Hall and Inoue 2003, Hansen and Lee 2021的假设）。这是为了应用中心极限定理和一致大数定律，对异方差和自相关是稳健的（通过HAC估计）。
假设2（伪真值的定义）：存在一个唯一的伪真值θ*，它是总体连续更新目标函数Q_p(θ)的唯一最小化者。相比于传统假设，这里不要求θ*是E[g(z, θ)] = 0的解（即允许误设定）。
假设3（识别强度渐近序列）：采用局部趋零（local-to-zero） 弱识别渐近序列。具体来说，总体雅可比矩阵D(θ*)被假设为随样本量T以T^{-1/2}的速度衰减到0：D(θ*) = D̄(θ*) / √T，其中D̄(θ*)是某个有界的、但不一定满秩的矩阵。这比简单的“矩阵为零”更精细，捕捉了弱识别的典型情况。
假设4（双稳健条件的结构）：对解析的关键在于，存在一个特定的正交分解，使得误设定导致的“漂移”项√T μ_f(θ*)与雅可比矩阵的弱识别部分√T D(θ*)在某种意义下是非退化的。作者的条件保证了这种分解能使DRLM统计量在极限下“对消”掉这些不稳定成分。

相比已有文献：这些假设削弱了“正确设定”（允许误设定）和“强识别”（允许弱识别）。它是将Kleibergen (2002) 的弱识别假设和 Hansen & Lee (2021) 的误设定假设结合起来的关键一步。相比Kleibergen (2002)，加入了μ_f(θ*)非零的漂移；相比Hansen & Lee (2021)，加入了弱识别渐近序列。

主要结果¶

定理1（DRLM统计量的渐近分布）：在本节设定的条件下，检验H0: θ = θ*的DRLM统计量DRLM(θ*)的极限分布是χ²_q。

直觉：DRLM统计量本质上是一个得分检验，但它在一个关键点进行了“去中心化”和“方差调整”。
必要条件：
伪真值θ*的存在性和唯一性（假设2）。
识别强度以T^{-1/2}速率衰减（假设3），这包含了完全未识别（D̄(θ*) = 0）和弱识别（D̄(θ*)非零但有限）的情况。
一系列关于矩函数、雅可比矩阵和协方差矩阵的“双稳健性”条件（假设4）。这些条件确保了在极限分布中，从μ_f(θ*)和D(θ*)中来的不稳定项被精确地相消。
解决的技术难点：难点在于同时处理两种非标准情况：
弱识别导致D_T(θ*)不稳定，θ的CUE估计量本身不一致（只有T^{1/4}的收敛速度），传统的Delta方法失效。
误设定使得中心极限定理施加于f_T(θ*)的极限不是均值为0的高斯分布，而是有一个与μ_f(θ*)相关的漂移。
作者的关键想法：作者将这个复合极限分布（一个带有随机漂移的高斯族）进行线性变换，构造一个与D̄(θ*)和μ_f(θ*)独立的标准高斯向量，其平方和即为χ²分布。DRLM统计量的方差估计正是为了计算出这个变换的逆，使得所有“坏”的不稳定性都被吸收到方差中去。证明中核心是给出了双稳健方差估计量的概率极限，这个极限是θ*处信息矩阵的特定函数，硬核地处理了漂移和弱识别。

定理2（DRLM统计量的局部幂）：在局部备择假设序列下（即θ = θ* + δ / √T），DRLM统计量具有非中心χ²的极限分布，非中心参数λ取决于δ和识别强度D̄(θ*)。

这说明即使有双稳健性保证，检验在弱识别下仍然是低效的（power较低），但这并非方法缺陷，而是问题本身固有的信息局限性。这与已有弱识别理论一致。

证明路线与技术技巧¶

整体路线（3-5步逻辑主干）：
分解：将DRLM统计量表达为S = (A_T) (B_T)^{-1} (A_T)'的形式。其中A_T是经过正交化后的“伪得分”，B_T是其“双稳健方差估计”。重点在于用一种方式表达A_T，使得其在极限下与√T f_T(θ*)和√T D_T(θ*)中的不稳定成分“解耦”。
联合极限：推导出[√T f_T(θ*), √T D_T(θ*), √T μ̂_f(θ*), ...]在假设下的联合弱收敛性质。这里用到经验过程（empirical process）理论来处理D_T的估计，以及U-统计量展开处理μ̂_f。
方差对消：关键的引理（Lemma 1-4）展示了如何用D_T和μ̂_f的极限构造一个统计量，该统计量与√T f_T(θ*)的极限之间的协方差矩阵，恰好等于B_T的极限期望。这确保A_T在极限下是一个均值为0、单位方差的高斯向量。
中心极限定理：将步骤3的结果代入步骤1的分解中，得到S的极限是q个独立标准正态随机变量的平方和，即χ²_q。
关键跳跃点与引理：
最难的点：证明√T μ̂_f(θ*)的极限分解（Lemma 3）。因为μ̂_f是对样本矩的期望的估计，其极限包含了关于f_T本身的样本外预测误差，这个误差与√T f_T(θ*)的极限高度相关。必须正确处理这种相关性，否则“对消”无法实现。作者通过将μ̂_f写成关于f_T的投影来突破。
技术技巧：使用random matrix theory的一个派生技巧：处理D_T的HAC方差估计量时，利用其与f_T的协方差结构的性质。
技术技巧点名：
经验过程 (Empirical Process)：用于建立√T(f_T(θ*) - μ_f(θ*))和√T(D_T(θ*) - D(θ*))的联合弱收敛。这是大样本理论的标准工具箱。
高阶U-统计量展开 (Higher-order U-statistics)：在推导方差估计量B_T的极限时，涉及到对μ̂_f和D_T的估计，本质上是对样本矩的二次型进行展开，可以通过U-统计量的理论来处理。
HAC估计 (Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Estimation)：一般性地处理了时间序列数据中的序列相关和异方差，是实证应用的关键。
双稳健性 (Double Robustness)：核心思想，指方差估计量对识别强度和误设定都不敏感。这是通过巧妙设计的、依赖于θ和样本数据的权重函数来实现的。

真实例子与应用¶

本文包含两个真实数据例子：

风险溢价分析 (Risk Premia Analysis)：
数据/场景：使用30个行业投资组合的收益率（R_t）作为测试资产。检验两个著名的资产定价因子模型：Adrian, Etula, and Muir (2014) 的金融中介资本因子（Intermediary Capital Factor） 和 He, Kelly, and Manela (2017) 的金融中介杠杆因子（Intermediary Leverage Factor）。
方法应用：将DRLM检验应用于这些因子对投资组合收益的回归方程中的风险溢价参数（λ）。矩条件是E[ (R_t - β λ) * Z_t ] = 0，其中Z_t包括因子本身和常数项。这等同于检验因子模型是否被数据拒绝。
结果：
- 传统LM检验：对两个因子模型都强烈拒绝（p值极小），认为任何风险溢价都能被拒绝。
- 双稳健LM（DRLM）检验：对于Adrian et al.的因子，p值很大（不拒绝），说明在考虑了弱识别和误设定后，该模型是可接受的。对于He et al.的因子，DRLM仍部分拒绝，但p值比传统LM大得多。
说明什么：这个例子展示了DRLM在实践中的价值。传统方法由于弱识别和/或误设定导致过度拒绝，而DRLM提供了更可靠、更保守的检验，帮助研究者避免错误地否定一个其实尚可接受的模型。这直接回应了Gospodinov & Robotti (2021) 对He et al.模型的批评。
非线性资产定价模型：
数据/场景：使用市值加权市场组合（value-weighted market portfolio）作为测试资产，检验标准消费资本资产定价模型（CCAPM），其随机贴现因子为M_t = β (C_{t+1}/C_t)^{-γ}，其中γ是相对风险厌恶系数。
方法应用：矩条件是E[ M_t * R_{t+1} - 1 ] = 0。检验关于结构参数θ = (β, γ)的假设。
结果：构建了γ的置信区间集。传统方法给出一个较窄的区间（e.g., [1.2, 3.5]），但DRLM给出的区间很宽（e.g., [0.4, 10.2]）。这说明参数识别很弱。DRLM提供的这个宽区间比传统窄区间更诚实，它告诉研究者：所以，我们对γ的估计非常不确定。
说明什么：演示了DRLM在非线性模型和弱识别下的行为。它不仅仅提供一个点检验，还能用于构造稳健的置信区间（通过反函数法）。这个结果证实了Cheng, Dou & Liao (2021)等文中对CCAPM弱识别的担忧。

🔎 结论是否比证明窄¶

是。论文的主要渐近结果（定理1）证明是在特定的局部趋零弱识别序列下得出的。这是一个技术性很强的条件，它假设识别强度以T^{-1/2}$的速度衰减。虽然这比“完全未识别”更合理，但它并不覆盖所有可能的弱识别情形（例如，识别强度以T^{-1/4}$或其它速度衰减）。作者没有证明DRLM在所有弱识别情景下（例如，识别强度以更慢或更快的速率衰减）都保持χ²分布。因此，实证中如果将DRLM的直接应用解读为对所有形式的弱识别都稳健，是一种泛化。作者在文中（Section 5）主要讨论了一种特定形式（局部趋零），而对该框架的一般性做了限制。

四、开放问题¶

有限样本行为与Bootstrap修正：DRLM的极限分布是渐近的χ²，但Second-order effects（特别是当T很小时，D_T的估计非常不稳定）可能会在有限样本下导致显著的大小扭曲。能否发展一个Bootstrap版本的DRLM来改善有限样本性质？这扎根于论文的Monte Carlo模拟部分，作者承认DRLM拒绝率可能略超过名义水平。
扩展到其他GMM估计量：本文的DRLM是为连续更新GMM（CUE）设计的。它能否推广到两步GMM (2SGMM) 或迭代GMM？在两步GMM中，权重矩阵不依赖于θ，弱识别下的性质完全不同。将双稳健思想迁移到其他估计框架需要重新审视方差估计结构。这与论文的结论部分（Section 6） 提到的“extending to other estimators”对应。
对“强识别”和“正确设定”的最优性：当模型被正确设定且识别很强时，DRLM不是最有效的（相比于基于经验似然或高效GMM的检验）。一个未解决的问题是：能否构造一个在所有（弱/强、正确/错误）状态下都达到最优或近似最优的统一检验？这涉及到一个Minimax-optimal稳健检验的存在性和构造问题。论文的intro中暗示了这一点，但没有明确作为一个目标提出。
高维工具变量与稀疏性：当工具变量数量m远大于样本量T（高维）时，DRLM会失效。能否将本文的框架与惩罚GMM或Lasso-type IV结合，发展出在高维工具变量下同时具有识别和设定稳健性的推断方法？这源于论文中对工具变量个数的讨论，以及与许多IV（many instruments）的经典文献的关联，但作者并未对此进行展开。

Maintained by 陈星宇 · Homepage · Source on GitHub