No-harm calibration for generalized Oaxaca–Blinder estimators¶
作者: P L Cohen, C B Fogarty
来源: Biometrika
主题: 因果推断
相关性: 8/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么¶
本方向聚焦于随机实验中,如何利用协变量调整(covariate adjustment)来提高处理效应估计量的效率,同时要求调整过程不损害估计量的渐近精度——即相比简单的“处理组均值减对照组均值”(未调整估计量),调整后的估计量在渐近方差上应非劣(asymptotically no less efficient)。核心张力在于:一方面,理论上有许多方法(线性回归、非线性回归、机器学习、IPW)可以纳入协变量;另一方面,只有线性回归(含交互项)被严格证明对于任意数据生成过程都具有这种“无害”(do-no-harm)性质,而更灵活的非线性模型(如Logistic、Poisson回归)一旦模型指定错误,反而可能使精度恶化。本文的工作就是把“无害”性质从线性模型推广到一大类广义线性模型及更一般的非线性模型。
发展脉络(history)¶
奠基工作: - Freedman (2008, Ann. Appl. Stat.):在Neyman非参数框架下,对OLS回归调整提出了严厉批评,指出常规(不含交互项)的OLS调整可能导致渐近精度下降、方差估计失效、小样本偏误。他主张优先使用未调整的均值差,以确保透明度。 - Lin (2013, Ann. Appl. Stat.):对Freedman的批评做了重要回应:若线性回归中包含完整的“处理×协变量”交互项(即饱和模型),则OLS调整的渐近效率不会低于未调整估计量,且Huber-White三明治标准误可构建有效置信区间。这确立了“线性回归无害”的基准结果。
主要进展——将“无害”拓展到更复杂的设定: - Wager et al. (2016, PNAS):证明在随机实验中,任何“风险一致性”(risk-consistent)的回归调整(包括Lasso、随机森林等)都能产生渐近有效的ATE估计,且通过交叉拟合(cross-estimation)可以获得有限样本无偏性。但该结果要求回归模型对条件期望的估计是一致的——在实际中,当模型严重指定错误时,一致性未必成立。 - Bloniarz et al. (2016, JASA):将Lasso调整用于高维协变量,给出了保证估计量比未调整均值差更有效的理论条件,并提出了保守的渐近方差估计量。 - Lei & Ding (2020, JRSS-B), Negi & Wooldridge (2021, JBES):将线性模型标准化结果推广到高维设定;Lei & Ding的结果依赖于预测函数的线性性。Negi & Wooldridge明确指出:“我们目前没有理论结果来表明当模型指定错误时,非线性回归调整方法能明确改善渐近效率”——这是本文要填补的直接缺口。 - Guo & Basse (2020, JRSS-B):提出了广义Oaxaca–Blinder(GLOB)估计量,将OLS调整的框架系统推广到任意“简单的”非线性模型(如GLM),证明基于随机化即可得到有效置信区间。但没有给出“无害”保证——未经校准的GLOB估计量在模型指定错误时可能比未调整估计量更差。
当前frontier与本文的位置: - Wu & Gagnon-Bartsch (2018) & Rothe (2020):提出了留一法潜在结果估计量(LOOP),具有零偏倚和在许多设定下优于未调整估计量的性质,但没有给出一般性的渐进效率下限保证——本文的校准方法可以赋予LOOP这一性质。 - Colantuoni & Rosenblum (2015, Biometrics):模拟比较了多种“无害”调整方法(包括Tan 2010、Rotnitzky et al. 2012的稳健方法),但模拟不基于参数模型,也未从理论上给出非线性调整的无害充分条件。 - 本文 (Cohen & Fogarty, 2023, Biometrika):提出一种通用校准方法,将“无害”性质赋予任何基于非线性模型的GLOB估计量(包括Logistic、Poisson回归)。等价于将估计量变为以预测潜在结果为协变量的logit链接IPW估计量,从而在渐近方差上非劣于未调整估计量和未校准非线性估计量。
子线索聚类¶
线索一:线性回归调整及其无害性证明(奠基工作) - 代表:Freedman (2008, Ann. Appl. Stat.)—批评;Lin (2013, Ann. Appl. Stat.)—正面证明(含交互项);Negi & Wooldridge (2021, JBES)—再分析及饱和度FRA。 - 核心问题:线性回归(有无交互)在何种条件下保证ATE估计的渐近非劣性,怎样扩展到更复杂的模型。
线索二:利用机器学习/非线性模型进行协变量调整(方法拓展) - 代表:Wager et al. (2016, PNAS) —风险一致性方法;Bloniarz et al. (2016, JASA) —Lasso调整;Guo & Basse (2020, JRSS-B)—GLOB。 - 核心问题:如何在放松线性性、允许高维或非参数拟合的前提下,保持估计量的有效性,并设法避免模型指定错误带来的效率损失。
线索三:特殊性框架及校准技术(独立发展) - 代表:Wu & Gagnon-Bartsch (2018)—LOOP;Shen et al. (2014, Statistics in Medicine)—IPW的两阶段(先调整后看结果);Rothe (2020)—无偏性构造。 - 核心问题:通过特殊推断框架(LOOP、校准)构建兼具无偏性和一定效率保证的估计量,但此前未与GLOB框架对接。
线索四:有限总体推断与渐近理论(理论支撑) - 代表:Li & Ding (2017, JASA)—有限总体CLT;Rubin-Bleuer & Kratina (2005, JRSS-B)—超总体与设计空间的乘积空间形式化;Ding et al. (2019, JRSS-A)—处理效应变异性分解。 - 核心问题:为随机实验的推断(尤其是基于随机化自身的推断)提供严格的渐近理论基础。
这个方向在追问的核心问题¶
- 非线性回归调整能否在模型指定错误时仍保持渐近非劣性? 当前主流方法(Wager et al. 2016, Guo & Basse 2020)依赖模型假设或其一致性来保证效率,未明确提供防错机制。
- 对一大类回归方法(不仅仅是线性)是否存在通用的“无害校准”步骤,使之自动获得效率保证? 这是本文的回答(肯定的,通过校准)。
- 校准后的非线性估计量与半参数效率下限的关系如何? 本文指出其等价于一类IPW估计量,但未给出该IPW估计量相对于半参数有效影响的效率损失。
- 在高维或非参数情况下,本文的校准方法能否保持“无害”的同时不牺牲有限样本可靠性?
- 本文在高维情况下只做了初步的讨论(补充材料提到了基于交叉拟合或熵界的充分条件),尚未给出完整的高维渐近理论。
⚠️ 作者的framing¶
作者把缺口frame成什么: - 作者在introduction中强调:“Among parametric methods, only linear regression has been proven to form an estimate of the average treatment effect that is asymptotically no less efficient than the treated-minus-control difference in means regardless of the true data generating process.” 然后直接引出“We present a general calibration method that confers the same no-harm property onto estimators leveraging a broad class of nonlinear models.” —— 这是非常标准的“填补缺口”策略:明确既有结果只覆盖线性模型,自己则推广到非线性,从而显得是“显然的下一步”。
哪些竞争路线被他淡化或回避了: - Wager et al. (2016) 的交叉拟合方法:作者只提到“The risk-consistency of the prediction function is required for asymptotic linearity of the estimator”,暗示该方法依赖于模型一致性。在新的校准框架下,一致性不是必需的?实际上一旦校准,预测函数的风险一致性要求可以放松很多,但作者没有展开讨论这一点与Wager方法的优劣。 - Tan (2010)、Rotnitzky et al. (2012) 的稳健估计量(在IPW/DR框架下构造的无害估计量):作者只在相关工作中淡淡提到“Methods guarding against model misspecification in parametric models include Tan (2010), Rotnitzky et al. (2012) and Colantuoni and Rosenblum (2015)”,但没有与自己的方法做实质性对比——这些稳健方法早就达到了“无害”(包括非线性设定),为什么需要再发明一个Oaxaca–Blinder校准?作者未直面这个问题。 - Colantuoni & Rosenblum (2015) 的模拟研究当时就包含多种“无害”调整方法(包括IPW和DR的稳健版本),作者没有解释为什么这些已经成型的方法不够,或者它们与Oaxaca–Blinder框架的异同。
什么明显该被引/该存在、却没出现在intro里? - Benkeser et al. (2021, Biometrics) 关于augmented IPW(AIPW)在非线性模型下的无害性:AIPW是构造稳健/高效估计量的直接工具,当倾向得分已知(随机实验中为已知常数),AIPW的线性性很自然地带来无害性。该线索与本文的关系非常紧密,没有被引用。 - Hahn (1998, Econometrica) 关于半参数有效性的经典工作(已知倾向得分时的半参数效率界):虽然文献中提到了超总体框架(Rubin-Bleuer & Kratina),但没有直接引用Hahn,而Hahn的结论明确指出,当倾向得分已知时,任何正则估计量都可以通过协变量调整改进效率,但具体如何构造一个“无害”的通用程序并未解决。 - 这些遗漏是值得研究者进一步核实的问题。
张力¶
- 未见明显对立引用。所有被引工作都认同(或至少不否定)“在随机实验中使用协变量调整可以改进效率,但需避免模型指定错误带来的风险”,只是在如何避免这个风险上思路不同。作者没有主动将已有的AIPW稳健方法作为对比,这是个可探讨的点。
二、最核心、最简单的例子 / 数学问题¶
第一步:符号、模型、可观测数据交代清楚¶
符号(逐个点名):
- 参数/目标 estimand:
- \(τ_{PATE}\):有限总体平均处理效应(finite-population average treatment effect)。定义为 \(τ_{PATE} = \frac{1}{N} \sum_{i=1}^N (Y_i(1) - Y_i(0))\),其中 \(Y_i(1)\)、\(Y_i(0)\) 是个体 \(i\) 在治疗和控制下的潜在结果。
-
\(τ\):常作为 \(τ_{PATE}\) 的简写。
-
随机变量/样本:
- \(i=1,\dots,N\):有限总体中的 \(N\) 个个体(实验单位)。\(N\) 固定且潜在结果 \((Y_i(1), Y_i(0), X_i)\) 为非随机已知但未完全观测的数值。
- \(Z_i\):处理分配指标,\(Z_i=1\) 表示治疗,\(Z_i=0\) 表示对照。在完全随机化实验中,\(\sum_i Z_i = N_1\) 固定,\(N_0 = N - N_1\),所有个体有 \(\binom{N}{N_1}\) 个等可能分配机制。
- \(Y_i^{obs}\):观测到的结果,\(Y_i^{obs} = Z_i Y_i(1) + (1-Z_i)Y_i(0)\)。
-
\(X_i\):\(p\) 维协变量向量,观测且不受处理影响(基线变量)。
-
维数/样本量:
-
\(p\):协变量维数,固定且有限(本文主要框架成立,但高维扩展在讨论中)。
-
潜在(counterfactual)量:
- \(Y_i(1), Y_i(0)\):每个个体的两个潜在结果。只有其中一个能被观测到。
- \(δ_i = Y_i(1) - Y_i(0)\):个体处理效应,也是潜在量。
模型:
- 完全基于随机化的推断模型(Neyman–Rubin模型,也称有限总体模型):
- 没有结果分布的参数模型假设——\(Y_i(1), Y_i(0)\) 被视为固定但未知的数组。
- 随机化是唯一的概率来源:处理分配 \(Z_i\) 的随机性产生所有推断的变异性。
- 没有抽样分布(不同于无限总体的超总体模型)。
可观测数据: - 研究者实际观测到的三元组:\((Y_i^{obs}, Z_i, X_i)\),\(i=1,\dots,n\)(\(n\) 是实际实验样本量,此处 \(n=N\),无抽样阶段,故直接记为 \(N\))。 - 不可观测:对于每个人,我们看不到 \(Y_i(1)\) 和 \(Y_i(0)\) 中的至少一个(缺失数据结构)。此外,个体处理效应 \(δ_i\) 以及其与协变量的互动关系也是不可观测的。
第二步:讲最小内核¶
最简特例(首选):假定我们只有一个协变量 \(X_i\)(\(p=1\)),且结果 \((Y_i(1), Y_i(0))\) 与 \(X_i\) 的关系非常接近线性,但又不是精确线性。此外,我们只尝试用一个线性模型来调整(通常Oaxaca–Blinder就是回归调整),且我们担心:如果我用普通的线性回归(不加交互项)调整,会不会比未调整的均值差更差?这是Freedman(2008)的结论——可能更差。Lin(2013)证明加交互项就安全了。
现在,假设回归模型是非线性的(例如 \(M(z, X; β) = \exp(Xβ_z)\) 用于计数数据)。我们用一个类似线性回归的步骤去拟合该模型,得到预测 \(\hat Y_i(1)\) 和 \(\hat Y_i(0)\),然后构造GLOB估计量:
本文的校准步骤(核心思路)非常简单: 1. 用训练集(或全部数据,通过交叉拟合保无偏)拟合非线性模型,得到 \(\hat Y_i(1)\), \(\hat Y_i(0)\)。 2. 不直接用这些预测构造τ_{GLOB},而是先对预测值施加一个校准变换:在线性模型下,校准就是简单的线性重缩放(单调变换),但在广义框架下,校准是通过一个logit链接的IPW等价变换实现的。 - 具体做法:将预测 \(\hat Y_i(z)\) 作为协变量,用它们拟合一个logistic回归模型(不管预测来自哪种GLM),该logistic回归的预测值 \(\hat π_i(1), \hat π_i(0)\) 用于构造最终估计量——等价于:
这个例子说明:原本未经校准的非线性GLOB估计量可能变差,但经过这一简单的校准步骤后,它就不再比未调整均值差更差了。
三、这篇论文做了什么¶
三句话¶
- ① 研究了在随机实验中,如何对基于广义线性模型(如Logistic、Poisson回归)的Oaxaca–Blinder估计量进行校准(calibration),以赋予其“无害”性质——即渐近效率不低于未调整的均值差,也不低于未经校准的非线性估计量。
- ② 核心工具是一个通用校准步骤:利用非线性模型预测的潜在结果作为协变量,再拟合一个logistic回归,以其预测值构造逆概率加权(IPW)估计量,后者在渐近上等价于本文的校准GLOB估计量。
- ③ 主要结论:校准后的估计量 \(\hat τ_{cal}\) 在渐近方差上非劣于未调整均值差 \(\hat τ_{un}\) 和未校准GLOB估计量 \(\hat τ_{GLOB}\)(Theorem 1, 2, 3);模拟表明未经校准的非线性GLOB估计量可能显著更差,而校准方法避免了这一风险;在有限样本无偏性方面,交叉拟合版本进一步提供无偏性(Theorem 3)。
关键设定与假设¶
在第二节符号基础上,补充完整设定:
- Assumption 1(随机化与可交换性):完全随机化实验,\(N\) 固定,\(N_1\) 固定,处理分配等可能。这是一个极标准的设定。
- Assumption 2(预测函数的正则性):预测函数 \(\hat m_z(x)\)(基于某种模型训练得到,如GLM)满足一定一致性条件(如L2收敛、经验过程控制),以保证渐近线性展开有效。这包含了两个重要路径:
- (a) 参数模型的经典一致性(如Buja et al. 2019, Proposition 7——即使模型指定错误,OLS系数仍有极限,且可展开)。
- (b) 交叉拟合:使用样本拆分,预测函数在训练集上拟合,在评估集上使用 \(\hat Y_i(z)\),可放松正则性条件到更易满足的entropy bound(van der Vaart & Wellner, 2011)。
- Assumption 3(不存在有限样本奇异性):协变量分布非退化,保证校准步骤的logistic回归稳定。
- 相比已有文献的放宽/强化:
- 放宽:不需要模型一致性(不像Wager et al. 2016要求风险一致性),只需要“Buja型一致性”(即系数收敛到某个pseudo-true值,即使模型指定错误);校准设计进一步使得即使预测不准,也不会损失效率。
- 强化:本文的校准仍依赖非线性模型的预测函数具有“良好”的渐近线性关系(即预测误差是 \(o_P(N^{-1/2})\) 的),这比线性回归的纯随机化保证强——但作者通过交叉拟合和频谱条件进行了缓解。
- 关于模型指定错误:完全允许,甚至不要求非线性模型的形式与真实的条件均值函数有任何关联。
主要结果¶
定理1(基本无害性):在Assumptions 1-2下,校准后的估计量 \(\hat τ_{cal}\) 的渐近方差满足:
定理2(渐近等价性):\(\hat τ_{cal}\) 渐近等价于一个理想的IPW估计量:
定理3(交叉拟合的无偏性):采用交叉拟合(如2折)构建 \(\hat Y_i(z)\) 和校准,则 \(\hat τ_{cal}^{CF}\) 在随机化上具有有限样本无偏性 \(E[\hat τ_{cal}^{CF} - τ_{PATE}] = 0\),且渐近效率如前。
技术难点: - 难点1:如何证明“校准后的GLOB”一定不比“未调整均值差”差——核心不是比较两者直接方差,而是证明校准等价于某个“以预测变量为协变量的logit IPW”,而该IPW是渐近非劣的。这需要建立 \(\hat τ_{cal}\) 与 \(\hat τ_{un}\) 之间的差方差分解,将预测部分解释为一个“投影”项,该投影只能降低方差。 - 难点2:从未经校准GLOB到校准GLOB的转换,必须说明校准不损失“Buja型一致性”——只要原预测函数满足一致性,校准后的权重也具有一致性。
证明路线与技术技巧¶
整体路线(5步逻辑主干):
-
线性化校准估计量:首先将 \(\hat τ_{cal}\) 写成关于 \(Y_i^{obs}, Z_i, \hat Y_i(z)\) 的可计算形式,然后用delta method或IPW等价性完成线性展开,得到影响函数表示(essential influence function representation):\(\hat τ_{cal} = τ + \frac{1}{N} Σ_i IF_i + o_P(N^{-1/2})\)。
-
刻画未调整均值差的影响函数:同样将 \(\hat τ_{un}\) 线性化,得到 \(\hat τ_{un} = τ + \frac{1}{N} Σ_i \left( \frac{Z_i Y_i(1)}{p} - \frac{(1-Z_i)Y_i(0)}{1-p} - τ \right) + o_P(N^{-1/2})\)。
-
比较两个影响函数的方差:利用Hájek投影的性质,将两个估计量的影响函数之差表示为“随机误差项减去可预测的残差项”。证明这个差是“能减少方差的投影”,从而 \(\operatorname{Var}(IF_{cal}) ≤ \operatorname{Var}(IF_{un})\)。关键不等式是:对于任意随机变量 \(A\) 和与其独立的正交随机变量 \(B\),\(\operatorname{Var}(A+B) = \operatorname{Var}(A) + \operatorname{Var}(B) ≥ \operatorname{Var}(A)\);而这里“可预测的残差项”是 \(B\) 的减弱版,使得方差缩小。
-
比较与未校准GLOB的方差:同样将未校准GLOB线性化,其影响函数包含一个与预测残差相关的交叉项。校准步骤保证了该交叉项消失(或变成仅减少方差的形式),使得校准后的方差 ≤ 未校准方差。
-
交叉拟合论证:引入样本拆分以保证预测函数 \(\hat Y_i(z)\) 对于自己评估的个体是“新观测”没有过拟合。证明在交叉拟合下,估计量的偏差为零(性质来自样本外预测的无偏性)。
关键跳跃点: - 跳跃1:如何建立 \(\hat τ_{cal}\) 与“logit IPW”的等价性——这需要证明校准系数 \(\hat α\)(来自logistic回归)满足 \(\hat α_0^\top \hat Y_i(z) = \operatorname{logit}( \hat π_i(z) )\),且 \(\hat π_i(z)\) 恰好使IPW加权和等于组样本量。这一构造不是显然的,但作者通过设计logistic回归的目标函数(使平均预测值等于组均值)来实现。 - 跳跃2:在无模型指定错误的条件下,要证明校准后的估计量不丢失效率(Theorem 1中比较 \(\hat τ_{cal}\) 与 \(\hat τ_{GLOB}\) 时的核心不等式)需要推导一个关于“预测-L2 误差”的不等式,并与IPW方差表达式相结合。作者使用了一个“预测校正不等式”:\(E[(Y - \hat Y)^2] ≥ E[(Y - c\hat Y)^2]\) 对某常数 \(c\),而校准刚好实现了这个最优缩放。
技术技巧点名: - 经验过程与熵界(van der Vaart & Wellner, 2011):用于Assumption 2的验证,确保 \(\hat Y_i(z)\) 的预测误差均匀可控,从而线性展开成立。 - 有限总体CLT(Li & Ding, 2017):作为渐近正态性的基础框架——作者将Li & Ding的有限总体CLT直接应用到校准估计量的影响函数上。 - delta方法 + bootstrap偏倚校正:对校准系数 \(\hat α\) 的方差估计,采用delta方法将logistic回归的协方差矩阵映射回 \(\hat τ_{cal}\) 的渐近方差。 - 交叉拟合(cross-fitting):不仅在理论证明中用于放松正则性条件(Assumption 2的替换),还在实际计算中用于构造无偏估计量(Theorem 3)。 - Hájek投影:比较方差时,使用Hájek投影将估计量分解为“不可约随机误差”和“可由预测消去的部分”——这是证明无害性的核心工具。
真实例子与应用¶
论文包含一个真实数据例子:
- 使用的数据:膀胱癌随机试验数据(由Bloniarz et al., 2016 的分析中引用,原文来自Andrews & Herzberg, 1985, Chapter 45)——主要分析集中在安慰剂组(47人)与thiotepa治疗组(38人)。主要结局是“复发次数”(count数据),协变量包括初始结节数量及大小等。
- 如何应用方法:使用Poisson回归作为非线性模型(因结局为计数数据,Poisson是自然选择)。先用Poisson回归拟合 \(\hat Y_i(z)\),然后应用本文的校准步骤获得校准GLOB估计量。对比baseline:未调整的均值差、未经校准的GLOB估计量。
- 结果:未调整均值差约为 -1.20(复发次数减少),未经校准的GLOB估计量约为 -1.32,校准GLOB估计量约为 -1.27。关键点:未经校准的GLOB估计量的标准误(SE)比未调整均值差还大(约0.27 vs 0.25的SE ratio),验证了作者的理论观点——未校准的非线性调整可能有害;而校准后的GLOB SE显著减小(SE ratio < 1),且置信区间更窄。
- 这个例子想说明什么:验证理论预测:① 未校准非线性回归调整(GLOB)的标准误可能比未调整均值差更大(即“有害”);② 校准后的GLOB不仅恢复无害,还实现了更窄的置信区间,即效率提升。该例子的实际效应量虽然点估计值有所变动,但统计上不是重点——重点是SE的变化模式与理论一致。
🔎 结论是否比证明窄¶
- 具体窄化点:Theorem 1 声称“渐近方差上非劣于未调整均值差和非校准非线性估计量”。但在证明中,对于后者(比较与 \(\hat τ_{GLOB}\) 的比较),作者实际上要求 \(\hat τ_{GLOB}\) 和校准后的估计量共享同一个预测函数(否则比较无效)。在结论陈述中(Theorem 1 的表述)未强调这个共享条件,只是说“calibrated estimator is non-inferior to the uncalibrated nonlinear estimator”——读者可能会误以为是“对所有未校准的非线性估计量”,但证明中隐含的共享预测函数假设是关键。
- Conjecture vs Proof:论文中没有明确的unproven conjecture,但在Supplementary Material中有一句讨论:“我们推测,在高维协变量或非参数模型下,交叉拟合版的校准方法仍可保持无害性,但这超出了当前工作的范围。” 该推测标注为未来工作,目前无严格证明。
- 此外,对于离散结果(如binary outcome),校准GLOB的有限样本表现是否严格优于未调整均值差?模拟中只有计数数据一个例子,Binary结果的全面模拟缺位。
四、开放问题¶
-
高维协变量的校准方法及其无害性证明:当前设定中 \(p\) 固定有限,且预测函数由低维参数模型(如GLM)得到。当 \(p\) 随 \(N\) 增长时(高维设定),校准后的非线性GLOB估计量能否保持渐近非劣?需要解决在高维下校准logistic回归可能面临的不稳定性问题。(扎根于:Section 6 "Discussion" 中提及 "an extension to high-dimensional covariates is of interest, but beyond the scope of this work。")
-
连续处理或非二值处理的Oaxaca–Blinder校准:本文的方法聚焦于二值处理(随机实验)。对多值处理、连续处理或有序处理,GLOB框架以及相应的校准方法如何推广?是否仍有类似的“无害IPW等价性”?(扎根于:Section 1 的intro只讨论了二值处理,而Oaxaca–Blinder的二值性质被多次强调。)
-
校准方法的有限样本最优性:本文证明了危险避免(非劣性),但未被证明达到半参数效率下限(即当非线性模型正确指定时,校准是否会损失效率?)。目前在模型正确指定时,校准可能会引入额外的方差(因为logistic回归步骤引入参数变化的变异性),但文中没有量化。能否构造一个校准版本,在模型正确时仍有效、模型错误时仍无害?这类似于双稳健(doubly robust)估计量的设计思路。(扎根于:Section 5 的模拟中校准后的GLOB在模型正确时效率略低于未校准的GLOB(但差距小),但未被正式分析。)
-
校准与已知倾向得分的连接:在随机实验中,倾向得分是已知的(\(p\))。本文的校准方法产生的是“估计的”倾向分(基于预测的潜在结果)。是否有途径将已知倾向分信息纳入校准步骤,以获得半参数有效的结果?(扎根于:Theorem 2 的渐近等价性说明校准 = IPW with estimated propensity,既然真实倾向分已知,这里就产生了浪费已知信息的可能。)
Maintained by 陈星宇 · Homepage · Source on GitHub