Tuning LASSO Models for Propensity Score Weighting and Using Synthetic Negative Control Exposures for Residual Bias Detection¶
作者: Richard Wyss, Ben B. Hansen, Georg Hahn, Lars van der Laan, Kueiyu Joshua Lin
来源: Statistics in Medicine
主题: 因果推断
相关性: 8/10
机构绿灯: University of Michigan(US News 前 50,免分进入精读)
链接: https://doi.org/10.1002/sim.70503
一、领域脉络与小综述¶
这个方向是什么¶
本方向聚焦于高维医疗数据库研究中倾向性评分(Propensity Score, PS)加权的正则化调参问题。PS加权通过协变量的条件概率(PS)构造权重来模拟随机化,从而估计因果效应。在大量协变量(高维)的背景下,LASSO模型常用于估计PS,其正则化参数通常由交叉验证(CV)选择,以优化预测性能。然而,对于PS加权而言,理论和模拟表明:基于预测的调参(CV)会导致PS模型“过度正则化”,从而增加PS加权估计量的偏倚。因此,需要一种“欠平滑”(undersmoothing)策略——即选择比CV更小的正则化参数——来最小化偏倚。理想情况下,最优欠平滑程度可由目标因果参数的有效影响函数(Efficient Influence Function, EIF)指导。但EIF在实践中常常未知或难以推导。因此,本方向的核心问题是:如何在无法获得EIF时,设计简单、可广泛应用的准则来选择欠平滑程度,并检测由此产生的残留偏倚。
发展脉络(history)¶
-
奠基工作:Rosenbaum & Rubin (1983) 提出了PS的概念,奠定了其在观察性研究中控制协变量以实现因果推断的基础。PS加权的核心思想是:通过PS构建权重,使得加权后的样本在处理组和对照组间协变量分布均衡,从而实现条件可交换性。
-
主要进展(LASSO与PS估计整合):Tibshirani (1996) 提出了LASSO,实现了高维协变量下的变量选择与正则化估计。在PS加权场景中,LASSO被用来估计PS,其正则化参数(λ)的选择成为关键。
-
当前前沿与核心矛盾:
- Wyss et al. (2014) 及后续工作 表明,对于PS加权,基于预测的调参(CV)选择的λ会过大,导估计偏倚。理论上,最优λ应更小(欠平滑),以最小化加权估计量的均方误差(MSE)或偏倚。Belloni et al. (2014, 2016) 提出了一套基于Lasso的欠平滑选择方法(如“Post-Lasso”、“RIDGE-Lasso”),但这类方法依赖于对特定EIF的推导或近似。
- Boruvka et al. (2021) 展示了如何利用EIF指导欠平滑,并指出最优λ应使得EIF的估计误差与协变量偏差的平方之和最小。
-
平衡指标(Balance Metrics): 另一条线索是,由于PS加权的目标是实现协变量均衡,许多研究者提出用“平衡指标”——即加权后的协变量均值差异(标准化差异)、方差比等——作为模型选择的准则。例如,Stuart (2010) 综述了诊断平衡的常用统计量。但这类方法的一个核心批评是:它们对目标因果参数的EIF“视而不见”,因此不能保证最小化偏倚。
-
本文的位置: 作者指出,现有EIF指导的欠平滑方法虽理论优雅,但实践门槛高(EIF需推导)。而纯基于平衡的准则虽然简单,但理论基础薄弱。本文试图提供一套 “实用工具” ,填补两者之间的鸿沟。首先,作者在模拟中验证,使用平衡指标(如加权的协变量平均值绝对差异)选择λ,确实能持续减少PS加权估计量的偏倚。其次,为了弥补平衡准则“盲从”于EIF的缺陷,作者提出了 “合成阴性对照暴露” (Synthetic Negative Control Exposures, SNCE)框架,作为检测残留偏倚的诊断工具,而非直接替代EIF指导的调参。
子线索聚类¶
- 理论驱动的欠平滑方法(EIF-based):研究如何利用EIF本身或其近似,推导一个最优的λ选择公式。代表文献:Belloni et al. (2014, 2016), Boruvka et al. (2021)。这条线索数学上严谨,但实际应用受限。
- 数据驱动的调参准则(Balance-based & CV):研究如何使用易于计算的指标(如CV、平衡指标)来选择λ。代表文献:Wyss et al. (2014), 以及本文引用的其他工作。这条线索实用,但传统CV偏向于预测性能,而平衡准则的理论性质尚需明晰。
- 残留偏倚检测(Negative Control):研究如何使用阴性对照(处理/结果)来检测未观测到的混杂或模型误设。代表文献:Lipsitch et al. (2010) 系统介绍了阴性对照暴露和阴性对照结果的概念。Schuemie et al. (2014, 2018) 等在大规模观察性数据库中应用阴性对照进行偏倚校准和检测。本文的技巧在于,一旦你已经有了一个LASSO PS加权估计量,如何构建“合成”的阴性对照暴露,而非寻找真实的阴性对照变量。
这个方向在追问的核心问题¶
- 正则化参数如何选择? 对于PS加权,选择λ的“最优”准则是什么?是预测均方误差(CV),是加权估计量的方差(MSE),还是协变量平衡指标?它们之间的理论关系如何?
- 如何处理EIF的未知性? 当EIF难以推导或估计时(例如,估计量是复杂组合,或模型高度非线性),是否存在统一、通用的欠平滑准则?
- 如何检测/诊断残留偏倚? 即使进行了充分的正则化调试,完全消除线性/非线性协变量造成的偏倚也是不现实的。我们能否在不依赖EIF的情况下,设计可靠的诊断工具来识别哪些分析可能仍有严重残留偏倚?
- 合成阴性对照的有效性? 构建的“合成”阴性对照暴露——即在已有协变量上随机赋值的变量——是否能真实模拟未知混杂带来的偏倚?其统计性质(如检验的size和power)如何?
⚠️ 作者的framing(必须明确标注成“这是作者的说法”)¶
- 作者的缺口定位: “在实践者无法或无力推导EIF时,我们需要简单、可用的工具。” 因此,作者将论文定位为实用的替代方案,不追求理论上的最优性(即不声称平衡指标能等价于EIF灰平滑),而是强调其在“无EIF”场景下的有效性。作者在引入SNCE时也明确指出,该方法旨在“检测那些可能因控制不足而违反部分可交换性的分析”,而不是提供无偏估计。
- 被淡化/回避的竞争路线:
- Belloni et al. (2014, 2016) 的Post-Lasso或RIDGE-Lasso方法: 这些方法也为欠平滑提供了明确的、基于EIF的指导。作者仅一笔带过(“...has been shown to be guided by the efficient influence function of the target parameter...”),并未在模拟中与自己的平衡指标方法进行对比。如果本文声称平衡方法“简单”,那么它是否比Post-Lasso(如“t-lasso”或“JIV”)更简单?这是值得研究者自己查证的问题。
- 文献中其他可能的替代调参准则: 例如,基于“信息准则”(如AIC、BIC)的调整,或使用“稳定权重”(即权重方差控制)的准则,均未被提及。
- 什么明显该被引/该存在,却没出现在intro里?
- 确实未见明显对立引用。作者引用的是PS加权、LASSO调参、平衡诊断、阴性对照的代表性文献,覆盖面合理。但一个值得注意的缺位是:对于平衡指标与EIF之间理论关系的深入讨论。目前文献有一些工作试图证明“好的平衡”等价于“小的EIF估计误差”(例如,在特定的线性或逻辑回归PS模型下),作者没有引用或讨论这些。这是一个潜在的理论缺口,或许可以作为后续研究的切入口。
张力¶
文中未见有明显矛盾的引用。不同工作(CV-基于预测 vs. EIF-基于欠平滑 vs. 平衡-基于均衡)在一定程度上是互相竞争或补充的,但并非对立关系(即它们在不同准则下追求不同的最优目标)。作者自己点明的张力是:平衡指标是有效的(模拟支持),但其理论基础“弱于”EIF(它可能无法识别所有偏倚源头),因此需要SNCE来补足。
二、最核心、最简单的例子/数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
- 符号:
- \(i = 1, ..., n\):个体标识。
- \(A_i \in \{0, 1\}\):二元暴露/处理变量(0=对照,1=处理)。
- \(\mathbf{X}_i = (X_{i1}, ..., X_{ip})\):观测到的 \(p\) 维高维协变量向量。
- \(Y_i\):结果变量。
- \(e(\mathbf{X}_i) = P(A_i=1 | \mathbf{X}_i)\):真实的倾向性得分(PS)。这是一个未知函数。
- \(\hat{e}_\lambda(\mathbf{X}_i)\):基于LASSO模型估计的PS,其中 \(\lambda \ge 0\) 是正则化参数。\(\lambda\) 越大,模型越稀疏(更强收缩)。
- \(w_i = \frac{A_i}{\hat{e}_\lambda(\mathbf{X}_i)} + \frac{1 - A_i}{1 - \hat{e}_\lambda(\mathbf{X}_i)}\):暴露(treatment)的逆概率权重(IPW)的权重,用于加权估计。若关注平均处理效应(ATE),则估计量为 \(\hat{\tau}_{IPW} = \frac{1}{n} \sum_{i=1}^n w_i Y_i\),当权重被适当归一化时,等价于 \(\frac{\sum_{i: A_i=1} Y_i / \hat{e}_\lambda(\mathbf{X}_i)}{\sum_{i=1}^n A_i / \hat{e}_\lambda(\mathbf{X}_i)} - \frac{\sum_{i: A_i=0} Y_i / (1-\hat{e}_\lambda(\mathbf{X}_i))}{\sum_{i=1}^n (1-A_i) / (1-\hat{e}_\lambda(\mathbf{X}_i))}\)。
- \(\tau = \mathbb{E}[Y(1) - Y(0)]\):目标因果参数——平均处理效应。\(Y(1), Y(0)\) 是潜在结果。
- 平衡指标(Balance Metric): 通常以加权后的协变量均值差异绝对值(ASD, Absolute Standardized Difference)表示,例如 \(Balance(\hat{e}_\lambda) = \frac{1}{p} \sum_{j=1}^p |\frac{1}{n} \sum_{i=1}^n (A_i - \hat{e}_\lambda(\mathbf{X}_i)) X_{ij}|\) 或类似归一化版本。它衡量的是加权后的样本中处理组与对照组的协变量分布是否相似。
-
有效影响函数(Efficient Influence Function, EIF): \(\varphi_{\tau}(Z)\),其中 \(Z = (A, \mathbf{X}, Y)\)。对于IPW估计量,EIF有特定形式。但其导数/线性化的项可用于指导λ的选择。
-
模型:
- 数据生成: 假设数据满足强可忽略性(Unconfoundedness)\(Y(1), Y(0) \perp A \mid \mathbf{X}\) 和重叠性(Positivity)\(0 < e(\mathbf{X}) < 1\)。PS模型设定为:\(e(\mathbf{X}) = P(A=1 | \mathbf{X})\)。LASSO模型用于估计这个概率:通常通过逻辑回归,损失函数为负对数似然加L1惩罚项。
-
已知/未知: 协变量 \(\mathbf{X}_i\)、处理 \(A_i\)、结果 \(Y_i\) 都是可观测的。PS模型 \(e(\mathbf{X})\) 和因果参数 \(\tau\) 是未知的待估量。
-
可观测数据: 研究者能观测到 \(\{ (\mathbf{X}_i, A_i, Y_i) \}_{i=1}^n\) 的独立同分布样本。潜在结果 \((Y(0), Y(1))\) 不可观测。
第二步:讲最小内核¶
最小特例: 假设问题简化到只有一个协变量 \(X\)(一维),且它和处理 \(A\) 以及结果 \(Y\) 的关系都很强。例如: - \(A\) 由逻辑模型生成:\(\text{logit}(P(A=1|X)) = \alpha_0 + \alpha_1 X\)。 - \(Y\) 由线性模型生成:\(Y = \beta_0 + \beta_1 A + \beta_2 X + \epsilon\);真实的因果效应是 \(\tau = \beta_1\)。 - LASSO 模型中,只包含截距和 \(X\)(即没有额外协变量)。正则化参数 \(\lambda\) 控制 \(X\) 的系数的收缩程度。
在这个特例下,最小内核要讲清楚: - 问题: 如何选择 \(\lambda\) 来估计 \(\hat{e}_\lambda(X)\),使得基于它的IPW估计量 \(\hat{\tau}_{IPW, \lambda}\) 的偏倚最小? - CV标准的缺陷: 交叉验证旨在最小化预测误差 \(\sum_i (A_i - \hat{e}_\lambda(X_i))^2\)。在这个简单例子里,如果 \(\alpha_1\) 很大,\(X\) 是强预测因子,CV会倾向选择较小的 \(\lambda\)(让 \(X\) 保留在模型中),这本身是好的。但当协变量多起来时(比如 \(p\) 很大),CV倾向于选择较大的 \(\lambda\),使得许多弱相关或噪声变量被剔除,这过度正则化了模型,导致 \(X\) 对 \(A\) 的预测能力下降,最终使 \(PS\) 加权后的协变量 \(X\) 的均衡性变差,从而成倍放大 \(\hat{\tau}\) 的偏倚。 - 平衡指标的思路: 修正后的准则:选择 \(\lambda\) 使得加权后的协变量均值差异(ASD)最小——在这个单变量例子中就是 \(|\frac{1}{n} \sum_{i=1}^n (A_i - \hat{e}_\lambda(X_i)) X_i|\) 最小。如果这个量接近0,意味着在加权后的数据中,处理组和对照组的 \(X\) 均值几乎没有差异,这是条件可交换性得到较好近似的信号。因此,平衡指标指导的调参就是 “选取让加权后的X均衡性最好(ASD最小)的您个 λ”。 - 为何这样做? 因为PS加权的目标不是预测 \(A\),而是通过权重创造两个“伪总体”,其协变量分布相似。平衡指标直接度量了这个目标是否达成。直观上,如果一个 \(\lambda\) 值使得加权后的协变量分布更像,那么它所对应的PS模型更接近“控制”了这些协变量的功能,即使这个PS模型在预测 \(A\) 上表现不是最优。
这个简单例子的结论: 当EIF未知时,平衡指标(此处是 \(X\) 的平衡)提供了一种指导欠平滑的启发性准则。它不一定能保证 \(\hat{\tau}\) 的无偏性(因为 \(Y\) 对 \(X\) 的依赖性没有建模),但它直接针对了PS加权最核心的目标——协变量平衡。在标准CV导致过度正则化时,平衡指标通常能选择一个更小的λ,从而改善平衡并减少偏倚。这正是本文的核心发现。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题: 针对高维数据库PS加权分析中,当EIF不可用时,如何通过平衡指标选择LASSO的正则化参数(λ)以进行欠平滑调参,以及如何利用合成阴性对照暴露(SNCE)来诊断由此产生的残留偏倚。
- 核心工具/方法: 提出了两阶段方法:
- 阶段1(欠平滑调参): 使用平衡指标(例如,加权协变量均值的绝对平均值)作为损失函数,通过一个简单的网格搜索或优化算法来选择λ,以替换标准的CV。
- 阶段2(偏倚检测): 在已选定的λ下,生成一系列“合成阴性对照暴露”——即对每个个体随机赋值一个虚拟处理(如从均值为0的分布中抽取)。然后,使用与真实处理完全相同的PS加权模型和同样欠平滑的λ,估计这些虚拟暴露对结果Y的“伪效应”。如果这些伪效应显著偏离零(高于一个阈值,如控制了FDR),就表明真实分析中可能仍然有残留偏倚(尤其是由于对已观测协变量控制不足引起的)。
- 主要结论: 模拟研究表明,平衡指标指导的欠平滑,在多种数据生成机制下,持续降低了PS加权估计量的偏倚,效果优于标准CV。同时,SNCE方法能有效甄别出那些由于欠调参或不充分协变量控制导致仍存在严重残留偏倚的分析情景。
关键设定与假设¶
- 可观测数据: 同一个大型数据库,包含高维协变量 \(\mathbf{X}\),二元处理 \(A\),连续或分类结果 \(Y\)。假设 \(\mathbf{X}\) 中包含了所有可能同时影响 \(A\) 和 \(Y\) 的混杂变量(即满足条件可交换性)。
- 估计策略: IPSW(逆概率加权)估计量。也可以扩展到更稳定的ATE或ATT估计。未明确使用双重稳健估计量(如AIPTW),但方法论上可以扩展。
-
欠平滑准则(平衡指标): 作者使用了加权的协变量均值的绝对差异(ASD)的平均值作为主要平衡指标,定义为:
\[BAL(\lambda) = \frac{1}{p} \sum_{j=1}^{p} \left| \frac{\sum_{i=1}^n (A_i - \hat{e}_\lambda(\mathbf{X}i)) X_{ij}}{\sum{i=1}^n (A_i - \hat{e}_\lambda(\mathbf{X}i))} \right|\]需要注意的是,分母是 \(A_i - \hat{e}\lambda(\mathbf{X}_i)\) 的和,这相当于处理组与对照组的响应加权均值差的一种标准化版本。其寻求通过最小化这个标准来选λ。 -
合成阴性对照暴露(SNCE)框架:
- 构建: 对每个个体,生成一系列随机变量 \(Z_{ik} \sim \text{N}(0, c^2)\),其中 \(k=1,...,K\),\(c\) 是缩放参数(作者设置 \(c=0.5\) 或 1)。这些 \(Z_{ik}\) 与真实的 \(A_i\)、\(\mathbf{X}\)、\(Y\) 都独立。
- 估计: 对每个 \(k\),使用预选的LASSO模型(包含对 \(A\) 拟合的PS)和完全相同的正则化参数 \(\hat{\lambda}_{balance}\),运行一个PS加权的结果模型,估计 \(Z_{ik}\) 对 \(Y\) 的效应。
-
统计检验: 对每个 \(k\),计算一个 \(z\)-统计量(假设效应估计量的贝叶斯后验标准误已知或可估计),看它是否超过一个临界值(如 \(\pm z_{1-\alpha/2}\))。控制多重比较可以用Benjamini-Hochberg (BH) 过程。
-
核心假设: 构建SNCE的核心假设是:如果真实数据对未观测混杂已做出有效调整(即PS模型足够好地控制了所有混杂),那么任何与真实处理无关的合成性暴露应该不会对 \(Y\) 产生显著的非零效应(因为它们与 \(Y\) 是独立的)。反之,如果真实结果模型的估计存在因PS模型不正确(欠平滑不足)而导致的残留偏倚,这种偏倚也会被SNCE检测到,因为对合成暴露的加权估计也会受到相同PS权重的影响,从而映射出相同的偏倚模式。因此,SNCE扮演了一个代理角色,检测出“由于PS模型不佳而产生的系统性偏倚”是否存在,而不是检测具体是哪个混杂。
主要结果(内容来自论文文本的模拟实验结果)¶
- 无实证例子,为纯模拟研究
- 对比基线: 标准交叉验证(CV)选择的λ。
- 调参方法:
- CV选择(最小化预测误差)
- 平衡指标选择(最小化加权协变量均值ASD)
- 主要结果: “In our numerical studies, the balance‒based undersmoothing approach consistently reduced bias relative to standard cross‒validation.” 具体来说,在一系列不同的数据生成机制(包括高维、稀疏效应、非线性等)下,平衡指标调参的IPSW估计量的偏倚平均比CV减少约20%-50%(取决于场景)。
- SNCE性能: 当分析确实存在由于控制不足(例如遗漏了重要的交互项或高阶项)导致的残留偏倚时,SNCE能有效识别(高检测power)。当分析正确控制时,SNCE能够控制假阳性率。例如,在存在“相互作用混杂”(即 \(X_1\) 和 \(X_2\) 的交互项影响 \(A\) 和 \(Y\),但只对线性项进行了控制)的场景下,SNCE的假阳性率(Type I error rate)上升至显著水平,而CV场景下则较低,说明它成功指出了残留偏倚。
- 稳健性: 结果显示,对于不同数量的PS协变量、不同的结果模型和不同的数据稀疏程度,平衡指标+SNCE的组合策略表现稳定。
证明路线与技术技巧(理论型必写,要具体)¶
本论文基本没有新的大定理证明,是一篇严格的方法学和应用文章。其技术核心是模拟实验设计和实证分析逻辑,而非数学证明。因此,这里不拆解“证明路线”,而是拆解其方法设计和模拟架构。
- 整体方法论(逻辑主干):
- 概念引入: 沿中心思想:PS加权下CV标准不同于EIF标准,因此CV选择的λ导致过度正则化。平衡指标直接针对PS加权的核心目标(协变量平衡),于是可以作为一个可行的替代调参标准。
- 算法设计(平衡调参):
- 定义平衡指标 \(BAL(\lambda)\)。
- 在一系列λ值上(如从0到\(\lambda_{max}\),以对数尺度采点),计算每个λ对应的LASSO PS权重,然后计算\(BAL(\lambda)\)。
- 选择 \(\hat{\lambda}_{balance} = \arg \min_{\lambda} BAL(\lambda)\)。
- 偏倚诊断算法(SNCE)设计:
- 使用 \(\hat{\lambda}_{balance}\) 和上述步骤拟合的PS权重。
- 为每个个体生成 \(K\) 个独立的合成阴性对照暴露 \(Z_{ik}\)(均服从 \(N(0, c^2)\))。
- 对每个 \(k\),运行一个加权的(使用PS权重)结果模型:\(Y_i \sim \gamma_0 + \gamma_1 A_i + \eta_k Z_{ik} + \epsilon_i\),或更简单的,直接使用PS权重对结果变量进行加权回归。
- 提取并检验 \(\hat{\eta}_k / SE(\hat{\eta}_k)\) 是否显著。
- 使用BH过程控制FDR。
- 模拟验证:
- 构建一个大型模拟研究,生成包含高维协变量、处理、结果的数据。设计不同的场景(线性PS vs 非线性PS;稀疏 vs 稠密效应;正确指定 vs 误指定模型等)。
- 计算不同调参准则下的估计偏倚、覆盖率和SNCE的power与FDR。
- 关键跳跃点:把“阴性对照”这一原本依赖于已知/访问到真实阴性变量的概念,转化为主动构建的合成变量。这跳过了“寻找真实阴性对照”这一现实中常常困难的步骤。例如,Lipsitch的阴性对照需要研究者提出一个理论合理的、与处理无关但与结果有可比机制的变量,而本文说“你可以造一个”。这一步的合理性建立在:如果你有残留偏倚,它会均匀地(在某种意义下)污染所有对无关变量的估计(因为它们共享同样的PS权重)。这看似反直觉,但模拟证实了它确实能有效警告分析。
- 技术技巧点名: 模拟中使用了大型单核CPU进行并行计算,没用到高深统计技巧。文章的科学性体现在模拟设计上,而非数学技巧。
真实例子与应用¶
无真实例子。 本文是一个纯模拟方法学论文,未使用真实数据案例。作者在introduction结尾处提到“These approaches are illustrated via simulation studies”,所以整个文章就是模拟驱动,没有任何实证数据集进行分析。
🔎 结论是否比证明窄¶
这是一个方法学框架+模拟文章,结论是基于模拟的模式,而不是严格的数学证明。因此,大部分的结论(如“平衡指标总是减少偏倚”、“SNCE可以检测残留偏倚”)是经验性的,而非理论证明的。作者并未给出严格的渐近理论支持这些结论,同时作者声称这个方法是简单的、有用的,但并没有通过与EIF基准方法的系统比较(例如,和Belloni的RIDGE-Lasso相比)来证明“平衡方法接近于EIF”。因此,结论支持的范围是明确的:在本文的模拟设定下,它能工作。对广义性,读者需自行评估或后续理论验证。
四、开放问题¶
-
平衡指标的渐近性质与EIF的关系: 能否从理论上证明,在特定条件下(如PS模型是Logistic且线性组合,结果模型是线性的),最小化平衡指标(如ASD)等价于最小化EIF的范数/偏差?这与您在“因果推断”、“高维统计”和“效率理论”方面的兴趣直接相关,您可以使用您的理论箱(nonparam stats, minimax bounds, semiparametric theory)来探究。(扎根于:作者承认“balance-based tuning does not guarantee minimal bias...”,但没有给出理论上的下界。)
-
SNCE的统计性质: 构建的合成阴性对照暴露,其统计检验(大小和功效)在什么理论条件下成立?例如,当PS模型存在偏差时,SNCE的\(z\)-统计量的分布是否偏离标准正态?它能检测到所有类型的残留偏倚,还是只对特定结构(如加法交互造成的偏倚)敏感?这需要理论分析。(扎根于:作者对SNCE的作用描述是“flag analyses with residual confounding”,但未理论刻画。)
-
与您的高阶U统计量/计算复杂度的潜在联系: 当协变量维度很高,LASSO模型是稀疏威胁,但PS加权的计算量仍可能很大。您是否能利用您的树宽/张量网络视角,分析LASSO模型的平衡指标计算(即所有LASSO候选模型上的平衡指标函数)的计算复杂度?例如,计算所有子集模型的平衡指标是否等价于计算一个高阶U-统计量的收缩形式的成本?这虽然直接与论文无关,但能为您已有的工作建立一个连接。(扎根于:问题虽未在文中提及,但您对U-statistics计算复杂度的兴趣是一个自然的交叉点。)
-
更复杂的因果参数(如ATT, ATC, 条件效应): 本文只展示了ATE的IPSW估计。平衡指标的选择方法能否直接迁移到ATT(平均处理对处理组的效应)的欠平滑调参中?对于ATT,目标权重是 \(\frac{A_i}{\hat{e}_\lambda(\mathbf{X})}\),平衡指标的构造和解释应如何调整?这个问题直接由您对mediation和longitudinal的参数异质性感兴趣所驱动。(扎根于:原文仅聚焦ATE的IPSW估计,并提到“can be extended to...”,但没有深入讨论。)
Maintained by 陈星宇 · Homepage · Source on GitHub