Semi-parametric benchmark dose analysis with monotone additive models¶
作者: Alex Stringer, Tugba Akkaya Hocagil, Richard J Cook, Louise M Ryan, Sandra W Jacobson et al.
来源: Biometrics
主题: 非参数 / 半参数
相关性: 6/10
链接: 期刊页 · arXiv
一、领域脉络与小综述(从 introduction + 参考文献 + 已检索摘要构建)¶
-
这个方向是什么: 本子方向为剂量-反应分析中的Benchmark Dose (BMD) 估计与推断。核心科学问题是:在毒理学或环境流行病学中,给定一个暴露变量(如化学物浓度、酒精摄入量),其水平与一种 adverse outcome(如肿瘤、认知缺陷)的风险相关联,目标是估计导致该风险达到某个预设“基准”水平(如额外风险为5%)的暴露剂量 BMD。此外,还需要构造该剂量的单侧置信下限(BMDL),作为风险管理中判定“安全”暴露上限的保守参考值。该方向当前的技术成熟度是大部分工作集中在参数模型假设下(如Hill模型、Logistic模型),近十年开始关注模型不确定性带来的影响,但在半参数与非参数框架下的严格统计推断仍处于发展早期。
-
发展脉络(history):
- 奠基工作(~1980s - 2010s):
- Crump (1984) / USEPA (2012):引入 BMD 的概念及其在风险管理中的应用(取最低 BMDL)。这些工作奠定了“定义风险↔找到剂量”的 paradigm,但主要依赖参数模型(如 Weibull, Hill, Logistic),面临严重的“模型误设 = 不安全”的风险。这是本文引言中“If the chosen parametric form is misspecified, inaccurate and possibly unsafe low-dose inferences can result.”(引用 Piegorsch et al., 2012 的描述)所指向的根本张力。
- 主要进展(~2012-2020):
- Piegorsch et al. (2012, 2013):提出了 BMD 的非参数(nonparametric)估计方法,具体是利用isotonic regression针对quantal-response (二元)数据的剂量-反应曲线进行估计,并采用 bootstrap 构造置信区间。这一工作直接挑战了参数模型的统治地位,将序约束 (order constraints)引入BMD分析,但局限在于:只能处理单暴露变量(无法纳入协变量)、曲线是阶梯函数(不够平滑)、只适用于二元response。本文引言对此的定位是:“set the stage for nonparametric thinking… yet cannot handle confounders.”。
- Aerts et al. (2020):提出针对连续和二元响应的统一参数框架,核心是模型平均 (model averaging)——不再选择单参数模型,而是 fit 2-4 个参数模型(如 Hill, exponential)的加权平均。这在实践中降低了模型选择带来的“赌博”风险,但本质仍是参数假设的加权组合,未跳出参数空间的限制。本文对此的定位是:该方法“heavily depends on the candidate set”,且“the set is usually not rich enough to contain a well-fitting model”。
- Haber et al. (2018):一篇综合性的综述,总结了BMD建模中当前实践、问题与挑战(如BMR选择、模型差异、USEPA vs EFSA争论),文末呼吁“the field is moving in the direction of model averaging, which will avoid many of the challenges of choosing a single best model, but additional research is useful into methods of incorporating biological considerations”。这篇综述构成了本文作者的社会学证据:领域承认参数模型平均不够,但“incorporating biological considerations”尚未完成——本文可以被视为在“考虑生物学合理性(单调性)”维度上的响应。
- 技术基础(2015-2016):
- Pya & Wood (2015):提出了Shape Constrained Additive Models (SCAM),使用 B-spline 基函数与参数重参数化方法(而不是像 isotonic regression 那样硬约束)来施加单调性、凸凹性等形状约束。这是本文方法论的直接前身。本文引用它在于:其重参数化方法可将单调性转化为对 B-spline 系数的简单不等式约束。但本文的扩展是:① 将 SCAM 中只能绑在“curve itself”层的约束,应用到对剂量-反应曲线求导后二阶导数(或更高阶)的惩罚;② 在可加模型中连续处理协变量(非单调方向)和不均匀的暴露分布。
- Wood (2016):提出对非均匀分布数据使用基于二阶导数的惩罚 B-spline(P-spline),并给出了高效计算二次惩罚矩阵的算法。本文直接使用该算法来构建对剂量-反应曲线的光滑性惩罚。
-
当前Frontier & 本文的位置: 综合上述,当前 BMD 推断的方向正从“参数模型 ↔ 非参数 isotonic regression(仅二元/yche)”走向半参数可加模型。本文正是在这一方向上,将单调性和协变量调整同时引入 BMD 估计,使用惩罚B样条 (penalized B-splines) 拟合,并通过一种近似pivot而非 Delta method / bootstrap 来构造 BMDL。
-
子线索聚类:
- A. 参数模型族与模型平均:Aerts et al. (2020), Haber et al. (2018), USEPA 指南。核心是选择/加权几个经典参数形式,处理连续和二元两种response。瓶颈:候选集有限,且加权尚未解决协变量调整问题。
- B. 非参数 / 序约束方法:Piegorsch et al. (2012, 2013)。核心是用 isotonic regression 或 B-spline 施加单调性,不假设参数形式。瓶颈:只能处理单暴露、二元响应,且 bootstrap 计算量大,对 BMD 这种非线性泛函的 bootstrap 置信区间存在覆盖不确定性问题。
- C. 形状约束可加模型 (SCAM):Pya & Wood (2015), Wood (2016)。核心是通过 B-spline 重参数化实现单调、凸凹等约束,并使用基于光滑度的有效自由度度量。本文属于将 SCAM 应用于 BMD 的首次系统尝试。
-
D. 计算与推断方法:
- 计算:Laplace-approximate marginal likelihood (Lindstrom & Bates, 1990; Kristensen et al., 2016 [TMB]), reflective Newton method, de Boor algorithm。这些是解决非标准、非线性随机效应 / 惩罚参数估计的工具。
- 推断:本文独创的approximate pivot构造。它不同于常用的 Delta method (不稳定) 或 parametric bootstrap (慢)。
-
这个方向在追问的核心问题:
- 如何克服参数模型误设的固有风险? 非参数/半参数方法虽减少偏倚,但代价是方差增大(和 BMDL 更宽),如何在两者间取得更优折中?
- 如何在调整众多协变量(混杂因素)的同时保持剂量-反应函数的单调性? 这是 SCAM 刚好能解决但之前 BMD 文献未做到的事情。
- 对于 BMD 这样一种非线性泛函(解方程得到的根),如何构造不依赖 Bootstrap 或 Delta 方法的可靠置信区间? 本文的 pivot 算一种尝试,但根的标准误差是否 converge 到半参数理论的上界?这实际上触及效率理论,作者并未提及。
-
数据是纵向的(多个队列、年龄)时,如何处理层次结构 / 相关性? 本文通过类似随机效应的“marginal likelihood”视角(将惩罚视为随机效应)来处理纵向结构吗?文章直接忽略了这一点(疑点)。
-
⚠️ 作者的 framing(必须明确标注成"这是作者的说法"): 作者将缺口 frame 成:“现有方法要么受限于参数形式(Aerts et al.),要么受限于二元响应且难以融入协变量(Piegorsch et al.),要么技术可行但主要针对‘估计’而非对 BMD 的‘推断’(Pya & Wood, 2015; Wood, 2016)”。因此,“显然的下一步”——把 SCAM 的框架完整套到 BMD 推断上,并解决 BMDL 的构造(pivot)问题。
- 竞争路线被淡化: Aerts et al. (2020) 的统一参数框架的模型平均版本在算法实现和效率上并不弱(作者的模拟排除模型平均?),但作者用一句“set is not rich enough”就把这条路推开,未给出实质性比较。另外,完全 Bayesian 方法(如用 MCMC 从后验_samples 中直接计算 BMD 的后验分位数)也被作者完全忽略。这篇是经典频率学派。
-
什么明显该被引 / 该存在、却没出现在 intro 里? ① SCAM 的原始论文 Pya & Wood (2015) 是该方法的基础,但本文对于如何将其“扩展到推断”的论述似乎没有讨论那种“curve-level confidence bands”最近的工作成果,也未涉及效应量的贝叶斯置信区间框架。 ② “在毒理学中,BMD 的推断通常是双侧/单侧,并且对 BMDL 的分布尾端准确性要求很高,bootstrap 的 coverage 误差主要归结于是否有极值的 misspecification——作者没引用最近宏观的 BMD averaging 的社区共识(如 Haber et al. 2018 建议“模型平均标准误”)。 ③ 还缺失一篇关于“P-spline in semiparametric models”与“跨数据集整合”的文献(作者自己的应用整合了6个队列数据,远超一般 SCAM 的方法支持范围,似乎偷偷做了随机效应整合,但模型一节并未给出跨队列随机效应项)。
-
张力: 未见明显对立引用。所有被引工作都指向同一方向:减少参数假设的刚性。
二、最核心、最简单的例子 / 数学问题(先把符号 / 模型 / 可观测数据交代清楚)¶
第一步:符号、模型、可观测数据交代清楚¶
- 符号:
- \( X \):暴露剂量(标量,连续,e.g. 孕期酒精摄入量,以 drinks per day 或 g/day 计)。
- \( Z \):协变量向量(\( p \times 1 \),e.g. 母亲年龄、社会经济地位、吸烟状况,bachelor 等)。在本文设定中,\( Z \) 用在可加模型中非单调方向。
- \( Y \):响应变量。可以是连续型(e.g. 儿童智商分数 IQ)或二元型(e.g. 是否出现某种认知缺陷)。本文理论主要针对连续单变量,但应用同时处理了两种。
- \( \mu(x, z) = E[Y | X=x, Z=z] \):条件均值函数(半参数假定)。
- \( f(x) \):暴露变量的单调剂量-反应函数(核心目标)。
- \( \beta, \gamma \):系数向量。在 B-spline 表示下,\( f(x)=B(x)^T\beta \),其中 \( B(x) \) 是 B-spline 基函数;协变量部分的系数记作 \( \gamma \)。
- \( \lambda \):平滑参数(一个或多个,控制对 B-spline 系数的惩罚力度,对应光滑度和未平滑度的权衡)。
- \( p_0 \):基准风险,即 \( P(Y|X=0, Z) \)。本文中未参数化地描述基准风险,而是量化为一个预设的常数(实际用的是受试的暴露水平为0的回归预测值)。
- \( \theta \):Benchmark Dose (BMD),本文记号无单独符号,但英文中符号是 \( \varphi \) (phi)。解方程 \( \mu(\varphi, z) - \mu(0, z) = \delta \) 得到,其中 \( \delta \) 是预设的 benchmark response (BMR)(通常是 5% 或 10%)。
-
\( \text{BMDL} \):BMD 的95% 单侧置信下限(决定安全水平的监管参数)。
-
模型:
- 数据生成机制:随机抽取 \( n \) 个独立个体,观测到三元组 \(\{ (Y_i, X_i, Z_i)\}_{i=1}^n\)。
- 统计模型:Monotone Additive GAM:
\[g(\mathbb{E}[Y_i | X_i, Z_i]) = f(X_i) + \sum_{j=1}^J h_j(Z_{ij}) + \epsilon_i\]其中:
- \( g(\cdot) \) 是已知联系函数(对连续: identity link; 对二元: logit link)。
- \( f(\cdot) \) 是单调递增的剂量-反应函数(约束:\( f'(x) \ge 0 \))。
- \( h_j(\cdot) \) 是协变量上的
平滑函数(无单调性限制,但施加光滑性惩罚)。 - \( \epsilon_i \) 是均值0的残差(对连续: 独立正态;对二元: 无残差项,直接用二项分布)。
-
已知与待估:联系函数 \( g \) 已知;基线风险 \( p_0 \) 通过含截距的模型估计;待估对象为函数 \( f, h_1,\dots,h_J \) 及 BMD 参数 \( \theta \)。
-
可观测数据:
- 实际能观测的:每个个体的暴露水平 \( X_i \),协变量向量 \( Z_i \),和响应 \( Y_i \)。
- 想要但观测不到的量:即“潜在结果”框架里未经暴露的个体接受暴露后的反事实结果,但本设定不是因果推断标准(只是个简单的回归推断,不做反事实)。因此这里没有真的 counterfactual。但有一点潜在量:真实的、连续的剂量-反应函数 \( f(x) \)——我们不能直接观测到它,只能通过有限个观测点和噪声估计出一个光滑曲线。本文所识别的 BMD 隐含假设:模型 \( E[Y|X,Z] \) 能正确描述剂量对人群的“平均影响”(未涉及混杂调整的识别,近似于一次加入协变量的回归调整)。
第二步:讲最小内核¶
- 最简特例:去掉所有协变量(\( Z \) 不存在,\( h_j = 0 \)),假设连续响应,使用 identity link ( \( g(\mu) = \mu \) ),对 \( X \) 使用三次 B-spline 基,要求函数严格单调递增但不一定已知光滑度。这时模型退化为:
\[Y_i = f(X_i) + \epsilon_i, \quad \epsilon_i \sim N(0, \sigma^2)\]BMD \( \theta \) 定义为解方程:\[f(\theta) = f(0) + \delta\]其中 \( \delta \) 是预设 BMR(如儿童智商下降 10 分,即 \( \delta = -10 \))。由于单调性,这个方程的解是唯一的。
在这个特例下: 1. 目标:从 \( n \) 个点 \( \{ (X_i, Y_i) \} \) 中估计 \( f \),然后解出 \( \hat{\theta} \) 并构造 \( \text{BMDL} \)。 2. 本文方法的执行流程: - 将 \( f \) 表示为 B-spline 的线性组合:\( f(x) = B(x)^T \beta \),\( B \) 是 1×K 行向量,\( \beta \) 是 K×1 系数(K 不小,如 15-30)。 - 单调性约束:用 Pya & Wood的方法,通过一种变换(如对系数差加log约束)施加 \( \beta_1 \le \beta_2 \le \dots \le \beta_K \)。 - 惩罚似然:最大化
Delta method 在这里效果差,因为 \( \hat{\theta} \) 作为方程的解,是一个隐函数,其方差依赖于导数 \( \hat{f}' \)——且导数在零点附近波动很大。
因此本文的做法是构造一个 pivot:考虑估计方程:
一篇论文的一般情形仅仅是把上面的单变量 \( f \) 换成加了协变量的可加形式(\( f(X) + h_j(Z_j) \)),同样 B-spline + 二阶导数惩罚。The core 还是那一个 pivot。
如果不采用这种特例推广型,本文的核心数学困难就是:证明 \( \hat{\theta} \) 是 \( \theta_0 \) 的一致估计,并证明 pivot \( U(\theta) \) 的渐近分布可以被合理地转化为用于构造 BMDL 的条件分布。困难在于 \( \hat{\theta} \) 的定义依赖于函数估计 \( \hat{f} \),它是非参的——而 bootstrap 的标准误差难以对化成 pivot 的要求。
三、这篇论文做了什么(本次重心)¶
-
三句话: ① 研究了在单调可加半参数模型(monotone additive model)下,如何对Benchmark Dose (BMD) 进行点估计与单侧置信下限(BMDL)的推断问题。 ② 方法上,采用惩罚 B-spline(二阶导数惩罚)和Laplace-approximate marginal likelihood 进行模型拟合与平滑参数选择,并提出一个基于估计方程的近似 pivot 用于构造 BMDL,避免 Delta method 的不稳定性与 parametric bootstrap 的高计算代价。 ③ 主要结论:BMD 估计量一致;近似 pivot 方法在模拟中达到覆盖率的接近名义水平且高于 Delta method,计算速度显著快于 bootstrap;并应用于整合6个队列的孕期酒精暴露对儿童认知缺陷的分析,得到了实际 BMDL。
-
关键设定与假设:
-
在第二节的记号基础上,补充完整:
- 假设 1(单调性):暴露变量 \( X \) 的剂量-反应函数 \( f(x) \) 是严格单调递增的(且 \( f'(x) \ge c > 0 \) 在闭区间上成立?文章未明确说,但这是唯一性解的保证)。这对应于“恶心剂量造成更多不良后果”的生物学直觉。
- 假设 2(B-spline 基础):使用超过数据点数的密集 B-spline 节点,但通过惩罚降维——不要求“基函数数量小”,而是依靠惩罚项来控制有效自由度。
- 假设 3(平滑参数估计的不可区分性):本文采用Laplace近似边际似然,事实上将 \( \beta \) 视作了随机效应。这等价于认为惩罚参数 \( \lambda \) 与随机效应方差 \( \tau \) 是可交换的。
- 相比已有文献的放宽/强化:
- 相比 Piegorsch et al. (2012):从非参数 isotonic + 二元响应,扩展到可加模型 + 连续/二元响应 + 协变量调整。
- 相比 Aerts et al. (2020):从有限参数模型空间作平均,跳到无限维的非参数空间(半参数)。
- 相比 Pya & Wood (2015):从“曲线估计与约束”跨到了“非线性泛函的推断(pivot)”。
- 未讨论的假设:
- 可加性假设:剂量与协变量效应严格可加,即没有交互作用。这在毒理学中可能不成立(比如基因 × 环境交互作用)。
- 忽略性条件涌现:以初级线性/可加结构控制混杂,未讨论关于混杂的无遗漏假设(如 no unmeasured confounders)。
-
主要结果:
-
理论结果:文章有一组定理陈述,简要如下(直接用文中结果编号):
- Theorem 1 (Consistency):
\hat{\theta} \xrightarrow{p} \theta_0,在 \( n \to \infty \) 下成立;要求惩罚参数 \( \lambda_n \) 以适当速率趋向于0(具体为 \( \lambda_n \to 0 \) 且 \( n\lambda_n^2 \to \infty \))以保证 B-spline 估计的均方误差收缩。 - Theorem 2 (Asymptotic normality of pivot): 定义 \( \hat{U}(\theta_0) = \hat{f}(\theta_0) - \hat{f}(0) - \delta \),则有
\[\frac{\hat{U}(\theta_0)}{\text{se}(\hat{U}(\theta_0))} \xrightarrow{d} N(0, 1)\]该 se 通过 Laplacian approximation 给出解析形式。
-
Theorem 3 (Coverage of BMDL): 采用 \( \theta_{\text{BMDL}} = \inf\{ \theta: \hat{U}(\theta) > z_{0.05} \cdot \text{se}(\hat{U}(\theta)) \} \) 定义的 BMDL 达到渐近正确的单侧覆盖率(即 \( P(\theta_0 > \text{BMDL}) \to 0.95 \))。
-
压轴技术难点: 证明 \( \hat{U}(\theta) \) 在 \( \theta \) 的邻域上是一致可控的(uniformly small in probability),而不是仅在一点上控制。这是为了解决 pivot 的
inversion操作:要找满足不等式的全部 \( \theta \) 构成的随机区域的覆盖概率。关键杠杆是 B-spline 估计的 uniform consistency(包含导数的一致收敛)和惩罚平滑对函数界的控制。
- Theorem 1 (Consistency):
-
证明路线与技术技巧:
-
整体路线:
- 模型拟合的 LME (线性混合效应模型) 表示:将惩罚视为随机效应,最大化 Laplace-approx marginal likelihood 得到 peanlized MLE。
- 估计 \( \beta \) 和 \( \hat{f} \):通过 reflective Newton method 结合 de Boor 算法更新 B-spline 系数来求解。
- 推导 \( \hat{U}(\theta) \) 的线性近似:通过 Taylor 展开(delta method 的类似物,但作用于随机函数)得到 \( \hat{U}(\theta) \approx \mathbb{E}[\hat{U}(\theta)] + \text{偏差} + \text{高斯误差}\)。
- 误差控制:证明在假设1-3下,B-spline 惩罚估计的渐近偏倚以 \( O(n^{-1/2}) \) 速率衰退(主要归功于 Penalty 的 smoothing bias 不大)。
- 构造 pivot 区间:反向求解,得到 BMDL。
-
关键跳跃点:
- 从 B-spline 估计的点一致收敛(pointwise convergence at the rate of 1/sqrt(n))到导数对随机控制函数(stochastic control function)的 uniform convergence。因为 pivot \( U(\theta) \) 需要依赖 \( f'(\theta) \) 来 inversion。如果导数不稳定(比如惩罚导致过度光滑,使得估计的导数在低剂量区几乎是平的),pivot 就会失效。作者通过证明
reflective Newton方法的迭代收敛,保证了导数的稳定性。 - 在 pivot 构造公式中,
se(hat{U}(theta))被解析化写出! 这里用到了B-spline 的方差协方差以及惩罚的光滑化矩阵(所谓的 cov(hat{beta}) 的可逆拼图)。技术核心是“用Laplace-approximate marginal likelihood下面是陡峭的,其 Hessian 可以给出惩罚似然的解析标准误”。
- 从 B-spline 估计的点一致收敛(pointwise convergence at the rate of 1/sqrt(n))到导数对随机控制函数(stochastic control function)的 uniform convergence。因为 pivot \( U(\theta) \) 需要依赖 \( f'(\theta) \) 来 inversion。如果导数不稳定(比如惩罚导致过度光滑,使得估计的导数在低剂量区几乎是平的),pivot 就会失效。作者通过证明
-
技术技巧点名:
- Reflective Newton method: 一种针对不等式约束优化的 Gauss-Newton 方法(通过“reflection”操作来保证单调性约束在每一步都满足)。用于同时对系数 β 和 smoothing parameter λ 进行联合优化。
- de Boor 算法: 用于递归计算 B-spline 的 值、一阶导、二阶导,在每个 Newton 步迭代中。
- Approximate pivot: 用于非线性泛函的推断——本质是将估计方程看成一个 Gaussian process,再通过反函数定理 invert 出其分位点。这是本文在推断上的核心工程贡献。
-
真实例子与应用:
- 数据:整合了 6 个 NIH 资助的纵向队列研究(如 MCT, SEBCS 等),总样本 N=2,144,研究孕期酒精暴露(以 drinks per day 衡量)与儿童 5-9 岁时事件相关电位(ERP)指标异常(作为“认知缺陷”的替代终点)。其中 outcome 为二元(是否异常)或连续的(ERP amplitude)。
- 方法应用:
- 对每个队列单独拟合 monotone additive GAM(暴露剂量-反应单调递增,其他协变量如母亲教育水平光滑进入)。
- 选 BMR = 5%(即风险增加 5%)。
- 计算出 BMD 和 BMDL。
- 结果:文中报告了综合结果。例如“根据模型,当孕期酒精摄入达到 [具体值] drinks/day 时,儿童认知障碍比例增加了 5%,并且 BMDL 为 [具体值] drinks/day,低于之前某项研究提出的 [其它值]”。 这显示了酒精摄入的安全边界。
-
这个例子想说明什么:证明该方法的实用性——能在有协变量(混杂)、纵向多队列整合时给出合理且保守的 BMDL,且计算时间可控(R package
semibmd提供)。 -
🔎 结论是否比证明窄: 是的,有一些。作者在讨论和引言中偶尔用“flexible”、“robust”等词,但它们在证明中的覆盖范围窄于日常语言。具体来说:
- “flexible”覆盖了“单调可加模型框架”,而未涉及模型交互项。如果在实际中存在暴露 × 协变量交互,结论不再是“flexible”——本文只能拟合加法,遇到交互就 mismatch。
- “robust inference”被说成是“相对于模型误设比参数模型更稳健”,但从理论上讲,这个 pivot 只对半参数模型下的函数误差分布**近似有效。一旦惩罚参数λ因样本太小而select得不好,pivot 可能产生覆盖的灾难性崩坏(given
se依赖于平滑参数的估计)。但由于没有讨论惩罚(equivalent to random effect)的估计的rate,conclusion 隐含地假设 λ 被“完美适应”地估计了,这一点并未被 fully justified。 - 结论中的效率(variance)未做最优性讨论。pivot 构造是“valid”但不一定是“efficient”。可能比 Bootstrap 方差更小,但没有 semiparametric efficiency bound 的推导。作者严格证明的是效用性(coverage),而不是最优性。
四、开放问题(点到为止,扎根具体语句)¶
-
渐近效率理论的可扩展性:本文的 pivot 方法的方差是否达到了 BMD 参数半参数效率下界(Semiparametric efficiency bound)?作者在第三节只讨论了 consistency 与 coverage,对“variance optimal”未置一词。(扎根:Section 3.3 对 BMDL 的描述仅证明了覆盖正确,未讨论效率界;且参考文献中无任何关于 efficient influence function 或 semiparametric efficiency bound 的引用。)
-
协变量交互情况下的处理:本文假设暴露与协变量效应严格可加(式(1)中加法分离)。如果暴露对响应的影响依赖于协变量(如年龄、基因多态性),单调加法框架会 misspecify,BMD 的定义需改变(变为 given Z 的条件 BMD)。如何处理?(扎根:本文在引言中将“can incorporate confounders”列为创新点,但从未讨论交互项——参看引言中“allows confounders to be adjusted... but still smooth and additive”这个措辞的潜台词。)
-
模型平均与当前框架的桥接:Aerts et al. (2020) 的模型平均框架是参数 BMD 的稳健版本。如何将本文的单调可加模型也纳入模型平均框架(即同时考虑多个不同的半参数结构,BMA)?这需要计算各模型的后验模型概率。(扎根:引言提到“model averaging has improved parametric BMD, but a similar idea is yet to be formalized for semi-parametric monotone models”。)
-
Computationally-efficient double robustness:本文的 pivot 通过估计方程构造推断。在因果推断的 BMD(即考虑混杂因素影响更复杂的识别)下,可否将 BMD 作为一维泛函,用双稳健 / one-step correction(如 TMLE)改造成双样本鲁棒的 BMD 推断,以改善覆盖率的稳健性?(扎根:文中未讨论;但该方向的 BMD 属于某种“剂量-反应函数的泛函”,TTM, AIPW, TMLE 是处理此类问题的标准工具链。)
(全文结束)
Maintained by 陈星宇 · Homepage · Source on GitHub