Incorporating nonparametric methods for estimating causal excursion effects in mobile health with zero-inflated count outcomes¶
作者: Xueqing Liu, Tianchen Qian, Lauren Bell, Bibhas Chakraborty
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv
一、领域脉络与小综述¶
这个方向是什么¶
这个子方向聚焦于移动健康(mHealth)微随机试验(MRT)中的因果效应估计。MRT 是一种实验设计,其中每个参与者在大量时间点(如每天数百次)被随机分配是否接受某种干预(如推送通知)。核心的统计问题是:如何定义并估计一个时变的、边际化的因果效应(即“因果瞬时效应”,causal excursion effect),该效应允许研究者回答“在给定当前情境下,发送干预是否比不发送更有效?”以及“这种效果是否随时间或个体特征变化?”当前,该方向已从处理连续和二元结局,发展到处理更复杂的数据类型(如零膨胀计数),并开始引入非参数和双稳健估计方法。
发展脉络(history)¶
奠基工作:MRT 设计与因果效应的形式化定义 - Klasnja et al. (2015) / Liao et al. (2016):提出了 MRT 的概念和样本量计算方法,为后续因果推断提供了实验设计基础。本文引用称其为“touchstone methodology”。 - Boruvka et al. (2018):首次在 MRT 框架下,使用潜在结果(potential outcomes)形式化定义了时变效应调节(time-varying effect moderation),并提出了加权中心最小二乘(WCLS)估计量。本文引用称其“创新性地扩展了因果瞬时效应的概念”。
主要进展:从连续到二元结局,以及因果瞬时效应的精炼 - Qian et al. (2021a):将因果瞬时效应(ECE)和边际瞬时效应(EMEE)的定义推广到二元结局,并提出了半参数、局部有效的估计量。这是本文最直接的前身。本文引用称其方法“最初是为二元结局开发的”。 - Guo et al. (2021) / Kim et al. (2021):在讨论中指出了 ECE 的一个关键性质——当只对部分历史条件化时,边际瞬时效应依赖于过去治疗分配的随机化概率。本文引用引用了这一讨论,并指出 Kim et al. 的讨论中已提出将 ECE 扩展到计数结局的估计方程,但假设了参数化工作模型。
当前 Frontier:处理更复杂结局(零膨胀计数)与引入非参数/双稳健方法 - Yu et al. (2023):针对零膨胀非负结局(如游戏数据),提出了乘法结构嵌套均值模型(multiplicative SNMM),并建立了双向渐近理论(bidirectional asymptotics,即个体数或时间点任一趋于无穷时估计量一致)。本文直接借鉴了其双向渐近框架。 - Shi & Dempsey (2023):提出了双稳健的 WCLS(DR-WCLS) 方法,从元学习(meta-learner)视角估计因果瞬时效应,并处理了随机化概率未知、数据缺失等问题。本文引用称其方法为“灵活且双稳健的推断程序”。 - 本文(Liu et al., 2024):将 ECE/EMEE 框架从二元结局扩展到零膨胀计数结局,并首次引入非参数技术(核平滑/样条)来估计时间趋势和协变量的影响,而非假设参数化模型。同时,建立了所提估计量的双向渐近性质。
子线索聚类¶
这些被引文献大致落在以下三条子线索上:
- MRT 设计与因果效应定义:以 Klasnja et al. (2015), Liao et al. (2016), Boruvka et al. (2018), Qian et al. (2022) 为代表。核心是建立 MRT 的实验设计原则,并定义适用于该设计的因果 estimand(如 ECE, EMEE)。这是整个领域的基石。
- 特定结局类型的估计方法:以 Qian et al. (2021a)(二元结局)、Kim et al. (2021)(计数结局的参数化扩展)、Yu et al. (2023)(零膨胀非负结局的 SNMM)、以及本文(零膨胀计数结局的非参数扩展)为代表。这条线索的核心是,针对不同数据特征(连续、二元、计数、零膨胀),开发相应的识别条件和估计方程。
- 估计方法的稳健性与灵活性:以 Shi & Dempsey (2023)(双稳健 WCLS)、以及本文引入的非参数技术为代表。这条线索关注如何放松对模型(如线性、参数化)的依赖,通过双稳健性或非参数平滑来提高估计的可靠性。
这个方向在追问的核心问题¶
- 如何定义因果瞬时效应? 当干预是时变的、且只对部分历史条件化时,如何确保 estimand 的因果解释是清晰的,且不依赖于过去治疗的分配机制?
- 如何处理复杂结局? 对于零膨胀、过离散、或具有特殊分布(如计数)的结局,如何设计有效的估计方程和推断程序?
- 如何平衡模型假设与稳健性? 在 MRT 这种高维、时序相关的数据中,是采用参数化模型(简单但可能错误)还是非参数/半参数方法(灵活但需要更多数据)?双向渐近理论如何为后者提供理论支持?
- 如何应对实际数据中的挑战? 如随机化概率记录错误、数据缺失、未测量的混杂等,如何通过敏感性分析或双稳健方法进行缓解?
⚠️ 作者的 framing(必须明确标注成“这是作者的说法”)¶
- 作者把缺口 frame 成什么? 作者在引言中明确指出:“existing research mainly focuses on continuous or binary data, leaving count data largely unexplored.” 并且,对于计数结局,Kim et al. (2021) 的扩展“assumes a parametric working model for E(Y_{t,1} | H_t, A_t=0, I_t=1)”。因此,作者将缺口定位为:缺乏针对零膨胀计数结局的、且不依赖参数化工作模型的因果瞬时效应估计方法。本文的贡献就是填补这个缺口。
- 哪些竞争路线被他淡化或回避了? 作者淡化了参数化模型的路线。虽然引用了 Kim et al. (2021) 的参数化扩展,但将其定位为“假设参数化工作模型”,从而凸显自己引入非参数技术的必要性。作者也回避了与乘法 SNMM(Yu et al., 2023) 的直接竞争。Yu et al. 的方法也处理零膨胀结局,但使用的是乘法结构模型和 G-估计,而本文使用的是加性模型和加权估计方程。作者没有详细比较这两种框架在 MRT 设定下的优劣。
- 什么明显该被引/该存在、却没出现在 intro 里? 作者没有引用Nie & Wager (2017) 或 Kennedy (2020) 关于异质性处理效应(CATE)估计的“准 Oracle”或“双稳健”方法。虽然这些工作不是专门针对 MRT 的,但它们提出的“用非参数方法估计 nuisance 函数,然后代入目标函数”的通用框架,与本文“用核平滑估计 nuisance 函数,然后代入加权估计方程”的思路高度相关。引用它们可以为本文的非参数策略提供更广泛的文献支撑。此外,作者没有引用任何关于零膨胀计数数据的因果推断的综述性文章,如 Hu et al. (2011),这可能会让不熟悉该领域的读者觉得背景铺垫不够充分。
张力¶
未见明显对立引用。所有被引工作基本沿着“从简单到复杂”、“从参数到非参数”的路径演进,彼此之间是互补和递进关系,而非矛盾关系。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
i = 1, ..., n:个体索引。t = 1, ..., T:决策时间点索引。A_{i,t} ∈ {0, 1}:在时间t对个体i的干预分配(如是否发送通知)。A_{i,t}=1表示发送干预。Y_{i,t}:在时间t之后观测到的近端结局(proximal outcome)。本文中,它是零膨胀计数,如干预后一小时的屏幕浏览次数。I_{i,t} ∈ {0, 1}:可用性指示符(availability indicator)。I_{i,t}=1表示个体i在时间t是“可用”的(即可以被随机化)。这是 MRT 的关键特征,因为个体并非在所有时间点都适合接受干预。H_{i,t}:在时间t之前观测到的历史协变量(包括过去的干预、结局、时间趋势等)。S_{i,t} ⊆ H_{i,t}:研究者感兴趣的调节变量子集(moderator subset)。因果瞬时效应就是条件于S_{i,t}的。p_t(H_{i,t}):随机化概率。P(A_{i,t}=1 | H_{i,t}, I_{i,t}=1) = p_t(H_{i,t})。在 MRT 中,这个概率通常是已知的(由实验设计决定)。Y_{i,t}(a):潜在结局(potential outcome)。如果个体i在时间t被分配了干预a,将会观测到的结局。β:因果瞬时效应(ECE)的参数。本文假设 ECE 是S_{i,t}的线性函数:ECE(S_{i,t}) = β^T S_{i,t}。f_t(H_{i,t}):nuisance 函数。代表在无干预(A_{i,t}=0)且可用(I_{i,t}=1)的条件下,结局的条件期望:E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1]。这是本文用非参数方法估计的对象。
-
模型:
- 数据生成机制:数据来自一个 MRT。在每个时间点
t,对于每个可用个体i,干预A_{i,t}以已知概率p_t(H_{i,t})被随机分配。结局Y_{i,t}在干预后观测到。这是一个边际结构模型(marginal structural model)的变体,但 estimand 是条件于S_{i,t}的瞬时效应。 - 因果模型:本文假设一个加性因果模型(additive causal model),即干预的效果是加在无干预时的结局均值之上的:
E[Y_{i,t}(a) | H_{i,t}, I_{i,t}=1] = f_t(H_{i,t}) + a * ECE(S_{i,t})其中ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]。 - 要估的对象:
β(即ECE(S_{i,t})的参数)。f_t(H_{i,t})是 nuisance 参数,需要被估计但本身不是主要兴趣。
- 数据生成机制:数据来自一个 MRT。在每个时间点
-
可观测数据:
- 可观测:对于每个
(i, t),我们可以观测到(A_{i,t}, Y_{i,t}, I_{i,t}, H_{i,t}, S_{i,t})。随机化概率p_t(H_{i,t})是已知的设计参数。 - 不可观测:对于每个
(i, t),我们只能观测到Y_{i,t} = Y_{i,t}(A_{i,t}),即与分配干预对应的那个潜在结局。反事实结局Y_{i,t}(1-A_{i,t})是不可观测的。此外,f_t(H_{i,t})是未知的,需要从数据中估计。
- 可观测:对于每个
第二步:讲最小内核¶
本文的核心思路可以用一个最简特例来理解:假设没有时间趋势,且 S_{i,t} 只包含一个常数项(即我们只关心平均因果瞬时效应)。
-
最简设定:
- 所有个体在所有时间点都可用:
I_{i,t}=1。 - 随机化概率是常数:
p_t(H_{i,t}) = p(例如,p=0.5)。 - 我们只关心平均效应:
ECE(S_{i,t}) = β(一个标量)。 - 无干预时的结局均值也是常数:
f_t(H_{i,t}) = μ(一个标量)。
- 所有个体在所有时间点都可用:
-
核心思路: 在这个最简设定下,因果模型简化为:
E[Y_{i,t} | A_{i,t}] = μ + A_{i,t} * β这是一个简单的线性模型。如果我们用 OLS 回归
Y对A,得到的β估计量是:β̂_OLS = Cov(Y, A) / Var(A)由于
A是随机化的(E[A] = p),我们有Cov(Y, A) = E[Y*A] - E[Y]E[A]。代入模型:E[Y*A] = E[(μ + Aβ)*A] = μp + βE[A^2] = μp + βp(因为A^2 = A)E[Y] = μ + βp所以Cov(Y, A) = (μp + βp) - (μ + βp)p = βp(1-p)而Var(A) = p(1-p)。 因此β̂_OLS = β,即 OLS 是无偏的。 -
为什么需要加权? 在更一般的 MRT 中,随机化概率
p_t(H_{i,t})可能随时间或历史变化(例如,为了适应个体行为而改变)。此时,简单的 OLS 会失效。为了得到一致估计,我们需要使用逆概率加权(IPW)。核心思想是:给每个观测值(i,t)赋予一个权重W_{i,t} = A_{i,t}/p_t(H_{i,t}) + (1-A_{i,t})/(1-p_t(H_{i,t}))。这个权重可以“平衡”由于非恒定随机化概率带来的选择偏差。 -
为什么需要中心化? 即使使用了 IPW,如果
f_t(H_{i,t})不是常数,而是与A_{i,t}相关(例如,f_t随时间变化,而随机化概率也随时间变化),那么 IPW 估计量仍然可能有偏。中心化(centering)是解决这个问题的关键。具体来说,我们不直接回归Y对A,而是回归Y - f̂_t(H_{i,t})对A - p_t(H_{i,t}),其中f̂_t是f_t的估计。这个技巧可以消除f_t与A之间的相关性带来的偏差,使得估计量对f_t的估计误差具有鲁棒性。 -
本文的最小内核: 本文的核心就是将上述“加权 + 中心化”的估计方程,从参数化
f_t的设定(如 Kim et al., 2021),推广到用非参数方法(如核平滑)估计f_t。在这个最简特例下,f_t可能只是一个随时间平滑变化的函数μ(t)。本文的方法就是用核平滑来估计μ(t),然后代入中心化的加权估计方程。这个看似简单的推广,在理论上需要处理非参数估计带来的额外变异性,并建立双向渐近理论。
三、这篇论文做了什么¶
三句话¶
- 研究了什么问题:在移动健康微随机试验(MRT)中,针对零膨胀计数结局(如 Drink Less 试验中的屏幕浏览次数),定义并估计因果瞬时效应(ECE)。
- 核心工具/方法:提出了三类估计量——ECE-NonP(基于 ECE 定义的非参数扩展)、EMEE-NonP(基于 EMEE 定义的非参数扩展)、以及DR-EMEE-NonP(双稳健版本)。这些估计量的核心是:使用非参数技术(核平滑或样条) 估计 nuisance 函数
f_t(H_{i,t}),然后将其代入加权和中心化的估计方程。 - 主要结论:建立了所提估计量的双向渐近性质(bidirectional asymptotics),即当个体数
n → ∞或时间点T → ∞时,估计量均具有一致性和渐近正态性。模拟研究验证了有限样本性能,并在 Drink Less 试验数据上展示了方法的应用。
关键设定与假设¶
在第二节最小记号的基础上,补全完整设定:
-
关键定义:
- 因果瞬时效应(ECE):
ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]。这是本文的主要 estimand。 - 边际瞬时效应(EMEE):
EMEE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}]。与 ECE 的区别在于,EMEE 不对I_{i,t}=1条件化,因此它衡量的是“在给定当前情境下,如果发送干预(无论个体是否可用),会有什么效果”。本文同时考虑了这两种 estimand。
- 因果瞬时效应(ECE):
-
关键假设:
- 一致性(Consistency):
Y_{i,t} = Y_{i,t}(A_{i,t})。即观测到的结局等于其对应的潜在结局。 - 无未测量混杂(No Unmeasured Confounding):
A_{i,t} ⟂ Y_{i,t}(a) | H_{i,t}, I_{i,t}=1。由于 MRT 中干预是随机化的,这个假设自动满足。 - 正性(Positivity):
0 < p_t(H_{i,t}) < 1对所有(i,t)成立。即每个个体在每个时间点都有非零的概率被分配或不被分配干预。 - 模型假设:
ECE(S_{i,t}) = β^T S_{i,t}。即因果瞬时效应是调节变量的线性函数。这是一个工作模型,不一定正确,但估计量在模型误设下仍能估计出“最优线性近似”。 - Nuisance 函数假设:
f_t(H_{i,t}) = E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1]是某个光滑函数,可以用非参数方法(如核平滑)一致估计。
- 一致性(Consistency):
-
相比已有文献的放宽/强化:
- 放宽:相比 Kim et al. (2021) 的参数化假设,本文放宽了对
f_t的模型假设,允许其以非参数形式存在。 - 强化:相比 Qian et al. (2021a) 的二元结局,本文处理的是更复杂的零膨胀计数结局,需要更复杂的估计方程(如使用对数链接或处理零膨胀的特定方法)。
- 放宽:相比 Kim et al. (2021) 的参数化假设,本文放宽了对
主要结果¶
本文的理论结果主要围绕三个估计量展开:
-
ECE-NonP 估计量:
- 定义:通过求解一个加权和中心化的估计方程得到。核心是使用非参数估计
f̂_t(H_{i,t})替换真实的f_t。 - 定理 1:在正则条件下,
ECE-NonP估计量β̂是双向一致的(bidirectionally consistent),即当n → ∞或T → ∞时,β̂ → β。并且,它是双向渐近正态的,即√(nT)(β̂ - β) → N(0, Σ)。 - 技术难点:证明的关键在于处理非参数估计
f̂_t带来的“一阶偏差”(first-order bias)。作者通过中心化技巧(centering)消除了这个偏差,使得f̂_t的收敛速度不影响β̂的√(nT)收敛速度。这类似于双稳健估计中的“Neyman orthogonality”性质。
- 定义:通过求解一个加权和中心化的估计方程得到。核心是使用非参数估计
-
EMEE-NonP 估计量:
- 定义:与 ECE-NonP 类似,但估计方程是针对 EMEE 定义的。它需要额外估计一个“可用性概率”
P(I_{i,t}=1 | S_{i,t})。 - 定理 2:在正则条件下,
EMEE-NonP估计量也是双向一致且渐近正态的。 - 技术难点:EMEE 的估计方程更复杂,因为它需要对
I_{i,t}进行边际化。作者通过引入一个额外的权重来处理这个问题。
- 定义:与 ECE-NonP 类似,但估计方程是针对 EMEE 定义的。它需要额外估计一个“可用性概率”
-
DR-EMEE-NonP 估计量:
- 定义:这是 EMEE-NonP 的双稳健版本。它除了需要估计
f_t外,还需要估计一个“条件期望”E[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1]。如果这两个 nuisance 函数中有一个被正确估计,那么估计量就是一致的。 - 定理 3:在正则条件下,
DR-EMEE-NonP估计量是双向一致且渐近正态的,并且具有双稳健性。 - 技术难点:证明双稳健性需要更精细的偏差分析。作者使用了一种“双稳健中心化”技巧,使得估计方程对两个 nuisance 函数的估计误差都具有一阶不敏感性。
- 定义:这是 EMEE-NonP 的双稳健版本。它除了需要估计
证明路线与技术技巧¶
-
整体路线:
- 写出估计方程:将目标 estimand 的识别条件转化为一个矩条件(moment condition),即
E[ψ(O; β, η)] = 0,其中O是可观测数据,η是 nuisance 参数(如f_t)。 - 构造样本类比:用样本矩
(1/nT) Σ ψ(O_{i,t}; β, η̂)代替总体矩,其中η̂是η的非参数估计。 - 求解估计方程:解出
β̂。 - 渐近分析:将
β̂的误差分解为两部分:一部分来自η̂的估计误差,另一部分来自样本平均的随机误差。通过证明中心化技巧使得第一部分误差是“高阶小量”(即o_p(1/√(nT))),从而主导项是第二部分,进而得到√(nT)收敛和渐近正态性。
- 写出估计方程:将目标 estimand 的识别条件转化为一个矩条件(moment condition),即
-
关键跳跃点:
- 跳跃点 1:处理非参数估计的偏差。最吃功夫的引理是证明
(1/nT) Σ [ψ(O_{i,t}; β, η̂) - ψ(O_{i,t}; β, η)] = o_p(1/√(nT))。这个引理需要用到非参数估计的收敛速度(如核估计的均方误差)和 empirical process 理论。 - 跳跃点 2:双向渐近的证明。传统的渐近理论通常假设
T固定,n → ∞。但在 MRT 中,T也可能很大。作者需要证明,无论n和T哪个趋于无穷,结果都成立。这需要处理“双索引”的 empirical process,并证明一个双向的 CLT(bidirectional central limit theorem)。
- 跳跃点 1:处理非参数估计的偏差。最吃功夫的引理是证明
-
技术技巧点名:
- 核平滑(Kernel Smoothing):用于估计
f_t(H_{i,t})。作者假设f_t是时间t和协变量H_{i,t}的光滑函数,然后用 Nadaraya-Watson 核估计或局部线性回归来估计它。 - 加权和中心化估计方程(Weighted and Centered Estimating Equation):这是本文方法的核心。权重是 IPW 权重,用于处理非恒定随机化概率;中心化是减去
f̂_t,用于消除 nuisance 函数带来的偏差。 - 双向渐近理论(Bidirectional Asymptotics):借鉴自 Yu et al. (2023)。作者证明,在适当的混合条件下,当
n → ∞或T → ∞时,估计量都收敛。这比传统的“固定T,n → ∞”的设定更符合 MRT 的实际。 - 双稳健性(Double Robustness):DR-EMEE-NonP 估计量具有双稳健性,即只要
f_t或E[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1]中有一个被正确估计,估计量就是一致的。这通过构造一个“双稳健”的估计方程实现。
- 核平滑(Kernel Smoothing):用于估计
真实例子与应用¶
- 使用的数据/场景:Drink Less 试验(Bell et al., 2020)。这是一个旨在帮助英国成年人减少饮酒的智能手机应用。试验中,每天晚上 8 点,用户会被随机分配是否收到一条旨在提高应用参与度的通知。近端结局是通知发送后一小时内用户的屏幕浏览次数。这个结局是零膨胀的(很多用户根本不看),且是计数数据。
- 如何应用:作者将本文提出的三个估计量(ECE-NonP, EMEE-NonP, DR-EMEE-NonP)应用于 Drink Less 数据。他们定义了调节变量
S_{i,t}为时间趋势(如研究天数)和一些基线协变量。他们使用核平滑来估计f_t(即无通知时的期望屏幕浏览次数,作为时间的函数)。 - 得到的结果:
- 估计的因果瞬时效应(ECE)表明,发送通知在短期内(一小时内)显著增加了屏幕浏览次数。
- 这种效应随时间变化:在试验初期效应较大,但随着时间推移逐渐减弱。
- 不同估计量(ECE-NonP vs. EMEE-NonP)给出了略有不同的效应大小,但定性结论一致。
- 这个例子想说明什么:
- 验证理论:展示了所提方法在真实数据上的可行性。
- 展示优势:通过非参数估计
f_t,方法能够捕捉到时间趋势,而参数化方法可能无法做到这一点。 - 提供洞见:发现了干预效果随时间衰减的现象,这为优化干预策略(如改变通知内容或频率)提供了有价值的线索。
🔎 结论是否比证明窄¶
- 窄结论 1:定理中假设
f_t是“足够光滑”的,且核平滑的带宽选择是“最优”的。在实际应用中,这些条件可能难以验证。作者在模拟中使用了交叉验证选择带宽,但在理论中并未证明这种数据驱动的带宽选择仍然能保证√(nT)收敛。这是一个典型的“理论假设 vs. 实际操作”的差距。 - 窄结论 2:定理的渐近正态性依赖于混合条件(mixing conditions),即数据在时间上的依赖性不能太强。虽然这在 MRT 中是合理的,但作者并未提供检验这些混合条件是否满足的实用方法。
- 泛泛 claim:作者在结论部分声称方法“可以处理零膨胀计数结局”。但严格来说,他们的估计方程并没有专门针对零膨胀建模(如使用 ZIP 或 Hurdle 模型)。他们只是使用了非参数方法,而零膨胀是数据的一个特征,并非模型的一部分。因此,方法对零膨胀的“处理”是隐式的,而非显式的。如果零膨胀是由一个与干预无关的“结构零”过程产生的,那么方法的效率可能会受到影响。
四、开放问题¶
- 更高效的估计:本文的估计量是“半参数有效的”吗?作者没有讨论效率界。一个开放问题是:在非参数
f_t的设定下,β的半参数效率界是什么?本文的估计量是否能达到这个界?扎根点:本文定理只证明了渐近正态性,未给出方差的下界或证明估计量是有效的。 - 数据驱动的带宽选择:本文在模拟中使用了交叉验证选择核平滑的带宽,但在理论证明中假设带宽是确定的。一个重要的开放问题是:证明使用交叉验证等数据驱动方法选择的带宽,仍然能保证估计量的
√(nT)收敛和渐近正态性。扎根点:本文的定理证明依赖于带宽的确定性和最优收敛速度。 - 对未测量混杂的敏感性:虽然 MRT 的随机化保证了无未测量混杂,但实际中可能存在“技术性”的混杂(如随机化概率记录错误,如 Shi & Dempsey (2023) 所指出)。本文没有讨论敏感性分析。一个开放问题是:如何将 Yang & Lok (2018) 的敏感性分析方法扩展到本文的非参数框架下?扎根点:本文在讨论中提到了 Yang & Lok (2018) 的敏感性分析,但并未将其整合到自己的方法中。
- 与乘法模型的比较:本文使用的是加性因果模型。对于零膨胀计数数据,乘法模型(如 Yu et al., 2023 的乘法 SNMM)可能更自然。一个开放问题是:在 MRT 设定下,加性模型和乘法模型各自的优缺点是什么?如何在实际应用中选择?扎根点:本文没有与 Yu et al. (2023) 的乘法模型进行任何理论或模拟上的比较。
Maintained by 陈星宇 · Homepage · Source on GitHub