跳转至

Incorporating nonparametric methods for estimating causal excursion effects in mobile health with zero-inflated count outcomes

作者: Xueqing Liu, Tianchen Qian, Lauren Bell, Bibhas Chakraborty
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv


一、领域脉络与小综述

这个方向是什么

这个子方向聚焦于移动健康(mHealth)微随机试验(MRT)中的因果效应估计。MRT 是一种实验设计,其中每个参与者在大量时间点(如每天数百次)被随机分配是否接受某种干预(如推送通知)。核心的统计问题是:如何定义并估计一个时变的、边际化的因果效应(即“因果瞬时效应”,causal excursion effect),该效应允许研究者回答“在给定当前情境下,发送干预是否比不发送更有效?”以及“这种效果是否随时间或个体特征变化?”当前,该方向已从处理连续和二元结局,发展到处理更复杂的数据类型(如零膨胀计数),并开始引入非参数和双稳健估计方法。

发展脉络(history)

奠基工作:MRT 设计与因果效应的形式化定义 - Klasnja et al. (2015) / Liao et al. (2016):提出了 MRT 的概念和样本量计算方法,为后续因果推断提供了实验设计基础。本文引用称其为“touchstone methodology”。 - Boruvka et al. (2018):首次在 MRT 框架下,使用潜在结果(potential outcomes)形式化定义了时变效应调节(time-varying effect moderation),并提出了加权中心最小二乘(WCLS)估计量。本文引用称其“创新性地扩展了因果瞬时效应的概念”。

主要进展:从连续到二元结局,以及因果瞬时效应的精炼 - Qian et al. (2021a):将因果瞬时效应(ECE)和边际瞬时效应(EMEE)的定义推广到二元结局,并提出了半参数、局部有效的估计量。这是本文最直接的前身。本文引用称其方法“最初是为二元结局开发的”。 - Guo et al. (2021) / Kim et al. (2021):在讨论中指出了 ECE 的一个关键性质——当只对部分历史条件化时,边际瞬时效应依赖于过去治疗分配的随机化概率。本文引用引用了这一讨论,并指出 Kim et al. 的讨论中已提出将 ECE 扩展到计数结局的估计方程,但假设了参数化工作模型。

当前 Frontier:处理更复杂结局(零膨胀计数)与引入非参数/双稳健方法 - Yu et al. (2023):针对零膨胀非负结局(如游戏数据),提出了乘法结构嵌套均值模型(multiplicative SNMM),并建立了双向渐近理论(bidirectional asymptotics,即个体数或时间点任一趋于无穷时估计量一致)。本文直接借鉴了其双向渐近框架。 - Shi & Dempsey (2023):提出了双稳健的 WCLS(DR-WCLS) 方法,从元学习(meta-learner)视角估计因果瞬时效应,并处理了随机化概率未知、数据缺失等问题。本文引用称其方法为“灵活且双稳健的推断程序”。 - 本文(Liu et al., 2024):将 ECE/EMEE 框架从二元结局扩展到零膨胀计数结局,并首次引入非参数技术(核平滑/样条)来估计时间趋势和协变量的影响,而非假设参数化模型。同时,建立了所提估计量的双向渐近性质。

子线索聚类

这些被引文献大致落在以下三条子线索上:

  1. MRT 设计与因果效应定义:以 Klasnja et al. (2015), Liao et al. (2016), Boruvka et al. (2018), Qian et al. (2022) 为代表。核心是建立 MRT 的实验设计原则,并定义适用于该设计的因果 estimand(如 ECE, EMEE)。这是整个领域的基石。
  2. 特定结局类型的估计方法:以 Qian et al. (2021a)(二元结局)、Kim et al. (2021)(计数结局的参数化扩展)、Yu et al. (2023)(零膨胀非负结局的 SNMM)、以及本文(零膨胀计数结局的非参数扩展)为代表。这条线索的核心是,针对不同数据特征(连续、二元、计数、零膨胀),开发相应的识别条件和估计方程。
  3. 估计方法的稳健性与灵活性:以 Shi & Dempsey (2023)(双稳健 WCLS)、以及本文引入的非参数技术为代表。这条线索关注如何放松对模型(如线性、参数化)的依赖,通过双稳健性或非参数平滑来提高估计的可靠性。

这个方向在追问的核心问题

  1. 如何定义因果瞬时效应? 当干预是时变的、且只对部分历史条件化时,如何确保 estimand 的因果解释是清晰的,且不依赖于过去治疗的分配机制?
  2. 如何处理复杂结局? 对于零膨胀、过离散、或具有特殊分布(如计数)的结局,如何设计有效的估计方程和推断程序?
  3. 如何平衡模型假设与稳健性? 在 MRT 这种高维、时序相关的数据中,是采用参数化模型(简单但可能错误)还是非参数/半参数方法(灵活但需要更多数据)?双向渐近理论如何为后者提供理论支持?
  4. 如何应对实际数据中的挑战? 如随机化概率记录错误、数据缺失、未测量的混杂等,如何通过敏感性分析或双稳健方法进行缓解?

⚠️ 作者的 framing(必须明确标注成“这是作者的说法”)

  • 作者把缺口 frame 成什么? 作者在引言中明确指出:“existing research mainly focuses on continuous or binary data, leaving count data largely unexplored.” 并且,对于计数结局,Kim et al. (2021) 的扩展“assumes a parametric working model for E(Y_{t,1} | H_t, A_t=0, I_t=1)”。因此,作者将缺口定位为:缺乏针对零膨胀计数结局的、且不依赖参数化工作模型的因果瞬时效应估计方法。本文的贡献就是填补这个缺口。
  • 哪些竞争路线被他淡化或回避了? 作者淡化了参数化模型的路线。虽然引用了 Kim et al. (2021) 的参数化扩展,但将其定位为“假设参数化工作模型”,从而凸显自己引入非参数技术的必要性。作者也回避了与乘法 SNMM(Yu et al., 2023) 的直接竞争。Yu et al. 的方法也处理零膨胀结局,但使用的是乘法结构模型和 G-估计,而本文使用的是加性模型和加权估计方程。作者没有详细比较这两种框架在 MRT 设定下的优劣。
  • 什么明显该被引/该存在、却没出现在 intro 里? 作者没有引用Nie & Wager (2017)Kennedy (2020) 关于异质性处理效应(CATE)估计的“准 Oracle”或“双稳健”方法。虽然这些工作不是专门针对 MRT 的,但它们提出的“用非参数方法估计 nuisance 函数,然后代入目标函数”的通用框架,与本文“用核平滑估计 nuisance 函数,然后代入加权估计方程”的思路高度相关。引用它们可以为本文的非参数策略提供更广泛的文献支撑。此外,作者没有引用任何关于零膨胀计数数据的因果推断的综述性文章,如 Hu et al. (2011),这可能会让不熟悉该领域的读者觉得背景铺垫不够充分。

张力

未见明显对立引用。所有被引工作基本沿着“从简单到复杂”、“从参数到非参数”的路径演进,彼此之间是互补和递进关系,而非矛盾关系。

二、最核心、最简单的例子 / 数学问题

第一步:把符号、模型、可观测数据交代清楚

  • 符号

    • i = 1, ..., n:个体索引。
    • t = 1, ..., T:决策时间点索引。
    • A_{i,t} ∈ {0, 1}:在时间 t 对个体 i干预分配(如是否发送通知)。A_{i,t}=1 表示发送干预。
    • Y_{i,t}:在时间 t 之后观测到的近端结局(proximal outcome)。本文中,它是零膨胀计数,如干预后一小时的屏幕浏览次数。
    • I_{i,t} ∈ {0, 1}可用性指示符(availability indicator)。I_{i,t}=1 表示个体 i 在时间 t 是“可用”的(即可以被随机化)。这是 MRT 的关键特征,因为个体并非在所有时间点都适合接受干预。
    • H_{i,t}:在时间 t 之前观测到的历史协变量(包括过去的干预、结局、时间趋势等)。
    • S_{i,t} ⊆ H_{i,t}:研究者感兴趣的调节变量子集(moderator subset)。因果瞬时效应就是条件于 S_{i,t} 的。
    • p_t(H_{i,t})随机化概率P(A_{i,t}=1 | H_{i,t}, I_{i,t}=1) = p_t(H_{i,t})。在 MRT 中,这个概率通常是已知的(由实验设计决定)。
    • Y_{i,t}(a)潜在结局(potential outcome)。如果个体 i 在时间 t 被分配了干预 a,将会观测到的结局。
    • β:因果瞬时效应(ECE)的参数。本文假设 ECE 是 S_{i,t} 的线性函数:ECE(S_{i,t}) = β^T S_{i,t}
    • f_t(H_{i,t})nuisance 函数。代表在无干预(A_{i,t}=0)且可用(I_{i,t}=1)的条件下,结局的条件期望:E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1]。这是本文用非参数方法估计的对象。
  • 模型

    • 数据生成机制:数据来自一个 MRT。在每个时间点 t,对于每个可用个体 i,干预 A_{i,t} 以已知概率 p_t(H_{i,t}) 被随机分配。结局 Y_{i,t} 在干预后观测到。这是一个边际结构模型(marginal structural model)的变体,但 estimand 是条件于 S_{i,t} 的瞬时效应。
    • 因果模型:本文假设一个加性因果模型(additive causal model),即干预的效果是加在无干预时的结局均值之上的: E[Y_{i,t}(a) | H_{i,t}, I_{i,t}=1] = f_t(H_{i,t}) + a * ECE(S_{i,t}) 其中 ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]
    • 要估的对象β(即 ECE(S_{i,t}) 的参数)。f_t(H_{i,t}) 是 nuisance 参数,需要被估计但本身不是主要兴趣。
  • 可观测数据

    • 可观测:对于每个 (i, t),我们可以观测到 (A_{i,t}, Y_{i,t}, I_{i,t}, H_{i,t}, S_{i,t})。随机化概率 p_t(H_{i,t}) 是已知的设计参数。
    • 不可观测:对于每个 (i, t),我们只能观测到 Y_{i,t} = Y_{i,t}(A_{i,t}),即与分配干预对应的那个潜在结局。反事实结局 Y_{i,t}(1-A_{i,t}) 是不可观测的。此外,f_t(H_{i,t}) 是未知的,需要从数据中估计。

第二步:讲最小内核

本文的核心思路可以用一个最简特例来理解:假设没有时间趋势,且 S_{i,t} 只包含一个常数项(即我们只关心平均因果瞬时效应)

  • 最简设定

    • 所有个体在所有时间点都可用:I_{i,t}=1
    • 随机化概率是常数:p_t(H_{i,t}) = p(例如,p=0.5)。
    • 我们只关心平均效应:ECE(S_{i,t}) = β(一个标量)。
    • 无干预时的结局均值也是常数:f_t(H_{i,t}) = μ(一个标量)。
  • 核心思路: 在这个最简设定下,因果模型简化为: E[Y_{i,t} | A_{i,t}] = μ + A_{i,t} * β

    这是一个简单的线性模型。如果我们用 OLS 回归 YA,得到的 β 估计量是: β̂_OLS = Cov(Y, A) / Var(A)

    由于 A 是随机化的(E[A] = p),我们有 Cov(Y, A) = E[Y*A] - E[Y]E[A]。代入模型: E[Y*A] = E[(μ + Aβ)*A] = μp + βE[A^2] = μp + βp (因为 A^2 = AE[Y] = μ + βp 所以 Cov(Y, A) = (μp + βp) - (μ + βp)p = βp(1-p)Var(A) = p(1-p)。 因此 β̂_OLS = β,即 OLS 是无偏的。

  • 为什么需要加权? 在更一般的 MRT 中,随机化概率 p_t(H_{i,t}) 可能随时间或历史变化(例如,为了适应个体行为而改变)。此时,简单的 OLS 会失效。为了得到一致估计,我们需要使用逆概率加权(IPW)。核心思想是:给每个观测值 (i,t) 赋予一个权重 W_{i,t} = A_{i,t}/p_t(H_{i,t}) + (1-A_{i,t})/(1-p_t(H_{i,t}))。这个权重可以“平衡”由于非恒定随机化概率带来的选择偏差。

  • 为什么需要中心化? 即使使用了 IPW,如果 f_t(H_{i,t}) 不是常数,而是与 A_{i,t} 相关(例如,f_t 随时间变化,而随机化概率也随时间变化),那么 IPW 估计量仍然可能有偏。中心化(centering)是解决这个问题的关键。具体来说,我们不直接回归 YA,而是回归 Y - f̂_t(H_{i,t})A - p_t(H_{i,t}),其中 f̂_tf_t 的估计。这个技巧可以消除 f_tA 之间的相关性带来的偏差,使得估计量对 f_t 的估计误差具有鲁棒性。

  • 本文的最小内核: 本文的核心就是将上述“加权 + 中心化”的估计方程,从参数化 f_t 的设定(如 Kim et al., 2021),推广到用非参数方法(如核平滑)估计 f_t。在这个最简特例下,f_t 可能只是一个随时间平滑变化的函数 μ(t)。本文的方法就是用核平滑来估计 μ(t),然后代入中心化的加权估计方程。这个看似简单的推广,在理论上需要处理非参数估计带来的额外变异性,并建立双向渐近理论。

三、这篇论文做了什么

三句话

  1. 研究了什么问题:在移动健康微随机试验(MRT)中,针对零膨胀计数结局(如 Drink Less 试验中的屏幕浏览次数),定义并估计因果瞬时效应(ECE)
  2. 核心工具/方法:提出了三类估计量——ECE-NonP(基于 ECE 定义的非参数扩展)、EMEE-NonP(基于 EMEE 定义的非参数扩展)、以及DR-EMEE-NonP(双稳健版本)。这些估计量的核心是:使用非参数技术(核平滑或样条) 估计 nuisance 函数 f_t(H_{i,t}),然后将其代入加权和中心化的估计方程
  3. 主要结论:建立了所提估计量的双向渐近性质(bidirectional asymptotics),即当个体数 n → ∞ 或时间点 T → ∞ 时,估计量均具有一致性和渐近正态性。模拟研究验证了有限样本性能,并在 Drink Less 试验数据上展示了方法的应用。

关键设定与假设

在第二节最小记号的基础上,补全完整设定:

  • 关键定义

    • 因果瞬时效应(ECE)ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]。这是本文的主要 estimand。
    • 边际瞬时效应(EMEE)EMEE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}]。与 ECE 的区别在于,EMEE 不对 I_{i,t}=1 条件化,因此它衡量的是“在给定当前情境下,如果发送干预(无论个体是否可用),会有什么效果”。本文同时考虑了这两种 estimand。
  • 关键假设

    1. 一致性(Consistency)Y_{i,t} = Y_{i,t}(A_{i,t})。即观测到的结局等于其对应的潜在结局。
    2. 无未测量混杂(No Unmeasured Confounding)A_{i,t} ⟂ Y_{i,t}(a) | H_{i,t}, I_{i,t}=1。由于 MRT 中干预是随机化的,这个假设自动满足。
    3. 正性(Positivity)0 < p_t(H_{i,t}) < 1 对所有 (i,t) 成立。即每个个体在每个时间点都有非零的概率被分配或不被分配干预。
    4. 模型假设ECE(S_{i,t}) = β^T S_{i,t}。即因果瞬时效应是调节变量的线性函数。这是一个工作模型,不一定正确,但估计量在模型误设下仍能估计出“最优线性近似”。
    5. Nuisance 函数假设f_t(H_{i,t}) = E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1] 是某个光滑函数,可以用非参数方法(如核平滑)一致估计。
  • 相比已有文献的放宽/强化

    • 放宽:相比 Kim et al. (2021) 的参数化假设,本文放宽了对 f_t 的模型假设,允许其以非参数形式存在。
    • 强化:相比 Qian et al. (2021a) 的二元结局,本文处理的是更复杂的零膨胀计数结局,需要更复杂的估计方程(如使用对数链接或处理零膨胀的特定方法)。

主要结果

本文的理论结果主要围绕三个估计量展开:

  1. ECE-NonP 估计量

    • 定义:通过求解一个加权和中心化的估计方程得到。核心是使用非参数估计 f̂_t(H_{i,t}) 替换真实的 f_t
    • 定理 1:在正则条件下,ECE-NonP 估计量 β̂双向一致的(bidirectionally consistent),即当 n → ∞T → ∞ 时,β̂ → β。并且,它是双向渐近正态的,即 √(nT)(β̂ - β) → N(0, Σ)
    • 技术难点:证明的关键在于处理非参数估计 f̂_t 带来的“一阶偏差”(first-order bias)。作者通过中心化技巧(centering)消除了这个偏差,使得 f̂_t 的收敛速度不影响 β̂√(nT) 收敛速度。这类似于双稳健估计中的“Neyman orthogonality”性质。
  2. EMEE-NonP 估计量

    • 定义:与 ECE-NonP 类似,但估计方程是针对 EMEE 定义的。它需要额外估计一个“可用性概率” P(I_{i,t}=1 | S_{i,t})
    • 定理 2:在正则条件下,EMEE-NonP 估计量也是双向一致且渐近正态的
    • 技术难点:EMEE 的估计方程更复杂,因为它需要对 I_{i,t} 进行边际化。作者通过引入一个额外的权重来处理这个问题。
  3. DR-EMEE-NonP 估计量

    • 定义:这是 EMEE-NonP 的双稳健版本。它除了需要估计 f_t 外,还需要估计一个“条件期望” E[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1]。如果这两个 nuisance 函数中有一个被正确估计,那么估计量就是一致的。
    • 定理 3:在正则条件下,DR-EMEE-NonP 估计量是双向一致且渐近正态的,并且具有双稳健性
    • 技术难点:证明双稳健性需要更精细的偏差分析。作者使用了一种“双稳健中心化”技巧,使得估计方程对两个 nuisance 函数的估计误差都具有一阶不敏感性。

证明路线与技术技巧

  • 整体路线

    1. 写出估计方程:将目标 estimand 的识别条件转化为一个矩条件(moment condition),即 E[ψ(O; β, η)] = 0,其中 O 是可观测数据,η 是 nuisance 参数(如 f_t)。
    2. 构造样本类比:用样本矩 (1/nT) Σ ψ(O_{i,t}; β, η̂) 代替总体矩,其中 η̂η 的非参数估计。
    3. 求解估计方程:解出 β̂
    4. 渐近分析:将 β̂ 的误差分解为两部分:一部分来自 η̂ 的估计误差,另一部分来自样本平均的随机误差。通过证明中心化技巧使得第一部分误差是“高阶小量”(即 o_p(1/√(nT))),从而主导项是第二部分,进而得到 √(nT) 收敛和渐近正态性。
  • 关键跳跃点

    • 跳跃点 1:处理非参数估计的偏差。最吃功夫的引理是证明 (1/nT) Σ [ψ(O_{i,t}; β, η̂) - ψ(O_{i,t}; β, η)] = o_p(1/√(nT))。这个引理需要用到非参数估计的收敛速度(如核估计的均方误差)和 empirical process 理论。
    • 跳跃点 2:双向渐近的证明。传统的渐近理论通常假设 T 固定,n → ∞。但在 MRT 中,T 也可能很大。作者需要证明,无论 nT 哪个趋于无穷,结果都成立。这需要处理“双索引”的 empirical process,并证明一个双向的 CLT(bidirectional central limit theorem)。
  • 技术技巧点名

    • 核平滑(Kernel Smoothing):用于估计 f_t(H_{i,t})。作者假设 f_t 是时间 t 和协变量 H_{i,t} 的光滑函数,然后用 Nadaraya-Watson 核估计或局部线性回归来估计它。
    • 加权和中心化估计方程(Weighted and Centered Estimating Equation):这是本文方法的核心。权重是 IPW 权重,用于处理非恒定随机化概率;中心化是减去 f̂_t,用于消除 nuisance 函数带来的偏差。
    • 双向渐近理论(Bidirectional Asymptotics):借鉴自 Yu et al. (2023)。作者证明,在适当的混合条件下,当 n → ∞T → ∞ 时,估计量都收敛。这比传统的“固定 Tn → ∞”的设定更符合 MRT 的实际。
    • 双稳健性(Double Robustness):DR-EMEE-NonP 估计量具有双稳健性,即只要 f_tE[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1] 中有一个被正确估计,估计量就是一致的。这通过构造一个“双稳健”的估计方程实现。

真实例子与应用

  • 使用的数据/场景Drink Less 试验(Bell et al., 2020)。这是一个旨在帮助英国成年人减少饮酒的智能手机应用。试验中,每天晚上 8 点,用户会被随机分配是否收到一条旨在提高应用参与度的通知。近端结局是通知发送后一小时内用户的屏幕浏览次数。这个结局是零膨胀的(很多用户根本不看),且是计数数据。
  • 如何应用:作者将本文提出的三个估计量(ECE-NonP, EMEE-NonP, DR-EMEE-NonP)应用于 Drink Less 数据。他们定义了调节变量 S_{i,t} 为时间趋势(如研究天数)和一些基线协变量。他们使用核平滑来估计 f_t(即无通知时的期望屏幕浏览次数,作为时间的函数)。
  • 得到的结果
    • 估计的因果瞬时效应(ECE)表明,发送通知在短期内(一小时内)显著增加了屏幕浏览次数。
    • 这种效应随时间变化:在试验初期效应较大,但随着时间推移逐渐减弱。
    • 不同估计量(ECE-NonP vs. EMEE-NonP)给出了略有不同的效应大小,但定性结论一致。
  • 这个例子想说明什么
    • 验证理论:展示了所提方法在真实数据上的可行性。
    • 展示优势:通过非参数估计 f_t,方法能够捕捉到时间趋势,而参数化方法可能无法做到这一点。
    • 提供洞见:发现了干预效果随时间衰减的现象,这为优化干预策略(如改变通知内容或频率)提供了有价值的线索。

🔎 结论是否比证明窄

  • 窄结论 1:定理中假设 f_t 是“足够光滑”的,且核平滑的带宽选择是“最优”的。在实际应用中,这些条件可能难以验证。作者在模拟中使用了交叉验证选择带宽,但在理论中并未证明这种数据驱动的带宽选择仍然能保证 √(nT) 收敛。这是一个典型的“理论假设 vs. 实际操作”的差距。
  • 窄结论 2:定理的渐近正态性依赖于混合条件(mixing conditions),即数据在时间上的依赖性不能太强。虽然这在 MRT 中是合理的,但作者并未提供检验这些混合条件是否满足的实用方法。
  • 泛泛 claim:作者在结论部分声称方法“可以处理零膨胀计数结局”。但严格来说,他们的估计方程并没有专门针对零膨胀建模(如使用 ZIP 或 Hurdle 模型)。他们只是使用了非参数方法,而零膨胀是数据的一个特征,并非模型的一部分。因此,方法对零膨胀的“处理”是隐式的,而非显式的。如果零膨胀是由一个与干预无关的“结构零”过程产生的,那么方法的效率可能会受到影响。

四、开放问题

  1. 更高效的估计:本文的估计量是“半参数有效的”吗?作者没有讨论效率界。一个开放问题是:在非参数 f_t 的设定下,β 的半参数效率界是什么?本文的估计量是否能达到这个界?扎根点:本文定理只证明了渐近正态性,未给出方差的下界或证明估计量是有效的。
  2. 数据驱动的带宽选择:本文在模拟中使用了交叉验证选择核平滑的带宽,但在理论证明中假设带宽是确定的。一个重要的开放问题是:证明使用交叉验证等数据驱动方法选择的带宽,仍然能保证估计量的 √(nT) 收敛和渐近正态性。扎根点:本文的定理证明依赖于带宽的确定性和最优收敛速度。
  3. 对未测量混杂的敏感性:虽然 MRT 的随机化保证了无未测量混杂,但实际中可能存在“技术性”的混杂(如随机化概率记录错误,如 Shi & Dempsey (2023) 所指出)。本文没有讨论敏感性分析。一个开放问题是:如何将 Yang & Lok (2018) 的敏感性分析方法扩展到本文的非参数框架下?扎根点:本文在讨论中提到了 Yang & Lok (2018) 的敏感性分析,但并未将其整合到自己的方法中。
  4. 与乘法模型的比较:本文使用的是加性因果模型。对于零膨胀计数数据,乘法模型(如 Yu et al., 2023 的乘法 SNMM)可能更自然。一个开放问题是:在 MRT 设定下,加性模型和乘法模型各自的优缺点是什么?如何在实际应用中选择?扎根点:本文没有与 Yu et al. (2023) 的乘法模型进行任何理论或模拟上的比较。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论