Incorporating nonparametric methods for estimating causal excursion effects in mobile health with zero-inflated count outcomes¶

作者: Xueqing Liu, Tianchen Qian, Lauren Bell, Bibhas Chakraborty
来源: Biometrics
主题: 因果推断
相关性: 7/10
链接: 期刊页 · arXiv

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向聚焦于移动健康（mHealth）微随机试验（MRT）中的因果效应估计。MRT 是一种实验设计，其中每个参与者在大量时间点（如每天数百次）被随机分配是否接受某种干预（如推送通知）。核心的统计问题是：如何定义并估计一个时变的、边际化的因果效应（即“因果瞬时效应”，causal excursion effect），该效应允许研究者回答“在给定当前情境下，发送干预是否比不发送更有效？”以及“这种效果是否随时间或个体特征变化？”当前，该方向已从处理连续和二元结局，发展到处理更复杂的数据类型（如零膨胀计数），并开始引入非参数和双稳健估计方法。

发展脉络（history）¶

奠基工作：MRT 设计与因果效应的形式化定义 - Klasnja et al. (2015) / Liao et al. (2016)：提出了 MRT 的概念和样本量计算方法，为后续因果推断提供了实验设计基础。本文引用称其为“touchstone methodology”。 - Boruvka et al. (2018)：首次在 MRT 框架下，使用潜在结果（potential outcomes）形式化定义了时变效应调节（time-varying effect moderation），并提出了加权中心最小二乘（WCLS）估计量。本文引用称其“创新性地扩展了因果瞬时效应的概念”。

主要进展：从连续到二元结局，以及因果瞬时效应的精炼 - Qian et al. (2021a)：将因果瞬时效应（ECE）和边际瞬时效应（EMEE）的定义推广到二元结局，并提出了半参数、局部有效的估计量。这是本文最直接的前身。本文引用称其方法“最初是为二元结局开发的”。 - Guo et al. (2021) / Kim et al. (2021)：在讨论中指出了 ECE 的一个关键性质——当只对部分历史条件化时，边际瞬时效应依赖于过去治疗分配的随机化概率。本文引用引用了这一讨论，并指出 Kim et al. 的讨论中已提出将 ECE 扩展到计数结局的估计方程，但假设了参数化工作模型。

当前 Frontier：处理更复杂结局（零膨胀计数）与引入非参数/双稳健方法 - Yu et al. (2023)：针对零膨胀非负结局（如游戏数据），提出了乘法结构嵌套均值模型（multiplicative SNMM），并建立了双向渐近理论（bidirectional asymptotics，即个体数或时间点任一趋于无穷时估计量一致）。本文直接借鉴了其双向渐近框架。 - Shi & Dempsey (2023)：提出了双稳健的 WCLS（DR-WCLS） 方法，从元学习（meta-learner）视角估计因果瞬时效应，并处理了随机化概率未知、数据缺失等问题。本文引用称其方法为“灵活且双稳健的推断程序”。 - 本文（Liu et al., 2024）：将 ECE/EMEE 框架从二元结局扩展到零膨胀计数结局，并首次引入非参数技术（核平滑/样条）来估计时间趋势和协变量的影响，而非假设参数化模型。同时，建立了所提估计量的双向渐近性质。

子线索聚类¶

这些被引文献大致落在以下三条子线索上：

MRT 设计与因果效应定义：以 Klasnja et al. (2015), Liao et al. (2016), Boruvka et al. (2018), Qian et al. (2022) 为代表。核心是建立 MRT 的实验设计原则，并定义适用于该设计的因果 estimand（如 ECE, EMEE）。这是整个领域的基石。
特定结局类型的估计方法：以 Qian et al. (2021a)（二元结局）、Kim et al. (2021)（计数结局的参数化扩展）、Yu et al. (2023)（零膨胀非负结局的 SNMM）、以及本文（零膨胀计数结局的非参数扩展）为代表。这条线索的核心是，针对不同数据特征（连续、二元、计数、零膨胀），开发相应的识别条件和估计方程。
估计方法的稳健性与灵活性：以 Shi & Dempsey (2023)（双稳健 WCLS）、以及本文引入的非参数技术为代表。这条线索关注如何放松对模型（如线性、参数化）的依赖，通过双稳健性或非参数平滑来提高估计的可靠性。

这个方向在追问的核心问题¶

如何定义因果瞬时效应？ 当干预是时变的、且只对部分历史条件化时，如何确保 estimand 的因果解释是清晰的，且不依赖于过去治疗的分配机制？
如何处理复杂结局？ 对于零膨胀、过离散、或具有特殊分布（如计数）的结局，如何设计有效的估计方程和推断程序？
如何平衡模型假设与稳健性？ 在 MRT 这种高维、时序相关的数据中，是采用参数化模型（简单但可能错误）还是非参数/半参数方法（灵活但需要更多数据）？双向渐近理论如何为后者提供理论支持？
如何应对实际数据中的挑战？ 如随机化概率记录错误、数据缺失、未测量的混杂等，如何通过敏感性分析或双稳健方法进行缓解？

⚠️ 作者的 framing（必须明确标注成“这是作者的说法”）¶

作者把缺口 frame 成什么？ 作者在引言中明确指出：“existing research mainly focuses on continuous or binary data, leaving count data largely unexplored.” 并且，对于计数结局，Kim et al. (2021) 的扩展“assumes a parametric working model for E(Y_{t,1} | H_t, A_t=0, I_t=1)”。因此，作者将缺口定位为：缺乏针对零膨胀计数结局的、且不依赖参数化工作模型的因果瞬时效应估计方法。本文的贡献就是填补这个缺口。
哪些竞争路线被他淡化或回避了？ 作者淡化了参数化模型的路线。虽然引用了 Kim et al. (2021) 的参数化扩展，但将其定位为“假设参数化工作模型”，从而凸显自己引入非参数技术的必要性。作者也回避了与乘法 SNMM（Yu et al., 2023） 的直接竞争。Yu et al. 的方法也处理零膨胀结局，但使用的是乘法结构模型和 G-估计，而本文使用的是加性模型和加权估计方程。作者没有详细比较这两种框架在 MRT 设定下的优劣。
什么明显该被引/该存在、却没出现在 intro 里？ 作者没有引用Nie & Wager (2017) 或 Kennedy (2020) 关于异质性处理效应（CATE）估计的“准 Oracle”或“双稳健”方法。虽然这些工作不是专门针对 MRT 的，但它们提出的“用非参数方法估计 nuisance 函数，然后代入目标函数”的通用框架，与本文“用核平滑估计 nuisance 函数，然后代入加权估计方程”的思路高度相关。引用它们可以为本文的非参数策略提供更广泛的文献支撑。此外，作者没有引用任何关于零膨胀计数数据的因果推断的综述性文章，如 Hu et al. (2011)，这可能会让不熟悉该领域的读者觉得背景铺垫不够充分。

张力¶

未见明显对立引用。所有被引工作基本沿着“从简单到复杂”、“从参数到非参数”的路径演进，彼此之间是互补和递进关系，而非矛盾关系。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- i = 1, ..., n：个体索引。
- t = 1, ..., T：决策时间点索引。
- A_{i,t} ∈ {0, 1}：在时间 t 对个体 i 的干预分配（如是否发送通知）。A_{i,t}=1 表示发送干预。
- Y_{i,t}：在时间 t 之后观测到的近端结局（proximal outcome）。本文中，它是零膨胀计数，如干预后一小时的屏幕浏览次数。
- I_{i,t} ∈ {0, 1}：可用性指示符（availability indicator）。I_{i,t}=1 表示个体 i 在时间 t 是“可用”的（即可以被随机化）。这是 MRT 的关键特征，因为个体并非在所有时间点都适合接受干预。
- H_{i,t}：在时间 t 之前观测到的历史协变量（包括过去的干预、结局、时间趋势等）。
- S_{i,t} ⊆ H_{i,t}：研究者感兴趣的调节变量子集（moderator subset）。因果瞬时效应就是条件于 S_{i,t} 的。
- p_t(H_{i,t})：随机化概率。P(A_{i,t}=1 | H_{i,t}, I_{i,t}=1) = p_t(H_{i,t})。在 MRT 中，这个概率通常是已知的（由实验设计决定）。
- Y_{i,t}(a)：潜在结局（potential outcome）。如果个体 i 在时间 t 被分配了干预 a，将会观测到的结局。
- β：因果瞬时效应（ECE）的参数。本文假设 ECE 是 S_{i,t} 的线性函数：ECE(S_{i,t}) = β^T S_{i,t}。
- f_t(H_{i,t})：nuisance 函数。代表在无干预（A_{i,t}=0）且可用（I_{i,t}=1）的条件下，结局的条件期望：E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1]。这是本文用非参数方法估计的对象。
模型：
- 数据生成机制：数据来自一个 MRT。在每个时间点 t，对于每个可用个体 i，干预 A_{i,t} 以已知概率 p_t(H_{i,t}) 被随机分配。结局 Y_{i,t} 在干预后观测到。这是一个边际结构模型（marginal structural model）的变体，但 estimand 是条件于 S_{i,t} 的瞬时效应。
- 因果模型：本文假设一个加性因果模型（additive causal model），即干预的效果是加在无干预时的结局均值之上的： E[Y_{i,t}(a) | H_{i,t}, I_{i,t}=1] = f_t(H_{i,t}) + a * ECE(S_{i,t}) 其中 ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]。
- 要估的对象：β（即 ECE(S_{i,t}) 的参数）。f_t(H_{i,t}) 是 nuisance 参数，需要被估计但本身不是主要兴趣。
可观测数据：
- 可观测：对于每个 (i, t)，我们可以观测到 (A_{i,t}, Y_{i,t}, I_{i,t}, H_{i,t}, S_{i,t})。随机化概率 p_t(H_{i,t}) 是已知的设计参数。
- 不可观测：对于每个 (i, t)，我们只能观测到 Y_{i,t} = Y_{i,t}(A_{i,t})，即与分配干预对应的那个潜在结局。反事实结局 Y_{i,t}(1-A_{i,t}) 是不可观测的。此外，f_t(H_{i,t}) 是未知的，需要从数据中估计。

第二步：讲最小内核¶

本文的核心思路可以用一个最简特例来理解：假设没有时间趋势，且 S_{i,t} 只包含一个常数项（即我们只关心平均因果瞬时效应）。

最简设定：
- 所有个体在所有时间点都可用：I_{i,t}=1。
- 随机化概率是常数：p_t(H_{i,t}) = p（例如，p=0.5）。
- 我们只关心平均效应：ECE(S_{i,t}) = β（一个标量）。
- 无干预时的结局均值也是常数：f_t(H_{i,t}) = μ（一个标量）。
核心思路：在这个最简设定下，因果模型简化为： E[Y_{i,t} | A_{i,t}] = μ + A_{i,t} * β

这是一个简单的线性模型。如果我们用 OLS 回归 Y 对 A，得到的 β 估计量是： β̂_OLS = Cov(Y, A) / Var(A)

由于 A 是随机化的（E[A] = p），我们有 Cov(Y, A) = E[Y*A] - E[Y]E[A]。代入模型： E[Y*A] = E[(μ + Aβ)*A] = μp + βE[A^2] = μp + βp （因为 A^2 = A） E[Y] = μ + βp 所以 Cov(Y, A) = (μp + βp) - (μ + βp)p = βp(1-p) 而 Var(A) = p(1-p)。因此 β̂_OLS = β，即 OLS 是无偏的。
为什么需要加权？ 在更一般的 MRT 中，随机化概率 p_t(H_{i,t}) 可能随时间或历史变化（例如，为了适应个体行为而改变）。此时，简单的 OLS 会失效。为了得到一致估计，我们需要使用逆概率加权（IPW）。核心思想是：给每个观测值 (i,t) 赋予一个权重 W_{i,t} = A_{i,t}/p_t(H_{i,t}) + (1-A_{i,t})/(1-p_t(H_{i,t}))。这个权重可以“平衡”由于非恒定随机化概率带来的选择偏差。
为什么需要中心化？ 即使使用了 IPW，如果 f_t(H_{i,t}) 不是常数，而是与 A_{i,t} 相关（例如，f_t 随时间变化，而随机化概率也随时间变化），那么 IPW 估计量仍然可能有偏。中心化（centering）是解决这个问题的关键。具体来说，我们不直接回归 Y 对 A，而是回归 Y - f̂_t(H_{i,t}) 对 A - p_t(H_{i,t})，其中 f̂_t 是 f_t 的估计。这个技巧可以消除 f_t 与 A 之间的相关性带来的偏差，使得估计量对 f_t 的估计误差具有鲁棒性。
本文的最小内核：本文的核心就是将上述“加权 + 中心化”的估计方程，从参数化 f_t 的设定（如 Kim et al., 2021），推广到用非参数方法（如核平滑）估计 f_t。在这个最简特例下，f_t 可能只是一个随时间平滑变化的函数 μ(t)。本文的方法就是用核平滑来估计 μ(t)，然后代入中心化的加权估计方程。这个看似简单的推广，在理论上需要处理非参数估计带来的额外变异性，并建立双向渐近理论。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在移动健康微随机试验（MRT）中，针对零膨胀计数结局（如 Drink Less 试验中的屏幕浏览次数），定义并估计因果瞬时效应（ECE）。
核心工具/方法：提出了三类估计量——ECE-NonP（基于 ECE 定义的非参数扩展）、EMEE-NonP（基于 EMEE 定义的非参数扩展）、以及DR-EMEE-NonP（双稳健版本）。这些估计量的核心是：使用非参数技术（核平滑或样条） 估计 nuisance 函数 f_t(H_{i,t})，然后将其代入加权和中心化的估计方程。
主要结论：建立了所提估计量的双向渐近性质（bidirectional asymptotics），即当个体数 n → ∞ 或时间点 T → ∞ 时，估计量均具有一致性和渐近正态性。模拟研究验证了有限样本性能，并在 Drink Less 试验数据上展示了方法的应用。

关键设定与假设¶

在第二节最小记号的基础上，补全完整设定：

关键定义：
- 因果瞬时效应（ECE）：ECE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}, I_{i,t}=1]。这是本文的主要 estimand。
- 边际瞬时效应（EMEE）：EMEE(S_{i,t}) = E[Y_{i,t}(1) - Y_{i,t}(0) | S_{i,t}]。与 ECE 的区别在于，EMEE 不对 I_{i,t}=1 条件化，因此它衡量的是“在给定当前情境下，如果发送干预（无论个体是否可用），会有什么效果”。本文同时考虑了这两种 estimand。
关键假设：
1. 一致性（Consistency）：Y_{i,t} = Y_{i,t}(A_{i,t})。即观测到的结局等于其对应的潜在结局。
2. 无未测量混杂（No Unmeasured Confounding）：A_{i,t} ⟂ Y_{i,t}(a) | H_{i,t}, I_{i,t}=1。由于 MRT 中干预是随机化的，这个假设自动满足。
3. 正性（Positivity）：0 < p_t(H_{i,t}) < 1 对所有 (i,t) 成立。即每个个体在每个时间点都有非零的概率被分配或不被分配干预。
4. 模型假设：ECE(S_{i,t}) = β^T S_{i,t}。即因果瞬时效应是调节变量的线性函数。这是一个工作模型，不一定正确，但估计量在模型误设下仍能估计出“最优线性近似”。
5. Nuisance 函数假设：f_t(H_{i,t}) = E[Y_{i,t} | H_{i,t}, A_{i,t}=0, I_{i,t}=1] 是某个光滑函数，可以用非参数方法（如核平滑）一致估计。
相比已有文献的放宽/强化：
- 放宽：相比 Kim et al. (2021) 的参数化假设，本文放宽了对 f_t 的模型假设，允许其以非参数形式存在。
- 强化：相比 Qian et al. (2021a) 的二元结局，本文处理的是更复杂的零膨胀计数结局，需要更复杂的估计方程（如使用对数链接或处理零膨胀的特定方法）。

主要结果¶

本文的理论结果主要围绕三个估计量展开：

ECE-NonP 估计量：
- 定义：通过求解一个加权和中心化的估计方程得到。核心是使用非参数估计 f̂_t(H_{i,t}) 替换真实的 f_t。
- 定理 1：在正则条件下，ECE-NonP 估计量 β̂ 是双向一致的（bidirectionally consistent），即当 n → ∞ 或 T → ∞ 时，β̂ → β。并且，它是双向渐近正态的，即 √(nT)(β̂ - β) → N(0, Σ)。
- 技术难点：证明的关键在于处理非参数估计 f̂_t 带来的“一阶偏差”（first-order bias）。作者通过中心化技巧（centering）消除了这个偏差，使得 f̂_t 的收敛速度不影响 β̂ 的 √(nT) 收敛速度。这类似于双稳健估计中的“Neyman orthogonality”性质。
EMEE-NonP 估计量：
- 定义：与 ECE-NonP 类似，但估计方程是针对 EMEE 定义的。它需要额外估计一个“可用性概率” P(I_{i,t}=1 | S_{i,t})。
- 定理 2：在正则条件下，EMEE-NonP 估计量也是双向一致且渐近正态的。
- 技术难点：EMEE 的估计方程更复杂，因为它需要对 I_{i,t} 进行边际化。作者通过引入一个额外的权重来处理这个问题。
DR-EMEE-NonP 估计量：
- 定义：这是 EMEE-NonP 的双稳健版本。它除了需要估计 f_t 外，还需要估计一个“条件期望” E[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1]。如果这两个 nuisance 函数中有一个被正确估计，那么估计量就是一致的。
- 定理 3：在正则条件下，DR-EMEE-NonP 估计量是双向一致且渐近正态的，并且具有双稳健性。
- 技术难点：证明双稳健性需要更精细的偏差分析。作者使用了一种“双稳健中心化”技巧，使得估计方程对两个 nuisance 函数的估计误差都具有一阶不敏感性。

证明路线与技术技巧¶

整体路线：
1. 写出估计方程：将目标 estimand 的识别条件转化为一个矩条件（moment condition），即 E[ψ(O; β, η)] = 0，其中 O 是可观测数据，η 是 nuisance 参数（如 f_t）。
2. 构造样本类比：用样本矩 (1/nT) Σ ψ(O_{i,t}; β, η̂) 代替总体矩，其中 η̂ 是 η 的非参数估计。
3. 求解估计方程：解出 β̂。
4. 渐近分析：将 β̂ 的误差分解为两部分：一部分来自 η̂ 的估计误差，另一部分来自样本平均的随机误差。通过证明中心化技巧使得第一部分误差是“高阶小量”（即 o_p(1/√(nT))），从而主导项是第二部分，进而得到 √(nT) 收敛和渐近正态性。
关键跳跃点：
- 跳跃点 1：处理非参数估计的偏差。最吃功夫的引理是证明 (1/nT) Σ [ψ(O_{i,t}; β, η̂) - ψ(O_{i,t}; β, η)] = o_p(1/√(nT))。这个引理需要用到非参数估计的收敛速度（如核估计的均方误差）和 empirical process 理论。
- 跳跃点 2：双向渐近的证明。传统的渐近理论通常假设 T 固定，n → ∞。但在 MRT 中，T 也可能很大。作者需要证明，无论 n 和 T 哪个趋于无穷，结果都成立。这需要处理“双索引”的 empirical process，并证明一个双向的 CLT（bidirectional central limit theorem）。
技术技巧点名：
- 核平滑（Kernel Smoothing）：用于估计 f_t(H_{i,t})。作者假设 f_t 是时间 t 和协变量 H_{i,t} 的光滑函数，然后用 Nadaraya-Watson 核估计或局部线性回归来估计它。
- 加权和中心化估计方程（Weighted and Centered Estimating Equation）：这是本文方法的核心。权重是 IPW 权重，用于处理非恒定随机化概率；中心化是减去 f̂_t，用于消除 nuisance 函数带来的偏差。
- 双向渐近理论（Bidirectional Asymptotics）：借鉴自 Yu et al. (2023)。作者证明，在适当的混合条件下，当 n → ∞ 或 T → ∞ 时，估计量都收敛。这比传统的“固定 T，n → ∞”的设定更符合 MRT 的实际。
- 双稳健性（Double Robustness）：DR-EMEE-NonP 估计量具有双稳健性，即只要 f_t 或 E[Y_{i,t} | H_{i,t}, A_{i,t}=1, I_{i,t}=1] 中有一个被正确估计，估计量就是一致的。这通过构造一个“双稳健”的估计方程实现。

真实例子与应用¶

使用的数据/场景：Drink Less 试验（Bell et al., 2020）。这是一个旨在帮助英国成年人减少饮酒的智能手机应用。试验中，每天晚上 8 点，用户会被随机分配是否收到一条旨在提高应用参与度的通知。近端结局是通知发送后一小时内用户的屏幕浏览次数。这个结局是零膨胀的（很多用户根本不看），且是计数数据。
如何应用：作者将本文提出的三个估计量（ECE-NonP, EMEE-NonP, DR-EMEE-NonP）应用于 Drink Less 数据。他们定义了调节变量 S_{i,t} 为时间趋势（如研究天数）和一些基线协变量。他们使用核平滑来估计 f_t（即无通知时的期望屏幕浏览次数，作为时间的函数）。
得到的结果：
- 估计的因果瞬时效应（ECE）表明，发送通知在短期内（一小时内）显著增加了屏幕浏览次数。
- 这种效应随时间变化：在试验初期效应较大，但随着时间推移逐渐减弱。
- 不同估计量（ECE-NonP vs. EMEE-NonP）给出了略有不同的效应大小，但定性结论一致。
这个例子想说明什么：
- 验证理论：展示了所提方法在真实数据上的可行性。
- 展示优势：通过非参数估计 f_t，方法能够捕捉到时间趋势，而参数化方法可能无法做到这一点。
- 提供洞见：发现了干预效果随时间衰减的现象，这为优化干预策略（如改变通知内容或频率）提供了有价值的线索。

🔎 结论是否比证明窄¶

窄结论 1：定理中假设 f_t 是“足够光滑”的，且核平滑的带宽选择是“最优”的。在实际应用中，这些条件可能难以验证。作者在模拟中使用了交叉验证选择带宽，但在理论中并未证明这种数据驱动的带宽选择仍然能保证 √(nT) 收敛。这是一个典型的“理论假设 vs. 实际操作”的差距。
窄结论 2：定理的渐近正态性依赖于混合条件（mixing conditions），即数据在时间上的依赖性不能太强。虽然这在 MRT 中是合理的，但作者并未提供检验这些混合条件是否满足的实用方法。
泛泛 claim：作者在结论部分声称方法“可以处理零膨胀计数结局”。但严格来说，他们的估计方程并没有专门针对零膨胀建模（如使用 ZIP 或 Hurdle 模型）。他们只是使用了非参数方法，而零膨胀是数据的一个特征，并非模型的一部分。因此，方法对零膨胀的“处理”是隐式的，而非显式的。如果零膨胀是由一个与干预无关的“结构零”过程产生的，那么方法的效率可能会受到影响。

四、开放问题¶

更高效的估计：本文的估计量是“半参数有效的”吗？作者没有讨论效率界。一个开放问题是：在非参数 f_t 的设定下，β 的半参数效率界是什么？本文的估计量是否能达到这个界？扎根点：本文定理只证明了渐近正态性，未给出方差的下界或证明估计量是有效的。
数据驱动的带宽选择：本文在模拟中使用了交叉验证选择核平滑的带宽，但在理论证明中假设带宽是确定的。一个重要的开放问题是：证明使用交叉验证等数据驱动方法选择的带宽，仍然能保证估计量的 √(nT) 收敛和渐近正态性。扎根点：本文的定理证明依赖于带宽的确定性和最优收敛速度。
对未测量混杂的敏感性：虽然 MRT 的随机化保证了无未测量混杂，但实际中可能存在“技术性”的混杂（如随机化概率记录错误，如 Shi & Dempsey (2023) 所指出）。本文没有讨论敏感性分析。一个开放问题是：如何将 Yang & Lok (2018) 的敏感性分析方法扩展到本文的非参数框架下？扎根点：本文在讨论中提到了 Yang & Lok (2018) 的敏感性分析，但并未将其整合到自己的方法中。
与乘法模型的比较：本文使用的是加性因果模型。对于零膨胀计数数据，乘法模型（如 Yu et al., 2023 的乘法 SNMM）可能更自然。一个开放问题是：在 MRT 设定下，加性模型和乘法模型各自的优缺点是什么？如何在实际应用中选择？扎根点：本文没有与 Yu et al. (2023) 的乘法模型进行任何理论或模拟上的比较。

Maintained by 陈星宇 · Homepage · Source on GitHub