Beyond Parallel Trends in Staggered Difference-in-Differences: Identification under Higher-Order Parallelism¶

作者: Zecharias Anteneh
主题: 因果推断
相关性: 9/10
链接: https://arxiv.org/abs/2606.17977

一、领域脉络与小综述¶

这个方向是什么¶

方向：交错采纳（staggered adoption）的差值-差值法（DiD）中的识别与推断。核心问题：当传统“平行趋势”假设（待处理组与对照组在无法处理状态下的结果差距随时间平坦）被前处理数据拒绝时，能否以更弱的假设实现点识别，且如何处理因采纳时间不同导致的队列间异质性。当前成熟度：方法论已高度活跃（2020-2026），但平行趋势的放松仍以部分识别/灵敏度分析为主，点识别下的高阶放松在交错设定中的聚合理论是空白。

发展脉络（从introduction + 参考文献构建）¶

奠基工作：交错DiD中，双重固定效应TWFE在效应异质性下的偏误（Goodman-Bacon 2021, De Chaisemartin & d'Haultfoeuille 2020），催生出可解释的组-时间平均处理效应估计量（Callaway & Sant'Anna 2021, Sun & Abraham 2021, Borusyak et al. 2024）。共同核心假设：标准平行趋势 Parallel[1]——待处理与对照组的未处理结果年度变化均值相等。作者引用Callaway & Sant'Anna (2021)作为主框架，其中“group-time average treatment effect”结构是本文的基底。
平行趋势的检验与失效：Roth (2022) 指出预趋势检验功效低，且“通过检验才继续”的条件推断会扭曲后续推断。Bilinski & Hatfield (2026) 提出非劣效框架，将预趋势评估转化为等价检验，但仍假设Parallel[1]下偏差小到可忽略。作者引用Roth (2022)来锚定“预趋势检验后仍无正确定量估计”的问题。
平行趋势放松的两种主要路径：
部分识别/灵敏度分析：Rambachan & Roth (2023) 限制后处理期平行趋势偏离前处理趋势的最大幅度，给出识别集。其“光滑性限制”（M=0对应线性外推）与本文Parallel[2]等价，但他们的做法是报告识别集如何随约束放松而扩大，而非点估计。
点识别下的高阶外推：Mora & Reggio (2019) 在两组多期设定下提出Parallel[p]层次，证明识别。Dobkin et al. (2018) 在单队列事件研究中包含线性趋势（对应于Parallel[2]），但只能处理单一采纳时间。
交错设定下的推广：Egami & Yamauchi (2023) 使用广义矩估计（GMM）结合Parallel[1]与Parallel[2]，但固定使用p∈{1,2}，未处理更高阶，且未考虑队列异质阶数下的聚合问题。
本文的位置：作者自称“第一个交错设定下队列异质阶数聚合定理”（Theorem 4.4），填补Egami & Yamauchi (2023)未解决的空白。同时将高阶平行趋势推至任意p≥1，并加入序列阶数选择与bootstrap后选择推断验证。

子线索聚类¶

线索1：交错DiD估计量及其性质（Callaway & Sant'Anna 2021, Sun & Abraham 2021, Goodman-Bacon 2021, De Chaisemartin & d'Haultfoeuille 2020, Borusyak et al. 2024）。它们提供可解释的ATT组合方法，但都等价地依赖Parallel[1]。
线索2：平行趋势失效的诊断与部分识别（Roth 2022, Rambachan & Roth 2023, Bilinski & Hatfield 2026, Roth et al. 2023）。诊断预趋势、用偏差幅度参数化识别集、或非劣效检验。回避点识别。
线索3：给定形式的趋势外推（Mora & Reggio 2019, Dobkin et al. 2018, Egami & Yamauchi 2023）。允许线性/多项式形式的前处理趋势外推。本文属于这一子线索，但扩展了阶数范围、交错聚合、以及阶数选择。
线索4：其他识别策略（合成控制Abadie et al. 2010/Arkhangelsky et al. 2021, 三重差分Strezhnev 2023/Ortiz-Villavicencio & Sant'Anna 2025, 变化-变化Athey & Imbens 2006）。作者指出它们适用于不同情境，本文的目标是“前处理差距平滑演化时多项式反事实可信”的常见场景。

方向核心问题、主流方法与瓶颈¶

核心问题1：如何定义和检验平行趋势的替代假设？主流方法: 参数趋势（线性、二次）、非参数平滑约束、偏差幅度灵敏度。瓶颈: 参数形式选择无共识；灵敏度分析给出区间而非点估计；选择后的推断未被正式解决。
核心问题2：交错采纳中，不同队列的可用前处理期数不等，如何统一识别？主流方法: 只使用所有队列共同支持的最长前处理窗口（损失后期队列信息），或排除早期队列。瓶颈: 改变目标参数；放弃信息。
核心问题3：前处理后，所选的替代假设是否因“使用同一数据选择而破”了推断？主流方法: 忽略选择步骤（报告名义覆盖）。瓶颈: 正式的后选择推断在DiD中极少处理。

⚠️ 作者的framing（明确标注为作者说法）¶

作者把缺口frame成：“当标准平行趋势被拒时，能否在不抛弃部分队列或进行灵敏度分析的前提下仍实现点识别？” 本文的答案是“能，通过将传统的平坦差距替换为一个可从前处理数据中检验的多项式外推”。作者淡化或回避： - 协变量调整：文中仅附录提及可加协变量进入多项式回归（Remark 10, Step 4），但未给出识别理论或渐近性质。实际应用中协变量调整可能是关键，例如状态时变特征。 - 非多项式平滑约束：作者指出Rambachan & Roth (2023)的导数有界灵敏度路径适用于多项式不成立的情况，但自己只追求点识别，回避了部分识别。 - 与前平行趋势检验的正式整合：Roth (2022)的后选择推论问题在本文的序列阶数选择中未被正式校验（仅在蒙特卡洛中展示覆盖接近名义水平，但承认“需要统一有效性结果”）。

值得研究者去查的问题：作者引用了Egami & Yamauchi (2023)并指出两点不同（全阶层次、序贯选择、聚合定理）。但Egami & Yamauchi (2023)是否实际处理了队列异质阶数？需要核查原文。此外，明显该出现但未出现的文献：Roth & Sant'Anna (2023, 2024?)中关于交错DiD下平行趋势检验联合检验的进一步结果；可能还有Cattaneo et al. (2020)关于伪治疗/处理效应伪试验的DiD框架；以及关于Vandermonde矩阵条件数在有限样本中的数值问题（本文注3提到但未深入引用）。

张力¶

未见明显对立引用。所有被引工作都承认平行趋势放松的必要性，只是在点识别 vs 部分识别、参数 vs 非参数形式上方法不同。作者与Rambachan & Roth (2023)的关系明确：M=0时等价，但使用方式不同（点 vs 区间）。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据（一次性交代清楚）¶

符号：
\(i=1,\dots,N\)：单位（如州）
\(t=1,\dots,T\)：时期（固定T）
\(G_i \in \{g_1,\dots,g_K,\infty\}\)：单位i的首次处理时间（吸收性）；\(G_i=\infty\)表示从未处理。
队列(cohort) \(g\)：所有\(G_i=g\)的单位。
\(m_g = g - t_{\min}\)：队列g可用的前处理期数（\(t_{\min}\)为第一期）。
\(Y_{it}(g)\)与\(Y_{it}(\infty)\)：若在g期开始处理或永不处理的潜在结果。
可观测结果\(Y_{it}\)：对于t<G_i，等于\(Y_{it}(\infty)\)；对于t≥G_i等于\(Y_{it}(G_i)\)。
ATT(g,t)：队列g在t期的平均处理效应（t≥g）。
\(\gamma_{g,t} = \mathbb{E}[Y_{it}|G_i=g] - \mathbb{E}[Y_{it}|G_i=\infty]\)：观察到的结果差距（可识别）。
\(\gamma_{g,t}(0) = \mathbb{E}[Y_{it}(\infty)|G_i=g] - \mathbb{E}[Y_{it}(\infty)|G_i=\infty]\)：未处理状态下的反事实差距（未知）。
\(\Delta^p\)：p阶差分算子，\(\Delta^p Y_{it} = \sum_{k=0}^p (-1)^k \binom{p}{k} Y_{i,t-k}\)。
Parallel[p]假设：对所有g和t，\(\mathbb{E}[\Delta^p Y_{it}(\infty)|G_i=g] = \mathbb{E}[\Delta^p Y_{it}(\infty)|G_i=\infty]\)。
模型：潜在结果框架（Neyman-Rubin），无预期假设（Assumption 1），重叠假设（Assumption 2）。不做任何分布假定；主要渐近依赖单位间独立、有限二阶矩、队列份额非退化。T固定，N→∞。
可观测数据：对于每个单位i和时期t，观测到\(Y_{it}\)和\(G_i\)。可观测的差距：\(\gamma_{g,t} = \mathbb{E}[Y_{it}|G_i=g] - \mathbb{E}[Y_{it}|G_i=\infty]\)（样本均值直接估计）。想要但观测不到：处理后的未处理潜在结果\(Y_{it}(\infty)\)，因而\(\gamma_{g,t}(0)\)未知。平行趋势假设通过将未处理结果差距的行为结构信息（如平坦、线性）借用过来识别\(\gamma_{g,t}(0)\)。

第二步：最小内核——去掉交错与聚合复杂性，仅考虑一个处理队列+从未处理组¶

考虑最简特例：单一处理队列g=5（第5期开始处理），对照组为从未处理组。只有两个组。前处理期数为4（t=1,2,3,4）。后处理期t=5,6,...。传统平行趋势（Parallel[1]）要求未处理差距\(\gamma_{g,t}(0)\)为常数。但前处理数据可能显示差距在上升：例如\(\gamma_{g,1}=0.02,\gamma_{g,2}=0.025,\gamma_{g,3}=0.03,\gamma_{g,4}=0.035\)——线性趋势明显。Parallel[1]被拒绝。

最小内核核心：假设Parallel[2]（线性趋势成立）。那么\(\Delta^2 \gamma_{g,t}(0)=0\)对所有t成立。在离散时间中，这等价于\(\gamma_{g,t}(0)\)是t的线性函数（阶数p-1=1）。因此：

\[\gamma_{g,t}(0) = a_g + b_g t,\quad t \text{任意}.\]

系数\((a_g,b_g)\)可由两个前处理观测唯一确定（例如t=3,4）。更高效地，用全部mg=4个前处理点OLS拟合直线。得到估计\(\hat{a}_g,\hat{b}_g\)。反事实差距后处理外推：\(\hat{\gamma}_{g,t}(0) = \hat{a}_g + \hat{b}_g t\)。观察到后处理差距\(\hat{\gamma}_{g,t}\)（样本均值差），则：

\[\widehat{ATT}(g,t) = \hat{\gamma}_{g,t} - \hat{\gamma}_{g,t}(0).\]

这个表达式就是整篇论文识别理论的核心：高阶平行趋势下，未处理差距是多项式，可从前处理数据拟合后外推，然后从观测差距中减去即得处理效应。

为什么这样应对了“平行趋势被拒”：传统DiD假设\(\gamma_{g,t}(0)\)在t=4后仍为常数（\(\gamma_{g,4}\)），但若前处理有趋势，该假设不可信。Parallel[2]使用数据来估计趋势（而不假设平坦），只要趋势是线性的（可检验），即使前处理有上升，也可外推。每一步提高阶数p就是允许多项式曲率的更多自由度；但每增加一阶需要多一前处理观测来拟合，代价是方差增大。

在交错设定中，不同队列可能有不同的mg，因此不同队列能支持的最大阶数不同。聚合定理（Theorem 4.4）解决了在队列使用不同阶数时，仍能一致估计总平均处理效应的问题。这是该论文区别于Mora & Reggio (2019)与Egami & Yamauchi (2023)的关键创见。在最小内核中，仅一个队列，聚合问题不存在；交错特殊性留到第三节。

三、这篇论文做了什么（本次重心，务必讲透）¶

三句话¶

研究问题：在交错DiD中，当标准平行趋势（Parallel[1]）被前处理数据拒绝时，如何用更弱的条件——高阶平行趋势Parallel[p]实现ATT的点识别，并处理不同队列因前处理期长不同而使用不同阶数时的聚合问题。
核心工具：将Parallel[p]层次嵌入Callaway & Sant’Anna (2021)的组-时间ATT结构；利用差分算子\(\Delta^p\)的性质将未处理差距表示为多项式；提出序列阶数选择程序（基于前处理数据的F检验）；用cluster bootstrap进行推断。
主要结论：Theorem 4.3给出在Parallel[p]下ATT(g,t)的点识别公式（观测差距减去多项式反事实）；Theorem 4.4证明即使不同队列采用不同可行阶数p_g，加权聚合ATT仍可识别；蒙特卡洛显示后选择bootstrap覆盖接近名义水平（85-94%），对序列相关稳健；Medicaid应用给出约6个百分点的保险覆盖率提升估计，建立在预数据未拒绝的Parallel[2]上，而传统假设被同一数据明确拒绝。

关键设定与假设¶

设定：同Callaway & Sant’Anna (2021)：平衡面板，固定T，吸收性处理，渐进单位数N→∞，队列份额固定。
核心假设：
无预期（Assumption 1）：处理前观测等于未处理潜在结果。
重叠（Assumption 2）：每个队列概率严格在0和1之间。
Parallel[p]（Assumption 4）：对给定p，\(\Delta^p\)的未处理结果期望在队列与未处理组间相等。
正则条件（Appendix A）：单位独立、有限二阶矩、队列份额非退化、前处理期足够多（\(m_g \ge p_g\)）、T固定。
相比已有文献：
相比Callaway & Sant’Anna (2021)：放宽Parallel[1]到任意p；允许队列异质阶数。
相比Mora & Reggio (2019)：从两组推广到交错；提供聚合定理。
相比Egami & Yamauchi (2023)：p不限于1,2；允许协变量（仅附录提及）；解决异质阶数聚合。

主要结果¶

Lemma 4.1（多项式差距结构）：在Parallel[p]和无预期下，前处理差距\(\gamma_{g,t}\)是t的p-1阶多项式。证明：利用\(\Delta^p\)线性性及Assumption 4得到\(\Delta^p \gamma_{g,t}=0\)，然后标准有限差分结论：零p阶差的序列是p-1次多项式。
Proposition 4.2（反事实识别）：若\(m_g \ge p\)，则：(i) 反事实差距\(\gamma_{g,t}(0)\)对所有t也是p-1阶多项式；(ii) 该多项式由p个最近的前处理差距唯一确定（更高效地用OLS使用全部前处理数据）；(iii) 后处理反事实通过多项式求值得出。证明：Parallel[p]适用于所有t，包括后处理，因此多项式性质保持；前处理差距可观测（因无预期）；多项式由p个点唯一确定。
Theorem 4.3（ATT识别）：在Assumptions 1,2,4下，\(ATT(g,t) = \gamma_{g,t} - \gamma_{g,t}(0)\)，两项均可由可观测数据识别。证明：ATT(g,t) = E[Y|G=g] - E[Y(∞)|G=g] = E[Y|G=g] - (E[Y|G=∞] + \gamma_{g,t}(0)) = \gamma_{g,t} - \gamma_{g,t}(0)。
Theorem 4.4（异质阶数聚合）：对每个队列g适用自身阶数p_g（1≤p_g≤m_g），则每个ATT(g,t)由Theorem 4.3单独识别；加权聚合θ = ∑{g,t≥g} w{g,t} ATT(g,t)可识别；当所有p_g=1且权重取CS权重时退化为标准CS聚合ATT。核心突破：因为ATT(g,t)是结构参数，不依赖于识别假设，所以即使各队列使用不同p_g，只要各自假设成立，聚合仍有效。注意：每个队列的Parallel[p_g]是独立施加的“群体条件”，不要求其他队列满足同一阶数。
Proposition 5.1（渐近正态性）：在正则条件下，\(\sqrt{N}(\widehat{ATT}^{(p_g)}(g,t) - ATT(g,t)) \xrightarrow{d} N(0, V_{g,t})\)，其中\(V_{g,t}\)包括前后处理协方差（共享对照组导致的交叉项）；聚合ATT同样渐近正态；cluster bootstrap一致估计方差。证明路线：样本差距是均值差→联合CLT；OLS系数是线性函数→delta方法；前后处理差距协方差非零（共享对照）→修正方差公式；bootstrap重抽样保持联合分布。
序列阶数选择：对每个队列独立进行：从p=1开始，检验\(\Delta^p \hat{\gamma}_{g,t}\)是否为零（用卡方统计量\(T_g(p) \sim \chi^2_{m_g-p}\)），若拒绝则升阶，直至不拒绝或达到最大阶数。选择后推荐报告1,2,3阶作为稳健性检查。

证明路线与技术技巧（理论部分）¶

整体路线（以ATT识别与聚合为代表）：

从Parallel[p]到多项式差距（Lemma 4.1）：数学上，\(\Delta^p \gamma_{g,t}=0\)是离散时间多项式刻画。关键：将该“相等性”从时间下标推广到所有t，包括后处理（Proposition 4.2(i)），这一步依赖于Assumption 4对所有t成立（不限于前处理）。这是技术关键：假设平行趋势不仅在两个组间相等，而且在整个时间维度上，p阶差分的期望组间恒等。这是比“两段时间趋势相似”更强的表述，但已隐含在通常平行趋势（p=1时要求各期变化量均值组间相等）中。
构造反事实：前处理差距\((\gamma_{g,s})_{s<g}\)可观测，含p个自由系数的多项式被唯一确定。当\(m_g>p\)时，OLS估计更高效。将系数向量记为\(c_g\)，则\(\gamma_{g,t}(0) = (1,t,\dots,t^{p-1}) c_g\)。
ATT识别：ATT(g,t) = 观测差距 - 反事实差距。
聚合定理：每个ATT(g,t)单独识别是基于本队列的独立识别条件：Parallel[p_g]是仅关于队列g和对照组的条件，与其他队列无关。因此每个ATT(g,t)是定义良好的识别量，加权平均自然识别。证明简洁（线性性）。
渐近分布：
将全部样本差距（前处理+后处理）堆叠为一个向量\(\tilde{\gamma}\)。利用单位独立CLT得到\(\sqrt{N}(\tilde{\gamma}-\tilde{\gamma}_0) \to N(0,\Sigma)\)。
每个ATT(g,t)是\(\tilde{\gamma}\)的线性函数（差距相减，其中反事实部分通过系数矩阵线性变换得到），故联合渐近正态。
方差计算涉及前后处理协方差（来自共享对照）——公式中的第三项\(-2v_t^\top(V^\top V)^{-1}V^\top \sigma_{g,t}\)显式修正了这一依赖，是之前版本缺失的关键项（见Appendix B Step 3）。
聚合方差包括跨队列交叉协方差项，因所有队列共享同一对照组。这些项无法通过独立假设简单处理，但cluster bootstrap统一捕捉。

关键跳跃点： - 如何将前处理多项式外推至后处理：关键是Assumption 4对所有t成立，而不是仅对前处理。这一点在直觉上较强：对后处理期，无法验证“如果未处理，差距的多项式形式会继续”。这是所有DiD外推的共性。本文不加检验地假设了多项式形式持续。作者引用有限差分基本定理来说明离散多项式性质，但外推本身是假设。 - 异质阶数聚合中，是否需要假设跨队列独立？ 不需要。聚合定理仅依赖每个队列自己的识别定理，不要求队列间独立性。但渐近方差的正确计算必须纳入跨队列协方差（通过共享对照产生）。在证明中，附录B的Part (ii)明确说明方差矩阵非分块对角，而cluster bootstrap的一致性依赖于重抽样保留共享对照的依赖结构。 - 后选择推断：论文并未给出正式的后选择推断理论，而是通过蒙特卡洛模拟展示覆盖接近名义水平，并指出未来需要正式结果。这是论文的弱处，也是开放问题。

技术技巧点名： - 有限差分与多项式恒等：Lemma 4.1的核心：\(\Delta^p \gamma =0 \iff \gamma \in \mathcal{P}_{p-1}\)，标准离散微积分结果，引用Jordan (1965)。这是整个识别的数学基础。 - Vandermonde矩阵与满秩：在证明多项式系数唯一确定时，用Vandermonde矩阵非奇异（不同时间点保证）。 - OLS投影：前处理样品差距的OLS拟合得到系数\(\hat{c}_g = (V^\top V)^{-1}V^\top \hat{\gamma}_g^{pre}\)，这是线性投影。反事实估计\(\hat{\gamma}_{g,t}(0)=v_t^\top \hat{c}_g\)是线性组合。 - 联合CLT与delta方法：\(\sqrt{N}\)-渐近正态性的核心。重点关注交叉协方差项（前后处理，跨队列）的处理。方差公式中第三项形如\(-2 v_t^\top (V^\top V)^{-1}V^\top \sigma_{g,t}\)，其中\(\sigma_{g,t}\)是前处理差距与后处理差距的渐近协方差向量。Cluster bootstrap避免了显式计算这些项。 - 序列检验：用检验统计量\(T_g(p)\)近似卡方（在假设独立残差下），但作者谨慎地建议作为描述性诊断，因p阶差分会引入MA(p-1)相关，实际分布偏离卡方。本文用bootstrap来做推断，检验只是选择工具。

真实例子与应用（Medicaid Expansion）¶

数据：46州、2008-2019年面板，结果变量为低收入无子女成人保险覆盖率（州层面比例）。五个扩张队列（2014:22州，2015:3，2016:2，2017:1，2019:2），16州未扩张。前处理期数：2014队列有6期（2008-2013），2015队列7期等。
方法运用：首先用callaway-sant'anna估计Parallel[1]的ATT，前处理联合检验拒绝（χ²(36)=65921, p<0.001）。然后实施序列选择：预期间隙R²在p=2时平均较高（0.50,0.87,0.20,0.72,0.55），选择p*=2作为主要设定。用自己提出的DD[p]估计器（stata命令anddp）计算p=1,2,3的ATT。使用状态层面的cluster bootstrap（B=999）。
结果：DD[2]的简单平均ATT=0.067，加权平均=0.064（vs DD[1] 0.060/0.065）。各事件时间点估计：τ=0时0.052，τ=4时0.084。95%置信区间显示显著正效应。DD[3]区间很宽，且部分包含0。作者强调DD[2]符合前处理数据未拒绝的假设，而DD[1]被明确拒绝，因此DD[2]更可信。
例子想说明什么：验证理论识别条件在实际数据中可操作，展示Parallel[2]（线性趋势）一方面承认了前处理差距上升（违反Parallel[1]），但另一方面反事实外推后仍给出合理正向ATT，且幅度与CS estimate接近但基于更可信的假设。同时说明DD[3]高方差，不宜作为主要规格。

🔎 结论是否比证明窄¶

差异点1：Theorem 4.4(聚合定理)严格证明的是“当每个队列的Parallel[p_g]成立时（各自p_g已知且假设真），加权ATT可识别”。但论文实践中的“选择阶数”来自序列检验，该检验基于前处理数据的真实信号但存在第一类/第二类错误。因此实际中使用的p_g是估计的、可能错选。作者在Remark 9明确承认后选择推断未正式解决，只给出蒙特卡洛证据。因此结论的泛化 claim “不同阶数可聚合” 被证明的是理想世界；现实细节被推迟到未来工作。
差异点2：Proposition 5.1 的渐近正态性依赖于队列份额非退化（π_g>0）。在Medicaid应用中，个别队列仅1-2州（2017队列1州），作者在Remark 6主动声明“不能建立中心极限定理”，将这种队列的估计视为描述性比较。所以大样本理论在极端小队列时不适用——结论窄于全样本无条件的claim。
差异点3：序列检验统计量\(T_g(p)\)的卡方近似依赖于“高阶差分的渐近不相关”，但作者承认该不相关条件“not automatically satisfied”。实际中使用该统计量作为描述性诊断而非正式检验（Section 6.1末尾）。因此“选择程序”的操作化比理论表述更粗放。

四、开放问题（点到为止，扎根具体语句）¶

正式的后选择推断理论：论文序列阶数选择的渐近性质未被严格刻画——覆盖率的蒙特卡洛显示接近但略低于名义水平（89-94%），且未的推导统一有效性结果。作者在Conclusion（Section 9）写道：“A formal uniform validity result for the complete selection-estimation pipeline would strengthen the inferential foundations. The extended version of Roth (2022) on post-selection inference provides a starting point”。这是直接的后续问题。
非多项式光滑约束下的延伸：当预期间隙不遵循多项式时（例如结构断裂、逻辑增长），Parallel[p]误用。作者建议“replacing the polynomial order restriction with derivative-bounded smoothness restrictions (Rambachan and Roth, 2023) would extend the framework... at the cost of point identification.” 问题：能否将导数有界平滑约束与点识别（部分识别）兼容？ 或者设计检验探测非多项式偏离。
协变量调整的理论深化：Remark 10步4提到可加协变量，但仅给出“假设变为条件的Parallel[p] across covariate gaps”的简短描述，未给出识别条件、双稳健性或渐近性质。本文缺少一个正式的协变量调整定理，这是实证应用（尤其是混杂机制）的常见需求。
小队列的推断稳定性：论文Remark 6指出单状态队列无法进行渐近推断。问题：是否存在基于重抽样（如pseudo-cohort bootstrap）或贝叶斯层次模型的方法，为极小队列提供有效推断，同时不放弃点识别？ 这一限制在交错设定中常见（如早期罕见政策）。

Maintained by 陈星宇 · Homepage · Source on GitHub