Causal Inference Using Factor Models¶

作者: Jushan Bai, Peng Wang
主题: 因果推断
相关性: 8/10
链接: https://arxiv.org/abs/2606.29691

一、领域脉络与小综述¶

这个方向是什么¶

这个子方向解决的根本问题是：在面板数据政策评估中，如何在不依赖“平行趋势”假设的前提下，从控制组信息中识别并估计处理组在政策干预后的反事实结果，进而得到因果效应。核心挑战在于，现实数据中不同个体往往面临不同的时间趋势，且这些趋势可能由不可观测的、随时间变化的共同冲击（如宏观经济、行业需求）驱动，而不同个体对这些冲击的暴露程度（因子载荷）又各不相同。当前该方向的成熟度较高，已发展出合成控制法（SC）、交互固定效应模型（IFE）、矩阵补全等多种方法，但如何在允许处理效应异质性和因子结构变化的同时，提供正式的统计推断（置信区间），仍是活跃的研究前沿。

发展脉络（history）¶

奠基工作：平行趋势与合成控制
- Card and Krueger (1994)：经典的双重差分（DID）框架，依赖平行趋势假设，即处理组和对照组在无干预情况下结果变量的变化趋势相同。
- Abadie and Gardeazabal (2003), Abadie, Diamond, and Hainmueller (2010, 2015)：提出合成控制法（SCM），通过加权组合控制单元来构造处理单元的反事实，放松了DID对平行趋势的严格依赖，但依赖“预处理拟合”和“权重稳定性”等隐含假设，且缺乏正式的推断理论（尤其是对单个处理单元）。
主要进展：交互固定效应与因子模型
- Bai (2009)：为面板数据模型提供了交互固定效应（IFE）的估计和推断理论，允许个体效应与时间效应的交互作用，为处理异质性趋势提供了严格的计量工具。这是本文的核心技术基础。
- Gobillon and Magnac (2016), Xu (2017)：将IFE模型引入政策评估，将未处理潜在结果 Y_it(0) 建模为 λ_i' f_t + X_it'β + ε_it。作者指出，这些方法“主要将因子成分作为未观测混杂因素的控制”，但处理效应 δ_it 本身不受模型约束，导致个体因果效应估计中存在 O_p(1) 的插补误差（见公式2.10）。
- Callaway and Karami (2023)：在IFE框架下，聚焦于小T（时间期数少）情形下的ATT识别，但同样只建模 Y_it(0)，且不适用于单个处理单元（n0=1）的合成控制场景。
- Bai and Ng (2021)：提出矩阵补全方法，利用因子结构插补缺失值（即反事实 Y_it(0)），为因果推断提供了另一种视角。作者指出，这些方法“专注于从控制组构造反事实 Y_it(0)”。
当前Frontier与本文位置
- Hsiao, Ching, and Wan (2012), Li and Bell (2017)：提出基于因子模型的回归方法估计反事实，并发展了平均处理效应的大样本理论，但未提供单元-时间点上的推断。
- Li (2020), Chernozhukov, Wuthrich, and Zhu (2025)：发展了合成控制法的时间平均处理效应（τ̄_1）的推断理论，但目标仍是平均效应，而非每个后处理时期的单元特异性效应。
- Imbens and Viviano (2023)：在合成DID框架下，明确将 Y_it(0) 建模为包含强弱因子的因子结构，但假设处理效应恒定。
- 本文（Bai & Wang, 2026）：作者将缺口frame为：现有方法（DID, SCM, IFE, 矩阵补全）都只建模 Y_it(0)，导致个体因果效应估计被 O_p(1) 的插补误差污染。本文通过同时对 Y_it(0) 和 Y_it(1) 建模，将因果效应分解为系统性和异质性两部分，并聚焦于可识别的系统性效应 τ*_it。这使得即使在 n0=1 时，也能对每个后处理时期的系统性效应进行一致估计和推断。

子线索聚类¶

反事实建模派（只建模 Y_it(0)）：包括DID、SCM、Gobillon & Magnac (2016)、Xu (2017)、Callaway & Karami (2023)、Bai & Ng (2021)、Imbens & Viviano (2023)。核心思路是：用控制组信息（加权平均、因子模型、矩阵补全）构造 Y_it(0) 的估计，然后用 Y_it(1) - Ŷ_it(0) 作为因果效应。共同瓶颈：个体效应估计中存在不可忽略的插补误差。
平均效应推断派：包括Li (2020)、Chernozhukov, Wuthrich, and Zhu (2025)、Hsiao, Ching, and Wan (2012)。核心思路是：通过时间或截面平均来消除插补误差，从而对平均处理效应进行推断。共同瓶颈：无法提供单元-时间点上的推断。
双模型建模派（本文）：同时建模 Y_it(0) 和 Y_it(1)，将因果效应视为因子表示的结构变化。核心优势：直接估计系统性效应，避免单侧插补误差，提供单元-时间点上的推断。

这个方向在追问的核心问题¶

识别问题：在什么条件下，个体处理效应（或其系统性部分）是可识别的？当处理组很小（n0=1）时，需要什么假设？
推断问题：如何为个体处理效应（而非平均效应）构造有效的置信区间？当因子和载荷都需要估计时，如何正确量化不确定性？
异质性来源：处理效应是来自对共同冲击暴露程度的变化（载荷变化），还是来自共同冲击本身的变化（因子变化），或是两者兼有？如何区分？
与现有方法的比较：因子模型框架下的估计量与合成控制法、DID等经典方法在什么条件下等价，什么条件下不同？哪个更优？

⚠️ 作者的Framing¶

作者把缺口frame成：现有方法只建模 Y_it(0)，导致个体效应估计被 O_p(1) 的插补误差污染。本文通过双模型建模，直接估计系统性效应，从而解决了这个问题，并提供了推断。
被淡化/回避的竞争路线：
- 作者在2.3节承认，合成控制法在 λ_1(0) ≈ Σ ω_i λ_i(0) 时，其估计量与本文估计量之差约为 ε_1t - Σ ω_i ε_it。作者暗示这个差是 O_p(1)，但没有讨论当 ε_it 的方差很大时，合成控制法的估计量可能比本文估计量（其方差来自 λ_i(1)-λ_i(0) 的估计）更有效。这是一个潜在的比较点。
- 作者在2.1节提到，Gobillon & Magnac (2016) 和 Xu (2017) 的方法在 n0 很大时，可以通过平均化消除插补误差。本文的方法在 n0 很大时也能工作，但作者没有直接比较两种方法在 n0 很大时的相对效率。
什么明显该被引/该存在、却没出现在intro里？
- Athey and Imbens (2022) "Design-based Analysis in Difference-in-Differences Settings with Staggered Adoption"：这篇论文在DID领域有巨大影响，讨论了交错处理下的设计基础推断。虽然本文假设处理时间相同，但讨论其与设计基础方法的联系或区别会很有价值。
- Roth et al. (2023) "What's Trending in Difference-in-Differences? A Synthesis of the Recent Literature"：这是一篇关于DID最新进展的综述，涵盖了平行趋势检验、敏感性分析等。本文作为一篇挑战平行趋势假设的论文，引用这篇综述来定位自己会更完整。
- 关于“因子载荷结构变化”的检验文献：作者在3(d)点提到用结构断点检验来检验 τ*_it=0，但未引用任何关于因子模型中结构断点检验的专门文献（如Bai (2010) "Common breaks in means and variances for panel data"）。这可能是作者未来工作的一部分，但作为方法论文，引用相关检验文献会更严谨。

张力¶

未见明显对立引用。所有被引工作都承认平行趋势假设的局限性，并试图用因子模型或类似结构来放松它。主要差异在于建模策略（只建模 Y_it(0) vs. 双模型）和推断目标（平均效应 vs. 单元-时间点效应）。

二、最核心、最简单的例子 / 数学问题¶

第一步：把符号、模型、可观测数据交代清楚¶

符号：
- i：个体/单元索引（如州、国家）。
- t：时间索引（如年）。
- Y_it：可观测的结果变量（如人均香烟销量、人均GDP）。
- D_it：处理状态指示变量。D_it = 1 表示个体 i 在时间 t 接受了处理。
- Y_it(d)：潜在结果，d=0 表示未处理，d=1 表示处理。Y_it = Y_it(D_it)。
- n：总个体数。n_0：处理组个体数。n_1 = n - n_0：控制组个体数。
- T：总时间期数。T_0：处理前时间期数。T_1 = T - T_0：处理后时间期数。处理发生在 T_0 + 1 时刻。
- f_t：r × 1 维的不可观测共同因子向量（如宏观经济冲击、行业趋势）。
- λ_i(d)：r × 1 维的不可观测因子载荷向量，表示个体 i 在处理状态 d 下对共同因子的暴露程度。
- X_it：p × 1 维的可观测协变量向量。
- β(d)：p × 1 维的协变量系数向量，在处理状态 d 下可能不同。
- ε_it(d)：不可观测的异质性误差项，表示个体 i 在时间 t 和处理状态 d 下的特异性冲击。
- τ_it：个体因果效应，τ_it = Y_it(1) - Y_it(0)。
- τ*_it：系统性因果效应，τ*_it = [λ_i(1) - λ_i(0)]' f_t + X_it' [β(1) - β(0)]。这是本文的目标估计量。
模型：
- 潜在结果由因子模型生成： Y_it(d) = λ_i(d)' f_t + X_it' β(d) + ε_it(d), d = 0, 1.
- 关键假设：共同因子 f_t 在处理前后保持不变（基准模型），或允许变化（潜在因子模型）。
- 处理效应通过因子载荷 λ_i 和/或协变量系数 β 的结构变化来体现。
可观测数据：
- 研究者能观测到的是 (Y_it, D_it, X_it) 的完整面板数据。
- 想要但观测不到的是：
  1. 潜在结果 Y_it(0) 和 Y_it(1)（对于处理组，处理后只能观测到 Y_it(1)，处理前只能观测到 Y_it(0)）。
  2. 共同因子 f_t。
  3. 因子载荷 λ_i(d)。
  4. 异质性误差 ε_it(d)。
- 识别依赖于：从控制组（D_it=0 对所有 t）的数据中，利用因子模型的结构，估计出共同因子 f_t 和控制组的载荷 λ_i(0)。然后，利用处理组处理前的数据，估计处理组的 λ_i(0)；利用处理组处理后的数据，估计处理组的 λ_i(1)。

第二步：讲最小内核¶

最简特例：无协变量、单因子、单处理单元 (n_0=1)、误差项与处理状态无关 (ε_it(0)=ε_it(1)=ε_it)。

在这个特例下，模型退化为： Y_it(d) = λ_i(d) * f_t + ε_it, d=0, 1.

可观测数据：
- 控制组 (i=2,...,n)：对所有 t，Y_it = λ_i(0) * f_t + ε_it。
- 处理组 (i=1)：处理前 (t ≤ T_0)，Y_1t = λ_1(0) * f_t + ε_1t；处理后 (t > T_0)，Y_1t = λ_1(1) * f_t + ε_1t。
核心思路：
1. 估计因子 f_t：利用控制组数据 {Y_it: i=2,...,n, t=1,...,T}，通过主成分分析（PCA）估计出共同因子 ŝ_f_t（至多相差一个旋转，但这里单因子无旋转问题）。
2. 估计处理前载荷 λ_1(0)：将处理组处理前的数据 {Y_1t: t=1,...,T_0} 对估计出的因子 ŝ_f_t 做回归，得到 ŝ_λ_1(0)。
3. 估计处理后载荷 λ_1(1)：将处理组处理后的数据 {Y_1t: t=T_0+1,...,T} 对估计出的因子 ŝ_f_t 做回归，得到 ŝ_λ_1(1)。
4. 估计系统性因果效应：对于任意后处理时期 t > T_0，系统性因果效应的估计量为： ŝ_τ*_1t = [ŝ_λ_1(1) - ŝ_λ_1(0)] * ŝ_f_t.
为什么这个特例抓住了核心？
- 识别：τ*_1t 是 [λ_1(1) - λ_1(0)] * f_t。由于 f_t 和 λ_1(0), λ_1(1) 都可以从数据中估计出来，所以 τ*_1t 是可识别的。
- 与合成控制法的对比：合成控制法估计的效应是 τ_synth_1t = Y_1t - Σ ω_i Y_it。在因子模型下，τ_synth_1t ≈ [λ_1(1) - Σ ω_i λ_i(0)] * f_t + ε_1t。即使合成控制法完美匹配了处理前的载荷（λ_1(0) ≈ Σ ω_i λ_i(0)），其估计量仍然包含 O_p(1) 的异质性误差 ε_1t。而本文的估计量 ŝ_τ*_1t 则没有这个误差项，因为它是直接从载荷变化中构造的。
- 核心数学困难：当因子 f_t 和载荷 λ_i(d) 都需要估计时，如何量化 ŝ_τ*_1t 的抽样不确定性？这需要联合处理因子估计误差和回归估计误差，并证明它们的渐近正态性。这正是本文Proposition 1要解决的核心问题。

三、这篇论文做了什么¶

三句话¶

研究了什么问题：在面板数据政策评估中，提出一个因子模型框架，将处理效应分解为系统性部分（由因子载荷和协变量系数的结构变化驱动）和异质性部分，并聚焦于可识别的系统性因果效应 τ*_it 的估计与推断。
核心工具/方法：采用双模型策略，同时对处理组和控制组的潜在结果 Y_it(0) 和 Y_it(1) 建立因子模型。利用控制组数据通过主成分分析（PCA）估计共同因子，然后通过处理组处理前/后的回归估计载荷变化，从而构造 τ*_it 的估计量。
主要结论：在 n_1, T_0, T_1 → ∞ 且满足一定速率条件（如 √n_1/T → 0）下，所提出的系统性因果效应估计量 ŝ_τ*_it 是一致且渐近正态的。该方法适用于单个或多个处理单元，并可以扩展至处理效应影响因子过程本身的情形。模拟和实证（加州烟草税、德国统一）表明其覆盖概率接近名义水平，且估计结果与合成控制法大体一致。

关键设定与假设¶

核心模型：公式 (2.2) Y_it(d) = λ_i(d)' f_t + X_it' β(d) + ε_it(d)。
- 与现有文献的区别：现有IFE方法（如Gobillon & Magnac 2016）假设 λ_i 和 β 在处理前后不变，处理效应 δ_it 是外生附加的。本文允许 λ_i 和 β 变化，将处理效应内生化到因子结构中。
关键假设（见Appendix A.3）：
- A.1 (因子矩非奇异性)：因子二阶矩矩阵正定，确保因子可识别。
- A.2 (处理组投影设计矩)：处理组协变量在因子投影后的二阶矩矩阵正定，确保 β(d) 可识别。
- A.3 (弱序列相关)：误差项 ε_it(d) 在个体间独立，且满足一定的矩条件和弱时间相关性。这是为了应用中心极限定理和控制因子估计误差。
- A.4 (处理组得分CLT)：处理组回归的得分向量（因子得分和协变量得分）满足联合CLT，且处理前、后得分渐近独立。这是证明 ŝ_τ*_it 渐近正态性的核心。
- A.5 (控制组矩非奇异性与得分CLT)：控制组载荷的二阶矩矩阵正定，且因子估计的得分向量满足CLT。这是为了控制因子估计误差的渐近分布。
- 速率条件：√n_1/T → 0 和 √T/n_1 → 0。这要求控制组个体数 n_1 和时间期数 T 都趋于无穷，且 n_1 的增长速度要快于 T 的平方根，反之亦然。这是为了确保因子估计的一致性以及因子估计误差相对于回归误差是可忽略的。

主要结果¶

Proposition 1 (因子不变情形)：
- 陈述：在假设A.1-A.5下，对于固定的处理单元 i 和后处理时间 t，估计量 ŝ_τ*_it 是 τ*_it 的一致估计，且 ŝ_V_it^{-1/2} (ŝ_τ*_it - τ*_it) ⇒ N(0,1)。
- 直觉：该结果成立的条件是 n_0 固定或发散。关键在于，通过双模型策略，ŝ_τ*_it 的误差主要来自两部分：处理组回归的估计误差（O_p(1/√T_0 + 1/√T_1)）和因子估计误差（O_p(1/√n_1)）。在给定速率条件下，这些误差的线性组合是渐近正态的。
- 必要条件：T_0, T_1, n_1 → ∞，且 √n_1/T → 0 和 √T/n_1 → 0。当 n_0 → ∞ 且 f_t = 0 时，需要额外条件 (A.23) 来保证回归误差占主导。
- 解决的技术难点：如何将因子估计误差（来自控制组）与回归估计误差（来自处理组）解耦，并证明它们的联合渐近正态性。作者通过将 ŝ_τ*_it - τ*_it 分解为三个部分（公式A.40），并证明交叉项 R_it 是可忽略的，从而实现了这一点。
Proposition 2 (因子变化情形，大 n_0)：
- 陈述：在假设A.1-A.5和B.1下，当 n_0/n → c ∈ (0,1) 且 T_0/T → b ∈ (0,1) 时，估计量 ŝ_τ*_it 是一致且渐近正态的。
- 直觉：当处理组个体数 n_0 也很大时，可以分别从控制组和处理组估计出处理前因子 f_t(0) 和处理后因子 f_t(1)。此时，系统性效应 τ*_it = λ_i(1)' f_t(1) - λ_i(0)' f_t(0) 的估计误差来自四个独立的部分：处理组因子估计、处理组载荷估计、控制组因子估计、控制组载荷估计。它们的方差可以相加。
- 必要条件：n_0, n_1, T_0, T_1 → ∞，且 √n/T → 0 和 √T/n → 0（这里 n = n_0 + n_1）。

证明路线与技术技巧¶

以Proposition 1为例（核心证明在Appendix A.4）：

整体路线：
1. 分解误差：将 ŝ_τ*_it - τ*_it 分解为三个部分（公式A.40）：
  - A_it,1 - A_it,0：来自处理组回归的估计误差（处理前、后）。
  - (ŝ_f_t - f_t)' [λ_i(1) - λ_i(0)]：来自因子估计的误差。
  - R_it：交叉项，是因子估计误差与回归估计误差的乘积。
2. 处理回归误差：通过Lemma 2和Lemma 3，证明 ŝ_β(d) 和 ŝ_λ_i(d) 的估计误差可以近似为已知因子 F_d 下的回归误差，加上一个可忽略的 O_p(b_nT,d) 项。这利用了因子估计误差 Δ_d 的收敛速率（Lemma 1）。
3. 证明交叉项可忽略：利用因子估计误差 ŝ_f_t - f_t = O_p(1/√n_1 + 1/T) 和回归估计误差 ŝ_λ_i(d) - λ_i(d) = O_p(1/√T_d + ...)，证明交叉项 R_it 是 o_p(1) 量级，相对于主导方差项可忽略。
4. 渐近正态性：主导项 A_it,1 - A_it,0 和 (ŝ_f_t - f_t)' [λ_i(1) - λ_i(0)] 分别来自处理组和控制组的独立样本，因此渐近独立。对每个部分应用CLT（假设A.4和A.5），得到联合渐近正态性。
5. 方差估计：Lemma 4证明了所提出的方差估计量 ŝ_V_it 是相合的。方差被分解为回归方差 ŝ_V^reg_it 和因子方差 ŝ_V^f_it，两者渐近不相关。
关键跳跃点：
- Lemma 2和Lemma 3的证明：这是最吃功夫的部分。需要证明，当用估计的因子 ŝ_F_d 代替真实因子 F_d 进行回归时，回归系数的估计误差可以近似为已知因子下的误差。这依赖于对 M_ŝ_F_d（投影矩阵）和 M_F_d 之差的精确展开，并利用Lemma 1中的因子估计误差界来控制展开中的高阶项。具体地，证明中使用了 M_ŝ_F_d - M_F_d = -M_F_d Δ_d Q_d^{-1} F_d'/T_d - F_d Q_d^{-1} Δ_d' M_F_d / T_d + Υ_d 这一展开，并逐项证明其贡献是可忽略的。
- 方差估计量的相合性（Lemma 4）：需要证明 ŝ_V_it / V_it → 1。关键在于处理 f_t = 0 的“刀锋”情形。当 f_t = 0 时，回归方差的主导项来自协变量部分（O_p(1/(n_0 T_d))），而因子方差和交叉项是更小的量级。Lemma 4通过仔细的量级分析，证明了在这些情形下，方差估计量仍然是相合的。
技术技巧点名：
- 主成分分析（PCA）：用于从控制组数据中估计共同因子 f_t。
- 投影矩阵展开：用于处理估计因子带来的误差，将 M_ŝ_F_d 围绕 M_F_d 展开。
- O_p 和 o_p 量级分析：贯穿整个证明，用于比较不同误差项的量级，证明交叉项和余项可忽略。
- 分块矩阵求逆（Schur补）：用于推导 ŝ_β(d) 和 ŝ_λ_i(d) 的显式表达式（公式A.10, A.11）。
- Delta方法：用于从回归系数和因子的联合渐近正态性推导出 ŝ_τ*_it 的渐近正态性。
- Sandwich方差估计：用于估计回归系数的方差（公式A.14），以应对异方差性。

真实例子与应用¶

数据/场景：
1. 加州烟草控制计划：使用Abadie, Diamond, and Hainmueller (2010) 的数据，评估1988年加州99号提案（提高香烟税）对人均香烟销量的影响。处理组是加州，控制组是其他38个州。
2. 德国统一：使用Abadie, Diamond, and Hainmueller (2015) 的数据，评估1990年德国统一对西德人均GDP的影响。处理组是西德，控制组是其他16个OECD国家。
方法应用：
- 从控制组数据中，通过PCA估计共同因子 ŝ_f_t（使用Ahn & Horenstein (2013) 的ER/GR准则确定因子数，加州案例中为1或2个因子，德国案例中为1个因子）。
- 将处理组处理前/后的数据分别对 ŝ_f_t 和截距项做回归，得到 ŝ_λ_i(0), ŝ_a_i(0) 和 ŝ_λ_i(1), ŝ_a_i(1)。
- 计算系统性因果效应 ŝ_τ*_it = [ŝ_λ_i(1) - ŝ_λ_i(0)]' ŝ_f_t + [ŝ_a_i(1) - ŝ_a_i(0)]。
- 构造95%置信区间。
结果：
- 因子模型估计的反事实路径和因果效应与合成控制法的估计结果“broadly consistent”（大体一致）。
- 因子模型提供了正式的置信区间，而合成控制法没有。这些置信区间通常覆盖了合成控制法的点估计。
- 结构断点检验（Quandt LR test, Chow test）显著，支持了处理组因子载荷在处理后发生变化的假设。
- 在德国统一案例中，发现了一个统计上显著的截距项变化（κ_WG），这可能反映了因子过程的常数偏移。
例子想说明什么：
- 验证理论：模拟和实证都表明，所提出的估计量在有限样本下表现良好，覆盖概率接近名义水平。
- 展示相对优势：与合成控制法相比，本文方法能提供正式的推断（置信区间），并且能提供关于处理效应来源的诊断信息（如载荷变化 vs. 截距变化）。

🔎 结论是否比证明窄¶

窄的结论：Proposition 1的证明依赖于假设A.4，即处理前、后得分向量渐近独立。这在处理前、后时间块不重叠时是合理的，但如果处理效应有动态溢出效应（即处理前的行为影响了处理后的误差），这个假设可能不成立。作者在证明中明确提到了这一点，但并未在结论中讨论其稳健性。
泛化的claim：作者在结论（Section 8）中声称该方法“不依赖标准平行趋势假设”。这是正确的，因为模型允许异质性趋势。但该方法依赖于一个更强的、隐含的假设：因子结构在控制组和处理组处理前是相同的，且因子在处理前后保持不变（基准模型）。这个假设在实证中可能比平行趋势更难验证。
Conjecture：作者在4.2节讨论小 n_0 下的潜在因子模型时，假设因子过程是常数偏移 f_t(1) = f_t(0) + Δ。作者声称“Proposition 1 therefore applies after augmenting the unit-level regression with a constant term.” 这严格来说是一个结论，但它的成立依赖于 Δ 被截距项吸收后，不影响 λ_i(1) 的估计。证明中并未显式处理这个吸收过程，但逻辑上是合理的。

四、开放问题¶

动态处理效应与交错处理：本文假设所有处理单元在同一时间接受处理。如何将框架扩展到交错处理（staggered adoption）设定？这需要处理不同处理时点的单元之间的相互影响，以及处理效应的动态变化。扎根点：本文假设“the policy intervention occurs in the same period for all treated units”（Section 2），这是一个很强的限制。
因子数选择与推断：本文在实证中使用了Ahn & Horenstein (2013) 和 Bai & Ng (2002) 的准则选择因子数，但推断理论（Proposition 1 & 2）是建立在已知因子数 r 的基础上的。如何将因子数选择的不确定性纳入推断，或者开发对因子数误设稳健的推断方法，是一个重要的开放问题。扎根点：Proposition 1的陈述中假设因子数 r 是已知的。
弱因子与强因子：本文假设因子是“强”的（即因子载荷的二阶矩矩阵正定，如Assumption A.5）。当存在弱因子（其载荷的贡献随样本量增加而衰减）时，因子估计的收敛速度会变慢，本文的推断理论是否仍然成立？扎根点：Imbens and Viviano (2023) 的工作明确考虑了强弱因子，本文在引言中提到了它，但未将其纳入自己的理论框架。
与设计基础方法的联系：本文的方法本质上是基于模型的（model-based）。近年来，DID领域的设计基础方法（design-based）取得了很大进展。本文的因子模型框架与设计基础方法（如随机化推断）之间是否存在联系？能否将两者结合，以获得对模型误设更稳健的推断？扎根点：本文未引用任何设计基础的DID文献（如Athey & Imbens 2022），这是一个值得探索的张力点。

Maintained by 陈星宇 · Homepage · Source on GitHub