2026 06 12 2606.12184

一、领域脉络与小综述¶

这个方向是什么¶

面板数据阈值回归是处理非线性经济关系的常用工具：核心假设是回归系数在某个未知的阈值变量（如通胀率）达到临界值后发生跳跃，从而形成“低区间”和“高区间”两种截然不同的行为。当面板数据存在未观测的交互固定效应（即个体-时间交互异质性）时，若忽视它，估计会因内生性与截面相关性而严重有偏。该子方向当前的关键难题是：交互固定效应下的阈值回归能否在时间维度T固定（即“微面板”）下获得可靠的渐近理论？ 已有工作（Miao et al., 2020; Barassi et al., 2023）要求T与N都大，但实践中T往往小（如年数据几十年已属“长”），而N可很大。本文直接迎战这一瓶颈。

发展脉络（history）¶

奠基工作：Hansen (1999, 2000) 首次证明面板固定效应阈值回归可在T固定、N→∞下一致估计阈值和斜率，为后续提供理论基础。但其假设截面独立，无法处理共有冲击（如技术知识、全球通胀）。
主要进展——交互固定效应：Pesaran (2006) 提出 CCE 估计量，用截面平均控制未观测因子，但要求T与N都大。Westerlund et al. (2019) 将 CCE 理论扩展到T固定，证明池化 CCE 仍一致且渐近正态，使 CCE 可用于短面板。Miao et al. (2020) 与 Barassi et al. (2023) 将阈值回归与交互固定效应结合，但均假设T→∞，且 Miao 等使用极大似然+网格搜索+奇异值阈值法，计算昂贵且有非凸优化收敛风险。
当前 frontier：在交互固定效应阈值回归中，T固定 时的估计与推断工具包尚缺。本文声称填补了这一空白，提出基于 CCE 的 LS 型估计量、LR 检验、supW 检验、Bootstrap 程序，并在 Stata 中实现 xtthreshold。
本文的位置：将 Westerlund et al. (2019) 的固定-T CCE 理论推广到阈值模型，同时借鉴 Hansen (1999, 2000) 的网格搜索与收缩阈值技巧，并引入截面 Bootstrap 处理未知γ下的线性假设检验。

子线索聚类¶

交互固定效应估计基准：Pesaran (2006) 的 CCE 估计器（被大量引用），及其在固定-T 下的拓展（Westerlund et al., 2019），以及关于 CCE 秩条件检验（De Vos et al., 2024）、稳健性（Juodis et al., 2021）和 Bootstrap（De Vos & Stauskas, 2024）的工作。这是本文方法的技术支柱。
面板阈值回归：Hansen (1999, 2000) 的固定效应设定；Miao et al. (2020) 与 Barassi et al. (2023) 加入交互固定效应但需T大；以及各类经济应用：Khan & Senhadji (2001) 将 Hansen 方法用于通胀-增长，Sarel (1996) 等。
通胀-增长实证文献：汗牛充栋。本文引用 Khan & Senhadji (2001)、Azam & Khan (2022)、Nell (2023) 作为背景，并指出多数研究忽略截面依赖与政府支出可能导致内生性。
诊断工具：Pesaran (2021) 的 CD 检验、Juodis & Reese (2022) 的经调整的残差 CD 检验、De Vos et al. (2024) 的 CCE 秩条件分类器——本文用于验证模型假设是否满足。

这个方向在追问的核心问题¶

Q1：当T固定时，交互固定效应下的阈值参数γ能否被一致估计？其收敛速率是多少？
Q2：斜率系数θ的√N-渐近正态性是否仍然成立？方差如何一致估计？
Q3：如何检验无阈值效应的原假设H0: δ=0？由于γ在原假设下不可识别，如何构造有效的检验？
Q4：计算效率如何保证？Miao et al. (2020) 的非凸优化+网格搜索代价高昂，能否用闭合形式 CCE 替代？

已知瓶颈：T固定时，截面平均的维数受k限制（需m≤k），否则 CCE 可能失效（Juodis et al., 2021）；收缩阈值假设（α∈(0,1/2)）使理论简化但可能偏离实践。

⚠️ 作者的 framing¶

作者把缺口 frame 成 “唯一缺少的是固定-T下的交互固定效应阈值回归工具包”：他们强调 Westerlund et al. (2019) 的固定-T CCE 已可用于线性模型，但尚未拓展到非线性（阈值）情形；而 Miao et al. (2020) 和 Barassi et al. (2023) 虽然处理了交互固定效应，但要求T大且计算繁重。因此本文“显然的下一步”就是将 Westerlund 的 CCE 与 Hansen 的阈值估计结合，在固定-T下得到完整推断工具。

被淡化/回避的竞争路线： - 平滑阈值模型（Seo & Linton, 2007）与节点阈值模型（Hansen, 2017）被一笔带过，仅在第3.2节末尾顺便提及。作者强调非连续阈值模型的优势在于γ超一致性，而平滑/节点模型的γ估计速度可能更慢。 - 贝叶斯方法或非参数方法（如局部线性）完全没被讨论。 - 含有滞后因变量的动态面板情形：作者在 Assumption 3.4后承认“可放松但需序列不相关”，未进一步展开。

什么明显该被引/该存在、却没出现在 intro 里？ - 几乎没有引用“因子模型”领域的主成分估计（PCA）方法（如 Bai, 2009; Bai & Ng, 2002），尽管 Miao et al. (2020) 使用了因子估计。作者选择 CCE 而非 PCA 可能是出于计算简单和T固定下的有效性，但未解释为何 CCE 优于 PCA。 - 没有引用 Han & Phillips (2006) 关于收缩阈值估计的“nonsmoothness”理论与“慢收敛”的经典讨论。 - 没有引用关于“信息-计算折衷”或“高阶 U-统计量”相关文献——当然这并非本文方向，但研究者的兴趣领域可能注意到这一点。

张力¶

未见明显对立引用。主要进展之间是继承关系：Hansen (1999) → Miao et al. (2020) → 本文。唯一潜在的张在于：Miao et al. (2020) 声称γ的收敛速率是N^{1-2α}（与本文一样），但本文在 Theorem 3.1 后指出 Miao 等声称“当δ不收缩时γ不一致”是错误的，并声称在附录中证明γ即使在固定δ下也一致。这是作者对自己工作的一个“小改进”主张。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型与可观测数据交代¶

符号： - \(i=1,\dots,N\)：截面单元（如国家）；\(t=1,\dots,T\)：时间点，T固定。 - \(y_{i,t}\)：标量响应（如 GDP 增长率）。 - \(x_{i,t}\)：\(k\times 1\) 回归向量（如通胀、政府支出等）。 - \(z_{i,t}\)：标量阈值变量（本文中属于 \(x_{i,t}\) 的一个分量，例如通胀 INF）。 - \(\gamma\)：标量阈值参数（未知），真实值 \(\gamma_0\)。 - \(\beta\)：\(k\times 1\) 回归系数（不依赖区间）。 - \(\delta\)：\(l\times 1\) 系数，度量“跨越阈值后的额外效应”。\(l\) 是受阈值影响的回归元个数。 - \(h_{i,t}(\gamma) := S' x_{i,t} I(z_{i,t} > \gamma)\)，其中 \(S\) 是已知的 \(k\times l\) 选择矩阵（本文为简单取 \(S=[0,1]'\) 表示仅第二个变量系数可变）。 - \(e_{i,t}\)：误差项。 - \(f_t\)：\(m\times 1\) 公共因子（未观测）。 - \(\mu_i\)：\(m\times 1\) 因子载荷（未观测，个体特定）。 - \(\Lambda_i\)：\(m\times k\) 因子载荷矩阵（未观测，决定 \(x_{i,t}\) 如何受因子影响）。 - \(\varepsilon_{i,t}\)：标量特质误差（独立同分布？实际允许序列相关与异方差）。 - \(v_{i,t}\)：\(k\times 1\) 向量，\(x_{i,t}\) 的特质误差。 - \(X_i, y_i, H_i(\gamma), e_i, \varepsilon_i, V_i\)：时间堆叠形式（\(T\times k\) 或 \(T\times 1\) 矩阵/向量）。 - \(F\)：\(T\times m\) 因子矩阵（非随机，满足秩条件）。 - \(\overline{X} = N^{-1}\sum_i X_i\)：截面平均（未知因子的替代估计量）。 - \(Q_{\overline{X}} = I_T - \overline{X}(\overline{X}'\overline{X})^{-1}\overline{X}'\)：基于截面平均的正交投影矩阵，用以“去因子化”。 - \(\widetilde{A}_i = Q_{\overline{X}} A_i\)：去因子化后的变量。 - \(\theta = (\beta', \delta')'\)：斜率参数的总向量（\((k+l)\times 1\)）。 - \(\widehat{\gamma}\)：阈值估计；\(\widehat{\theta} = \widehat{\theta}(\widehat{\gamma})\)。 - \(\widehat{W}_i(\gamma) = [\widetilde{X}_i, \widetilde{H}_i(\gamma)]\)，\(\widetilde{W}(\gamma)\) 是堆叠形式。 - \(\overline{W} = [\overline{X}, \overline{H}(\widehat{\gamma})]\)：用于最终估计的截面平均扩充（除因子外还包含阈值相关变量）。

模型：数据生成机制：

\[y_{i,t} = \beta' x_{i,t} + \delta' h_{i,t}(\gamma_0) + e_{i,t}, \quad h_{i,t}(\gamma_0) = S' x_{i,t} I(z_{i,t} > \gamma_0),\]

\[e_{i,t} = \mu_i' f_t + \varepsilon_{i,t},\]

\[x_{i,t} = \Lambda_i' f_t + v_{i,t}.\]

因子 \(f_t\) 和载荷 \(\mu_i, \Lambda_i\) 都是未知且非随机的（为一般性，也可随机但本文假设非随机）。\(\varepsilon_{i,t}\) 和 \(v_{i,t}\) 相互独立，且独立于因子。允许序列相关与异方差。

可观测数据： - 研究者实际能观测到的是 \(\{(y_{i,t}, x_{i,t})\}_{i=1,t=1}^{N,T}\)，其中 \(z_{i,t}\) 是 \(x_{i,t}\) 的一个分量。 - 无法观测：\(f_t, \mu_i, \Lambda_i, \varepsilon_{i,t}, v_{i,t}\) 以及真实的阈值 \(\gamma_0\)（需估计）。 - 关键识别挑战：\(y_{i,t}\) 与 \(x_{i,t}\) 的共同变异可能源于每个变量各自的因子载荷，使得 OLS 有偏。通过截面平均 \(\overline{X}\) 吸收因子空间，可以在不需要估计 \(m\) 的情况下识别斜率。

第二步：最小内核（最简特例：k=2, l=1, m=1, T固定）¶

设定：假设只有一个因子（\(m=1\)），所以 \(f_t\) 是标量，\(\mu_i\) 和 \(\lambda_i\) 均为标量。假设没有选择矩阵问题，设 \(x_{i,t}\) 的第一个分量（常数？简化）和第二个分量；令受阈值影响的变量恰好是 \(x_{i,t}\) 的第二个分量（记为 \(x_{2,i,t}\)）。即 \(k=2, l=1, S=(0,1)'\)。那么模型退化为：

\[y_{i,t} = \beta_0 + \beta_1 x_{2,i,t} + \delta x_{2,i,t} \cdot I(x_{2,i,t} > \gamma_0) + \mu_i f_t + \varepsilon_{i,t},\]

\[x_{2,i,t} = \lambda_{2,i} f_t + v_{2,i,t}.\]

（假设 \(x_{1,i,t}\) 为常数项或另一回归元，类似处理。）

可观测：\(\{y_{i,t}, x_{2,i,t}\}\)。不可观测：\(f_t, \mu_i, \lambda_{2,i}, \varepsilon_{i,t}, v_{2,i,t}\)。

目标：估计 \(\beta_0, \beta_1, \delta, \gamma_0\)。

核心思路（继续用符号）： 1. 去因子：构造 \(\overline{x}_{2,t} = N^{-1}\sum_i x_{2,i,t}\)（截面平均）。在 \(T\) 固定、\(N\to\infty\) 下，\(\overline{x}_{2,t} \approx \bar\lambda_2 f_t\)，其中 \(\bar\lambda_2 = N^{-1}\sum_i \lambda_{2,i}\)。于是矩阵 \(\overline{X} = (\overline{x}_{2,1}, \ldots, \overline{x}_{2,T})'\) 的列空间近似等于因子 \(f\) 的空间。因此投影 \(Q_{\overline{X}} = I_T - \overline{X}(\overline{X}'\overline{X})^{-1}\overline{X}'\)渐近消除因子（在给定 \(\overline{X}\) 满秩条件下）。 2. 给定 \(\gamma\) 估计斜率：对每个候选 \(\gamma\)，构造 \(H_i(\gamma) = (0_{T\times1}, x_{2,i,t} I(x_{2,i,t}>\gamma))\)，堆叠后得到 \(\widetilde{W}(\gamma) = [\widetilde{X}, \widetilde{H}(\gamma)]\)，其中 \(\widetilde{A}_i = Q_{\overline{X}} A_i\)。则 CCE 估计量为：\(\widetilde{\theta}(\gamma) = (\widetilde{W}(\gamma)'\widetilde{W}(\gamma))^{-1}\widetilde{W}(\gamma)'\widetilde{Y}\)。这本质上是 OLS，没有迭代。 3. 选择 \(\gamma\)：在所有候选值（取自 \(\{x_{2,i,t}\}\) 的若干分位数）上最小化 SSD：\(\text{SSR}(\gamma) = \|\widetilde{Y} - \widetilde{W}(\gamma)\widetilde{\theta}(\gamma)\|^2\)。 4. 最终估计：\(\widehat{\gamma} = \arg\min \text{SSR}(\gamma)\)，然后更新去因子矩阵为 \(Q_{\overline{W}}\)（加入 \(\overline{H}(\widehat{\gamma})\)），重新计算 \(\widehat{\theta} = \widehat{\theta}(\widehat{\gamma})\)。

为什么这个例子抓住了核心：即使只考虑一个因子、一个阈值变量的最简情形，CCE 的去因子步骤和网格搜索仍然是完全一样的；更一般的 \(k,l,m\) 只是线性代数维度的增加，而所有渐近论证的核心——即 \(\overline{X}\) 能够渐近吸收因子空间——在此特例中已经体现。此外，T 固定条件下，Westerlund et al. (2019) 已证明 CCE 在固定 T 下的有效性，本文的关键就是将阈值搜索与固定-T 的 CCE 相结合。

这个最小内核的数学困难：当 \(\gamma\) 不连续地改变区间成员时，\(\widetilde{W}(\gamma)\) 作为 \(\gamma\) 的函数是阶梯函数，导致目标函数 \(\text{SSR}(\gamma)\) 是非凸、不连续的。但因子部分通过投影被消除后，Hansen (1999) 的论证仍成立：在收缩阈值假设下，\(\gamma\) 估计的收敛速率为 \(N^{2\alpha-1}\)，且分布收敛到一个涉及双边布朗运动的极值问题（Theorem 3.2）。而斜率估计保持 \(\sqrt{N}\)-一致，且渐近正态。

三、这篇论文做了什么¶

三句话¶

研究问题：为兼具交互固定效应和固定时间维度 T 的面板数据阈值回归模型，开发一套完整的估计与推断工具包（阈值估计、斜率估计、区间检验、无阈值效应检验）。
核心工具：基于共同相关效应（CCE）的最小二乘估计量，利用截面平均消除未观测因子，在网格搜索中最小化 CCE 残差平方和得到阈值估计，并构建 LR 检验统计量与截面 Bootstrap 方法。
主要结论：在 N→∞、T 固定、且阈值效应为“收缩型”（δ ∝ N^{-α}, α<1/2）条件下，阈值估计满足 \(N^{1-2\alpha}\) 收敛（超一致），斜率估计 \(\sqrt{N}\) 一致且渐近正态，LR 检验的临界值来自已知分布（可校正异方差），无阈值效应检验的 supW 统计量通过 Bootstrap 获得有效推断。蒙特卡洛模拟显示有限样本性能良好。实证应用发现通胀对增长的非线性阈值在 1.1%–3.5% 之间。

关键设定与假设¶

模型已在第二节给出。本文假设： - Assumption 3.1：T > k+l（避免去因子时秩亏）。 - Assumption 3.2：F 非随机，rank(F)=m。 - Assumption 3.3：\(\Lambda_i\) 非随机且上界有限，截面平均载荷矩阵 \(\overline{\Lambda}\) 的秩为 m ≤ k，且极限矩阵满秩为 m。这是 CCE 的核心条件：截面平均能覆盖因子空间。允许观测因子（如固定效应）被显式加入来放松该条件（通过增大 k）。 - Assumption 3.4：\(\varepsilon_{i,t}\) 与 \(v_{i,t}\) 独立于彼此及截面，允许序列相关与异方差；四阶矩有限。这保证中心极限定理成立。 - Assumption 3.5：非共线性条件：\(\Omega(\gamma)\) 与 \(\Gamma(\gamma,\gamma)\) 正定；\(\Sigma(\gamma)\) 正定确保 γ 可识别。 - Assumption 3.6：收缩阈值：\(\delta_0 = N^{-\alpha} c_0\)，\(\alpha\in(0,1/2)\)。标准技术假设，使 γ 的渐近分布无 nuisance 参数。作者指出此假设仅用于推导 γ 的收敛速率，而非一致性；θ 的 √N 一致性不需要此假设。 - Assumption 3.7：高阶矩条件：涉及 \(\Phi_N(\gamma), \Theta_N(\gamma)\) 的连续性、概率界与双边布朗运动收敛。这是为了最终 γ 的极限分布。

对比已有文献：相比 Hansen (1999) 的固定效应（交互效应更一般），相比 Miao et al. (2020) 的 T→∞ 设定（本文 T 固定），相比 Westerlund et al. (2019) 的线性模型（本文引入阈值非线性）。

主要结果（理论）¶

Theorem 3.1（收敛速率）： - (a) \(N^{1-2\alpha}(\widehat{\gamma}-\gamma_0) = O_p(1)\)，因此 \(\widehat{\gamma}-\gamma_0 = O_p(N^{2\alpha-1})\)，当 α<1/4 时超一致（即快于 √N）。 - (b) \(\sqrt{N}(\widehat{\theta}-\theta_0) = O_p(1)\)，斜率估计始终 √N 一致。

Theorem 3.2（渐近分布）： - (a) \(\sqrt{N}(\widehat{\theta}-\theta_0) \xrightarrow{d} N(0, \Omega^{-1}\Psi\Omega^{-1})\)。方差可被一致估计为 \(\widehat{\text{var}}(\widehat{\theta}) = \frac{1}{N}\widehat{\Omega}^{-1}\widehat{\Psi}\widehat{\Omega}^{-1}\)，从而 t 与 Wald 检验有效。 - (b) \(N^{1-2\alpha}(\widehat{\gamma}-\gamma_0) \xrightarrow{d} \omega \zeta\)，其中 \(\zeta = \arg\max_r [ -|r|/2 + B(r) ]\)，B(r) 为双边标准布朗运动。该分布是非标准的，但可通过 LR 检验避免。

Theorem 3.3（LR 检验的分布）： - 在 H0: γ=γ0 下，\(LR_{\gamma_0} = N(T-k-l)\frac{SSR(\gamma_0)-SSR(\widehat{\gamma})}{SSR(\widehat{\gamma})} \xrightarrow{d} \eta^2 \xi\)，其中 \(\eta^2 = c_0'\Theta(\gamma_0)c_0 / [\sigma_\varepsilon^2 c_0'\Phi(\gamma_0)c_0]\)。 - 同方差时 η=1，ξ 的 CDF 为 \(P(\xi\leq r)=(1-e^{-r/2})^2\)，临界值易得。异方差时可缩放 LR 统计量：\(LR_{\gamma_0}/\widehat{\eta}^2\)，其中 \(\widehat{\eta}\) 用核估计构造（公式 3.8）。

Theorem 3.4（无阈值效应检验）： - 在 H0: δ=0 下，supWδ0 弱收敛到 supγ∈Γ ϑ(γ)，其中 ϑ(γ) 是依赖于 Ω,Ψ,R 的高斯过程的二次型，分布非标准。但截面 Bootstrap 方法可实现渐近有效推断（作者未给出该 bootstrap 的理论证明，但蒙特卡洛模拟验证了有限样本性能）。

证明路线与技术技巧¶

整体路线（简化表述）： 1. 去因子有效性：利用截面平均 \(\overline{X}\) 的秩条件（Assumption 3.3），证明 \(Q_{\overline{X}}\) 能渐近消除因子：即 \(\widetilde{e}_i = Q_{\overline{X}} e_i = Q_{\overline{X}} (F\mu_i + \varepsilon_i) = Q_{\overline{X}} \varepsilon_i + o_p(1)\)，因为 \(Q_{\overline{X}} F = o_p(1)\)。 2. 给定γ下的θ估计：去因子后的模型近似为 \(\widetilde{y}_i = \widetilde{X}_i\beta + \widetilde{H}_i(\gamma)\delta + \widetilde{\varepsilon}_i\)。证明当 N→∞，T 固定时，\(\frac{1}{N}\widetilde{W}(\gamma)'\widetilde{W}(\gamma) \xrightarrow{p} \Omega(\gamma)\)，且 \(\frac{1}{\sqrt{N}}\widetilde{W}(\gamma)'\widetilde{\varepsilon} \xrightarrow{d} N(0,\Psi(\gamma))\)。关键在于 \(\widetilde{\varepsilon}_i\) 仍保持适当的矩条件且截面独立（经过去因子后截面依赖被消除？这里需要证明 \(\widetilde{\varepsilon}_i\) 的截面相关性渐近可忽略，文中 Assumption 3.4 的独立性被保留）。 3. γ的一致性与速率：利用收缩阈值假设，将目标函数 SSR(γ) 近似写作一个关于 γ 的“阶梯”函数，其跳跃幅度由 δ0 决定。使用 Assumption 3.7 的概率界，证明在 \(|\gamma-\gamma_0|\) 足够小时，SSR(γ) - SSR(γ0) 的主项由 \(\delta_0' \Gamma(\gamma,\gamma_0)\delta_0\) 主导，从而导出 γ 的收敛速率为 \(N^{2\alpha-1}\)。 4. γ的极限分布：将 SSR(γ) - SSR(γ0) 在缩放的局部邻域 \(r = N^{1-2\alpha}(\gamma-\gamma_0)\) 上展开，得到 \(-|r|/2 + B(r)\) 形式的极限过程，对应于 Theorem 3.2(b) 中的 ζ。 5. θ的分布：证明 \(\widehat{\gamma}\) 的估计误差不影响 \(\widehat{\theta}\) 的 √N 渐近性，因为 \(\widehat{\gamma}-\gamma_0 = o_p(N^{-1/2})\)（当 α<1/4 时超一致，即使 α≥1/4，Theorem 3.2(b) 表明 \(\widehat{\gamma}\) 的收敛仍慢于 √N，但影响可被 δ 的收缩抵消，需细致论证——文中省略细节，依赖 “nuisance parameter free” 论证）。 6. LR 检验：利用 SSR(γ0) 和 SSR(γ̂) 的差与 γ 分布的关系，得到 Theorem 3.3。 7. Bootstrap 有效性：截面 Bootstrap（按个体重抽）保持因子结构与相关性，在收缩阈值假设下能够复制原统计量的渐近分布，无需新证明——文中说 “validity should follow from arguments similar to those of De Vos and Stauskas (2024)”。

关键跳跃点： - γ 估计的“剔除因子”效应：CCE 投影步骤之后，目标函数仍含与 γ 交互的 \(\widetilde{H}_i(\gamma)\)。当 δ 收缩时，H_i(γ) 对 γ 的敏感度被 δ 缩放。证明需要在 γ 离 γ0 较远处，SSR 差异能被 Φ(γ) 主导，且 Φ(γ) 在 γ0 附近有断点。这需要 Assumption 3.7(b) 的高阶矩条件（概率界）来确保一致收敛。 - 异方差校正的 η̂：式 (3.8) 使用核平滑估计 η^2，但这是近似；Theorem 3.3 只给出了同方差下的精确分布，作者声称缩放后也有效，但没有正式定理（只是在文本中描述“Analogous to Miao et al. (2020), we use…”）。

技术技巧点名： - CCE 投影矩阵：\(Q_{\overline{X}}\) 和 \(Q_{\overline{W}}\)。利用了 OLS 闭合形式，避免了因子迭代。 - 网格搜索与分位数缩减：将候选集 Γ 缩减为 N 个分位数，降低计算量（Hansen 1999 的经典技巧）。 - 收缩阈值假设：使 δ 趋于 0，从而将 γ 的跳跃幅度参数化，得到无 nuisance 参数的极限分布。 - 双边 Brownian motion 的极值分布：与 Hansen (2000) 相同，其 CDF 已知；作者直接引用。 - 截面 Bootstrap (pairs bootstrap)：按个体重抽，保持时间维结构；简单易实现，适用于各类序列相关。 - 核估计 η̂：使用核函数 K_b 在 γ̂ 附近平滑估计 Θ(γ0) 与 Φ(γ0) 的比率。

真实例子与应用¶

数据：World Bank 发展指标数据库，74 个国家（51 个发展中国家，23 个工业化国家），1970-2022 年。因变量：人均 GDP 增长率（GDP）。回归元：通胀（INF，也是阈值变量）、政府支出（GOV）、贸易开放（TRA）、人口增长（POP）、资本形成（CAP）。作者让 INF 和 GOV 的系数受阈值影响（即 δ 对应这两个变量）。采用“部分对数”变换处理通胀（保留低值、对数转换高值）。

方法应用： 1. 分别对全样本、发展中国家、工业化国家估计阈值回归模型。 2. 使用 supWδ0 检验阈值效应是否存在。结果：全样本和发展中国家显著（p<0.01 和 p<0.05），工业化国家不显著（可能因为样本量小）。 3. 估计阈值：工业化国家 3.401%（CI: [2.787, 4.336]），发展中国家 1.141%（CI: [1.029, 1.306]），全样本 3.476%（CI: [2.787, 4.336]）。注意发展中国家的阈值低于工业化国家，这与许多已有研究相反（通常是发展中国家阈值更高）。作者将此归因于他们的交互固定效应控制了机构质量等不可观测特征（引用 Ibarra & Trupkin, 2016）。 4. 斜率估计：低通胀区域 INF 系数为正但不显著（工业化国家）或显著正（全样本）；高通胀区域 INF 系数显著负（绝对值大）。GOV 系数在低通胀区域显著负，高通胀区域显著正，说明高通胀时政府支出能刺激增长。 5. 诊断：使用 De Vos et al. (2024) 的秩条件分类器，Assumption 3.3 均通过；使用 Juodis & Reese (2022) 的残差 CD 检验，除工业化国家在10%水平拒绝外，其余不显著，说明模型已充分捕捉截面依赖。

这个例子想说明什么：验证工具包在实际经济问题中的可用性，并展示：① 考虑交互固定效应后阈值估计结果与传统文献有异（发展中国家阈值更低）；② 政府和通胀的非线性效应在不同区间不对称。同时证明诊断检验的良好表现。

🔎 结论是否比证明窄¶

Theorem 3.4（supWδ0 的极限分布）只给出了形式，没有给出显式临界值，而是依赖 Bootstrap。 участков：作者未证明 Bootstrap 的渐近有效性，仅凭 Monte Carlo 和“理论类似”作为依据。这是一个窄化：本文的“新工具包”中 supW 检验缺乏正式大样本理论。
异方差校正的 LR 检验：Theorem 3.3 只给出了同方差下的分布；异方差校正仅通过构造 η̂ 并声称适用，但无正式极限定理（只说“Analogous to Miao et al. (2020)”——而 Miao 也是在 T→∞ 下给出的，是否适用于 T 固定未检验）。这意味着实证中的异方差校正部分的理论基础弱于同方差部分。
动态面板：作者声明可放松独立性假设但未给出结果。真实的实证中，GDP 增长率可能具有动态（滞后因变量），但本文模型是静态的。这窄化了应用范围。
δ 固定不收缩：作者在附录中声称 γ 仍然一致（未证明速率），但 Theorem 3.1 只处理收缩情形，且 Monte Carlo 中 δ 固定时（α=0）γ 的覆盖概率严重偏低（Table 2 中当 α=0, T=100, N=200 时覆盖仅 14.6%），说明收缩假设对置信区间构造至关重要，而该假设在实际中无法验证。作者在讨论中说“inference based on Assumption 3.6 may be misleading”对此有所承认。

四、开放问题（简短，扎根具体语句）¶

动态面板与滞后因变量：模型假设 ε_i,t 与 v_i,t 独立（Assumption 3.4），排除了滞后因变量。作者承认“可放松但需序列不相关”（Section 3.1 后）。开放问题：在固定 T 下，含滞后因变量的阈值模型与交互固定效应能否同时处理？（扎根于 Assumption 3.4 的讨论与 remark）。
非收缩阈值时的置信区间：Theorem 3.2(b) 的分布依赖于收缩假设。Monte Carlo 表 2 显示 α=0（即 δ 固定）时，95% 名义置信区间的实际覆盖率降至 15%~92%（N 大时更差）。开放问题：能否开发一种不依赖收缩假设的 γ 置信区间算法（如倒置 Bootstrap）？（扎根于 Table 2 的最后一列与 Section 3.2 末尾“inference may be misleading”的警告）。
supW 检验的 Bootstrap 理论：Section 3 未给出 Bootstrap 一致性的证明，仅在第4节用 Monte Carlo 支持。开放问题：在 T 固定、N→∞ 下，截面 Bootstrap 对阈值原假设的适应有效性如何严格证明？（扎根于 Theorem 3.4 后的段落：“The basic intuition for why the bootstrap should work is that… validity should follow from arguments similar to those of De Vos and Stauskas (2024).”）
计算与因子维数：当 m > k 时 CCE 可能失效（Assumption 3.3）。作者提到“观测因子”可弥补，但未提供系统性方案。开放问题：若 m > k，是否有替代的固定-T 估计量（如投射到主成分）仍能获得类似结果？（扎根于 Assumption 3.3 的 discussion 以及 Juodis et al. (2021) 的参考文献。）