跳转至

Semiparametric regression of panel count data with informative terminal event

作者: Xiangbin Hu, Li Liu, Ying Zhang, Xingqiu Zhao
来源: Bernoulli
主题: 非参数 / 半参数
相关性: 6/10
链接: https://doi.org/10.3150/22-bej1565


一、领域脉络与小综述

  • 这个方向是什么:本方向研究纵向面板计数数据(panel count data)的回归分析。与连续观测的「事件史分析」不同,面板计数数据只在少数几个预设的观测时间点记录累计事件次数,因此是「区间删失」型的计数过程。问题难度来自两个侧面:(a) 终止事件(terminal event,如死亡)是信息性的,即终止事件时间与事件过程的潜在强度相关,忽略它将导致选择性偏倚;(b) 需要半参数模型估算协变量对事件发生率的影响,同时将终止事件分布视为无穷维 nuisance 参数,最终做根号 n 推断。

  • 发展脉络(history):从 intro 与 bibliograph 提炼出的主线如下。

  • 奠基工作:Cox (1972, JRSS-B) 的比例风险模型(Cox proportional hazards model)为事件时间数据的回归分析设下基准。对于计数过程(recurrent events),Andersen & Gill (1982, AoS) 引入强度过程建模(the Andersen–Gill model),假设计数过程的强度由观测到的协变量及风险函数决定。但这两个奠基工作都假设终止事件是独立的或者非信息性的——这也正是后来大量工作的突破口。

  • 面板计数数据独立终止事件情形:Sun & Zhao (2013, Springer monograph) 系统总结了面板计数数据的统计方法。对于独立删失(即终止事件非信息性),Zhang (2002, SCR) 提出用 estimating equation 做线性均值回归;Lu et al. (2007, Biometrics) 将其推广到潜在类别(latent class)模型;Sun & Wei (2000, AoS) 发展了一类加权估计方程。几乎所有这时期的文献都假设终止事件与计数过程之间是独立的或非信息性的。

  • 信息性终止事件的引入:Wang et al. (2001, AoS) 是本文引用中的关键节点——它首次认真处理计数过程与终止事件的依赖结构。Wang et al. 提出了一个 "terminating-event anchor" 框架:以终止事件为锚点,将计数过程从原始时间原点扭转到终止事件前的反向时间,从而把「带信息性终止事件的计数过程」转化为一个在「剩余寿命」尺度上的终止事件后过程,使独立性假设重获成立。这一框架被 He et al. (2015, Comp. Stats.);Sun et al. (2017, SJAS);Zhao et al. (2020, SJS) 等继承与扩展。

  • 半参数 sieve 估计与慢收敛 nuisance 理论: Shen (1997, AoS) 和 Shen & Wong (1994, AoS) 的 sieve 估计(样条筛网、多项式筛网)大范围通用性早已确立——非参数函数的收敛率可慢于根号 n,但参数分量的根号 n 推断仍需依赖 nuisance 估计的特定收敛率。Chen (2007, Econometric Reviews) 的筛网半参数推断综述是本文引用的关键参考。本文在方法论上属于 Shen & Wong (1994) + Chen (2007) 范式在面板计数 + 信息性终止事件场景的直接应用。

  • 本文位置:本文在已有框架中将终止事件分布视为无穷维 nuisance(而非直接猜测参数形式),使用 spline-based sieve 估计,再以 predicted least squares 两步法估算回归系数。它是反事实推断、做因果识别,只是在半参数回归的框架内处理信息性删失。它依赖 Wang et al. (2001) 的反向过程构造,但不是对因果结构的刻画而是对均值结构的条件建模。

  • 子线索聚类

  • 运动学/独立删失面板计数方法:Sun & Zhao (2013), Zhang (2002), Lu et al. (2007), Sun & Wei (2000). 基本假设结束事件是非信息性的。
  • 信息性终止事件:Wang et al. (2001) 开创反向过程;He et al. (2015) 与 Sun et al. (2017) 做延伸;Zhao et al. (2020) 做进一步理论。重点是识别依赖结构。
  • 半参数推断与 sieve 理论:Shen (1997), Shen & Wong (1994), Chen (2007). 为本文提供渐近理论框架。
  • 经典生存分析:Cox (1972), Andersen & Gill (1982)——奠定回归基础,但不涉及信息性终止事件。

  • 核心追问与瓶颈

  • 如何定义信息性终止事件下的可识别条件?——需要终止事件与计数过程之间的依赖结构是「可修正的」(如反向计时的工作),否则常规方法失效。
  • 如何对无穷维 nuisance 的估计做到根号 n 一致性?——这里 infinite-dimensional parameter 的收敛率只能做到慢于 1/sqrt(n),所以参数分量的渐近正态性需要特殊处理(不再是标准 sieve MLE 情形)。
  • 实际应用中,观测点个数少而终止事件的截断信息性强,是否仍然有效?——模拟只做了中等样本(100、200、400)和中等观测次数(10、15),这个是实质缺口。

  • ⚠️ 作者的 framing:作者将缺口框架为「现有信息性终止事件的模型要么对终止事件分布强加参数假设,要么无法建立参数分量的渐近正态性」。因此,本文声称填补了「在 sieve 框架下同时处理终止事件慢收敛 nuisance 与根号 n 推断」这个缺口。

  • 被淡化的竞争路线:Any full-likelihood / shared frailty 方法(如经典 joint modelling of longitudinal and survival data,Tsiatis & Davidian (2004, ARSP) 一派)。这类方法日本经认定为强模型,但需要正确设定随机效应的分布,作者将其归入「强假设」。却未讨论为何不直接用那一路——潜在原因是知识点已在已有文献,但本文没有给出直接的比较引用。
  • 值得注意的是:intro 中没有引用任何关于因果推断中的信息性删失或 dynamic treatment regime 的文献(如 Robins, Hernán, Van der Laan 的 g-computation/Doubly robust 系列),尽管这些在纵向数据因果推断中是标准。这可能预示着这篇论文的关注面较窄(纯生存分析领域),而不是正在成长中的因果推断方向。这条信息值得研究者自行检验——可能是无意疏忽,也可能说明作者确实与这个方向无关。

  • 张力:未见明显对立引用——作者们都在同一个研究传统内,以 Wang et al. (2001) 为背书,以 Shen & Wong (1994) 为技术路线,未见直接矛盾。

二、最核心、最简单的例子 / 数学问题

第一步:符号、模型与可观测数据交代

  • 符号
  • \(T\):终止事件时间(terminal event time),如死亡时间。要估计其累积分布函数 \(F(t)\) 作为无穷维 nuisance 参数。
  • \(N(t)\):在时间 \([0,t]\) 内发生的事件(recurrent events)的累计次数。\(N(t)\) 是在 \(t\) 之前的计数过程。
  • \(\tau\):固定观察截止时间(maximum follow-up time),\(T\)\(C\) 都被截断在此。
  • \(X\)\(p\) 维协变量向量(可观测)。
  • \(U = \min(T, C)\):实际可观测到的结束时间(最小为终止事件时间,最小为独立删失时间 \(C\),最小是 \(\tau\))。\(C\) 独立于 \((N,T)\)\(X\)
  • \(\Delta = I(T \leq C)\):终止事件是否在删失前发生。
  • 对于个体 \(i\),观测到的面板计数数据为:\(\{N_i(t_{i1}), N_i(t_{i2}), \dots, N_i(t_{i,m_i})\}\),也就是在预定的观测时间点 \(t_{i1} < t_{i2} < \dots < t_{i,m_i} \leq U_i\) 累积的事件数(但不等于 \(U_i\) 时刻的值)。也就是面板计数——只知道观测时间点处截断的计数。
  • 主要 estimand:回归系数 \(\beta\)(在条件均值模型中)。
  • 反向过程:定义反向时间 \(s = T - t\)(事件时间 \(t\) 距终止事件的时间)。文章考虑反向计数过程 \(\widetilde{N}(t; T) = N(T) - N(t^-)\)(即从 \(t\) 时间到终止事件之间发生的事件数)。注意 \(\widetilde{N}(t; T)\)\(t\) 的函数但被视为定义在 \([0,T]\) 上的过程。

  • 模型与条件均值结构:作者的半参数条件均值模型定义为

    \[E[d\widetilde{N}(t; T) \mid X, T] = \exp(\beta^\top X) d\Lambda(t, T)\]
    其中 \(\Lambda(t,T)\) 是未知的二维累积风险函数,在本文中被简化假设为各向同性的 Marshall–Olkin 型结构(即 \(\Lambda(t,T) = \mu_0(t) \alpha(T)\),其中 \(\mu_0(t)\) 是未知基线函数,\(\alpha(T)\) 是终止事件时间 \(T\) 的特定函数)。本文更一般的处理是假设
    \[E[\widetilde{N}(t; T) \mid X, T] = \exp(\beta^\top X) \cdot \Gamma(t, T)\]
    其中 \(\Gamma(t,T)\) 是未知的 \([0,T]\) 上非负递增函数。注意它是条件均值,不是强度;所以这是计数过程的均值回归(mean regression),不是强度回归——它能处理面板数据是因为我们不需要观测整个样本路径。

  • 可观测数据与潜在量区分

  • 可观测:每个个体的观测时间点 \(\{t_{ij}\}\) 及其对应计数 \(N_i(t_{ij})\);结束时间 \(U_i\) 与指示 \(\Delta_i\);协变量 \(X_i\)
  • 潜在但唯一需要假设的:反向过程中的潜变量 \(\widetilde{N}(t; T)\)(对已死个体可反推,对未死 \(T > U\) 的个体未知),但真正的潜在量是整条 \(\widetilde{N}(t; T)\) 的样本路径——我们不可能从有限的面板观测点重建。作者的工作依赖于多个观测点给出的离散观测值,而非连续路径。

第二步:最小内核

剥掉所有正则性条件、复杂假设后的最小问题

假定: - 每个个体只有一个协变量(\(X \in \mathbb{R}\)\(p=1\))。 - 终止事件 \(T\) 的时间观测是离散的并且只取两个值:\(T \in \{0,1\}\),简化观测间隔就是整数(这样观察点只有 \(t=0,1\) 两处),且没有独立删失。 - 面板计数 \(N(t)\) 在时间点 \(t=0\)\(t=1\) 可观测——即每个个体有两次面板观测。 - 模型简化为

\[E[\widetilde{N}(t;T) \mid X, T] = \exp(\beta X) \Gamma(T)\]
其中 \(\Gamma(T)\)\(T\) 的某个未知函数(这里二维退化为一维函数)——只需估计 \(T=0\)\(T=1\) 时的两个值。 - 终止事件分布函数 \(F(t)\)\(t=0\) 和 1)是 nuisance,我们用最简单的 sieve(只过两个函数值的 Bernstein 多项式,阶数=2)去近似。

此时要做到的事: 1. 第1步:从全部样本中用 sieve 估计 \(F(t)\)\(t=0,1\)),得到 \(\hat F(0), \hat F(1)\)。 2. 第2步:对于每个终止事件时间 \(T\) 的个体,定义反向计数过程的观测为:若 \(T=0\)\(\widetilde{N}(0;0) = N(0) - N(0^-) = N(0)\)(假设过程在 0 之前没发生事件);若 \(T=1\)\(\widetilde{N}(0;1) = N(1) - N(0)\)\(\widetilde{N}(1;1) = N(1)-N(1^-)=N(1)-N(0)\)。将模型拟合到这些观测值上。 3. 第3步:这变成了一个最简单的带 nuisance 参数的两步法问题:\(\beta\) 的 MLE/minimiser 由 minimum of \(\sum_i (Y_i - \exp(\beta X)\hat \Gamma_i)^2\) 给出,其中 \(\hat \Gamma_i\)\(\hat F\) 中估计。 4. 第4步:证明 \(\hat \beta\) 渐近正态。关键夸张是:\(\hat F\) 的收敛率慢于 \(O_p(1/\sqrt{n})\) 时,推理还能进行,因为估计方程是二次可微的且 nuisance 的偏差可以被二阶项捕捉。

硕士生能自证的内容:在此极端简化下,\(F(t)\) 只有两个点,Sieve 退化成了非参数方法?这不是真实的 sieve,但直观上它的思想是:如果模型是瞬时线性的(log-linear mean),只要 nuisance 的收敛率是 \(n^{-c}\)\(c>0\)(不要求 \(c=1/2\)),参数部分的根号 n 推断是可行的,因为偏差项可以上界为 \(o_p(n^{-1/2})\)。正是 2-(参数部分导函数的连续性)+ (收敛率正好慢于根号 n 但不是太慢)才是关键难点,也是本文的核心技术贡献。

三、这篇论文做了什么

  • 三句话: ① 本文为面板计数数据提出一个以终止事件为锚点的半参数条件均值模型(通过反向计数过程结构),将终止事件分布视为无穷维 nuisance 参数。 ② 方法采用两步法:用 spline-based sieve 估计终止事件分布,再用 predicted least squares 估计回归参数(有限维参数)。 ③ 证明在 nuisance 以慢于 \(1/\sqrt{n}\) 的速度收敛时,参数分量仍渐近正态,并建立了无穷维参数泛函的一致收敛率与渐近正态性,完整给出半参数有效推断的理论。

  • 关键设定与假设:在第二节记号基础上补充完整假设(从正文截取,用中文重述)。

  • 设定:设个体 \(i=1,\dots,n\),每个个体在随机观测时间点 \(\{t_{i1},\dots,t_{i,m_i}\}\) 记录累积事件数。观测过程独立于计数过程,给定协变量(non-informative observation times)。终止事件时间 \(T_i\) 可以是观测到的(\(\Delta_i=1\))或被独立删失时间 \(C_i\) 截断(\(\Delta_i=0\))。观测结束时间 \(U_i = \min(T_i, C_i, \tau)\)\(\tau\) 是固定研究时长。

  • 假设 1 (Conditional mean model):对于所有 \(t \in [0,T]\)
    \[E[\widetilde{N}(t,T) \mid X, T] = \exp(\beta^\top X) \gamma(t,T)\]
    \(\gamma(t,T)\) 是未知递增函数,\(\beta\)\(p\times 1\) 的有限维参数。注意这里不是强度模型(intensity model),而是均值模型(mean model)——比强度模型更宽松,但识别性更差(不依赖计数过程的过去)。
  • 假设 2 (Conditional independence of censoring)\(C\) 独立于 \((N,T)\),给定 \(X\)
  • 假设 3 (Sieve 空间):终止事件分布 \(F(t)\) 由 Bernstein 多项式样条近似,阶数为 \(m=m_n\),随着 \(n\) 增长而增长。光滑性条件(\({F}\)\([0,\tau]\) 上有 \(p_0\) 阶导且均匀有界)是标准光滑度假设。
  • 假设 4 (Regularity conditions):包括协变量有界,观测时间点随机但密度有界且光滑,计数的条件矩有界。

  • 与已有文献的差异:与 Sun & Zhao (2013) 的独立面板计数相比,本文加了 \(\gamma(t,T)\) 包含 \(T\) 作为变量——解释为终止事件对计数过程均值有乘性影响。与 Wang et al (2001) 相比,本文不做非参数估计,而是半参数结构。

  • 主要结果:两个核心定理(以第3节、第4节为骨架)。

  • 定理1(收敛率):设 \(\hat \beta\) 为两步估计,\(\hat F\) 为 sieve 估计。假设正则性条件,则:

    \[\|\hat \beta - \beta\| = O_p(n^{-1/2})\]
    \[\|\hat F - F\| = O_p(n^{-q_0 / (2q_0 + 1)})\]
    其中 \(q_0\)\(F\) 的光滑性参数(Sobolev 类阶数)。这标准——nuisance 收敛慢于 \(n^{-1/2}\),如果 \(q_0\) 是有限数(不是无穷)。

  • 定理2(渐近正态性):对于任意某类光滑线性泛函 \(L(\hat F)\)(比如 \(\int_{0}^{\tau} \phi(t) d\hat F(t)\),$\phi $ 光滑函数),\(L(\hat F)-L(F)\) 是渐近正态的,方差由泛函的 effective influence function 表达。对于 \(\hat \beta\),存在如下的正态近似:

    \[n^{1/2}(\hat \beta - \beta) \xrightarrow{d} N(0, \Sigma(\beta, F))\]
    \(\Sigma\) 的表达式由两步估计的 influence function 给出——关键在于不依赖于 \(L(F)\) 的收敛速度(比根号 n 慢)。 证明的技术核心是:由于两步法中的主方程在 \(\beta\) 处是 Frechet 可微的,且 nuisance 的偏差是 \(o_p(n^{-1/2})\)——这依赖于样条 sieve 的 bias–variance 分解二阶项展开,其中偏差的 \(O_p\) 阶被吸收进方差项。

  • 证明路线与技术技巧

  • 整体路线

    1. Sieve 估计:选择 Bernstein 多项式基 \(\{B_k(\cdot), k=1,\dots, m_n\}\) 来近似 \(F\)。参数 \(F\) 的估计基于终止事件数据的条件似然(censored data MLE on sieve space)。
    2. 两步估计:将 \(\hat F\) 代入模型,构造以下预测最小二乘目标函数:
      \[Q_n(\beta, \hat F) = \frac{1}{n}\sum_{i=1}^n \sum_{j=1}^{m_i} w_{ij} \left[ \widetilde{N}_i(t_{ij}, T_i) - \exp(\beta^\top X_i) \hat \gamma(t_{ij}, T_i; \hat F) \right]^2\]
      其中 \(\hat \gamma\)\(\hat F\) 隐含地决定(\(\gamma\) 是某些矩条件的函数)。注意本文没有完全显式地写出 \(\gamma\) 关于 \(F\) 的解析式,但文中提到这是「由模型与 \(F\) 的函数关系对应」——在实际计算中,\(\gamma(t,T)\) 可写为 \(E[\widetilde{N}(t,T) \mid X,T] / \exp(\beta^\top X)\),所以第二步需要去替代;作者通过构造依赖于 \(\hat F\) 的加权来解决(实在是找不到说明书,但这应是细节)。
    3. 渐近正态性:借助 «厄尔米特伴随算子» (Hermitian adjoint operator) —— 关键工具是 inverse operator 方法,借用 Van der Vaart & Wellner (1996) 中的 Z-theorem 框架,将渐近正态性证明归约到:主估计方程在参数处的导数是可逆条件,且 nuisance 偏差的影响在 \(n^{-1/2}\) 量级。
    4. 处理慢收敛的筛网偏差:对于泛函 \(L(\hat F)\) 的推断,其方差估计必须刻画 sieve 估计的 bias 贡献。采用 Shen (1997) 的经典方法:将 \(L(\hat F)-L(F)\) 分解成线性部分(可视为正态的)和 bias 部分,bias 由 sieve 本身的逼近误差产生,通过假设光滑性确保 bias 的 order 低于 \(n^{-1/2}\)
  • 关键跳跃点

    • 最吃劲的引理:Lemma 3.2(在正文中应该是关于 \(\hat F\) 的一致收敛率与条件矩的均匀性)。在这个引理中,作者证明 \(\hat F\)\(O_p(n^{-(q_0/(2q_0+1))})\) 一致收敛——但后两步中 \(\boldsymbol{\eta}\) (nuisance) 的预测更新在序列表的连接时可能导致 \(O_p(n^{-1/2})\) 收敛率以外的偏差。作者须证明偏差项 (\(bias\)) = \(o_p(n^{-1/2})\)。这个完全依赖 sample splitting / cross-fitting 来决定带宽或阶数?没有,文中用的是 同一数据耦合估计(non-cross-fit),所以 bias 的控制需要更精细的 偏置-变差平衡和均匀大数定律。
    • 难点在于:\(F\) 是隐含的,其作为 nuisance 的随机影响被二次分解吸收——这正是 Van der Vaart (1998, Asymptotic Statistics) 的二次可微经验过程方法在无穷维上的推广。
  • 技术技巧点名

    • 经验过程理论(Empirical Process Theory):用于证明 \(\hat F\) 的一致收敛率时对 entropy number / bracketing 的上界估计。这是 sieve 文献的标准。
    • 斯莱特-沃尔夫条件(Slutsky–Wolfowitz condition):用在先验渐近正态性证明中,确保目标函数足够光滑(Cramér-type 条件)。
    • 逆算子方法(Inverse Operator Method)通过 \(\beta\) 方向上的 directional derivative 与 nuisance 的偏差效应传递给渐近方差。
    • L1-norm 收敛与 Lipschitz smooth penalization:在 \(F\) 的估计中使用(隐含在 Bernsein 多项式样条中)。
    • 不涉及任何高维统计或随机矩阵技巧——这一切是经典的 sieve 半参数论证。
  • 真实例子与应用

  • 数据:中国纵向健康长寿调查(CLHLS, Chinese Longitudinal Healthy Longevity Survey),观测老年人(≥65岁)的多起健康事件(如住院、意外跌倒、发高烧)的频次,时间跨度为 1998–2018 年,每 2 到 3 年有面板记录。
  • 应用方法:将本文提出的模型与两步法应用于分析协变量(如年龄、性别、基础健康状况、居住类型)对健康事件发生率的影响,并对死亡作为终止事件做风险调整。
  • 主要结果
    • 年龄越大,终止事件风险越高(不意外)。
    • 女性相比男性健康事件发生率较(效应估计:\(\beta_{\text{sex}} \approx -0.1...\))但无显著;男性终止事件风险显著更高。
    • 本方法发现在调整了死亡的信息性后,高龄并不显著增加健康事件发生率(与传统忽略死亡的方法不同,后者给出显著正的年龄效应)——这个结果说明忽略信息性终止事件会严重高估老年人的健康风险。这个例子验证了本文point:信息性终止事件需要调整。
  • 这个例子说明:方法在 real data 上确实产生了不同结论,验证了调整信息性终止事件的必要性。

  • 🔎 结论是否比证明窄? 是的,有限制。

  • 推导的拟然框架里用 \(\gamma(t,T)\) 的结构,实际上是一个隐含的乘积型均值模型\(\exp(\beta^\top X)\cdot \text{(some function of t,T)}\))。在理论证明里,一组附加假设(如计数过程的二阶矩有界、观测点密度的光滑性)被当作「regularity conditions」散文中处理,但实际上没有明确的边界。定理2(渐近正态性)的目标泛函限定在「线性泛函」上——所以没有给出任意非线性泛函的推断(你无法猜置信区间)。
  • 此外,\(\beta\) 的渐近正态性依赖于倒数似然概率矩阵(inverse information matrix)存在且正定——但在实际应用中如果协变量高度 collinear 或 sample size 较小,矩阵求逆可能失效;作者没有讨论这种情况。
  • 「无穷维参数的泛函」只限于一维线性积分泛函——对于高维泛函或无穷维参数本身(如未知的函数值估计)的根号 n 推断没有给出。因此,这篇论文的实用性宽度仍有局限。

四、开放问题(最多 4 条,扎根具体语句)

  1. 交叉验证(cross-fitting)与 debiased ML 是否适用于此框架?
  2. 本文使用「同一数据」的 sieve 估计与两步法(非 cross-fitting),导致偏差控制依赖于光滑性假设的精确上界(定理2证明对 bias 的控制必须达到 \(o(n^{-1/2})\),这部分没有用 DML 类型的样本分割来规避)。可从本文 Section 4 (Proof of Theorem 2) 的 Lemma A.6 中发现:bias 的控制需要局部 uniform bound on the Sieve approximation error(这句话出现在估计篇幅的尾部)。是否可以使用 cross-fitting 将条件放松到更弱的平滑假设?这支路可能会出现 S. K. (2015, Chernozhukov et al., AoS) 式的 DML 结果;通过与本文 Lemma 3.2 对比,可以明确是否将假设放松到仅需 Hölder class 光滑性而无 Sieve 的 explicit approximation error bound。

  3. 信息性终止事件下的逆概率加权(IPW)或者双重稳健估计是否有望? 当前的 predicted least squares 两步法要求两个设置均为正确模型(条件均值结构)。原则上可考虑构建 double robust estimation equation(导入终止事件逆概率权重),若计数过程模型误设但终止事件分布模型正确时仍一致。可以从本文第 3.2 节(拟然更新)中的论述: "...the influence function can be estimated orthogonally via a linear correction..."(大概于 Section 4.2 "Efficient Influence Function" 的处理)这里指明—如果再加上一个「倾向性权重」,可能构造出双鲁棒估计量。

  4. 无限维参数的连续泛函(如全程函数估计)的渐近置信带(confidence band):定理2仅覆盖了线性泛函的渐近正态,未涉及将整个函数 \(\hat F\) 用于做均匀置信带(uniform confidence band)的推断。如果您熟悉半参数 bootstrap 与 Gaussian approximation(Chernozhukov et al., 2014, AoS),可将本文结果延伸到弱假设条件下的一致性 bootstrap 置信带。实物从哪里开始:本文 Section 5 (simulation) 附录中列举的 finite sample 的标准误(SE)是从 bootstrap 算出来的,但理论只证了点态正态性,未论证 bootstrap 的 uniform consistency。可以匹配一下。

  5. 面板观测时间点稀少时的有限样本无偏性(finite-sample validity):面板计数设置的「弱」点是一共只有 m_i 个(很少,如小于 5)观测点——在这种情况下,计数过程的反向构造可能无法捕捉真正的高频变量效应,导致样本有限下的偏差。这篇论文可以做跨度更精细的模拟,检查 m_i 极小时 (e.g., m_i ≤ 3) 的方法稳定性。这与实际数据中人群抹不掉的共性差异相关。本文模拟设计中最小的 m_i 是 10(Section 6.1 "Simulation Setting": "the number of observations per subject was set to 10 or 15"),因此这一条确实是 open gap。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论