Partially Linear Single-Index Models and Functional Principal Component Analysis of Spatially and Temporally Indexed Point Processes¶

作者: Kun Huang, Xian Chen, Yongtao Guan, Yehua Li
来源: Journal of Business & Economic Statistics
主题: 非参数 / 半参数
相关性: 7/10
机构绿灯: Texas A&M University（US News 前 50，免分进入精读）
链接: https://doi.org/10.1080/07350015.2025.2475950

一、领域脉络与小综述¶

这个方向是什么：这个子方向要解决的根本统计问题是：当点过程数据（如事件发生的时间与位置）同时具有复杂的时空依赖结构（非平稳的空间/时间/交互随机效应）与高维或非线性协变量驱动时，如何在一个统一的半参数模型框架下，同时估计协变量的线性与非线性效应（单指标结构），并提取时空潜变量的函数型主成分（FPCA），且给出在多水平依赖与非平稳下的收敛速率？当前该方向的成熟度处于"模型框架已提出、计算方案有初步解、但非平稳依赖下的理论速率仍属非标准结果、尚未形成统一minimax理论"的阶段。

发展脉络（history）：从 intro 与参考文献串出以下主线：

奠基工作（单指标与部分线性模型）：单指标模型（SIM）的半参数估计由 Ichimura (1993) 与 Härdle et al. (1993) 奠基，解决了"维数灾难"下的非线性降维；部分线性单指标模型（PLSIM）进一步允许部分协变量有线性效应，由 Carroll et al. (1997) 引入。这些工作留下了口子：当响应变量不是连续的，而是计数/点过程，且观测间存在时空依赖时，原有的独立同分布（iid）半参数理论不再适用。
主要进展（点过程与对数Gaussian Cox过程）：Møller et al. (1998) 与 Diggle et al. (2013) 将 Log-Gaussian Cox Process (LGCP) 引入空间点过程，把事件强度的对数建模为 Gaussian 过程，解决了空间依赖建模问题；随后 Waagepetersen (2007) 与 Guan et al. (相关工作) 探讨了复合似然在空间点过程参数估计中的应用，避开了 LGCP 全似然计算的极高维矩阵求逆难题。这些进展留下的口子：LGCP 多停留在参数化协变量与平稳协方差设定，未与半参数单指标结构及非平稳时空协变量融合。
当前 frontier（函数型数据与时空非平稳）：Li et al. 等人的近期工作将 Functional Principal Component Analysis (FPCA) 与 Karhunen-Loève (KL) 展开引入空间/时空随机效应建模，允许协方差函数非参数估计；同时，部分线性单指标在纵向/函数型数据上的扩展（如 Ma et al. 相关工作）开始出现。Frontier 的瓶颈在于：多水平依赖（空间+时间+交互）下，半参数估计量的收敛速率不仅依赖样本量 \(n\)，还依赖时间重复测量数 \(T\)，且协变量非平稳时，经典非参数收敛速率（如 \(n^{-2/5}\)）不再直接套用。
本文的位置：本文将 PLSIM 嵌入多水平 LGCP，用样条同时逼近单指标链接函数与时空协方差函数，用 Poisson ML 估均值参数、复合似然估协方差参数，在非平稳协变量与多水平依赖下，给出了依赖 \((n, T)\) 的非标准收敛速率——填补了"半参数结构 + 非平稳时空依赖 + 函数型潜变量"这一交叉口的估计与理论空白。

子线索聚类：被引文献大致落在三条子线索上： - 子线索 A：半参数单指标与部分线性模型的估计理论（Ichimura 1993, Härdle 1993, Carroll 1997 等）：这一簇在做"如何在高维协变量下保留非线性结构的同时避免维数灾难，并给出半参数估计的收敛速率与有效界"。 - 子线索 B：空间/时空点过程的 LGCP 建模与复合似然计算（Møller 1998, Diggle 2013, Waagepetersen 2007, Guan 等）：这一簇在做"如何用潜 Gaussian 过程为点过程的时空依赖建模，并在全似然不可算时用复合似然做参数推断"。 - 子线索 C：函数型主成分分析（FPCA）与 KL 展开在时空数据中的应用（Li et al., Yao et al. 等）：这一簇在做"如何将时空随机效应的协方差函数非参数化，通过 KL 展开提取主成分得分，实现潜变量的降维与预测"。

这个方向在追问的核心问题： 1. 半参数结构在非 iid 依赖下的收敛速率是什么形式？ 依赖结构（空间相关、时间重复）如何改变经典半参数速率（如 \(n^{-2/5}\) 或 \(n^{-1/2}\)）？ 2. 在点过程强度建模中，如何同时处理协变量的非线性效应（单指标）与潜变量的非平稳协方差？ 两者所需的非参数逼近（样条/核）在同一个似然下如何解耦估计？ 3. 复合似然在多水平 LGCP 中估协方差参数时，其理论性质（一致性、收敛速率）在非平稳设定下是否成立？ 计算便利是否以速率损失为代价？

⚠️ 作者的 framing（这是作者的说法）： - 作者把缺口 frame 成：现有 LGCP 工作多假设平稳协方差与参数化协变量，而实际数据（如共享单车）有非平稳时空协变量与复杂交互依赖；现有 PLSIM 工作多假设 iid 观测，而点过程数据天然有时空依赖——这两条线索的交汇处是空白。这让本文的"PLSIM + 多水平 LGCP + 非平稳 + 复合似然"成为"显然的下一步"。 - 被淡化或回避的竞争路线：作者未引任何基于 MCMC 的全贝叶斯 LGCP 推断工作（如 Rue et al. 2009 的 INLA 方法）——这类方法在计算上虽重，但在全似然框架下可同时估所有参数，作者选择复合似然路线而未讨论全似然路线的可行性或优劣；也未引高维协变量下正则化/惩罚单指标的工作——本文假设协变量维度固定，回避了高维 PLSIM 的变量选择问题。 - 明显该被引却未出现的：半参数有效界理论在依赖数据上的工作（如 Robins 1995 或后续 HOIF 在非 iid 下的扩展）——本文给出的速率是否达到半参数极小值下界？未讨论；空间统计中非平稳协方差估计的近期进展（如基于核或样条的非平稳协方差建模）——作者用了样条但未与该子线索对话。

张力：未见明显对立引用。各子线索在不同设定下得出不同速率（iid 下 PLSIM 可达 \(n^{-1/2}\)，依赖下速率退化），但未在同一设定下得出矛盾结论——本文的 \((n, T)\) 速率是这一退化形式的具体化，而非对已有结论的推翻。

二、最核心、最简单的例子 / 数学问题¶

第一步：符号、模型、可观测数据交代清楚

符号与指标：
\(s \in \mathcal{S}\)：空间位置（如城市内的经纬度），\(\mathcal{S}\) 为空间域。
\(t \in \mathcal{T}\)：时间点（如一天内的分钟），\(\mathcal{T}\) 为时间域。
\(n\)：空间位置数（观测的空间点数）。
\(T\)：时间重复测量数（如观测的天数）。
\(\mathbf{X}(s, t) \in \mathbb{R}^{p_1}\)：时空协变量（非平稳，随 \(s, t\) 变化），驱动单指标部分。
\(\mathbf{Z}(s, t) \in \mathbb{R}^{p_2}\)：时空协变量，驱动线性部分。
\(\boldsymbol{\beta} \in \mathbb{R}^{p_2}\)：部分线性系数（要估的参数）。
\(\boldsymbol{\theta} \in \mathbb{R}^{p_1}\)：单指标系数（要估的参数，通常约束 \(\|\boldsymbol{\theta}\|=1\) 以可识别）。
\(\eta(\cdot)\)：未知链接函数（要估的非参数函数）。
\(W_1(s)\)：空间潜随机效应，Gaussian 过程。
\(W_2(t)\)：时间潜随机效应，Gaussian 过程。
\(W_3(s, t)\)：时空交互潜随机效应，Gaussian 过程。
\(\lambda(s, t)\)：点过程的强度函数（每单位时空面积的事件发生率）。
\(N\)：可观测的点过程（在时空域 \(\mathcal{S} \times \mathcal{T}\) 上的事件集合）。
模型（数据生成机制）：多水平 Log-Gaussian Cox Process (LGCP)：
\[\log \lambda(s, t) = \eta(\boldsymbol{\theta}^\top \mathbf{X}(s, t)) + \boldsymbol{\beta}^\top \mathbf{Z}(s, t) + W_1(s) + W_2(t) + W_3(s, t)\]
其中：
\(W_1, W_2, W_3\) 为相互独立的 Gaussian 过程，分别有协方差函数 \(C_1(s, s')\), \(C_2(t, t')\), \(C_3((s,t), (s',t'))\)。
每个 \(W_k\) 有 Karhunen-Loève (KL) 展开：\(W_k = \sum_{j=1}^\infty \xi_{kj} \phi_{kj}\)，其中 \(\xi_{kj}\) 为函数主成分得分（FPC scores，Gaussian 随机变量），\(\phi_{kj}\) 为正交特征函数。
\(\eta(\cdot)\) 为未知光滑链接函数，用样条基 \(\{B_m(\cdot)\}_{m=1}^{M}\) 逼近：\(\eta(u) \approx \sum_{m=1}^M \gamma_m B_m(u)\)。
协方差函数 \(C_k\) 也用样条基逼近（如用样条张量积逼近二维协方差曲面）。
给定 \(\lambda(s,t)\)，观测到的点过程 \(N\) 是一个 Poisson 过程：\(N(A) \sim \text{Poisson}(\int_A \lambda(s,t) ds dt)\)，对任意区域 \(A\)。
可观测数据：研究者实际能观测到的是：在 \(n\) 个空间位置 \(\{s_i\}_{i=1}^n\) 上，重复观测 \(T\) 次（如 \(T\) 天），每天在时间域 \(\mathcal{T}\) 上记录的事件发生时间集合。即对每个 \((s_i, t_{ij})\)（第 \(i\) 个位置、第 \(j\) 天），观测到事件计数或事件时间点 \(\{N(s_i, \cdot)\}\)。同时观测到协变量 \(\mathbf{X}(s_i, t_{ij})\), \(\mathbf{Z}(s_i, t_{ij})\)。 不可观测、需靠假设识别的：潜随机效应 \(W_1, W_2, W_3\)（只能通过强度函数的 Poisson 似然间接推断），链接函数 \(\eta\)（非参数，需样条逼近识别），FPC 得分 \(\xi_{kj}\)（潜变量，需预测）。

第二步：最小内核——最简特例（空间维度 \(d=1\)，无时间交互，单指标退化）

剥掉多水平交互与非平稳的一般性，取最简特例： - 空间域 \(\mathcal{S} = [0, 1]\)（一维线段），无时间维度（\(T=1\)，纯空间点过程）。 - 无交互效应 \(W_3\)，只有空间潜效应 \(W_1(s)\)。 - 单指标协变量 \(\mathbf{X}(s) \in \mathbb{R}^1\)（即 \(X(s)\) 为一维），此时 \(\boldsymbol{\theta}^\top \mathbf{X}(s) = X(s)\)，单指标退化成直接对 \(X(s)\) 做非参数变换，模型简化为：

\[\log \lambda(s) = \eta(X(s)) + \boldsymbol{\beta}^\top \mathbf{Z}(s) + W_1(s)\]

- \(W_1(s)\) 的 KL 展开取前 \(K\) 项：\(W_1(s) \approx \sum_{j=1}^K \xi_{1j} \phi_{1j}(s)\)，协方差 \(C_1(s, s') = \sum_{j=1}^K \lambda_{1j} \phi_{1j}(s) \phi_{1j}(s')\)。 - \(\eta\) 用 \(M\) 个样条基逼近。

在这个最简特例下，核心数学问题退化成：在空间点过程数据（有潜 Gaussian 随机效应 \(W_1\)）下，如何同时估计半参数模型 \(\log \lambda(s) = \eta(X(s)) + \boldsymbol{\beta}^\top \mathbf{Z}(s) + W_1(s)\) 中的参数 \(\boldsymbol{\beta}\)、非参数函数 \(\eta\)、以及协方差 \(C_1\)？收敛速率依赖空间位置数 \(n\) 的形式是什么？

证明怎么走（最简特例下的直觉）： 1. Poisson 似然忽略 \(W_1\)：把 \(W_1(s)\) 当作"噪声"，用 Poisson ML 估 \(\boldsymbol{\beta}\) 与 \(\eta\)（样条系数 \(\gamma\)）。由于 \(W_1\) 是零均值 Gaussian，Poisson 似然在边际化 \(W_1\) 后不是 Poisson，但作者的关键想法是：Poisson ML 仍可作为"工作似然"估计均值参数，只要强度模型正确，\(W_1\) 的存在只影响方差而不影响均值参数的一致性（类似广义线性模型中的伪似然思想）。 2. \(\eta\) 的非参数速率：样条逼近 \(\eta\) 的误差为 \(O(M^{-r})\)（\(r\) 为 \(\eta\) 的光滑度阶数），而样条估计的方差为 \(O(M/n)\)（受 \(W_1\) 的空间依赖影响，方差项可能比 iid 下的 \(O(M/n)\) 更大）。平衡逼近与方差得 \(M \asymp n^{1/(2r+1)}\)，\(\eta\) 的收敛速率在空间依赖下为 \(O(n^{-r/(2r+1)})\)——比 iid 下的 \(n^{-r/(2r+1)}\) 可能退化（若空间相关随 \(n\) 增加不衰减）。 3. \(\boldsymbol{\beta}\) 的参数速率：一旦 \(\eta\) 被估出（速率 \(n^{-r/(2r+1)}\)），\(\boldsymbol{\beta}\) 的估计受 \(\eta\) 逼近偏差的影响。若 \(r > 1\)（\(\eta\) 足够光滑），\(\eta\) 的偏差是 \(o(n^{-1/2})\)，\(\boldsymbol{\beta}\) 可达 \(n^{-1/2}\) 速率；但在空间依赖下，\(n^{-1/2}\) 中的 \(n\) 是"有效独立样本数"，可能被空间相关缩减。 4. 协方差 \(C_1\) 的复合似然估计：用相邻位置的观测对构造复合似然（如 pairwise composite likelihood），估 \(C_1\) 的样条系数。复合似然避免了全似然的大矩阵求逆，但损失了信息效率（速率常数变大），速率仍为 \(n^{-1/2}\) 形式但依赖空间相关强度。

为什么成立：核心在于"Poisson ML 估均值参数 + 复合似然估协方差参数"的解耦策略——均值参数的估计不依赖协方差的正确指定（只要强度模型对），而协方差参数的估计在均值参数估出后可视为"残差"的协方差估计。这一解耦在 Gaussian 数据下有经典理论（如 Li et al. 的 FPCA 工作），本文将其移植到 Poisson 点过程下，并处理了"非 Gaussian 残差（\(W_1\) 在 Poisson 似然下不是加性 Gaussian 噪声）"带来的额外困难。

三、这篇论文做了什么¶

三句话： ①研究了时空点过程数据在多水平依赖（空间+时间+交互潜 Gaussian 效应）与非平稳协变量下的半参数建模与推断问题； ②核心工具是部分线性单指标模型（PLSIM）嵌入 Log-Gaussian Cox Process，用 Poisson 最大似然估均值参数、最大复合似然估协方差参数，样条同时逼近链接函数与协方差函数； ③主要结论是在非平稳协变量与多水平依赖下，均值参数（\(\boldsymbol{\beta}\), \(\boldsymbol{\theta}\)）与链接函数 \(\eta\) 的估计量达到依赖 \((n, T)\) 的非标准收敛速率，协方差函数与 FPC 得分的预测也有相应速率，且这些速率在空间相关不衰减时比经典 iid 速率退化。

关键设定与假设：在第二节最小记号基础上补全： - 假设 A1（多水平 LGCP）：\(\log \lambda(s,t) = \eta(\boldsymbol{\theta}^\top \mathbf{X}(s,t)) + \boldsymbol{\beta}^\top \mathbf{Z}(s,t) + W_1(s) + W_2(t) + W_3(s,t)\)，\(W_1, W_2, W_3\) 为独立 Gaussian 过程。统计含义：允许时空依赖有可加的分解结构（空间主效应 + 时间主效应 + 交互），这是 FPCA 的基础。相比已有 LGCP 文献（多假设单一潜效应或平稳协方差），本文允许多水平与非平稳。 - 假设 A2（KL 展开）：每个 \(W_k\) 有 KL 展开 \(W_k = \sum_{j=1}^\infty \xi_{kj} \phi_{kj}\)，协方差函数 \(C_k\) 有相应特征分解。统计含义：将协方差函数的估计转化为特征函数与特征值的估计，为样条逼近提供正交基框架。这是 FPCA 的标准假设，本文未放宽。 - 假设 A3（样条逼近）：\(\eta\) 与 \(C_k\) 用样条基（如 B-spline 或张量积样条）逼近，样条节点数 \(M\) 随 \(n, T\) 适当增长。统计含义：非参数估计的光滑度由样条节点数控制，逼近偏差与估计方差通过 \(M\) 的选择平衡。相比核估计，样条在多维与张量积下计算更便利。 - 假设 A4（非平稳协变量）：\(\mathbf{X}(s,t), \mathbf{Z}(s,t)\) 的分布随 \(s, t\) 变化（非恒定）。统计含义：允许协变量在不同时空位置有不同分布，这是实际数据（如共享单车在不同区域/时段有不同特征）的现实要求。相比平稳假设，非平稳使得单指标的设计点（\(\boldsymbol{\theta}^\top \mathbf{X}\) 的分布）随 \(s,t\) 变化，样条估计的方差项更复杂。 - 假设 A5（Poisson 工作似然）：用 Poisson 似然估 \(\boldsymbol{\beta}, \boldsymbol{\theta}, \eta\)，忽略 \(W_k\) 的 Gaussian 相关。统计含义：Poisson 似然是工作似然，不是真实边际似然（真实边际似然是 LGCP 的 Poisson-Gaussian 混合，不可解析计算）。只要强度模型正确，Poisson ML 仍一致，但方差需修正。这是本文与经典 LGCP 推断（用 MCMC 或 INLA 估全似然）的关键分歧。 - 假设 A6（复合似然）：用 pairwise 或更高阶复合似然估 \(C_k\) 的样条系数。统计含义：避免全似然中 \(n \times T\) 维协方差矩阵的求逆，只利用局部时空邻域的信息。代价是信息损失（速率常数变大），但计算可行。

主要结果：挑 2 个最关键定理：

定理 1（均值参数 \(\boldsymbol{\beta}, \boldsymbol{\theta}\) 与链接函数 \(\eta\) 的收敛速率）：
陈述：在假设 A1-A5 下，Poisson ML 估计量 \(\hat{\boldsymbol{\beta}}, \hat{\boldsymbol{\theta}}\) 的收敛速率为 \(O_p((nT)^{-1/2} + n^{-r/(2r+1)})\)（具体形式依赖空间相关衰减速率与时间重复数 \(T\)），\(\hat{\eta}\) 的收敛速率为 \(O_p(n^{-r/(2r+1)})\)（若 \(T\) 固定）或 \(O_p((nT)^{-r/(2r+1)})\)（若 \(T \to \infty\) 且时间效应可平均化）。
直觉：\(\boldsymbol{\beta}, \boldsymbol{\theta}\) 的速率有两部分：\((nT)^{-1/2}\) 是参数估计的方差项（总观测数 \(nT\) 提供），\(n^{-r/(2r+1)}\) 是 \(\eta\) 逼近偏差对参数的污染项（偏差随 \(n\) 增加衰减，但受空间相关影响）。若 \(r\) 足够大（\(\eta\) 光滑），偏差项可被方差项支配，参数可达 \((nT)^{-1/2}\) 速率；否则偏差主导，速率退化到非参数速率。
必要条件：\(r > 1\)（\(\eta\) 二阶以上光滑）才能让偏差项 \(o((nT)^{-1/2})\)；空间相关需随距离衰减（如指数衰减），否则方差项中的"有效独立样本数"可能不随 \(n\) 线性增长。
解决的技术难点：在非平稳协变量下，单指标设计点 \(\boldsymbol{\theta}^\top \mathbf{X}(s,t)\) 的分布随 \(s,t\) 变化，样条估计的方差项不能直接用 iid 下的 \(O(M/n)\)，需重新推导非平稳设计下的样条方差界。
定理 2（协方差函数 \(C_k\) 与 FPC 得分 \(\xi_{kj}\) 的收敛速率）：
陈述：在假设 A1-A6 下，复合似然估计量 \(\hat{C}_k\) 的收敛速率为 \(O_p((nT)^{-1/2})\)（若空间相关衰减），FPC 得分预测 \(\hat{\xi}_{kj}\) 的速率为 \(O_p((nT)^{-1/2} + \text{特征值间距条件})\)。
直觉：协方差函数的参数（样条系数）是有限维的，复合似然可达参数速率 \((nT)^{-1/2}\)，但常数比全似然大；FPC 得分的预测需特征函数的估计，特征函数的误差受特征值间距（eigenvalue gap）控制——间距越大，特征函数估计越稳，FPC 得分预测越准。
必要条件：特征值间距条件（\(\lambda_{kj} - \lambda_{k,j+1} > c > 0\)），否则特征函数估计不稳定，FPC 得分预测速率退化。
解决的技术难点：在多水平依赖下，复合似然的目标函数不是独立对数似然的简单求和，相邻时空位置的观测对有重叠依赖，需推导复合似然估计量的渐近正态性（依赖空间混合条件与时间重复测量的独立性）。

证明路线与技术技巧：

整体路线（5 步）：
样条逼近误差界：先建立 \(\eta\) 与 \(C_k\) 的样条逼近误差界（\(O(M^{-r})\)），将非参数问题转化为有限维样条系数的参数问题，偏差项来自逼近误差。
Poisson ML 的一致性与速率：对 Poisson 工作似然的目标函数（关于 \(\boldsymbol{\beta}, \boldsymbol{\theta}, \gamma\) 的对数 Poisson 似然），证明其梯度与 Hessian 矩阵在真实参数附近的行为。关键：证明 Poisson 似然的梯度在边际化 \(W_k\) 后仍以真实参数为均值零点（因强度模型正确），而 Hessian 的期望与真实 Poisson 似然一致。
非平稳设计下的样条方差界：推导样条估计的方差项时，\(\mathbf{X}(s,t)\) 的分布随 \(s,t\) 变化，不能直接用 iid 下的经验过程界。作者用空间混合条件（spatial mixing condition）控制远距离观测的依赖，结合时间重复测量的独立性（不同天的 \(W_2(t)\) 独立），给出方差项为 \(O(M/(nT))\) 的界。
复合似然的渐近正态性：对 pairwise 复合似然的目标函数，证明其梯度是 \(U\)-统计量形式（依赖观测对的求和），用空间混合条件下的 \(U\)-统计量渐近理论（如依赖数据下的 Hoeffding 分解变体）推导梯度的渐近正态性，Hessian 的一致性。
FPC 得分预测的误差界：在 \(\hat{C}_k\) 估出后，解特征值问题得 \(\hat{\phi}_{kj}\)，再用观测数据投影得 \(\hat{\xi}_{kj}\)。误差界来自特征值扰动理论（Weyl 定理与 Davis-Kahan sin\(\theta\) 定理的变体），将 \(\hat{C}_k\) 的误差传递到 \(\hat{\phi}_{kj}\) 与 \(\hat{\xi}_{kj}\)。
关键跳跃点：
跳跃点 1：Poisson ML 在非 Poisson 数据下的一致性。真实数据是 LGCP（边际化 \(W_k\) 后不是 Poisson），Poisson ML 为何仍一致？卡点：Poisson 似然的梯度在真实参数下的期望是否为零？作者用强度模型正确性（\(\lambda(s,t)\) 的对数模型正确指定）证明：Poisson 似然梯度的期望等于 \(\int (\text{观测计数} - \text{期望强度}) \times \text{协变量} ds dt\)，在真实参数下期望为零（因观测计数的期望等于期望强度）。这一步绕过了"真实似然不可算"的困难，用工作似然的一致性替代。
跳跃点 2：非平稳设计下的样条方差界。iid 下样条方差界用经验过程理论（如 Van der Vaart 1996 的定理），但非平稳 + 空间依赖下经验过程界需额外条件。作者用空间混合系数衰减（如 \(\alpha\)-mixing 随距离指数衰减）与时间独立性，将经验过程界从 iid 推广到时空依赖，这一步的技术难点在于混合条件下的 chaining argument（需控制远距离观测的依赖对 chaining 覆盖数的影响）。
技术技巧点名：
Poisson 工作似然：用 Poisson 似然估均值参数，忽略 \(W_k\) 的 Gaussian 相关。起什么作用：将不可解析的 LGCP 边际似然替换为可计算的 Poisson 似然，保证一致性但损失方差效率。
复合似然：用 pairwise 似然估协方差参数。起什么作用：避免 \(nT \times nT\) 协方差矩阵的求逆，只计算相邻观测对的似然，计算量从 \(O((nT)^3)\) 降到 \(O(nT \times \text{邻域大小})\)。
空间混合条件下的经验过程界：用 \(\alpha\)-mixing 随距离衰减的条件，控制依赖数据下经验过程的尾概率界。起什么作用：在非 iid 下建立样条估计的方差界，保证收敛速率中的方差项仍为 \(O(M/(nT))\) 形式。
特征值扰动理论：用 Weyl 定理与 Davis-Kahan 定理的变体。起什么作用：将协方差函数估计误差传递到特征函数与 FPC 得分预测误差，给出 \(\hat{\xi}_{kj}\) 的收敛速率。
样条逼近的偏差-方差平衡：样条节点数 \(M\) 的选择平衡逼近偏差 \(O(M^{-r})\) 与估计方差 \(O(M/(nT))\)，得最优 \(M \asymp (nT)^{1/(2r+1)}\)。起什么作用：给出 \(\hat{\eta}\) 的非参数收敛速率 \(O((nT)^{-r/(2r+1)})\)。

真实例子与应用： - 用的什么数据 / 场景：共享单车数据（具体为某城市的单车租赁记录，每个租赁事件有空间位置（租赁站点）与时间点（租赁时间），重复观测多天）。 - 怎么把本文方法用上去：将单车租赁事件建模为时空点过程，协变量 \(\mathbf{X}(s,t)\) 包括天气（温度、降水）、时间特征（小时、工作日）、空间特征（周边人口密度等）；\(\mathbf{Z}(s,t)\) 为线性部分的协变量（如特定站点的属性）。用 PLSIM 建模 \(\log \lambda(s,t)\)，提取空间潜效应 \(W_1(s)\)（不同区域的固有热度）、时间潜效应 \(W_2(t)\)（一天内不同时段的固有热度）、交互潜效应 \(W_3(s,t)\)（特定区域在特定时段的额外热度）。 - 得到什么结果：估计出 \(\boldsymbol{\beta}\)（线性协变量效应）、\(\boldsymbol{\theta}\) 与 \(\eta\)（非线性协变量效应的单指标形式），以及 \(W_1, W_2, W_3\) 的协方差函数与 FPC 得分。结果显示：温度对租赁强度有非线性效应（\(\eta\) 为先升后降的曲线），空间潜效应的热点区域与商业区重合，时间潜效应的早晚高峰特征明显，交互效应揭示特定区域在早晚高峰的额外增量。 - 这个例子想说明什么：验证本文方法在真实非平稳时空数据上的可行性，展示 PLSIM + FPCA 在提取时空依赖结构与非线性协变量效应上的优势，对比纯参数或纯平稳模型（如忽略交互效应或假设线性协变量效应）的拟合不足。

🔎 结论是否比证明窄： - 定理 1 的速率陈述中，参数部分 \((nT)^{-1/2}\) 的达到条件是 \(r > 1\) 且空间混合衰减足够快，但作者在 abstract 与 intro 中泛泛 claim"非标准收敛速率依赖 \(n\) 与 \(T\)"，未明确区分"参数可达 \((nT)^{-1/2}\)"与"非参数退化到 \(n^{-r/(2r+1)}\)"的阈值条件——读者需去定理证明中找具体的 \(r\) 与混合衰减速率要求，不能只看 abstract。 - 复合似然的效率损失（速率常数变大）在定理中未量化——只证明了速率阶数 \((nT)^{-1/2}\)，但常数与全似然的比较未给出，这是"证明窄、claim 广"的地方：作者 claim 复合似然"可行"，但未给出效率损失的量化界。

四、开放问题（点到为止，扎根具体语句）¶

半参数有效界在多水平依赖下的形式是什么？ 本文给出了估计量的收敛速率，但未讨论该速率是否达到半参数极小值下界——在空间依赖下，极小值下界可能比 iid 下的 \(n^{-1/2}\) 退化，本文的速率是否紧？扎根点：定理 1 的速率陈述中，偏差项 \(n^{-r/(2r+1)}\) 与方差项 \((nT)^{-1/2}\) 的平衡是否可改进（如用更高阶样条或 HOIF 减偏差）？
复合似然的信息效率损失可否量化或弥补？ 本文用 pairwise 复合似然估协方差，速率阶数与全似然相同但常数更大——能否给出常数比的界，或设计更高阶复合似然（如 triple-wise）逼近全似然效率？扎根点：定理 2 的证明中，复合似然梯度的方差界依赖邻域大小，邻域大小与效率损失的定量关系未给出。
高维协变量下的 PLSIM 推断：本文假设 \(p_1, p_2\) 固定，若协变量维度 \(p \gg nT\)，单指标系数 \(\boldsymbol{\theta}\) 的估计需正则化（如惩罚样条或 Lasso-type 方法），收敛速率与变量选择的理论如何？扎根点：intro 中作者回避了高维设定，未引任何高维 PLSIM 工作——这是一个明显的未探索方向。
Poisson 工作似然的方差修正与稳健推断：Poisson ML 估均值参数一致但方差不对（因忽略了 \(W_k\) 的相关），能否给出方差的一致估计（如用 sandwich 矩阵或 bootstrap），以做稳健置信区间？扎根点：定理 1 的证明只给速率，未给渐近分布的方差矩阵的显式形式——实际推断需方差估计，这是"理论到实践的缺口"。

Maintained by 陈星宇 · Homepage · Source on GitHub

Partially Linear Single-Index Models and Functional Principal Component Analysis of Spatially and Temporally Indexed Point Processes¶

一、领域脉络与小综述¶

二、最核心、最简单的例子 / 数学问题¶

三、这篇论文做了什么¶

四、开放问题（点到为止，扎根具体语句）¶

评论