跳转至

Obstructive sleep apnea and functional hearing loss over 8 years: results from the National Health and Aging Trends Study

作者: Kening Jiang, Adam P Spira, Nicholas S Reed, Frank R Lin, Jennifer A Deal
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 6/10
机构绿灯: Johns Hopkins University(US News 前 50,免分进入精读)
链接: https://doi.org/10.1093/aje/kwag006


一、领域脉络与小综述

这个方向是什么: 这个子方向研究的是阻塞性睡眠呼吸暂停(OSA)对老年人群功能性听力损失的纵向因果效应。其根本科学问题在于:OSA 是否通过间歇性缺氧/缺血对耳蜗毛细胞造成不可逆损伤,或通过睡眠碎片化损害中枢听觉处理通路,从而在长期随访中导致功能性听力下降?当前该方向的成熟度处于从横断面关联走向纵向因果推断的过渡期——已有若干横断面研究报告了 OSA 与听力损失的显著相关性,但受限于随访时长与混杂控制,纵向因果证据仍然稀疏且结论不一。

发展脉络: - 奠基工作(横断面关联发现):早期工作如 Kim et al. (2018) 与 Sundaravelu et al. (2017) 在临床样本中报告了 OSA 患者的高频听力下降比例显著高于对照组,提出了缺氧/缺血损伤耳蜗的生物学假说。但横断面设计无法区分因果方向与时间先后。 - 主要进展(引入纵向随访与机制探索):随着队列数据的积累,部分工作开始尝试纵向关联。例如,作者在 intro 中引用的 Spira et al. (2019) 利用 NHATS 数据发现 OSA 高风险与自我报告听力下降的横断面 OR 增大,但未能追踪发病时间;Reed et al. 系列工作则聚焦于老年听力损失的人口学轨迹,为后续纵向建模提供了轨迹分类的参考基准。 - 当前 frontier(从单时间点走向多时间点轨迹与发病风险):当前前沿试图将 OSA 风险与听力损失的动态轨迹(而非单一时间点的状态)联系起来,并试图估计发病风险而非仅仅是患病率比。本文即处于此位置:首次在 8 年随访的全国代表性老年队列中,同时估计了 OSA 对功能性听力损失发病的 hazard 以及对长期轨迹组归属的相对风险比。 - 本文的位置:填补了"OSA → 听力损失"的纵向证据空白,将结局从二值状态扩展为多时间点轨迹,并使用了离散时间生存分析与轨迹建模的双重策略。

子线索聚类: 1. OSA 与听力损失的生物学机制线索:聚焦于间歇性缺氧导致耳蜗微血管缺血、氧化应激损伤毛细胞的动物模型与临床观察(引用了耳蜗缺血相关文献)。这一簇在做什么:确立"OSA → 缺氧 → 耳蜗损伤"的病理通路合理性,为因果推断提供先验机制支撑。 2. 老年听力损失的纵向轨迹建模线索:聚焦于利用群体数据刻画听力损失随年龄的演变模式(引用了 Reed 等的轨迹分类工作)。这一簇在做什么:提供结局变量的纵向刻画工具,将"听力损失"从静态二值变量细化为动态轨迹组。 3. OSA 替代测量与筛查工具线索:聚焦于 STOP-BANG 评分在社区/队列研究中的效度与替代使用(引用了 STOP-BANG 原始验证文献及在 NHATS 中的修改版应用)。这一簇在做什么:在缺乏多导睡眠监测(PSG)金标准的队列中,提供一种低成本、可操作的 OSA 风险分类工具。

这个方向在追问的核心问题: 1. 因果方向与时间先后:OSA 是否在时间上先于听力损失发生,且控制了基线听力状态后仍能预测新发病例?(横断面研究无法回答此问题) 2. 长期轨迹塑造:OSA 风险不仅影响发病与否,是否还影响听力损失随时间恶化的轨迹形态(如稳定正常 vs. 快速恶化 vs. 缓慢过渡)? 3. 混杂控制的充分性:在观察性队列中,年龄、性别、BMI、心血管疾病等既是 OSA 的风险因素也是听力损失的风险因素,如何剥离 OSA 的独立效应? 4. 测量替代的效度:当暴露(OSA)由问卷筛查评分替代金标准诊断时,测量误差与错分对效应估计的影响几何?

当前主流方法与已知瓶颈: - 主流方法:横断面 logistic 回归(无法定因果方向)、离散时间生存分析(可估计发病 hazard 但对轨迹形态无刻画)、Group-Based Trajectory Modeling (GBTM)(可刻画轨迹但通常仅做描述,少与暴露做因果联动)。 - 已知瓶颈:① PSG 诊断在大型队列中极难实施,STOP-BANG 替代必然引入错分;② 老年人群的听力损失定义若依赖纯音测听则缺乏功能性视角,若依赖自我报告则存在报告偏倚;③ 纵向随访中的死亡/失访竞争风险与删失机制极少被显式建模。

⚠️ 作者的 framing: - 作者将缺口 frame 为:"longitudinal evidence is lacking"——强调横断面证据已有,但纵向发病风险与轨迹塑造的证据空白是本文的显然下一步。 - 被淡化或回避的竞争路线:① 因果推断方法学路线(如 IV、g-formula、targeted maximum likelihood estimation、proximal causal inference)完全未在 intro 或方法中出现,作者选择了标准的条件回归路线(cloglog + multinomial logistic),将因果效应的识别完全寄托于"在回归中纳入足够多的混杂变量"这一强假设;② 竞争风险建模路线(如 Fine-Gray 子分布 hazard 模型)未被提及,而老年人群 8 年随访中死亡是听力损失的强竞争事件,忽略它可能导致发病 hazard 的过度估计。 - 明显该被引/该存在却未出现的:① 因果推断文献中关于测量误差/错分对因果效应识别的影响(如 surrogate exposure literature)——本文核心暴露是替代变量,却无任何文献讨论替代测量的效度对效应估计的偏倚方向与大小;② 纵向因果推断的 g-methods(如 Robins 的 g-formula 或 marginal structural models for time-varying confounding)——本文虽用纵向数据,却未考虑时变混杂的调整策略;③ 老年队列中竞争风险的处理——NHATS 队列高龄人群死亡率高,intro 与方法中均未引用竞争风险文献。这些缺失是研究者值得去查的问题:是该领域惯例忽略,还是作者选择性回避?

张力: 未见明显对立引用。横断面文献普遍报告正相关,本文纵向结果亦为正相关,方向一致。但存在一个隐性张力:横断面研究中的效应估计往往远大于纵向调整基线后的效应(本文 hazard ratio 仅 1.34,而横断面 OR 在某些研究中可达 2-3 倍),这暗示横断面设计可能严重混淆了反向因果或共同原因,但本文未显式讨论此落差。


二、最核心、最简单的例子 / 数学问题

第一步:符号、模型、可观测数据交代清楚

  • 符号与变量定义
  • \(i \in \{1, \dots, n\}\):个体索引,\(n = 1433\)
  • \(t \in \{0, 1, \dots, 8\}\):随访时间点索引(对应 NHATS 2013–2021 的 9 个轮次,\(t=0\) 为基线 2013 年)。
  • \(A_i\)暴露变量,二值,\(A_i = 1\) 表示"OSA 高风险"(修改版 STOP-BANG 评分 \(\geq 3\)),\(A_i = 0\) 表示"OSA 低风险"(评分 \(<3\))。此变量仅在基线 \(t=0\) 测量一次,后续不更新。
  • \(Y_{it}\)结局变量,二值,\(Y_{it} = 1\) 表示个体 \(i\) 在时间 \(t\) 出现功能性听力损失(自报耳聋/助听器使用/日常交流困难),\(Y_{it} = 0\) 表示未出现。注意:一旦 \(Y_{it} = 1\),后续时间点该个体的结局状态通常保持为 1(听力损失为不可逆事件)。
  • \(Y_i^*\)轨迹组标签,多类别,取值于 \(\{1, 2, 3\}\),分别对应 GBTM 估计的三个轨迹组:"稳定正常听力"、"过渡至听力损失"、"稳定听力损失"。这是从整个纵向序列 \((Y_{i0}, Y_{i1}, \dots, Y_{i8})\) 中通过模型聚类派生的潜变量。
  • \(X_i\)混杂向量,包含基线测量的年龄、性别、种族、教育、BMI、高血压、糖尿病、吸烟史等。
  • \(D_i\)删失/死亡指示变量,若个体 \(i\) 在时间 \(t\) 因死亡或失访退出随访,则 \(D_{it} = 1\),此后 \(Y_{it}\) 不可观测。

  • 模型(数据生成机制的简化表述): 本文未显式写出潜在结果框架或结构因果模型,其隐含的数据生成机制可表述为:

  • 基线时,\((X_i, A_i)\) 依某种联合分布生成,\(A_i\)\(X_i\) 影响(如 BMI、年龄、性别均影响 STOP-BANG 评分)。
  • 给定 \((X_i, A_i)\)\(Y_{it}\) 依离散时间 hazard 生成:\(\Pr(Y_{it}=1 \mid Y_{i,t-1}=0, A_i, X_i) = h_{it}(A_i, X_i)\)
  • 本文的核心假设是:条件可忽略性——在控制基线混杂 \(X_i\) 后,\(A_i\)\(Y_{it}\) 的效应可被识别为条件 hazard 的对比,即 \(\{Y_{it}(a)\}_{a \in \{0,1\}} \perp A_i \mid X_i\)
  • 轨迹组 \(Y_i^*\)\((Y_{i0}, \dots, Y_{i8})\) 的联合分布通过 GBTM 的多项 logistic 结构聚类生成,其与 \(A_i\) 的关联通过 \(\Pr(Y_i^* = k \mid A_i, X_i)\) 的 multinomial logistic 模型捕捉。

  • 可观测数据

  • 研究者实际观测到的是:基线的 \((X_i, A_i, Y_{i0})\),以及后续每个存活且未失访时间点的 \(Y_{it}\)(若 \(D_{it}=0\) 则观测到 \(Y_{it}\),若 \(D_{it}=1\) 则此后 \(Y\) 缺失)。
  • 想要但观测不到的:① 个体 \(i\) 在反事实暴露 \(A_i = a\) 下的潜在听力损失序列 \(\{Y_{it}(a)\}\)——只能靠条件可忽略性假设从观测数据中识别;② OSA 的真实诊断状态(多导睡眠监测 PSG 结果)——STOP-BANG 评分是替代测量,真实 OSA 状态不可观测;③ 轨迹组 \(Y_i^*\) 的真实归属——这是 GBTM 模型从观测序列中派生的潜变量,无外部金标准验证。

第二步:最小内核——离散时间互补 log-log 模型下的 hazard 估计

剥掉 GBTM 轨迹建模、多类别 logistic 回归等附加分析,支撑本文因果声称的最小内核是:在离散时间随访中,用互补 log-log 模型估计暴露 \(A_i\) 对不可逆事件 \(Y_{it}\) 发病的条件 hazard ratio,并以此作为因果效应的估计

  • 最简特例:假设只有两个时间点 \(t=0\)(基线)和 \(t=1\)(随访终点),且无删失(\(n\) 个个体全部观测到 \(Y_{i1}\)),混杂 \(X_i\) 为空(或仅一个二值变量)。
  • \(t=0\) 时,\(Y_{i0}=0\)(基线无听力损失,这是入组条件)。
  • \(t=1\) 时,\(Y_{i1}\) 依连续时间 hazard \(\lambda_i\) 生成。离散时间下,\(\Pr(Y_{i1}=1 \mid A_i) = 1 - \exp(-\lambda_i \Delta t)\),其中 \(\Delta t\) 为随访区间长度。
  • 互补 log-log 模型将此直接参数化:\(\log(-\log(1 - \Pr(Y_{i1}=1 \mid A_i))) = \log(\lambda_i \Delta t) = \beta_0 + \beta_1 A_i\)
  • 此时,\(\beta_1\) 即为连续时间 hazard ratio 的对数\(\exp(\beta_1) = \lambda_{A=1} / \lambda_{A=0}\)。这正是本文报告的 "1.34 times the hazard" 的来源——\(\exp(\beta_1) = 1.34\)
  • 为什么用互补 log-log 而不用 logistic?因为离散时间下,若底层连续时间 hazard 恒定,互补 log-log 模型给出的参数 \(\beta_1\) 恰等于连续时间 hazard ratio 的对数,具有跨随访区间长度的尺度不变性;而 logistic 模型给出的 odds ratio 会随 \(\Delta t\) 变化,不对应任何连续时间参数。这是离散时间生存分析的经典选择理由。

  • 最小内核的数学命题:在条件可忽略性 \(Y_{it}(a) \perp A_i \mid X_i\) 下,通过拟合 \(\log(-\log(1 - \Pr(Y_{it}=1 \mid Y_{i,t-1}=0, A_i, X_i))) = \beta_0(t) + \beta_1 A_i + \beta_2^T X_i\),得到的 \(\exp(\beta_1)\) 是连续时间条件 hazard ratio \(\lambda(t \mid A=1, X) / \lambda(t \mid A=0, X)\)一致估计(在随访区间划分足够细、模型正确指定的前提下)。

  • 核心思路一看就懂:本文在数学上干的事情就是——把老年队列的 8 年随访切成年份区间,在每个区间对"仍无听力损失"的人用互补 log-log 回归预测"该区间内首次发生听力损失"的概率,暴露 \(A_i\) 的系数即为 hazard ratio 的对数,混杂 \(X_i\) 被纳入以阻断非因果路径。这是离散时间生存分析的标准参数化,无任何新颖统计模型,其因果声称完全依赖条件可忽略性假设的可信度。


三、这篇论文做了什么

三句话: ① 研究了老年队列中 OSA 高风险对功能性听力损失发病风险与长期轨迹的纵向因果效应; ② 核心工具是离散时间互补 log-log 模型(估计发病 hazard)与 group-based trajectory modeling + multinomial logistic 回归(估计轨迹组归属的相对风险比); ③ 主要结论是:OSA 高风险与功能性听力损失发病 hazard 1.34 倍(95% CI 1.06–1.70)相关,且与"稳定听力损失"轨迹组归属的相对风险比 1.79(95% CI 1.32–2.42)相关。

关键设定与假设: - 数据来源与入组条件:NHATS 2013(Round 3)睡眠模块受访者,基线时需完成睡眠问卷且有听力状态记录,随访至 2021(Round 11)。最终分析样本 \(n=1433\),41% 男性,21% 黑人,平均年龄约 70+。 - 暴露定义:修改版 STOP-BANG 评分 \(\geq 3\) 为 OSA 高风险(\(A=1\))。原始 STOP-BANG 包含 8 项(打鼾、疲倦、观察到呼吸暂停、高血压、BMI>35、年龄>50、颈围>40cm、男性),每项 1 分,范围 0–8。NHATS 未收集颈围,故修改版去除此项,范围 0–7,阈值取 \(\geq 3\)(引用了 STOP-BANG 原始文献中 \(\geq 3\) 对中重度 OSA 的灵敏度数据)。 - 结局定义:功能性听力损失 \(Y_{it}=1\) 若满足以下任一:自报耳聋、自报使用助听器、自报无法听清电话或电视开着时房间里的对话。基线时 \(Y_{i0}=0\) 的人进入发病分析;基线时 \(Y_{i0}=1\) 的人被排除出发病分析,但仍参与轨迹建模。 - 核心假设: 1. 条件可忽略性:在控制基线混杂 \(X_i\)(年龄、性别、种族、教育、BMI、高血压、糖尿病、心脏病、吸烟)后,\(A_i\) 与潜在听力损失序列独立。此假设不可检验,且本文仅控制基线混杂,未考虑时变混杂(如随访期间新发高血压可能同时影响 OSA 进展与听力损失)。 2. 无测量误差/错分:STOP-BANG 评分 \(\geq 3\) 被当作 OSA 的无错分替代。实际上,STOP-BANG 是筛查工具而非诊断工具,其特异度有限(假阳性率高),这意味着 \(A_i\) 中包含大量无真实 OSA 的人,效应估计向零偏倚(稀释效应)。本文未对此做任何敏感性分析或修正。 3. 无竞争风险:发病 hazard 的估计假设删失(死亡/失访)独立于听力损失发病过程。在老年队列中,死亡与听力损失共享心血管病因,此假设极可能被违反。 4. 互补 log-log 模型正确指定:hazard 的函数形式为 \(\log(-\log(1 - h_{it})) = \beta_0(t) + \beta_1 A_i + \beta_2^T X_i\),即 \(A_i\)\(X_i\) 对连续时间 log-hazard 的效应是可加的,且不随时间 \(t\) 变化(\(\beta_1\) 为常数 hazard ratio)。本文未检验 \(\beta_1\) 的时间一致性或交互效应。 - 与已有文献相比:假设强度与横断面研究相当(均依赖条件可忽略性),但增加了纵向时间先后约束(基线无听力损失者才进入发病分析),略微加强了因果方向的可信度;对测量误差与竞争风险的假设则比临床 PSG 诊断研究更弱。

主要结果: 1. 发病 hazard(核心因果声称):在互补 log-log 模型中,OSA 高风险(\(A=1\))的系数 \(\beta_1\) 对应 hazard ratio = 1.34(95% CI 1.06–1.70, \(p < 0.05\))。这意味着在控制基线混杂后,OSA 高风险者发生功能性听力损失的连续时间 hazard 是低风险者的 1.34 倍。直觉:OSA 每年将听力损失的发病风险抬高了约 34%。 2. 轨迹组归属(辅助因果声称):GBTM 将 1433 人的 8 年听力状态序列分为 3 组:稳定正常听力(约 60%)、过渡至听力损失(约 20%)、稳定听力损失(约 20%)。在 multinomial logistic 回归中(参照组为稳定正常听力),OSA 高风险对"稳定听力损失"组的相对风险比 RRR = 1.79(95% CI 1.32–2.42),对"过渡至听力损失"组的 RRR = 1.18(95% CI 0.81–1.72,不显著)。直觉:OSA 高风险者更倾向于落入"从一开始就有听力损失并持续"的组,而非"逐渐恶化"的组——这可能暗示 OSA 的效应更多体现在基线已存在的亚临床听力损伤的维持/加重上,而非纯粹的新发驱动。 3. 敏感性分析:本文做了两组敏感性分析——① 将 STOP-BANG 阈值从 \(\geq 3\) 改为 \(\geq 5\)(更严格的高风险定义),hazard ratio 变为 1.40(更接近真实 OSA 的效应,但样本量减少导致 CI 变宽);② 在混杂中额外加入基线听力状态的连续度量(而非仅二值排除),结果稳健。但未做:测量错分的定量修正、竞争风险的 Fine-Gray 分析、时变混杂的 g-methods 调整、未观测混杂的敏感性分析(如 E-value)。

证明路线与技术技巧: 本文为应用/方法型,无定理证明。其"技术路线"是数据分析流程: 1. 数据清洗与入组:从 NHATS 9 轮数据中提取完成 2013 睡眠模块且有听力记录的受访者,排除基线已有听力损失者(发病分析),构建人年数据集(person-period dataset)用于离散时间生存分析。 2. 暴露构建:从睡眠问卷中提取修改版 STOP-BANG 各项,计算总分,二值化。 3. 结局构建:从各轮听力相关问卷项中提取二值功能性听力损失指标。 4. 发病分析:将数据整理为 \((i, t)\) 行的人年格式,对 \(Y_{i,t-1}=0\) 的行拟合互补 log-log 模型,时间效应用分层截距 \(\beta_0(t)\) 捕捉(每轮一个截距),暴露与混杂为协变量。 5. 轨迹分析:对全部样本的 \((Y_{i0}, \dots, Y_{i8})\) 序列拟合 GBTM(用 traj 插件包),选择 3 组模型(BIC 准则),然后在个体层面将最大后验概率归属的轨迹组标签 \(Y_i^*\) 作为 multinomial logistic 回归的结局,暴露与混杂为协变量。

  • 技术技巧点名
  • 互补 log-log 阶层:用于离散时间生存分析,保证参数 \(\beta_1\) 对应连续时间 hazard ratio,而非 odds ratio。这是流行病学纵向分析的标准工具,无新颖性。
  • Group-Based Trajectory Modeling (GBTM):用于将纵向二值序列聚类为潜类别轨迹组。GBTM 假设个体归属有限个潜类别,每个类别内 \(Y_{it}\) 依时间遵循特定的 logistic/cloglog 曲线。此方法在老年流行病学中广泛使用(引用了 Nagin 的奠基工作),但已知局限是:轨迹组是统计构造而非真实实体,组数与形态依赖模型选择准则(BIC),且最大后验概率归属会引入分类误差——本文未对此做不确定性传播。
  • Multinomial logistic 回归:用于估计暴露对轨迹组归属的 RRR。标准方法,无新颖性。

真实例子与应用: - 数据集:NHATS(National Health and Aging Trends Study),2013–2021,美国 Medicare 受益人的全国代表性纵向队列,每年一轮访谈,包含健康、功能、社会参与等模块。2013 轮附加了睡眠模块(STOP-BANG 各项),听力状态在每轮均有自报项。 - 怎么用上去:从 NHATS 提取 2013 轮睡眠模块受访者作为基线,链接后续 8 轮的听力变量,构建纵向分析样本。暴露从睡眠模块计算,结局从每轮听力项提取,混杂从基线健康/人口学变量提取。 - 得到什么结果:hazard ratio 1.34,RRR 1.79,均在调整基线混杂后显著。 - 想说明什么:验证 OSA 对听力损失的纵向因果效应假说,提供"筛查与治疗 OSA 可能有助于保护听力"的公共卫生建议。本文的实证贡献在于首次在全国代表性老年队列中用纵向发病分析确认了此效应,而非方法学创新。

🔎 结论是否比证明窄: - 本文在结果部分声称 "Elevated OSA risk score was associated with 1.34 times the hazard",并在讨论中将此延伸为 "Screening and treating OSA may be important for hearing health"——这是从关联跳跃到因果干预建议。条件可忽略性假设的不可检验性意味着 hazard ratio 1.34 可能包含未观测混杂(如遗传易感性、噪声暴露史),但讨论中仅用一句话提及"residual confounding may exist",未提供定量敏感性分析(如 E-value)来评估此声称的稳健性。 - 轨迹组归属的 RRR 1.79 被解读为 OSA 导致"稳定听力损失"轨迹的风险增高——但 GBTM 的轨迹组是模型构造,其归属有后验概率不确定性,本文将归属当作确定性标签放入 multinomial 回归,未考虑分类误差对 RRR 估计的标准误影响,这可能导致 CI 过窄。


四、开放问题(点到为止,扎根具体语句)

  1. 测量错分对因果识别的偏倚方向与大小:本文核心暴露是 STOP-BANG 评分(筛查工具,特异度有限),而非 PSG 诊断(金标准)。STOP-BANG 的假阳性会导致 \(A_i\) 中混入无真实 OSA 的人,效应估计向零偏倚(稀释);假阴性则进一步稀释。问题:能否用参数化错分模型或 Bayesian 修正,在给定 STOP-BANG 灵敏度/特异度的先验下,推导真实 OSA 对听力损失的 hazard ratio 的识别区间?扎根点:作者在方法部分明确写了 "Elevated OSA risk was defined as a modified STOP-BANG score \(\geq 3\)",且在敏感性分析中仅做了阈值切换(\(\geq 5\)),未做错分修正——这是明确的口子。

  2. 竞争风险下的子分布 hazard 估计:老年队列 8 年随访中死亡是听力损失的强竞争事件,本文的互补 log-log 模型估计的是cause-specific hazard(假设删失独立),而非subdistribution hazard(Fine-Gray 模型,允许死亡与听力损失相关)。问题:在死亡与听力损失共享心血管病因的条件下,cause-specific hazard ratio 1.34 是否过度估计了 OSA 对听力损失的累积发病率效应?用 Fine-Gray 模型重新估计 subdistribution hazard ratio,差异几何?扎根点:作者在讨论中提及 "participants who died or were lost to follow-up were censored",但未引用竞争风险文献或做 Fine-Gray 分析。

  3. 时变混杂的 g-methods 调整:本文仅控制基线混杂,但随访期间新发高血压、心血管事件既是 OSA 的后果也是听力损失的原因(时变混杂),若用标准回归调整会阻断 OSA 通过这些中介的间接效应,若不调整则留下混杂偏倚。问题:能否用 marginal structural models (MSM) with inverse probability weighting 或 g-formula,在 NHATS 的多轮数据中重新估计 OSA 的总效应与直接效应?扎根点:作者在混杂列表中纳入了基线高血压与心脏病,但随访期间这些变量的变化未被纳入模型——这是时变混杂的典型场景。

  4. 轨迹组归属的不确定性传播:GBTM 将个体分配到轨迹组的最大后验概率通常不为 1(本文报告的平均后验概率未给出),但 multinomial logistic 回归将归属当作确定性标签。问题:能否用 bootstrap 或多重分配策略,将 GBTM 的分类不确定性传播到 RRR 估计的标准误与 CI 中?扎根点:作者在方法部分写了 "trajectory group membership was estimated using GBTM" 并直接用于后续回归,未提及分类不确定性——这是 GBTM 文献中已知的局限(引用 Nagin 2005 即可确认)。


Maintained by 陈星宇 · Homepage · Source on GitHub

评论