跳转至

A prospective study on the association between potential prescribing omissions and hospitalizations in community-dwelling older adults

作者: Liat Orenstein, Angela Chetrit, Keren Laufer, Rachel Dankner
来源: Epidemiology
主题: 流行病学
相关性: 6/10
链接: https://doi.org/10.1097/01.ede.0001193476.44765.da


一、领域脉络与小综述

这个方向是什么

本论文扎根于处方适当性评估(Prescribing Appropriateness Assessment)这个流行病学与老年医学交叉的子方向。其根本问题是:对于社区老年患者,药物的“该用而没用”(潜在处方遗漏,Potential Prescribing Omissions, PPOs)是否独立于合并症与多重用药,带来可量化的不良健康后果?当前该子方向的成熟度处于中等——已经有成熟的筛查工具(如START、ACOVE)和积累了不少关于PPO与死亡率、跌倒关联的证据,但关于住院频率与住院严重程度的前瞻性证据仍然稀缺。

发展脉络(从Introduction + 参考文献构建)

该论文的Introduction恰好是一份作者亲手绘制的小地图。我把其中被引工作串成一条线:

  1. 奠基工作:明确“不恰当用药”的两幅面孔

    • Beers 标准(1991年首发,多次更新):一个以共识为基础的工具,主要针对药物过度使用(Potentially Inappropriate Medications, PIMs),被大量研究用于识别哪些药“不应该用”。它留下了第一个缺口:几乎只关注用药过大,没系统关注应开未开的药。
    • STOPP/START 标准(2008年首发):O'Mahony等人开发的对偶工具——STOPP查不恰当用药,START应该开但没开的药。这正式把PPO这个概念放在与PIM并列的位置上,但早期流行病学证据集仍偏向PIM。
  2. 主要进展:PPO与硬终点的关联证据积累

    • Wallace et al. (2015)Gallagher et al. (2011):使用START标准在住院老人中研究PPO,发现PPO常见(尤其心血管和内分泌治疗领域)。这些是横断面或短期结果(如用药协调、住院时长)。留下缺口:前瞻性队列、社区老人、更长的随访时间、对照更充分的混杂调整。
    • Orenstein et al.(作者自己的前期工作,2018):在同一队列中已表明PPO与长期死亡率风险升高相关。这篇当前文章(2021)明确说:“Our previous study showed PPOs associated with increased long-term mortality”——所以这个缺口的“死亡率”一侧已被填补,剩下的是住院结果这颗缺的螺丝钉。
  3. 当前前沿与本文位置

    • 在引言中,作者声称“clinical consequences of PPOs remain underexplored”,尤其是对住院的效应。
    • Dose-response relationship——多数已有研究做的是0/1二分(有无PPO),而作者专门花了力气做三档(0, 1-2, ≥3 PPOs),并呈现趋势检验p值。这是比单纯二分类更细的信号。
    • 本文的位置:在一个已经建立好的、有一定年龄的社区队列中,用标准工具(START v3)定义暴露,前瞻性观察12个月内住院的频次延长住院(≥4天)住院严重程度(无住院→择期→紧急无手术→紧急手术/死亡),并用经典回归做多变量调整。

子线索聚类

这一领域的被引文献大致落在两条子线索上:

子线索 聚类内容 代表性工作
1. 工具验证与患病率研究 开发、更新、验证PPO筛查工具(START及其扩展版本),并做横断面/短暂随访的患病率描述。核心方法是共识法和简单关联(卡方、比值比)。 Beers (1991, 多次更新), O'Mahony/STOPP-START (2015), ACOVE (Wenger et al.)
2. PPO与不良结局的纵向关联 用队列(前瞻性或回顾性)研究基线PPO与后续结局(死亡率、住院、跌倒、认知下降)的关联。核心方法为回归调整,少数有倾向性评分或工具变量。 作者自己的前期工作(死亡率),以及少量其他文献如Wallace (2015, 横断面性质为主)

本文落在子线索2内:它为住院这个特定结局(频次、延长、严重程度)提供了来自以色列社区队列的证据,强调剂量-反应。方法上没有创新——回归调整是经典做法。

这个方向在追问的核心问题(2-4个)

  1. PPO是否独立于PIM(不恰当用药)和多重用药,对健康有独立的负面影响?——多数研究,包括本文,将PIM和多重用药作为协变量调整,但很少直接比较两者的效应量或做交互作用。
  2. 剂量-反应关系是否稳健?如果暴露维数(PPO种类、个数)与硬终点之间存在阈值效应(如“只要≥1个PPO就有同样风险”)还是连续梯度?
  3. 因果性还是残余混杂?——PPO者往往更老、更病、用药更多,传统回归调整能否消除药物的需求方/供给侧混杂(如医生倾向于不给健康老年人开药、虚弱者本身更易被遗漏)?
  4. 工具通用性:START v3(及更新版本)是否在所有老年人群(种族、医疗系统、合并症模式)中具有相同的预测效度?

⚠️ 作者的Framing(必须明确标注成“这是作者的说法”)

  • 作者把缺口frame成什么? 作者第一章说“However, the clinical consequences of PPOs remain underexplored”——然后补上:“尤其是对住院结果”。从而把自己的工作包装成这个“显然的下一步”:在死亡率之后,查PPO与住院的关联。
  • 哪些竞争路线被淡化或回避了? 全文几乎没有对比PIM(不当用药)与住院的关联——Prevalence和risk of PIM-linked hospitalization已有不少文献,但作者没有把PPO的效应量与PIM的做对比。此外,被淡化的是:因果推断方法——全文只是“关联”而非“因果”,作者没提工具变量、逆概率加权、目标试验模拟等更紧的因果识别框架。
  • 什么明显该被引或该存在,却没出现在intro里? 我没看到与系统综述或meta分析(如Lewis, 2018, "Association of PIM and PPO with adverse outcomes in older adults")的直接引用。另外,作者没提STOPP/START之外的其他PPO识别工具(如ACOVE、ASCO、EU-PIM list),虽然这些工具可能被较老老年人队列使用。这可能是由于目标发表期刊“Epidemiology”更偏向流行病学设计而非处方质量工具的比较。这个“缺失”是值得研究者去查的:是否在不同PPO定义下结论一致?(建议:PubMed搜索关键词“START AND PPO AND hospitalization AND older adults”。)

张力

未见明显对立引用。多数引用是共识性质(Beers/START)或支持性(PPO→不良结局)。没有发现引用彼此矛盾、在不同条件下得相反结论的工作。这不是带有大量争议的活跃子领域,更像是证据累积填补未知结果栅格。

二、最核心、最简单的例子 / 数学问题(先交代记号,再讲最小内核)

第一步:把符号、模型、可观测数据交代清楚

  • 符号(粗记号,为后面技术节用):
    • \(n = 1210\):样本量(基线队列规模)。
    • \(Y_i\):某一位参与者\(i\)预后结局。本文考虑三种:
      • \(Y_{1i}\):12个月内住院次数(count,取值0,1,2,...)。
      • \(Y_{2i}\):是否住院延长(超过4天;二元,0/1)。
      • \(Y_{3i}\):住院严重程度(有序:0=无住院,1=择期住院,2=紧急无手术,3=紧急手术/死亡)。
    • \(X_i\):暴露变量——PPO暴露状态。主要有两种编码:
      • 二分\(X_i = 1\)(有\(\ge 1\)个PPO),\(X_i = 0\)(无PPO)。
      • 三级剂量-反应\(X_i \in {0, 1, 2, 3}\)映射到(0 PPO, 1-2 PPOs, \(\ge 3\) PPOs)。
    • \(Z_i\):协变量向量。包括社会人口学(年龄、性别、教育、出生地)、生活方式(吸烟、BMI、饮酒)、健康相关(慢性病数、多重用药(\(\ge 5\)种药)、既往住院史、认知功能评估等)。总共调整的协变量个数大约20个左右。
  • 模型
    • 作者没有指定一个单一的、总括的统计模型,而是按结局类型用了三个不同的回归模型——这是流行病学中结局驱动的建模范式。具体:
      • \(Y_{1i} \mid X_i, Z_i \sim\) 负二项分布(Negative Binomial, 允许过离散)。这意味着\(\mathbb{E}[Y_{1i} \mid X_i, Z_i] = \exp(\beta_0 + \beta_1 X_i + \gamma^\top Z_i)\),且方差=均值+尺度参数\(\times\)均值\(^2\)
      • \(Y_{2i} \mid X_i, Z_i \sim\) 伯努利,用逻辑回归:\(\logit(P(Y_{2i}=1 \mid X_i, Z_i)) = \alpha_0 + \alpha_1 X_i + \theta^\top Z_i\)
      • \(Y_{3i}\)用比例优势逻辑模型(Ordinal Logistic Regression):\(\logit(P(Y_{3i} \le k \mid X_i, Z_i)) = \zeta_{k} - (\delta_1 X_i + \eta^\top Z_i)\),其中\(k=0,1,2\)(假设截距单调递增,但斜率不变——即一个公共的OR跨所有切点)。
    • 核心感兴趣参数\(\beta_1\)(负二项回归的回归系数,取exp后为发生率比IRR)、\(\alpha_1\)(逻辑回归系数,exp后为比值比OR)、\(\delta_1\)(序数逻辑回归系数,即整个有序尺度的公共OR)。
  • 可观测数据:研究者实际观测到的是完整基线访谈与医疗记录:人口学问卷回答、自我报告生活方式、医生诊断的慢性病列表、用药清单(用以生成START标准所列的PPO赋值)、以及前瞻性12个月内(通过HMO数据库)的住院记录(时间、诊断、手术、出院日期)。能够直接归因为无PPO的缺失(即,哪些药“应该被开却未被开”)是基于START标准在用药清单上推断的——这是一个基于专家共识的潜在编码,而非随机对照下可识别出的缺失。

第二步:讲最小内核

不要被三个结果和四种模型吓到。这篇论文的本质,把许多额外假设(序数、截距不变、过离散)去掉后,可以归结为下面这个最小例子

针对一个二分结局(是否延长住院≥4天)做一个2×2表比较: - 暴露组(至少一个PPO,n=717) - 非暴露组(无PPO,n=493)

原始logistic回归,只调整一个协变量年龄(年龄可能有混杂效应:更老的老年人更易有PPO,也更易住院)。

在这个特例下: - 模型\(\text{logit}(P(\text{延长住院}=1 \mid X, \text{年龄})) = \alpha_0 + \alpha_1 \times \text{PPO指示}(X) + \gamma \times \text{年龄}\) - 估计:最大似然估计得的\(\hat{\alpha}_1\),取\(\exp(\hat{\alpha}_1)\)就是调整年龄后的OR——它大概在1.3-1.9之间(真实论文为1.8,95%CI 1.2-2.7)。 - 核心思路:用一个logistic回归把年龄的效应从“PPO的效应”中剥离,看残余效应对照是否还显著。

论文的一般情形(三个结果、多种模型、更多协变量)就是把这个例子的: 1. 结果变量从一个logistic扩展到计数(负二项)和有序(序数逻辑)。 2. 协变量从年龄扩展到约20个(社会、生活方式、健康相关)。 3. 暴露从二分(0/1)扩展三级分类(0, 1-2, ≥3 PPOs)——做一个“趋势检验”看斜率是否单调。 4. 结果的编码:从“是否住院≥4天”扩展成“无/择期/紧急无手术/紧急手术或死亡”的有序变量——用了比例优势假设(含一个公共OR)。

但是,根本计量逻辑和上述最简例子一模一样:调整混杂后的多变量线性回归(在逆连接函数下)来分离PPO与住院的关联。全文没有用到因果推断前沿技巧(IPTW、双重稳健、工具变量),没有处理缺失数据问题(可能用完整案例分析),所以其技术内核对于已熟悉流行病学测试的研究者来说非常容易理解

目标读者读完这个最小例子后,手里就已经有了(a)全部记号;以及(b)论文的核心论证模式:“当我们把能观测到的协变量放进回归后,PPO的系数不再为零,表明PPO可能作为一个独立的预测因子,或者至少与未观察到的混杂因子有关”。

三、这篇论文做了什么

三句话

  • 研究了什么问题:社区老年人中潜在处方遗漏(PPOs)与12个月入院结果(入院次数、延期住院≥4天、住院严重程度)之间的关联。
  • 核心工具/方法:使用START v3标准定义PPO,采用负二项回归(计数)、二元逻辑回归(延期)和序数逻辑回归(严重程度),并调整社会人口、生活方式和健康相关的协变量。
  • 主要结论:暴露于≥1个PPO与入院次数增加40%(IRR=1.44, CI: 1.07-1.94)、延期住院风险增加1.8倍(OR=1.8, CI: 1.20-2.70)、住院严重程度增加1.6倍(OR=1.6, CI: 1.10-2.30)相关,并呈现清晰的剂量-反应关系。

关键设定与假设

在第二节所勾勒的最简记号基础上,完整设定需要补充:

  • 暴露定义:PPO识别基于START v3(2015年)。START包含28条标准,每条对应一个特定临床情境(如心房颤动者无抗凝血药)。每位参与者被编码为“有/无”每条PPO(来自用药清单比对)。所以\(X_i\)实际上是一个28维的二进制向量,然后总和得到PPO计数(0-28)。但是,分析中用的是这个总和的分组编码(三档或二分),而不是使用28维全向量——即,隐含假设:不同种类的PPO对住院的效应是等价的(同质性假设)
  • 混杂调整:在Multi-variable调整的“标准流行病学做法”——通过有向无环图(DAG)构建调整集不是明确的陈述;但该论文通过逐步建立模型(模型1:仅暴露;模型2:+人口统计;模型3:+生活方式;模型4:+健康相关)展示了调整逐渐削弱但未消除效应,这是流行病学中的常见做法。
  • 因果假设(隐性):作者没有声称因果。他们使用“association”一词。但若要解释为因果,需要调整所有共同原因。该论文没有讨论“未观测到混杂”(unmeasured confounders)的可能性,也没有做敏感性分析(E-value等)。
  • 缺失数据:论文应该提到1250个基线对象中的1210人有完整住院数据,但没讨论失访如何处理——很可能做了完整案例分析(Complete-case analysis)。

主要结果

论文给出了三个主要结果表(对应三种结局):

结局 模型 效应度量 估计值 95%CI p(趋势)
入院次数 负二项回归 IRR(≥1 PPO vs 0) 1.44 1.07 - 1.94
入院次数 负二项回归 IRR(0/1-2/≥3 PPOs) 1.00/1.30/2.02 (ref)/0.93-1.82/1.21-3.38 <0.01
延长住院≥4天 二元逻辑回归 OR(≥1 PPO) 1.80 1.20 - 2.70
延长住院≥4天 二元逻辑回归 OR(0/1-2/≥3 PPOs) 1.00/1.60/2.60 (ref)/0.90-2.40/1.30-5.20 <0.01
住院严重程度 序数逻辑回归 OR(≥1 PPO) 1.60 1.10 - 2.30
住院严重程度 序数逻辑回归 OR(0/1-2/≥3 PPOs) 1.00/1.40/2.10 (ref)/0.90-2.20/1.10-3.90 <0.01

注意: - 对剂量-反应组(1-2 PPOs)来说,除入院次数外,其余两项的置信区间跨1——即,在常规α=0.05水平下不显著,但趋势检验(把三级暴露当作一个连续变量)的p值很小(≤0.01),这是流行病学中支持剂量-反应关系的常用手法。 - 次要分析:作者可能做了亚组分析(按性别、年龄组、多重用药的亚组),但摘要未见深入描述——实际论文中有无这些分析,需看全文Table。

证明路线与技术技巧(应用型论文,非理论型,所以以描述分析流程为主)

  • 整体“证明”路线(实际上是分析流程)
    1. 数据收集:获取基线(1999-2004)的社区老年人访谈记录、合并症、用药清单。
    2. 暴露编码:根据START v3对每条参与者赋值≥1个PPO的二分类,以及三分组。
    3. 结局获得:从HMO数据库链接12个月内住院记录,并编码为三种形式。
    4. 模型拟合:对每个结局,用对应的回归模型拟合,从粗模型(M1)逐渐加入协变量(M2-M4)。每个步骤报告效应量。
    5. 推断:以完全调整模型(M4)为最终结果,若CI不包括零(对于log-odds/log-rate尺度)则判断为“关联”。剂量-反应做趋势检验(用Wald检验或似然比检验)。
  • 难点与跳跃不存在特别的数学难点。负二项回归处理过离散、序数逻辑回归的比例优势假设是本论文唯一可能技术不成立的地方——如果比例优势假设被违反(即不同严重程度切点上的OR不是常数),那么序数logistic回归的单一OR会被误导。论文中没有提到检验比例优势假设。
  • 技术技巧点名负二项回归——处理计数结局因过离散可能高估显著性的Poisson回归;序数逻辑回归——允许有序分类结局且给出单一的OR度量(假设比例优势)。没有新颖统计方法,全部是流行病学教科书标准内容。

真实例子与应用

用的什么数据/场景:以色列玛格比特(Maccabi)健康维护组织(HMO)成员队列,基线采集在1999-2004年第三轮随访,随访至12个月结束时。该队列是从“Tel Aviv-Markowitz”地中海缺血性心脏病风险因素研究衍生出的一个社区老人样本(55岁以上)。怎么用:研究对每位参与者通过START v3标准检查其用药清单(数据来自HMO药房数据库),编码PPO暴露(28个条目逐一核对),然后与住院数据库关联,用回归模型估计关联。得到什么结果:见上面表:PPO组住院频率、延期、严重程度均显著更高,有剂量-反应。这个例子想说明什么:这是一个实证检验——不是验证理论,而是在一个真实的老年人群中检验PPO是否可作为一个住院风险的预测信号例子(从公共卫生角度,而非因果角度)。它验证了前期研究(死亡率关联)的拓展,并产生建设性的公共卫生政策建议(如临床决策支持系统)。

🔎 结论是否比证明窄

是的,有一条重要的被泛化的陈述。作者在结论部分说“PPOs were prevalent and associated with higher hospitalization frequency and severity”,但在“证明”部分,他们只调整了可观测的协变量。未观测混杂的可能性没有讨论,且没有敏感性分析(如E-value)。此外,严重程度结局使用的序数逻辑回归隐含了比例优势假设,未报告该假设的检验结果。因此,结论的因果推断力度(即使作者没有明确声称因果)被模型的未检验假设和未处理的未观测混杂削弱。全文打印的因果推断强度实际上仅限于associational,而不是causal的——这是一条“论文说/它实际能证明”的差距。此外,论文没有处理多重用药(polymedication,≥5种药)与PPO之间的交互作用——效应可能只是因为“病情更严重导致用药更多、也更难全面开方”,而不仅仅是因为PPO本身。

四、开放问题(点到为止,扎根具体语句)

  1. 因果关系验证:这篇文章只证明了associational关系。文献中最直接的下一步是使用工具变量(例如Stanford医药的某种区域性处方实践倾向)或目标试验模拟(将PPO视为“治疗”指派,使用IPTW来调整时间依赖性混杂)来估计PPO对住院的因果效应。扎根点:论文结论只说“associated”,而局限性段落会提到“因果推论的局限性”。
  2. 不同工具定义(如ACOVE vs START)的PPO的一致性:这是作者的introduction没有引用但应该有的——如果另一套标准(如ACOVE)给出的PPO覆盖面与START不同,那么研究的结果是否仅依赖于一个特定的、可能不完善的标准?扎根点:intro没有对比多套PPO定义。
  3. 剂量-反应函数的形式:作者在三组编码(0, 1-2, ≥3)中展示了趋势,但没有尝试用连续PPO计数(0-28)拟合非线性模型(如限制性立方样条)来探索阈值效应。扎根点:论文只做了分组,没有进行连续剂量-反应建模。
  4. 异质性治疗效应(HTE):PPO的效应在特定疾病亚组(例如仅心血管vs仅内分泌)是否不同?在认知正常vs认知障碍中被放大还是缩小?扎根点:本文报告的是总体效应,未披露亚组异质性分析结果。在流行病学中,这一点常常是未来工作的方向。

Maintained by 陈星宇 · Homepage · Source on GitHub

评论