Spatiotemporal analysis of human response to wildfire events and PM2.5 exposure¶
作者: Yuming Sun, Andrew Lee, Stella E Lee, Tanujit Dey
来源: American Journal of Epidemiology
主题: 流行病学
相关性: 6/10
链接: https://doi.org/10.1093/aje/kwag002
一、领域脉络与小综述¶
-
这个方向是什么:本子方向旨在利用大规模、高频率的互联网搜索数据(如Google Trends)作为公众行为、意识或健康状态的“实时”代理指标,结合环境暴露数据(如PM2.5)与经典的流行病学时空统计模型(如分布式滞后模型、空间回归模型),来量化环境事件(如野火)对公众行为响应的影响模式与异质性。这是一个交叉应用方向,其核心统计挑战在于:(1)如何处理暴露与响应之间的时间滞后结构;(2)如何刻画和解释空间异质性;(3)如何将非结构化、零星的互联网搜索数据与传统的、空间连续的环境监测数据整合。
-
发展脉络(history):作者在引言中将被引工作串成一条线。
- 奠基工作:
- Gasparrini et al. (2010) 与 Gasparrini (2014):奠定了分布式滞后模型(DLM) 在环境流行病学中的核心地位。这些方法允许暴露(如温度、PM2.5)对健康结局的影响在时间上延展(例如,当天的PM2.5不仅影响当天的健康,还影响之后数周)。这是本文建模的时间维度的基础。
- Schwartz (2000) 及其他早期工作:建立了时间序列分析在空气污染与健康关联研究中的基本框架,通常假设暴露与健康结局之间的关联是线性的、无滞后的,或在很短的滞后期内(如滞后0-2天)。
- 主要进展:
- Bobb et al. (2016), Heaton et al. (2020):将分布式滞后模型从纯时间序列扩展至时空(spatiotemporal) 框架,引入了空间随机效应来控制未被观测到的空间混杂因素(如不同地区的空气质量、人口密度、医疗资源差异)。这是本文建模的空间维度的基础。
- Naeher et al. (2007), Rappold et al. (2012):实证研究了野火烟雾对公众健康(如呼吸系统疾病急诊)的直接效应,建立了环境暴露与健康响应之间的关联。这篇论文的作者从中引申出自己的问题:健康响应是直接的,那行为响应(搜寻信息、购买防护品)是否也存在可测的、不同模式的关联?
- 当前 Frontier 与本文的位置:
- Rappold et al. (2017), Wen & Burke (2022):将研究焦点从“暴露-健康”转向“暴露-行为”,探讨野火如何影响公众的心理健康和行为响应(如外出、避险),并指出这些行为响应与健康效应之间存在复杂的交互。本文直接跟进这一趋势,但将其细化为更具体、可量化、高频(周度)的行为代理指标——Google Trends搜索词。
- Burke et al. (2022), Jones et al. (2022):开始分析Google Trends或其他社交媒体数据(如Twitter)对野火的反应,但通常局限于简单的时间序列关联(如相关分析、格兰杰因果检验)或单一地区的案例研究。本文的定位是:在一个更大的(11个DMA)、更长时间跨度(5年)的地理空间上,用贝叶斯时空分布式滞后模型(BSTDLM)同时处理延迟响应和空间异质性,从而提供更丰富、更结构化的证据。
- 奠基工作:
-
子线索聚类:这些被引文献大致可归为三条线索,但本文的贡献主要在于它们的交叉点,而非任意一条的延续。
- 方法学线索(分布式滞后与时空建模):Gasparrini (2010, 2014), Bobb et al. (2016), Heaton et al. (2020)。这一簇专注于如何构建统计模型来估计随时间/空间变化的暴露-响应关系,是本文的工具箱。
- 流行病学线索(暴露-健康效应):Naeher et al. (2007), Rappold et al. (2012)。这一簇关注PM2.5等污染物的健康效应,是本文研究问题(暴露-行为)的背景和类比来源。
- 行为科学与“大数据”线索(社会信号检测):Rappold et al. (2017), Wen & Burke (2022), Burke et al. (2022), Jones et al. (2022)。这一簇试图用新的数据源(搜索数据、社交媒体) 来直接测量公众的行为或心理状态,是本文研究问题的新颖性所在。本文正是将线索1的方法应用到线索3的问题上。
-
这个方向在追问的核心问题:
- 因果识别:如何从观察性研究中识别出PM2.5暴露对公众行为的因果效应,而非仅仅是相关性?分布式滞后模型能否提供有意义的因果解释框架?
- 行为异质性:不同地区、不同人群对同一环境暴露的行为响应是否存在系统性差异(空间异质性、社会经济脆弱性修饰)?如何量化和解释这种异质性?
- 时间动态:行为响应的时间模式是什么(立即爆发 vs. 逐渐衰减;单峰 vs. 多峰)?分布式滞后模型提供的滞后结构是否能合理刻画这种动态?
- 代理变量的效度:Google Trends搜索指数作为“公众意识”或“担忧”的代理变量是否可靠?其选择偏差(只反映上网人群)和解释歧义(搜索“空气净化器”可能是因为已经买了,也可能是在疑惑)如何影响结论?
-
⚠️ 作者的 framing:
- 作者如何 frame 缺口:作者把缺口描述为:“尽管已有研究考察了野火对健康和心理的影响,但对公众行为响应(如信息寻求和准备行为)的实证研究有限。特别是,之前的研究没有在空间上区分不同地区的响应差异,也很少同时考虑暴露的时间滞后性和空间异质性。” 作者以此让本研究成为“显然的下一步”:即在时空分布式滞后模型的框架下,首次系统性地研究野火PM2.5对Google Trends搜索行为的影响。
- 被淡化/回避的路线:作者回避了对因果识别的深入讨论。全文使用的语言是“关联”(association),而非“因果效应”(causal effect)。对于潜在的混杂因素(如新闻媒体报导,不同地区对野火本身的敏感度不同),作者仅用“空间随机效应”和“气象协变量”来控制,但并未讨论更高级的因果推断策略(如工具变量法、断点回归设计),也未讨论这些策略在Google Trends数据上的应用限制。这是一个重要的缺口。
- 什么是明显该被引/该存在,却没有出现的:未引用社会科学家与数据科学家关于“数字痕迹(digital trace)”分析中普遍存在的测量误差与代表性问题(如 Morstatter et al., 2013)。Google Trends数据并非对真实行为的无偏测量,存在关键词选择、搜索趋势的归一化处理(“缩放相关搜索兴趣”)、以及“假阳性”搜索(如机器人或新闻内部点击)等噪声。论文未在方法部分或引言的缺口描述中处理这个重要的测量学挑战。
-
张力:未见明显对立引用。被引用的工作总体上支持一个演进中的共识:分布式滞后模型是环境暴露-响应建模的合适工具,而Google Trends正在成为行为流行病学的一种有前景的数据源。
二、最核心、最简单的例子 / 数学问题¶
第一步:把符号、模型、可观测数据交代清楚¶
-
符号:
- \(i \in \{1, \dots, I\}\):空间单位索引,这里是“指定市场区域”(DMA),本文中 I = 11。
- \(t \in \{1, \dots, T\}\):时间单位索引,这里是周。本文跨越 2016-2020 共约 5 年,T ≈ 260。
- \(Y_{it}\):可观测的 响应变量,在 DMSA i 和 周 t 的“缩放相对搜索兴趣”(scaled relative search interest)——论文对原始 Google Trends 数据进行线性缩放,使其在0-100之间。\(Y_{it}\) 被模型化为服从正态分布或似正态分布。
- \(E_{it}\):可观测的 主要暴露变量,在 DMA i 和 周 t 的“烟尘 PM2.5”浓度(单位:μg/m³)。
- \(Z_{it}\):可观测的 一组时变协变量,包括温度、气压、风速、湿度等气象变量。
- \(S_i\):可观测的/固定的 空间协变量,例如 DMA 的“社会经济脆弱性”评分。
- \(L\):滞后期长度,这是模型中的超参数或由数据选择。论文中使用的最大滞后期为 L=4 周。
- \(\beta_l\)(\(l=0,...,L\)):待估计的 滞后效应参数,表示 \(E_{i,t-l}\) 对 \(Y_{it}\) 的贡献。
- \(\gamma\):待估计的 一组时变协变量 \(Z_{it}\) 的回归系数向量。
- \(\mu_i\):待估计的 空间随机效应,用于捕捉未被观测到的、时间恒定的、空间单位 \(i\) 特有的混杂因素(例如DMA的人口密度、平均收入、当地新闻对野火的关注程度)。
- \(f(E_{it})\):暴露的“交叉基(cross-basis)”函数。分布式滞后模型的核心是将暴露和滞后两个维度用基函数展开。在贝叶斯框架下,这通常意味着对暴露-滞后响应曲面施加平滑先验(如随机游走或B样条)。
-
模型:采用一个贝叶斯时空分布式滞后模型(BSTDLM)。核心公式的潜在结构是:
\[Y_{it} \sim \text{Normal}(\eta_{it}, \sigma^2_Y)\]\[\eta_{it} = \alpha + \mu_i + \sum_{l=0}^L \beta_l \cdot f(E_{i,t-l}) + \gamma Z_{it}\]简化为线性情况(即 \(f(x)=x\))时:\[\eta_{it} = \alpha + \mu_i + \sum_{l=0}^L \beta_l \cdot E_{i,t-l} + \gamma Z_{it}\]这里的 \(\alpha\) 是全局截距,\(\mu_i\) 是空间随机效应(如 \(\mu_i \sim \text{Normal}(0, \sigma^2_\mu)\)),\(\beta_l\) 通常被赋予平滑先验(如随机游走先验 \( \beta_l = \beta_{l-1} + \epsilon_l, \epsilon_l \sim \text{Normal}(0, \tau^2)\)),以防止滞后效应系数在时间上剧烈波动。模型通过 MCMC 进行估计。 -
可观测数据:
- 可观测的是:\(Y_{it}\), \(E_{it}\), \(Z_{it}\), \(S_i\)(每个 DMA 的空间脆弱性指数)。研究者可以精确知道每个 DMA 每周的搜索兴趣、烟尘 PM2.5 浓度和气象条件。
- 想要但观测不到/只能靠假设识别的:真实的公众担忧 / 意识 / 准备行为。Google Trends 数据只是其一个有偏、有噪的代理。更关键的是因果效应:例如,假设 \(E_{it}\) 真的导致搜索量增加,但这一效应的估计依赖于“无未观测时变混杂”等假设。特别是,如果新闻报导(未观测)同时驱动了搜索(\(Y_{it}\))和促使人们留在家中(从而降低 \(E_{it}\)),就会产生混杂。模型中的 \(\mu_i\) 只能控制 DMA 间恒定的混杂,而时间上和空间上都在变化的混杂因素(如突发性或区域性的媒体报导)是本模型难以控制的。作者在论文中明确承认了这个局限性。
第二步:讲最小内核¶
最简特例:将一般时空模型退化为一个 两个 DMA、两周滞后、二值暴露、无空间随机效应的简单线性回归。
-
设定:假设只有两个 DMA:高脆弱性(H)和低脆弱性(L)。只有两周的数据:第 1 周无野火(\(E=0\)),第 2 周有野火(\(E=1\))。我们只关心当前周的暴露对当前周的搜索量(滞后 0)和下一周的搜索量(滞后 1)的影响。
-
记号:
- DMA i (i = H, L),周 t (t = 1, 2)。
- 暴露:\(E_{i1} = 0\),\(E_{i2} = 1\)。
- 搜索量:我们需要估计的效应是 \(\beta_0\)(暴露当周效应)和 \(\beta_1\)(暴露后一周效应)。假设无空间随机效应,即 \(\mu_i = 0\),并忽略其他协变量 \(Z_{it}\)。
- 模型为:\(Y_{it} = \alpha + \beta_0 E_{it} + \beta_1 E_{i,t-1} + \epsilon_{it}\)。
-
数据:
- 第 1 周(t=1):\(Y_{H1}, Y_{L1}\)。模型为 \(Y_{i1} = \alpha + \beta_0 \times 0 + \beta_1 \times E_{i,0}\)。因为 \(E_{i,0}\) 我们设定为 0(假设无暴露),所以 \(Y_{i1} = \alpha + \epsilon_{i1}\)。这给了我们基线水平。
- 第 2 周(t=2):\(Y_{H2}, Y_{L2}\)。模型为 \(Y_{i2} = \alpha + \beta_0 \times 1 + \beta_1 \times E_{i,1} = \alpha + \beta_0 + \beta_1 \times 0 = \alpha + \beta_0\)。所以 \(Y_{i2}\) 的期望值直接反映了 \(\alpha + \beta_0\)。
-
核心忽略/识别:在这个极端简化的设定中,滞后 1 效应 \(\beta_1\) 是无法从这两周的数据中估计的,因为 \(E_{i,1}\) 始终为 0。为了估计 \(\beta_1\),我们需要第三周的数据(暴露在第 2 周,第 3 周测量响应)或者更长时间的暴露期。这个简单的例子揭示了分布式滞后模型的基本运作方式:它通过比较同一时间点的暴露水平和过去不同时间滞后期的暴露水平来识别滞后效应。例如,为了识别 \(\beta_1\),我们需要在某个时间点 \(t\),对于某些个体/地区,他们过去的暴露量(\(E_{t-1}\))高,而当前暴露量(\(E_t\))低;对于另一些个体/地区,情况相反。这种变异性完全来自于时间序列的内在波动。
-
空间维度的演示:如果引入高、低两组 DMA,并且假设它们第1周环境相同(\(E=0\)),但第2周高脆弱性DMA暴露更高(\(E_H=2\))而低脆弱性DMA暴露较低(\(E_L=1\))。那么在第2周:
- 对DMA L:\(Y_{L2} = \alpha + \beta_0 \times 1 = \alpha + \beta_0\)
- 对DMA H:\(Y_{H2} = \alpha + \beta_0 \times 2 = \alpha + 2\beta_0\) 从而\(\beta_0\)可以通过比较DMA H和L的差异来估计(\(\beta_0 = Y_{H2} - Y_{L2}\)),无需依赖时间上的波动。这就是空间异质性为识别滞后效应提供额外信息的简单例子。
三、这篇论文做了什么¶
-
三句话:① 研究了加州野火产生的烟尘 PM2.5 对公众搜索行为(用 Google Trends 搜索“空气污染”和“空气净化器”作为代理)的影响。② 核心工具是贝叶斯时空分布式滞后模型(BSTDLM),同时考虑了暴露的滞后效应(4周内)和空间异质性(11个DMA之间)。③ 主要结论:发现搜索“空气污染”在暴露后立即大幅上升(149%),而搜索“空气净化器”表现出更持续的、为期两周的上升(34%和68%);空间上以“棕榈泉(Palm Springs)”反应最强;并且气象条件和社会经济脆弱性显著修饰了这种行为响应。
-
关键设定与假设(在第二节最小记号基础上补充):
- 暴露-响应函数形式:假设为线性(这一点对大规模效应估计很重要,但限制了模型的灵活性)。作者明确将 \(E_{it}\) 作为连续线性变量纳入模型。
- 滞后结构:假设滞后效应是平滑的。通过在 \(\beta_l\) 系数上施加二次随机游走(random walk of order 2, RW2)先验来实现。这假设相邻滞后期的效应大小相似,避免了系数在滞后时间上的剧烈振荡。
- 空间随机效应 \(\mu_i\):被建模为非结构化的、独立同分布的高斯随机变量(\( \mu_i \sim \text{Normal}(0, \sigma^2_\mu)\)),而不是具有空间相关结构(如条件自回归CAR)的随机效应。这意味着模型假设不同 DMA 之间的未观测混杂因素是不相关的。这是对复杂空间结构的一个简化假设,但作者选择了它而不是空间自相关模型(如CAR,ICAR)。
- 交叉基函数:论文使用的是线性交叉基,即暴露-滞后响应曲面是暴露量的线性函数与滞后时间的平滑函数的交互。这与前面给出的简化模型一致:\(\beta_l \cdot E_{i,t-l}\)。
- 无观测混杂的稳定性假设:模型假设,在控制了DMA固定特征(通过 \(\mu_i\))和时变气象变量后,暴露 \(E_{it}\) 相对于残差是条件外生的。这个假设是不可检验的,并且如前所述,强烈的威胁来自于未观测的、与时间/空间相关的混杂因素(如新闻报导)。
-
主要结果:
- 对“空气污染”搜索的影响:PM2.5 每增加 6.6 μg/m³(1 单位),“空气污染”的搜索量立即(滞后0)增加149%(95% CrI: 107%, 486%)。滞后1-4周的效应迅速衰减,在统计上不显著。
- 对“空气净化器”搜索的影响:PM2.5 每增加 6.6 μg/m³,“空气净化器”的搜索量在滞后0周增加不明显,但在滞后1周增加34%(95% CrI: 3%, 76%)和滞后2周增加68%(95% CrI: 26%, 123%)。滞后3-4周效应不显著。这表明公众准备行为(购买净化器)的爆发比单纯信息寻求(搜“空气污染”)有所延迟,且持续时间更长。
- 空间异质性:在所有11个DMA中,棕榈泉(Palm Springs) 对烟尘PM2.5的反应最强(效应估计值最大,后验概率最高)。这可能是因为该区域的地理位置(内陆,野火烟雾更容易聚集)和气候特征。
- 效应修饰:
- 气象条件:在高温、高气压的条件下,PM2.5 对搜索“空气污染”的影响被放大;在高风速、高湿度的条件下,影响被减弱。这符合物理常识:高温高气压通常意味着烟雾不易扩散,使暴露更严重;而风和雨会驱散烟雾。
- 社会经济脆弱性:社会经济脆弱性较高的 DMA(如洛杉矶、萨克拉门托)其搜索“空气污染”和“空气净化器”的反应显著低于脆弱性较低的DMA(如旧金山)。这个发现非常关键,它揭示了可能存在于环境暴露与公众行为响应之间的不公平——暴露更严重的弱势群体反而信息寻求和准备行为更低。
- 模型对比与拟合:BSTDLM 模型(包含空间随机效应)的 WAIC(Watanabe-Akaike Information Criterion) 显著优于不包含空间随机效应的模型(即纯时间序列DLM),并且在残差诊断中显示出更好的空间独立性质,验证了纳入空间随机效应的必要性。
- 稳健性检验:作者进行了一系列稳健性分析,包括:(1) 使用不同的滞后期长度(L=3 和 L=5);(2) 排除极端年份(2020)的数据;(3) 使用二值化的 Google Trends 数据(搜索量是否超过某个阈值)。这些检验都定性上支持了主要结论。
-
证明路线与技术技巧:这是一篇应用论文,核心不是证明一条数学定理,而是展示一个建模流程与推理过程。其“证明路线”可以概括为“模型估计与推断流程”。
- 整体路线:
- 数据准备与探索性分析:收集、清理、融合不同来源(Google Trends, EPA空气质量监测, 气象站)的周度面板数据。绘制时间序列图和空间图,初步探索趋势。
- 模型设定:利用 R-INLA 或 Stan 等贝叶斯计算软件,设定 BSTDLM 模型。包括确定先验分布(对 \(\beta_l\) 的RW2先验,对 \(\mu_i\) 的独立正常先验,对 \(\sigma^2_Y, \sigma^2_\mu\) 的逆伽马/半柯西先验)和似然函数(正态分布)。
- 模型拟合:使用MCMC算法(如NUTS)或INLA的数值近似法,从后验分布中抽样。得到所有参数的后验均值、标准差和95%等尾巴可信区间。
- 效应估计:从后验分布中提取关键的滞后效应参数 \(\beta_l\) 及其组合(如暴露的总累积效应,即 \(\sum_{l=0}^L \beta_l\))。将效应大小(β值)通过指数变换转化为百分比变化(因为搜索量是经过缩放的,所以转换为 % 变化更易读)。
- 效应修饰检验:在模型中加入交互项(如 \(\beta_l \times \text{气象变量}\) 或 \(\mu_i \times \text{脆弱性指数}\)),重复步骤3-4,检验交互项的后验分布是否显著偏离零。
- 验证与敏感性分析:进行一系列稳健性分析(改变滞后期、排除异常点、改变数据变换方式),确认结果是否稳定。
- 关键跳跃点:论文的核心“跳跃点”在于用“拉格朗日乘子型时空随机效应”来替代固定效应。在传统的固定效应模型中,每个DMA需要一个单独的截距,这会导致过多的参数(I=11个)。而BSTDLM中的空间随机效应 \(\mu_i\) 是一个潜在变量,它通过在DMA之间共享一个共同的方差参数 \(\sigma^2_\mu\) 来正则化(regularize)截距的估计,从而在控制未观测异质性的同时避免过拟合和提高小样本下的估计效率。这个决策使得模型能够在外推时更平滑。
- 技术技巧:
- 贝叶斯分层建模(Bayesian Hierarchical Modeling):这是构建整个模型的核心框架,用于整合先验知识、处理小样本和不确定性问题。
- R-INLA(Integrated Nested Laplace Approximation)或 Stan:用于高效地进行贝叶斯后验推断。对于非统计研究者来说,这是其实现复杂贝叶斯模型的关键“黑箱”。
- 分布式滞后模型(DLM):核心的时间建模技巧,使用了交叉基(cross-basis) 的思想(本质上是张量积)来参数化暴露-滞后-响应曲面。
- 随机游走(Random Walk)先验:对滞后效应系数施加平滑先验,是一种有效的惩罚光滑化(penalized smoothing)方法,避免了将尾部的滞后噪声错当作真实效应。
- 整体路线:
-
真实例子与应用:
- 数据:2016-2020年加利福尼亚州11个指定市场区域(DMA)的周度数据。暴露变量为烟尘PM2.5浓度,响应变量为“空气污染”和“空气净化器”的缩放相对搜索兴趣,协变量包括温度、气压、风速、湿度,以及DMA级的美国社区调查(ACS)社会经济脆弱性指数。
- 如何应用:作者将数据整理为 \(11 \times 260\)(DMA × 周)的面板数据。对于每个搜索词,分别拟合 BSTDLM 模型。模型假设搜索兴趣的正态分布,使用滞后期 L=4。
- 主要结果:如前所述,展现了时间异质(-速搜索 vs. 延迟准备)和空间异质(Palm Springs最强)。
- 想说明什么:这个例子旨在说明BSTDLM的效用和揭示现实世界中有意义的行为模式。它并不仅仅是验证了一个理论,而是产出了对公共卫生实践有直接启示的信息:例如,公共沟通中,在预警早期应侧重提供“这是什么”(对应“空气污染”搜索),而在预警后的1-2周,应及时引导“我应该做什么”(对应“空气净化器”搜索),并特别关注对弱势群体的信息推送。
-
🔎 结论是否比证明窄:是的,作者非常坦诚地指出了局限性,没有将其结论过度外推。
- 因果推断弱化:论文明确使用“关联”(association)一词,而非“因果效应”(causal effect),且指出“可能混杂因素(如新闻报导)不能被完全控制”。这比许多盲目声称因果的观察性研究要严谨。
- 空间外推范围:论文仅限于加州,并特别指出Palm Springs的强反应,但没有断言这种空间模式普遍适用于其他地区。
- 滞后效应的廓形:论文的结论(暴露后立即的“空气污染”激增和延迟1-2周的“空气净化器”激增)是基于数据拟合的,并没有证明这个滞后廓形在数学上是最优或唯一的。模型假设的平滑性(RW2先验)会天然地塑造出这种形状。
- 近因效应:因为没有直接测量“购买”,所以论文遵循“建议—搜索”的逻辑,但没有证明搜索“空气净化器”等于购买。
四、开放问题(点到为止,扎根具体语句)¶
- 放松假设:非线性暴露-响应关系:本文假设了线性关系(\(f(x)=x\))。如果允许非线性(如用B样条构造交叉基),能否发现更复杂的阈值效应(如只在极端高浓度时才触发行为)或饱和度效应?该问题扎根于论文的 “Statistical analysis” 部分:“We modeled smoke PM2.5 as a continuous linear variable...”
- 因果识别:内生性与工具变量:如何用工具变量法(如风向作为PM2.5的工具变量)或断点回归设计(如野火日期的外生冲击)来严格识别PM2.5对搜索行为的因果效应,以克服新闻报导等未观测混杂?该问题扎根于论文的 “Limitations” 部分:“...unmeasured confounding (e.g., media reporting) may bias the estimates.”
- 数据源效度:Google Trends 的选择与测量误差:如何从统计模型上校正Google Trends作为一个代理变量所固有的选择偏差(只代表上网人口)和测量误差搜索词的歧义性?该问题并不是论文的核心,但它是对该领域关键假设的挑战。论文中隐含承认了这:“”Scaled relative search interest for ‘air pollution’ and ‘air purifier’ was used as a proxy for public awareness and preparedness...” 但未讨论测量误差模型。
- 空间异质性的结构化建模:本文采用了非结构化的独立空间随机效应(\(\mu_i \sim \text{Normal}(0,\sigma^2_\mu)\))。如果换用具有空间相关性的模型(如条件自回归CAR模型),能否更好地揭示未观测混杂的空间结构,并允许对未观测区域(如加州内未被选中的其他DMA)的空间效应进行预测?该问题扎根于论文的 “Spatiotemporal Distributed Lag Model” 部分对空间随机效应的描述,以及稳健性检验中比较了含 / 不含空间随机效应的模型。
Maintained by 陈星宇 · Homepage · Source on GitHub