Online experimentation for studying political polarization¶

讲者: Alexander Volfovsky
讨论人: Edo Airoldi
来源: OCIS (Online Causal Inference Seminar)
日期: 2021-07-13
主题: 因果推断
视频: https://youtu.be/CoxmwebAsOw · 幻灯片

本页据讲座录音的自动转写（ASR）生成。人名 / 术语 / 公式 / 具体的率与界可能被听错，关键处请对照视频或讲者论文核对。

一、这场报告在讲哪条工作线¶

这场报告的核心是网络干扰下的实验设计——具体来说，是在存在干扰（interference）和同质性（homophily）的社交网络环境中，如何设计随机化方案，使得最简单的估计量（处理组与对照组均值差）能够获得对直接治疗效应（direct effect）的无偏或低偏差估计。报告的工作线横跨两个层面：

应用层面：一场关于社交媒体政治极化的实地实验（Bail et al., 2018, PNAS），讲者及其团队通过 Twitter 机器人向共和党与民主党用户推送对立观点，发现暴露于对立观点实际上加剧了极化，且效应在共和党中更强。该实验遇到的网络问题（出现两个大连通分量、潜在影响者干扰）直接驱动了后续的方法论工作。
方法论层面：针对网络干扰问题，讲者与合作者（Jagadeesan, Pillai & Volfovsky, 2020, Annals of Statistics）提出了一套基于节点配对的随机化方案：将 2n 个节点配成 n 对，每对内一人处理、一人对照。他们证明，在此设计下，若干扰函数满足 Lipschitz 类条件，则朴素均值差估计量的偏差上界仅依赖于配对中恰好是边的那部分节点（即 \( \{w_i, w'_i\} \subseteq E(G) \cap P \)）。如果能够选择一种配对使得没有任何一条边出现在同一对中，则估计量无偏；若无法完全避免，则偏差和 MSE 可通过排序度后进行“高度节点与高度节点配对”来被控制，并且在稠密图（\(d_{\min} \to \infty\)）中 MSE 趋于 0。

该工作线属于因果推断中网络实验设计这一子方向。奠基性工作：Sobel (2006)、Hudgens & Halloran (2008) 提出了两阶段随机化（先随机化群体再到个体）来分解直接与间接效应；Tchetgen Tchetgen & VanderWeele (2012) 发展了相关识别与估计方法。当前 frontier 还包括：图聚类随机化（Eckles, Karrer & Ugander, 2014, 用于估计总体网络效应）；模型辅助设计（讨论人 Edo Airoldi 的工作，在随机化空间中施加由模型导出的约束以控制偏差，同时保持设计无偏性）。本报告的方法正是针对直接效应，选择了一个极其简单的估计器（均值差），并将设计自由度留在随机化方案上——这与 Airoldi 讨论中“固定估计器、优化随机化”的理念完全一致。

二、最小内核 / 一个最简例子¶

符号与设定
- 图 \(G\)，节点集 \(V(G)\)，\(|V(G)| = 2n\)（便于配对）。
- 每个节点 \(v\) 有基线效应 \(x_v\)、直接治疗效应 \(t_v\)、干扰函数 \(f_v: 2^{N(v)} \to \mathbb{R}\)（\(f_v(\emptyset)=0\)），其中 \(N(v)\) 是 \(v\) 的邻居集，\(d(v)=|N(v)|\) 为度。
- 处理分配向量 \(Z \in \{0,1\}^{2n}\)，处理组 \(T = \{v: Z_v=1\}\)，\(|T|=n\)。
- 可观测结果：\(y_v = x_v + Z_v t_v + f_v(T \cap N(v))\)。
- 目标 estimand：平均直接治疗效应 \(\bar{t} = \frac{1}{2n}\sum_v t_v\)。
- 估计量：朴素 Neyman 估计量 \(\hat{t} = \frac{1}{n}\sum_{v\in T} y_v - \frac{1}{n}\sum_{v\notin T} y_v\)。
- 若我们无法观测干扰项，则“理想估计量”为 \(t_{\text{ideal}} = \frac{1}{n}\sum_{v\in T}(x_v+t_v) - \frac{1}{n}\sum_{v\notin T} x_v\)。
- 偏差核心量：\(\xi = \hat{t} - t_{\text{ideal}} = \frac{1}{n}\sum_{v\in T} f_v(T\cap N(v)) - \frac{1}{n}\sum_{v\notin T} f_v(T\cap N(v))\)。

最简特例：
取 \(n=2\)（4个节点），图结构为一条路径 \(1-2-3-4\)（边集 \(\{(1,2), (2,3), (3,4)\}\)）。假设线性干扰：\(f_v(S) = \gamma |S|\)（即每多一个处理邻居，结果增加 \(\gamma\)）。直接效应 \(t_v\) 均为 3，基线 \(x_v\) 为 0。若我们使用完全随机化（每个节点独立以概率 0.5 分配处理），则可能产生如 \(T = \{1,3\}\) 的分配。计算可得 \(\xi = \frac{1}{2}[\gamma\cdot1 + \gamma\cdot1] - \frac{1}{2}[0 + 0] = \gamma\)，因此 \(\hat{t} = 3 + \gamma\)，偏差为 \(\gamma\)。若 \(\gamma\) 与直接效应同量级，偏差显著。

现在采用配对随机化：将节点配成 \(\{1,4\}\) 和 \(\{2,3\}\)，每对内掷硬币决定谁处理。假设配对为 \(P = \{\{1,4\}, \{2,3\}\}\)，且掷硬币结果为 \(T = \{1,3\}\)。此时边 \((2,3)\) 落在同一对中（注意 \((1,4)\) 不是边）。计算偏差上界：\(\frac{1}{n}\sum_{\{w_i,w'_i\}\subseteq E\cap P} \left( \frac{K_{w_i}}{d(w_i)} + \frac{K_{w'_i}}{d(w'_i)} \right)\)。这里 \(K_v\) 是 Lipschitz 常数：对线性干扰 \(f_v(A)=\gamma|A|\)，有 \(K_v = \gamma d(v)\)，因此 \(\frac{K_v}{d(v)}=\gamma\)。如此，若配对使得没有任何一条边落在同一对中（即边被“切开”），则求和为空，偏差为 0。在上例中，边 \((2,3)\) 未切开，因此仍有偏差。若我们能重新配对为 \(\{1,2\}, \{3,4\}\)，则边 \((1,2)\) 与 \((3,4)\) 对内的边，但边 \((2,3)\) 被切开。实际偏差仍不为 0，但通过排序度后配对可控制界。

关键直觉：配对随机化将偏差限制在那些“巧合地连边且处于同一对”的节点上；通过优化配对（优先切断高度节点的边、避免同一对内有边），可以收紧偏差界。

三、报告主体：讲者讲了什么¶

第一部分：政治极化实验（[0:00:05]–[0:22:55]）

[0:05:00]–[0:09:00] 动机：美国政治极化严重，党派身份预测社会政策立场的效力超过年龄和教育。假设根源是“回音室”（echo chambers）及选择性暴露。提出问题：打乱回音室（促使人们接触对立观点）是否会降低极化？假设有三种可能：（1）大家都友好（接触减少刻板印象）；（2）大家都更对立（回火效应）；（3）不对称效应（保守派更容易回火）。
[0:09:18]–[0:11:40] 实验设计：通过 Qualtrics 调查公司招募自认民主党或共和党、每周至少上 Twitter 三次的受访者，共享 Twitter 帐户。最终样本约 1300+ 人。分层随机分块（block randomization）按党派依附度和时事兴趣分层。
[0:11:40]–[0:16:18] 网络结构的发现：研究团队发现样本在 Twitter 上形成两个大连通分量（56 节点和 43 节点），以及数百个独立的非连通节点与二节点组。讲者展示了一张幻灯片（[slide 7]）展示该网络。干扰潜在问题：幻灯片 [8] 用一个线性加性干扰模型量化偏差：若存在均匀干扰 \(\gamma_j=1\)，ATE 估计偏差约 1.5%；若存在“影响者”（中心节点），偏差可达 4.6%–7.2%。因此，实验时决定移除两个大分量，并从二分体（dyads）中随机选取一人，以消除直接连通干扰。
[0:16:18]–[0:19:05] 干预与结果：处理组被关注一个 Twitter 机器人，该机器人转发来自对立党派知名人士（议员、意见领袖）的推文。持续数月后测量意识形态变化（7 点量表）。结果（幻灯片 [12]）：共和党变得更保守，民主党略变得更自由，且随着依从性增加效果增大。结论：暴露于对立观点增加了极化（尤其保守派）。论文发表于 PNAS 2018。
[0:19:05]–[0:22:00] 局限性：仅限 Twitter 用户、无独立选民、未控制实际推文内容。但他们检验了极端主义、人口差异等，无其他解释。提出未来的个人化干预（更直接的对话可能更有效）。

第二部分：网络干扰下的实验设计方法（[0:22:00]–[0:46:01]）

[0:22:00]–[0:26:50] 泛化到一般网络场景：疾病传播、在线广告、社会发展。重新陈述潜在结果框架——无干扰假设不可信。estimands 类型：总体网络效应、直接效应、间接效应、节点总效应。强调estimand应驱动随机化设计。
[0:26:50]–[0:30:10] 回顾已有工作：Sobel/Hudgens-Halloran 两阶段随机化；Eckles et al. 图聚类随机化。讲者聚焦直接效应，采用最简单的均值差估计器，将设计自由度留在随机化方案上。假设：干扰局限于节点的邻域（neighborhood interference assumption）。
[0:30:10]–[0:32:20] 模型与符号（幻灯片 [19-20]）：线性加性模型（仅用于分析，非拟合）：
\[y_v = x_v + Z_v t_v + f_v(T \cap N(v)).\]
目标 estimand：\(\bar{t} = \frac{1}{2n}\sum_v t_v\)。朴素估计量 \(\hat{t} = \frac{1}{n}\sum_{v\in T} y_v - \frac{1}{n}\sum_{v\notin T} y_v\)。理想估计量 \(t_{\text{ideal}}\) 去掉干扰项。偏差 \(\xi = \hat{t} - t_{\text{ideal}}\)。引用 Sussman & Airoldi (2017) 的分解来说明在邻域干扰假设下可写成类似形式。
[0:32:20]–[0:36:40] 配对随机化设计（幻灯片 [23]）：将 \(2n\) 个节点配成 \(n\) 对，每对内随机分配一人处理一人对照。干扰函数 \(f_v\) 需满足 \(K_v\)-Lipschitz 条件（即改变一个邻居的处理状态最多改变结果 \(K_v/d(v)\)）。关键定理：偏差的期望（条件于配对 \(P\)）为
\[|E[\xi | P]| \le \frac{1}{n} \sum_{\{w_i,w'_i\} \subseteq E(G) \cap P} \left( \frac{K_{w_i}}{d(w_i)} + \frac{K_{w'_i}}{d(w'_i)} \right).\]
因此，若配对方案中没有一条边落于同一对（即所有边都被“切断”），则偏差为零。均匀随机配对可给出另一形式的偏差界（幻灯片 [24]）。
[0:36:40]–[0:40:00] 方差控制：需要进一步假设对称干扰（Symmetric interference，即干扰函数只取决于邻居中被处理的数量和未处理的数量，而不关心具体是谁）。引入“双度”（bidegree）\((a,b)\)，定义符号测度 \(D_T(u)\) 衡量处理的平衡性。完美准着色（perfect quasi-coloring）指每个双度在处理和对照节点中出现的次数相等，此时 \(\xi=0\)。但完美准着色不一定存在（如六边形图，幻灯片 [27]）。
[0:40:00]–[0:43:50] LPS: 不需要完美，控制偏差和方差即可。使用一个度量 \(d_K\) 衡量双度距离，得到 \(\xi\) 的 L2 范数界：
\[\|\xi\|_2 \le \frac{K_1}{n} C_P + \frac{2K_2}{n}\sum_v \frac{1}{\sqrt{d(v)}} + \frac{K_2}{n}\sum_{(v,v')\in E\cap P}\left(\frac{1}{d(v)}+\frac{1}{d(v')}\right)。\]
其中 \(C_P\) 与配对中节点的度差异有关。可以通过排序度（将节点按度降序排列，然后相邻成对）来使 \(C_P \le 2\)。此时代入界，如果最小度 \(d_{\min}\to\infty\)，则 MSE \(\to 0\)。
[0:43:50]–[0:44:45] 一个反例对比（幻灯片 [31]）：在完全随机化下线性干扰 \(\xi\) 的方差可随图大小发散；而在配对随机化下 \(\xi\) 是确定常数（等于 \(-\gamma/2\)），因此 MSE 更小。
[0:44:45]–[0:46:01] 仿真结果：展示了 Erdos-Renyi 图、小世界图、随机块模型（homophily）、星状图（影响者干扰）下的 MSE 比较。配对随机化（"restricted"）通常优于 CRD 和 CRD 分层，尤其在 misspecified 的星状图（影响者只有干扰效应而无对称性）中，配对随机化仍显著优于 CRD。
[0:46:01]–[0:47:04] 回到极化实验：未来将观察性研究、更个人化的干预等方向。最后一张幻灯片介绍估计间接效应的扩展工作（与 Sid Sarkar），通过优化设计使直接效应被平衡掉，从而识别间接效应。时间有限，讲者略过。

讨论环节（由 Edo Airoldi 讨论）
- [0:47:04]–[0:59:00] Edo 介绍了模型辅助设计（Model-assisted design）框架：固定估计器（如均值差），用简单模型导出随机化约束，使得即使模型错误，只要约束保持对称性，设计仍是无偏的。这与报告的方法互补。Edo 也提问了（1）是否使用了预随机化平衡检验（AA test）；（2）有限样本下界的紧性；（3）模型的嵌入是否会导致模型误设时失败。讲者回应：（1）用了 AA 检验，来自调查公司的样本本身已平衡；（2）界未探索紧性，但仿真显示实际误差比界更小；（3）模型假设仅是加性干扰假设（来自 Sussman & Airoldi 的分解），不是特定的线性模型；在不对称情景（如影响者干扰）下仍优于 CRD。

四、对应论文与开放问题¶

（a）这场报告对应的主要论文

Bail, C.A., Argyle, L.P., Brown, T.W., Bumpus, J.P., Chen, H., Hunzaker, M.F., Lee, J., Mann, M., Merhout, F. & Volfovsky, A. (2018). Exposure to opposing views on social media can increase political polarization. Proceedings of the National Academy of Sciences, 115(37), 9216–9221.
— 对应报告第一部分的政治极化实验。无争议。
Jagadeesan, R., Pillai, N.S. & Volfovsky, A. (2020). Designs for estimating the treatment effect in networks with interference. The Annals of Statistics, 48(2), 679–712.
— 对应报告第二部分的配对随机化设计与理论。报告标题和其他地方均有提及。
Sussman, D.L. & Airoldi, E.M. (2017). （可能是“Elements of estimation theory for causal effects in the presence of network interference”之类）报告引用了其分解潜在结果的工作，但未给全标题，需核实。

（b）开放问题（每条扎根于转写/幻灯片具体处）

如何将设计推广到观察性研究？ （[0:46:17] 讲者提问“How do we port this to observational studies?”）——这是一个方法论上的跳跃：在非随机化设置中，无法直接控制配对，如何利用设计的思路调整估计？
更个人化的干预能否减少极化？ （[0:19:40]–[0:22:00] 讲者提到正在开发的社交媒体孵化器 app 用于一对一对话，初步显示出更好的效果）——这本质上是一个新的干预设计与估计问题，嵌套在原有的网络问题中。
配对随机化界限的有限样本最优性/紧性 （Edo Airoldi 讨论中提及，[0:59:22] 提问“sharpness of the bounds for finite n”）——报告未探索紧性，仿真虽好但理论最坏情况可能不紧。
扩展到其他 estimands（如间接效应、总体网络效应）时的统一优化框架 （[1:04:00]–[1:05:30] Sid Sarkar 的工作，通过求解优化问题自动生成设计）——这提示可能有一套通用的“给定 estimand 和估计器，自动导出最优随机化方案”的算法。
模型误设下的鲁棒性（Edo 讨论及讲者回应，[0:59:28]–[1:03:30]）——虽然加性假设已比线性模型弱，但当干扰机制高度非对称（如影响者效应不满足对称性）时，设计的实际表现如何？报告只展示了星状图仿真，但理论界或许可进一步放松。

Maintained by 陈星宇 · Homepage · Source on GitHub

Online experimentation for studying political polarization¶

一、这场报告在讲哪条工作线¶

二、最小内核 / 一个最简例子¶

三、报告主体：讲者讲了什么¶

四、对应论文与开放问题¶

评论