第 1 章 ITS 估的是level shift 与 slope change,假设的反事实是 "pre-trend 直接外推"。若 pre-trend 本身就在变化,外推会偏。第 3 章断点检测在 BIC 罚项下让 15 条序列退化为 ,但这未必表示无效应——可能只是渐进式效应被罚项过滤掉。
合成控制提供另一种构造反事实的方式:用苏轼自己其他稳定概念的演化轨迹加权拟合目标概念的 pre-period 轨迹,然后把这个权重外推到 post-period 作为反事实。这种方法不需要 pre-trend 线性假设,也不需要 level shift 假设——它对渐进式效应天然敏感。阳明项目的 chap04 上证明它能拿到稳健的 1521 致良知反事实,苏轼项目沿用同样思路处理 1079 后的长期演化。
研究问题
具体问:1079 之后苏轼的 D2 自我修正、D7 隐逸倾向、D8 三教融合、贬谪、佛家、归隐这六个目标的演化,是否真的发生了 "超出 pre-period 趋势" 的偏离?ITS 在 D2 与贬谪上看到边缘显著效应,但在 D7 / D8 / 佛家 / 归隐 上没看到;第 3 章断点检测则在 D8 与佛家上看到断点(1088 / 1086),与 ITS 矛盾。合成控制是第三方仲裁。
方法
给定目标序列 在 pre-period (剔除 1079)上的观测值,以及 donor pool 同样在 pre-period 上的观测值,求权重 满足:
反事实轨迹: 对 。实际偏离:。
donor pool 的选择
donor 选择是合成控制最易陷循环论证的环节。一般原则是donor 与 target 不应在因果机制上同源,但应在 pre-period 上能拟合 target。本书选 9 个 donor:D1 政治姿态、D3 实践导向、D5 决断力、D6 情感深度、儒家纲领、道家、情感、君臣、文学。
这些 donor 与 6 个 target 在概念语义上相对独立:D1 政治姿态测的是 "讥讽 / 拥护朝政",与 target D2 "自我修正" 的语义维度不同;儒家纲领(仁 / 义 / 礼)与 target 佛家(禅 / 佛 / 空)是并列对照三教关系,用其中两支构造另一支的反事实是合理的。
Placebo 检验
Placebo 流程把每一个 donor 当作 "假 target",用其他 8 个 donor 给它构造合成控制,看 post 偏离的分布。真实 target 的 post 偏离若在这 9 个 placebo 分布的尾部,则视为非偶然。
具体地, (rough) =(|real gap| 在 9 个 placebo + 1 个 real 里的排位)/ 10。这条 值是单被试事件研究的标准近似,不是经典 OLS 意义上的 值。
图 4·1 合成控制示意。pre-period 上 donor 加权曲线与 target 实测曲线高度重合(反映权重拟合得好);post-period 上 donor 加权外推作为反事实,target 实测脱离反事实曲线,中间阴影即估计的事件累积效应 。完整 TikZ 概念图详见 PDF 全文。
6 个目标的合成控制结果
表 4·1 6 个目标在 1079 后的合成控制偏离
| 目标 | pre 拟合 RMSE | post 偏离均值 | Placebo p | 结论 |
|---|---|---|---|---|
| D2 自我修正 | 1.137 | +1.805 | 0.20 | 偏弱显著 |
| D7 隐逸倾向 | 5.425 | +0.372 | 0.90 | 无效应 |
| D8 三教融合 | 3.301 | +5.856 | 0.20 | 偏弱显著,最强效应 |
| 贬谪 | 0.614 | +1.028 | 0.80 | 无效应 |
| 佛家 | 0.904 | +2.896 | 0.20 | 偏弱显著 |
| 归隐 | 5.793 | +2.698 | 0.20 | 偏弱显著 |
6 个目标中,4 个(D2 / D8 / 佛家 / 归隐)都在 Placebo 水平上显著,后 2 个(D7 / 贬谪)无效应。
最强效应是 D8 三教融合,post 偏离均值 +5.856,意味着 1080 之后苏轼的三教融合词频均值比反事实预期高 5.86 千字 / 篇。这条结果与第 3 章断点检测(D8 在 1088 翻 2.4 倍)方向高度一致,给第 3 章的反传统结论提供独立验证。
佛家与归隐合成控制偏离 +2.90 / +2.70,与第 3 章断点检测的方向一致。这条结果反驳第 1 章 ITS 看到 "佛家 / 归隐 t 不显著" 的结论——ITS 把渐进式效应稀释到 pre-trend 与 post-trend 两侧,看不到累积偏离;合成控制能看到。
D7 隐逸倾向偏离仅 +0.37() 是真正的无效应。这一结果与 ITS、断点检测全部一致,三方法都说 D7 没变。D7 包含归 / 闲 / 老 / 病 / 退 / 隐 / 山林 / 衰,但这些词在苏轼整个 45 年里都是高频,单看 D7 总分看不出 1080 前后的差异——苏轼一直在写老病归隐,不是黄州后才开始写。
贬谪偏离 +1.03() 也是无效应,与 ITS 的 矛盾。这一矛盾的可能原因是合成控制的 donor 里含君臣(君 / 臣 / 圣 / 朝廷),它在 post-period 也下降,与贬谪上升互相抵消,让贬谪 − 君臣的差几乎为零。这是 donor 选择的副作用,后续 iteration 应当把君臣从 donor pool 移到 target list 单独分析。
合成控制与 ITS、断点检测的三方对照
把第 1 / 3 / 4 章的结果汇总到一张表,可以看到三方法的一致与不一致区域。
表 4·2 ITS / 断点检测 / 合成控制三方法的方向对照
| 目标 | ITS() | 断点(年) | 合成控制() |
|---|---|---|---|
| D2 自我修正 | +1.82 ★ | 无 | 0.20 ★ |
| D7 隐逸倾向 | −0.44 | 无 | 0.90 |
| D8 三教融合 | +0.25 | 1088 | 0.20 ★ |
| 贬谪 | +1.84 ★ | 无 | 0.80 |
| 佛家 | +0.68 | 1086 | 0.20 ★ |
| 归隐 | +0.51 | 无 | 0.20 ★ |
★ 表示该方法判定有信号。
D2 自我修正在三方法里方向一致(ITS 与合成控制都显著)。D8 三教融合在断点与合成控制里显著、ITS 不显著。佛家与 D8 类似。这种 "ITS 看不到、断点 + 合成控制看到" 的 pattern 暗示这些维度的效应是渐进累积的,不是 1079 一次性跳跃。真实的因果机制可能是:1079 乌台诗案触发自我修正(D2)的立即反应,但三教融合(D8)与佛家话语的渗入是长期阅读积累的结果,黄州 4 年加上元祐回朝有藏书可读的几年共同推动,不是 1080 一次性的事件触发。
donor 权重的解读
每个 target 的合成控制权重指向其 pre-period 最相似的 donor 概念。这些权重的方向有解释力,但本节因篇幅限制只做简要说明,完整权重表见 data/corpus/synth_control_results.json。
大致观察:D8 三教融合的最大权重来自 "儒家纲领" 与 "道家" donor,说明用其他两支三教 donor 合成 "佛家" 的 pre-trend 拟合得不错,但 post-period 仍出现 +5.86 偏离,这条偏离不是其他三教 donor 能解释的,才是 1080 后佛家词频独立上升的真信号。
本章知识地图
表 4·3 第 4 章核心概念与常见误解
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| donor pool | 用其他稳定概念加权拟合目标 | 以为越多越好 | donor 与目标相关性高会反向污染 |
| 权重非负与归一 | 凸组合约束 | 以为可以负权 | 负权会让反事实超出可观测范围 |
| 反事实轨迹 | 用 pre 权重外推 post | 以为 post 永远适用 | 距 treatment 越远不确定性越大 |
| Placebo 检验 | 用 donor 当假 target 算 值 | 以为 检验就够 | 单被试小样本 检验无意义,必须 Placebo |
| D8 三教 +5.86 | 合成控制最强信号 | 以为 ITS 没看到就是无效应 | ITS 看 level shift,合成控制看累积偏离 |
| 贬谪在合成控制下消失 | 与 ITS 矛盾 | 以为方法学故障 | donor 选择的副作用,君臣 donor 抵消了上升 |