Field Notes · 田野笔记

苏轼 1037 年生于四川眉山，1101 年卒于江苏常州，终年 65 岁。他留下 6,375 篇可定位到具体体裁的作品，合计约 203 万字纯古典原文。这些文字横跨他从 21 岁中进士到 65 岁卒前的 45 年人生，按写作年份排开，足以刻画出一条人格演化曲线。

研究问题、数据与时间分辨率

苏轼传记的标准叙事是 1079 乌台诗案是苏轼的人生转折点，1080 黄州贬所完成了他的文学与思想转向。这套叙事把转折归功于一次政治事件加一段贬所生涯，但叙事本身没有量化：所谓 "转折" 到底变了多少，在哪个维度上变，变化的统计稳健性如何，这些问题传记体回答不了。若把 1079 当作潜在的因果 treatment，问数据*"它真正触发了人格层面的什么变化"*，答案可能比传记给的更精细，也可能更微弱。

核心问题

把苏轼一生 16 个有据可考的关键生命事件（见第 0 章关键节点表）按时间排好，逐一作为 treatment 候选。对每个候选 treatment，我们想估的反事实是：

如果这个事件没发生，苏轼的人格演化轨迹会是什么样？实际轨迹相对这个反事实的偏离，就是这个事件的因果效应。

这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上：每个时间点的人格状态扮演潜在结果的角色，事件的发生扮演 treatment 的角色，事件之前的趋势外推扮演反事实的角色。

按项目级 CLAUDE.md 约束 1，三个外生 treatment 候选——1079 乌台、1094 惠州、1097 儋州——中本章只分析 1079，后两个留给第 4 章合成控制处理。选 1079 的理由是它最结构清晰：有完整的审讯档案（《东坡乌台诗案》）、明确的起讫日期（1079-07-28 中使到湖州到 1079-12-29 责授黄州）、以及紧接的 4 年半贬所观察期（1080–1084 黄州）。

数据来源

本章使用苏轼集（唐宋八大家本）作为底本，按卷、篇结构化抽取后得到 6,375 篇文档、203 万字纯古典原文。体裁分布如下表。

表 1·1　苏轼集语料按体裁分布

体裁	文档数	占比
诗	2,045	32.1%
尺牍（书启 / 札 / 简）	1,896	29.7%
其他（待二级精分）	1,372	21.5%
词	352	5.5%
奏议	343	5.4%
论策	111	1.7%
碑铭	108	1.7%
记	62	1.0%
祭文	62	1.0%
赋	24	0.4%
合计	6,375	100%

时间分辨率与编年问题

把每篇文档贴上写作年份后，是本章面临的核心数据挑战。苏轼集与阳明全集不同——后者大量篇章带有明确的纪年款识，阳明轨迹书在 1283 篇文档中能给 42.0% 找到编年信息。苏轼集的卷次基本按体裁编，不按时序，编年线索分散在三处。

一处是篇题中的天干地支，如《辛丑十一月十九日既与子由别于郑州西门之外马上赋诗一篇寄之》，题中的 "辛丑" 就是 1061 年；这一类型在全集中有 16 篇得到 high-confidence 编年。另一处是年谱中以《》标出的提及篇目，如《东坡先生年谱》1079 年下记 "作《文与可画筼筜谷偃竹记》"，这条记载直接把该文锚定到 1079；这一类型贡献 102 篇 high-confidence 编年。再一处是苏轼集的卷次惯例：诗、词、赋几类按大致时序编入卷，同卷内若有 3 篇以上已确认年份的篇目，可对同卷其余篇目做 medium-confidence 外推；这一类型贡献 107 篇 medium 与 321 篇 low confidence 编年。

最终编年回填的结果是：6,375 篇中 118 篇 high、107 篇 medium、321 篇 low confidence，累计 546 篇（8.6%）得到编年标签。

剩余 5,829 篇主要是尺牍、奏议、论策、题跋——这些是按类编而非按年编，单从篇题与卷次无法定年，需要更高成本的人工或现代年谱校注（孔凡礼《三苏年谱》中华书局本）来补全。本章 ITS 分析只使用 high + medium 共 225 篇，这条数据筛选是后续所有推断的基础。

人格维度与概念主题词表

ITS 的因变量是什么？在群体心理学研究里，用问卷量表（如 Big Five）测人格；但苏轼已死 900 年，不能填问卷。我们只能用文本计量替代：选定一组与人格相关的概念词，数它们在每篇文档中的出现频率，用这个频率作为该篇人格信号的代理变量。

8 维人格维度

参照阳明项目的 8 维框架，本书的 8 个维度与各自的关键词表见下表。完整词表共 109 个词，写在 code/concept_vocabulary.py。

表 1·2　8 维人格维度与代表性关键词

维度	代表性关键词	词数
D1 政治姿态	讥讽 / 讥切 / 讪 / 圣德 / 圣朝 / 尧舜	14
D2 自我修正	悔 / 愧 / 误 / 过 / 罪 / 自省 / 反思	12
D3 实践导向	躬耕 / 亲为 / 下手 / 事上 / 工夫 / 磨	11
D4 处变能力	镇定 / 从容 / 安然 / 随遇 / 自适	10
D5 决断力	速行 / 毋得 / 须 / 以为 / 决 / 宜	12
D6 情感深度	喜 / 哀 / 悲 / 苦 / 忧 / 忆 / 思 / 怀	18
D7 隐逸倾向	归田 / 归去 / 隐 / 闲 / 老 / 病 / 衰	16
D8 三教融合	仁 / 义 / 礼（儒）+ 禅 / 佛 / 空（佛）+ 道 / 玄（道）	16

每篇文档的 D-i 维度得分 = 该篇文本中所有 D-i 词出现频次之和 / 该篇字数 × 1000，即每千字 D-i 词频。这个量纲让不同长度的篇目可比。

9 主题概念词

除人格维度外，还有 9 个聚焦在苏轼一生关切话题上的概念主题，共 56 个词：政治新法、儒家纲领、佛家、道家、归隐、贬谪、情感、黄州、君臣。完整词表同样在 concept_vocabulary.py。

主题词用于第 2 章的概念分布散度分析与本章 ITS 的双重验证：同一个 1079 事件如果在人格维度上没显著效应、但在贬谪或黄州主题词频上显著，那说明效应是话题层面而非人格层面的，这条区分对解读结果至关重要。

ITS 模型设定

定义1079 乌台诗案的中断时间序列模型

def:its-wutai

对每一个维度 / 主题 $y$ ，拟合下面的线性模型：

y_t = \beta_0 + \beta_1 (t - 1056) + \beta_2 D_t + \beta_3 (t - 1079) D_t + \varepsilon_t

其中 $t$ 是日历年， $D_t = 1$ 当 $t \geq 1080$ 否则 $D_t = 0$ ， $\beta_2$ 是level shift（事件前后的立即跳跃）， $\beta_3$ 是slope change（事件前后的斜率变化）。1079 年本身作为过渡年从样本中剔除，因为该年 50% 时间在湖州、50% 时间在狱中，数据混杂。

模型估计用 OLS， $t$ -统计量按标准方法计算，不做异方差稳健修正——因单被试时间序列的样本独立性假设本身已经受质疑，任何标准误修正都不能根本解决问题。详见第 6 章的方法学讨论。

图 1·1　1079 乌台诗案 ITS 模型示意。pre-period（1056–1078）实测点拟合趋势线，外推到 post-period 作为反事实；post-period（1080–1101）实测点拟合另一条趋势线；两条线在 1079 处的垂直差 $\beta_2$ 就是 level shift 估计值。完整 TikZ 概念图详见 PDF 全文。

8 维人格维度的 ITS 结果

把 ITS 模型应用到 8 个人格维度，每个维度都拟合一次，结果见下表。

表 1·3　8 维人格维度在 1079 前后的 ITS 估计

维度	n 年	pre 均	post 均	$\beta_2$ 跳跃	$t$	显著性
D1 政治姿态	37	1.07	0.02	−1.27	−0.74
D2 自我修正	37	1.63	3.48	+3.71	+1.82	*
D3 实践导向	37	0.25	0.40	+1.15	+1.35
D4 处变能力	37	0.09	0.96	+1.94	+1.15
D5 决断力	37	8.34	5.55	−4.70	−1.48
D6 情感深度	37	13.68	10.76	+1.44	+0.21
D7 隐逸倾向	37	9.41	6.83	−2.77	−0.44
D8 三教融合	37	4.01	9.14	+0.89	+0.25

★ 表示 $|t|$ 大于 1.7（近似双侧 $p < 0.10$ ）。

结果解读

8 维中只有 D2 自我修正达到 $|t| > 1.7$ 的边缘显著性，其余 7 维 $t$ 值都未超过 1.7。最强信号是 D2：1079 之前 "悔 / 愧 / 误 / 过 / 罪 / 自省" 等自我修正词每千字 1.63，1080 之后跳到 3.48，level shift 估计 +3.71， $t$ 值 +1.82。

D5 决断力下降（pre 8.34 → post 5.55， $\beta_2 = -4.70$ ， $t = -1.48$ ），这条非显著但方向合理——黄州被禁止签书公事，决断力相关词（速行 / 毋得 / 须 / 决）的密度本就该下降。

D7 隐逸倾向意外不显著（pre 9.41 → post 6.83， $\beta_2 = -2.77$ ， $t = -0.44$ ），这条与传统叙事 "黄州让苏轼归隐" 相反。详细诊断会发现：隐逸词（归田 / 闲 / 老 / 病）的高频出现并非集中在黄州期（1080–1084），而是分散在苏轼整个晚年，特别是 1094 惠州后才显著上升。单独把 1079 当 treatment 看不到这条 long-term 效应，第 3 章断点检测会重新定位。

9 主题概念的 ITS 结果

把同样的 ITS 应用到 9 个概念主题上，结果见下表。

表 1·4　9 主题概念在 1079 前后的 ITS 估计

主题	n 年	pre 均	post 均	$\beta_2$ 跳跃	$t$	显著性
政治新法	37	0.08	0.00	−0.19	−1.36
儒家纲领	37	0.85	2.35	+1.80	+0.78
佛家	37	0.56	3.81	+1.66	+0.68
道家	37	1.43	2.30	−0.45	−0.26
归隐	37	8.03	8.55	+2.65	+0.51
贬谪	37	0.50	1.93	+1.96	+1.84	★
情感	37	3.41	2.57	+0.06	+0.02
黄州	37	0.00	1.79	+4.15	+3.10	★★★
君臣	37	7.70	5.20	−2.48	−0.46

★★★ 表示 $|t|$ 大于 3.0（近似双侧 $p < 0.01$ ）。

结果解读

9 主题中黄州与贬谪两个主题达到统计显著性，是本章最稳健的两个结果。

黄州主题词频 level shift 为 +4.15， $t$ 值 +3.10，在 0.01 水平上拒绝 "无 level shift" 的零假设。pre-period 苏轼写作中几乎不提 "黄州 / 东坡 / 雪堂 / 赤壁 / 临皋" 这些地标（1079 之前每千字 0.00）；1080 之后这五个词的合计频率跳到每千字 1.79。这是一个 sanity check——苏轼 1080 之前没去过黄州，自然不会提。ITS 在这个主题上通过了 sanity check，说明模型在 detect 真实变化时是工作的。

贬谪主题词频 level shift +1.96， $t$ 值 +1.84，在 0.10 水平上拒绝零假设。pre-period 苏轼几乎不写 "谪 / 贬 / 瘴 / 迁 / 流 / 海南"（每千字 0.50），1080 后跳到 1.93，近 4 倍。这一结果在统计上虽未达 0.01 严格显著，但方向与幅度都符合预期：1079 后苏轼成为被贬者，贬谪相关概念自然进入他的话语体系。

雷区把『黄州』词频跳跃当成人格证据

读者看到黄州词频 level shift $t = 3.10$ 这个最强结果，容易跳进一个陷阱："看，数据证明 1079 乌台诗案触发了苏轼的黄州转向！"

但这条解读是错的，或者至少是粗糙的。1080 后苏轼写 "黄州" 是因为他身在黄州，不是因为他在那里完成了思想转向。这条 level shift 在因果意义上是tautological的：事件直接决定了主语的位置，主语位置决定了地名出现频率。"位置变化 → 地名变化" 是直接物理推论，不是人格变化。

这个雷区与阳明项目里 "1506 之后阳明开始提『龙场』" 是同构问题。阳明数据的处理方法是把 "龙场 / 贵州 / 武夷" 等地名词从 D7 隐逸维度中剔除，单独作为 sanity check 主题。苏轼项目应采取同样做法：黄州主题的强信号只作为 ITS 是否在工作的 sanity check，不作为 "黄州转向" 的因果证据。

诊断方法：任何 ITS 主题，如果它的强信号能用 "事件改变了主语的物理位置 / 时间 / 身份" 直接解释，该信号就不能用来 claim 人格变化。

稳健替代：贬谪主题词频 level shift +1.96（ $t = 1.84$ ）才是更接近 "认知与情感层面变化" 的证据——它不依赖具体地名，而是反映苏轼是否在话语中以被贬者自居。真正的人格层面变化，是 D2 自我修正维度 +3.71（ $t = 1.82$ ），这条不依赖物理位置或地名。

把信号集中到 D2 自我修正与"贬谪"主题

排除地名 sanity check 之后，1079 乌台诗案在数据上留下的最稳健效应集中在两条：

第一，自我修正维度 D2 上升：pre 每千字 1.63 → post 3.48，翻 2.1 倍，level shift +3.71， $t = 1.82$ 。悔 / 愧 / 误 / 过 / 罪 / 自省 / 改易这些词的密度显著增加，这是经典的post-trauma reflection信号——经历重大政治打击后，苏轼在文字中更频繁地反思自身言行。

第二，贬谪话语进入：pre 每千字 0.50 → post 1.93，翻 3.9 倍，level shift +1.96， $t = 1.84$ 。谪 / 贬 / 瘴 / 迁 / 流 / 海南这些词的密度显著增加，苏轼开始把自己作为被贬者写进语言。

两条信号的方向一致——乌台诗案让苏轼在话语层面经历了一次 self-reframing。他不再像 1071–1078 那样以在朝官员、写诗议政者自居，而是开始以被贬者、自责反思者自居。这一变化既符合传记的描述，也在 ITS 框架下得到 $p < 0.10$ 水平的定量支持。

为什么 D6 情感深度、D7 隐逸倾向、D8 三教融合都不显著？

这三个维度在传统苏轼研究中常被认为是黄州转向的核心：黄州后情感更内敛、隐逸倾向更强、三教并用。但本章 ITS 没看到对应的统计显著效应，可能的原因有三。

第一，这些维度的真实变化是长期累积而非1079 一次性跳跃引发，ITS 的 level-shift 设定捕捉不到；第 3 章用 Bai-Perron 断点检测会重新定位真实转折点。

第二，1080 黄州刚到时苏轼仍处于震荡期，隐逸与三教融合的话语集中在 1082–1084 的 "雪堂期" 而非 1080 当年；第 4 章合成控制会精细处理这条阶段差异。

第三，这些维度的关键词（闲 / 老 / 病 / 禅 / 道）在苏轼的所有时期都高频出现，噪声大于信号，单靠 ITS 模型分不清。第 2 章双外部对照可以缓解这条问题。

简言之，1079 乌台诗案的最稳健效应是自我修正与贬谪话语的进入，而不是隐逸或三教转向。后两条在数据上需要更长的观察窗口与更精细的方法。

编年精度对结果的敏感性

ITS 用 225 篇 high+medium confidence 编年数据，而苏轼集总共 6,375 篇。这意味着 96.5% 的语料被排除在主分析之外，一个合理的质疑是：如果把 low confidence 也包含进来，结果会不会发生质变？

为了回答这个问题，应当做敏感性分析。本章的当前一版只跑了 high+medium 的主分析，low confidence 敏感性分析与人工校验留待后续 iteration。但有两点可以预先说明。

第一，low confidence 的编年误差主要是年份偏移 1–3 年，而不是完全错位。对 ITS 而言，这类小偏移会让 pre-period 与 post-period 的边界变模糊，但不会让 1079 前后的真实差异完全消失——除非偏移系统性地落在 1079 这条边界上，概率较低。

第二，主分析的两个显著效应（D2 自我修正、贬谪主题）都是方向稳健：即使加入 low confidence 让 $t$ 值漂移，level shift 的符号不会变。真正不稳定的是边缘显著的方向。

本章知识地图

表 1·5　第 1 章核心概念与常见误解

核心概念	核心内容	常见误解	为什么错
ITS 因变量	每千字关键词频率	以为可以直接用问卷量表	苏轼已死 900 年，文本计量替代
pre-trend 外推	用 1056–1078 数据外推 1080 后的反事实	以为外推总是对的	pre 趋势若被未观测因素污染，外推会偏
level shift $\beta_2$	事件前后立即跳跃	以为它就是因果效应	跳跃可能由共时性变化引起，不一定因果
地名 sanity check	"黄州" $t = 3.10$ 验证 ITS 在工作	以为它就是黄州转向的证据	位置变化导致地名变化是 tautology，不是人格变化
D2 自我修正	悔 / 愧 / 误 / 过 / 罪 / 自省词频	以为这维度反映道德感	反映的是 self-reframing 而非道德判断
贬谪主题	谪 / 贬 / 瘴 / 迁 / 流 / 海南词频	以为这维度反映抑郁	反映的是 self-positioning，不是情感
225 篇主分析	high+medium confidence 编年	以为应该用全部 6375 篇	编年错误会稀释真实信号