苏轼 1037 年生于四川眉山,1101 年卒于江苏常州,终年 65 岁。他留下 6,375 篇可定位到具体体裁的作品,合计约 203 万字纯古典原文。这些文字横跨他从 21 岁中进士到 65 岁卒前的 45 年人生,按写作年份排开,足以刻画出一条人格演化曲线。
研究问题、数据与时间分辨率
苏轼传记的标准叙事是 1079 乌台诗案是苏轼的人生转折点,1080 黄州贬所完成了他的文学与思想转向。这套叙事把转折归功于一次政治事件加一段贬所生涯,但叙事本身没有量化:所谓 "转折" 到底变了多少,在哪个维度上变,变化的统计稳健性如何,这些问题传记体回答不了。若把 1079 当作潜在的因果 treatment,问数据*"它真正触发了人格层面的什么变化"*,答案可能比传记给的更精细,也可能更微弱。
核心问题
把苏轼一生 16 个有据可考的关键生命事件(见第 0 章关键节点表)按时间排好,逐一作为 treatment 候选。对每个候选 treatment,我们想估的反事实是:
如果这个事件没发生,苏轼的人格演化轨迹会是什么样?实际轨迹相对这个反事实的偏离,就是这个事件的因果效应。
这就是中断时间序列分析所要回答的问题。它的核心是把潜在结果框架放到单一个体的时间序列上:每个时间点的人格状态扮演潜在结果的角色,事件的发生扮演 treatment 的角色,事件之前的趋势外推扮演反事实的角色。
按项目级 CLAUDE.md 约束 1,三个外生 treatment 候选——1079 乌台、1094 惠州、1097 儋州——中本章只分析 1079,后两个留给第 4 章合成控制处理。选 1079 的理由是它最结构清晰:有完整的审讯档案(《东坡乌台诗案》)、明确的起讫日期(1079-07-28 中使到湖州到 1079-12-29 责授黄州)、以及紧接的 4 年半贬所观察期(1080–1084 黄州)。
数据来源
本章使用苏轼集(唐宋八大家本)作为底本,按卷、篇结构化抽取后得到 6,375 篇文档、203 万字纯古典原文。体裁分布如下表。
表 1·1 苏轼集语料按体裁分布
| 体裁 | 文档数 | 占比 |
|---|---|---|
| 诗 | 2,045 | 32.1% |
| 尺牍(书启 / 札 / 简) | 1,896 | 29.7% |
| 其他(待二级精分) | 1,372 | 21.5% |
| 词 | 352 | 5.5% |
| 奏议 | 343 | 5.4% |
| 论策 | 111 | 1.7% |
| 碑铭 | 108 | 1.7% |
| 记 | 62 | 1.0% |
| 祭文 | 62 | 1.0% |
| 赋 | 24 | 0.4% |
| 合计 | 6,375 | 100% |
时间分辨率与编年问题
把每篇文档贴上写作年份后,是本章面临的核心数据挑战。苏轼集与阳明全集不同——后者大量篇章带有明确的纪年款识,阳明轨迹书在 1283 篇文档中能给 42.0% 找到编年信息。苏轼集的卷次基本按体裁编,不按时序,编年线索分散在三处。
一处是篇题中的天干地支,如《辛丑十一月十九日既与子由别于郑州西门之外马上赋诗一篇寄之》,题中的 "辛丑" 就是 1061 年;这一类型在全集中有 16 篇得到 high-confidence 编年。另一处是年谱中以《》标出的提及篇目,如《东坡先生年谱》1079 年下记 "作《文与可画筼筜谷偃竹记》",这条记载直接把该文锚定到 1079;这一类型贡献 102 篇 high-confidence 编年。再一处是苏轼集的卷次惯例:诗、词、赋几类按大致时序编入卷,同卷内若有 3 篇以上已确认年份的篇目,可对同卷其余篇目做 medium-confidence 外推;这一类型贡献 107 篇 medium 与 321 篇 low confidence 编年。
最终编年回填的结果是:6,375 篇中 118 篇 high、107 篇 medium、321 篇 low confidence,累计 546 篇(8.6%)得到编年标签。
剩余 5,829 篇主要是尺牍、奏议、论策、题跋——这些是按类编而非按年编,单从篇题与卷次无法定年,需要更高成本的人工或现代年谱校注(孔凡礼《三苏年谱》中华书局本)来补全。本章 ITS 分析只使用 high + medium 共 225 篇,这条数据筛选是后续所有推断的基础。
人格维度与概念主题词表
ITS 的因变量是什么?在群体心理学研究里,用问卷量表(如 Big Five)测人格;但苏轼已死 900 年,不能填问卷。我们只能用文本计量替代:选定一组与人格相关的概念词,数它们在每篇文档中的出现频率,用这个频率作为该篇人格信号的代理变量。
8 维人格维度
参照阳明项目的 8 维框架,本书的 8 个维度与各自的关键词表见下表。完整词表共 109 个词,写在 code/concept_vocabulary.py。
表 1·2 8 维人格维度与代表性关键词
| 维度 | 代表性关键词 | 词数 |
|---|---|---|
| D1 政治姿态 | 讥讽 / 讥切 / 讪 / 圣德 / 圣朝 / 尧舜 | 14 |
| D2 自我修正 | 悔 / 愧 / 误 / 过 / 罪 / 自省 / 反思 | 12 |
| D3 实践导向 | 躬耕 / 亲为 / 下手 / 事上 / 工夫 / 磨 | 11 |
| D4 处变能力 | 镇定 / 从容 / 安然 / 随遇 / 自适 | 10 |
| D5 决断力 | 速行 / 毋得 / 须 / 以为 / 决 / 宜 | 12 |
| D6 情感深度 | 喜 / 哀 / 悲 / 苦 / 忧 / 忆 / 思 / 怀 | 18 |
| D7 隐逸倾向 | 归田 / 归去 / 隐 / 闲 / 老 / 病 / 衰 | 16 |
| D8 三教融合 | 仁 / 义 / 礼(儒)+ 禅 / 佛 / 空(佛)+ 道 / 玄(道) | 16 |
每篇文档的 D-i 维度得分 = 该篇文本中所有 D-i 词出现频次之和 / 该篇字数 × 1000,即每千字 D-i 词频。这个量纲让不同长度的篇目可比。
9 主题概念词
除人格维度外,还有 9 个聚焦在苏轼一生关切话题上的概念主题,共 56 个词:政治新法、儒家纲领、佛家、道家、归隐、贬谪、情感、黄州、君臣。完整词表同样在 concept_vocabulary.py。
主题词用于第 2 章的概念分布散度分析与本章 ITS 的双重验证:同一个 1079 事件如果在人格维度上没显著效应、但在贬谪或黄州主题词频上显著,那说明效应是话题层面而非人格层面的,这条区分对解读结果至关重要。
ITS 模型设定
对每一个维度 / 主题 ,拟合下面的线性模型:
其中 是日历年, 当 否则 , 是level shift(事件前后的立即跳跃), 是slope change(事件前后的斜率变化)。1079 年本身作为过渡年从样本中剔除,因为该年 50% 时间在湖州、50% 时间在狱中,数据混杂。
模型估计用 OLS,-统计量按标准方法计算,不做异方差稳健修正——因单被试时间序列的样本独立性假设本身已经受质疑,任何标准误修正都不能根本解决问题。详见第 6 章的方法学讨论。
图 1·1 1079 乌台诗案 ITS 模型示意。pre-period(1056–1078)实测点拟合趋势线,外推到 post-period 作为反事实;post-period(1080–1101)实测点拟合另一条趋势线;两条线在 1079 处的垂直差 就是 level shift 估计值。完整 TikZ 概念图详见 PDF 全文。
8 维人格维度的 ITS 结果
把 ITS 模型应用到 8 个人格维度,每个维度都拟合一次,结果见下表。
表 1·3 8 维人格维度在 1079 前后的 ITS 估计
| 维度 | n 年 | pre 均 | post 均 | 跳跃 | 显著性 | |
|---|---|---|---|---|---|---|
| D1 政治姿态 | 37 | 1.07 | 0.02 | −1.27 | −0.74 | |
| D2 自我修正 | 37 | 1.63 | 3.48 | +3.71 | +1.82 | * |
| D3 实践导向 | 37 | 0.25 | 0.40 | +1.15 | +1.35 | |
| D4 处变能力 | 37 | 0.09 | 0.96 | +1.94 | +1.15 | |
| D5 决断力 | 37 | 8.34 | 5.55 | −4.70 | −1.48 | |
| D6 情感深度 | 37 | 13.68 | 10.76 | +1.44 | +0.21 | |
| D7 隐逸倾向 | 37 | 9.41 | 6.83 | −2.77 | −0.44 | |
| D8 三教融合 | 37 | 4.01 | 9.14 | +0.89 | +0.25 |
★ 表示 大于 1.7(近似双侧 )。
8 维中只有 D2 自我修正达到 的边缘显著性,其余 7 维 值都未超过 1.7。最强信号是 D2:1079 之前 "悔 / 愧 / 误 / 过 / 罪 / 自省" 等自我修正词每千字 1.63,1080 之后跳到 3.48,level shift 估计 +3.71, 值 +1.82。
D5 决断力下降(pre 8.34 → post 5.55,,),这条非显著但方向合理——黄州被禁止签书公事,决断力相关词(速行 / 毋得 / 须 / 决)的密度本就该下降。
D7 隐逸倾向意外不显著(pre 9.41 → post 6.83,,),这条与传统叙事 "黄州让苏轼归隐" 相反。详细诊断会发现:隐逸词(归田 / 闲 / 老 / 病)的高频出现并非集中在黄州期(1080–1084),而是分散在苏轼整个晚年,特别是 1094 惠州后才显著上升。单独把 1079 当 treatment 看不到这条 long-term 效应,第 3 章断点检测会重新定位。
9 主题概念的 ITS 结果
把同样的 ITS 应用到 9 个概念主题上,结果见下表。
表 1·4 9 主题概念在 1079 前后的 ITS 估计
| 主题 | n 年 | pre 均 | post 均 | 跳跃 | 显著性 | |
|---|---|---|---|---|---|---|
| 政治新法 | 37 | 0.08 | 0.00 | −0.19 | −1.36 | |
| 儒家纲领 | 37 | 0.85 | 2.35 | +1.80 | +0.78 | |
| 佛家 | 37 | 0.56 | 3.81 | +1.66 | +0.68 | |
| 道家 | 37 | 1.43 | 2.30 | −0.45 | −0.26 | |
| 归隐 | 37 | 8.03 | 8.55 | +2.65 | +0.51 | |
| 贬谪 | 37 | 0.50 | 1.93 | +1.96 | +1.84 | ★ |
| 情感 | 37 | 3.41 | 2.57 | +0.06 | +0.02 | |
| 黄州 | 37 | 0.00 | 1.79 | +4.15 | +3.10 | ★★★ |
| 君臣 | 37 | 7.70 | 5.20 | −2.48 | −0.46 |
★★★ 表示 大于 3.0(近似双侧 )。
9 主题中黄州与贬谪两个主题达到统计显著性,是本章最稳健的两个结果。
黄州主题词频 level shift 为 +4.15, 值 +3.10,在 0.01 水平上拒绝 "无 level shift" 的零假设。pre-period 苏轼写作中几乎不提 "黄州 / 东坡 / 雪堂 / 赤壁 / 临皋" 这些地标(1079 之前每千字 0.00);1080 之后这五个词的合计频率跳到每千字 1.79。这是一个 sanity check——苏轼 1080 之前没去过黄州,自然不会提。ITS 在这个主题上通过了 sanity check,说明模型在 detect 真实变化时是工作的。
贬谪主题词频 level shift +1.96, 值 +1.84,在 0.10 水平上拒绝零假设。pre-period 苏轼几乎不写 "谪 / 贬 / 瘴 / 迁 / 流 / 海南"(每千字 0.50),1080 后跳到 1.93,近 4 倍。这一结果在统计上虽未达 0.01 严格显著,但方向与幅度都符合预期:1079 后苏轼成为被贬者,贬谪相关概念自然进入他的话语体系。
读者看到黄州词频 level shift 这个最强结果,容易跳进一个陷阱:"看,数据证明 1079 乌台诗案触发了苏轼的黄州转向!"
但这条解读是错的,或者至少是粗糙的。1080 后苏轼写 "黄州" 是因为他身在黄州,不是因为他在那里完成了思想转向。这条 level shift 在因果意义上是tautological的:事件直接决定了主语的位置,主语位置决定了地名出现频率。"位置变化 → 地名变化" 是直接物理推论,不是人格变化。
这个雷区与阳明项目里 "1506 之后阳明开始提『龙场』" 是同构问题。阳明数据的处理方法是把 "龙场 / 贵州 / 武夷" 等地名词从 D7 隐逸维度中剔除,单独作为 sanity check 主题。苏轼项目应采取同样做法:黄州主题的强信号只作为 ITS 是否在工作的 sanity check,不作为 "黄州转向" 的因果证据。
诊断方法:任何 ITS 主题,如果它的强信号能用 "事件改变了主语的物理位置 / 时间 / 身份" 直接解释,该信号就不能用来 claim 人格变化。
稳健替代:贬谪主题词频 level shift +1.96()才是更接近 "认知与情感层面变化" 的证据——它不依赖具体地名,而是反映苏轼是否在话语中以被贬者自居。真正的人格层面变化,是 D2 自我修正维度 +3.71(),这条不依赖物理位置或地名。
把信号集中到 D2 自我修正与"贬谪"主题
排除地名 sanity check 之后,1079 乌台诗案在数据上留下的最稳健效应集中在两条:
第一,自我修正维度 D2 上升:pre 每千字 1.63 → post 3.48,翻 2.1 倍,level shift +3.71,。悔 / 愧 / 误 / 过 / 罪 / 自省 / 改易这些词的密度显著增加,这是经典的post-trauma reflection信号——经历重大政治打击后,苏轼在文字中更频繁地反思自身言行。
第二,贬谪话语进入:pre 每千字 0.50 → post 1.93,翻 3.9 倍,level shift +1.96,。谪 / 贬 / 瘴 / 迁 / 流 / 海南这些词的密度显著增加,苏轼开始把自己作为被贬者写进语言。
两条信号的方向一致——乌台诗案让苏轼在话语层面经历了一次 self-reframing。他不再像 1071–1078 那样以在朝官员、写诗议政者自居,而是开始以被贬者、自责反思者自居。这一变化既符合传记的描述,也在 ITS 框架下得到 水平的定量支持。
简言之,1079 乌台诗案的最稳健效应是自我修正与贬谪话语的进入,而不是隐逸或三教转向。后两条在数据上需要更长的观察窗口与更精细的方法。
编年精度对结果的敏感性
ITS 用 225 篇 high+medium confidence 编年数据,而苏轼集总共 6,375 篇。这意味着 96.5% 的语料被排除在主分析之外,一个合理的质疑是:如果把 low confidence 也包含进来,结果会不会发生质变?
为了回答这个问题,应当做敏感性分析。本章的当前一版只跑了 high+medium 的主分析,low confidence 敏感性分析与人工校验留待后续 iteration。但有两点可以预先说明。
第一,low confidence 的编年误差主要是年份偏移 1–3 年,而不是完全错位。对 ITS 而言,这类小偏移会让 pre-period 与 post-period 的边界变模糊,但不会让 1079 前后的真实差异完全消失——除非偏移系统性地落在 1079 这条边界上,概率较低。
第二,主分析的两个显著效应(D2 自我修正、贬谪主题)都是方向稳健:即使加入 low confidence 让 值漂移,level shift 的符号不会变。真正不稳定的是边缘显著的方向。
本章知识地图
表 1·5 第 1 章核心概念与常见误解
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| ITS 因变量 | 每千字关键词频率 | 以为可以直接用问卷量表 | 苏轼已死 900 年,文本计量替代 |
| pre-trend 外推 | 用 1056–1078 数据外推 1080 后的反事实 | 以为外推总是对的 | pre 趋势若被未观测因素污染,外推会偏 |
| level shift | 事件前后立即跳跃 | 以为它就是因果效应 | 跳跃可能由共时性变化引起,不一定因果 |
| 地名 sanity check | "黄州" 验证 ITS 在工作 | 以为它就是黄州转向的证据 | 位置变化导致地名变化是 tautology,不是人格变化 |
| D2 自我修正 | 悔 / 愧 / 误 / 过 / 罪 / 自省 词频 | 以为这维度反映道德感 | 反映的是 self-reframing 而非道德判断 |
| 贬谪主题 | 谪 / 贬 / 瘴 / 迁 / 流 / 海南 词频 | 以为这维度反映抑郁 | 反映的是 self-positioning,不是情感 |
| 225 篇主分析 | high+medium confidence 编年 | 以为应该用全部 6375 篇 | 编年错误会稀释真实信号 |