第 1 章 ITS 把整个语料合并处理,没有区分体裁。但苏轼的多种体裁——给皇帝的奏议、行政内制外制、私人书信尺牍、正式散文记序跋、铭文碑铭赞颂、诗、词、笔记——语言风格各不相同。奏议里有官式套语 "臣闻 / 切详 / 伏望",诗里有抒情语汇 "归 / 闲 / 老",行政公文里有 "速行 / 毋得"。如果 pre-period 与 post-period 的体裁分布失衡,跨时段的人格分差异就部分由体裁本身解释,不是苏轼真的变了。
本章正面处理这个问题,给出体裁画像表与体裁固定效应回归结果。由于 is_ghostwriting 标注待后续 iteration 完成,代笔诊断本章只给方法学讨论,不给具体数字。
10 体裁的人格画像差异
8 维度按体裁的均值表
表 5·1 8 维度在 10 种体裁上的平均分(每千字频率)
| 体裁 | n | D1 | D2 | D3 | D4 | D5 | D6 | D7 | D8 |
|---|---|---|---|---|---|---|---|---|---|
| 诗 | 2045 | 0.27 | 1.94 | 0.35 | 0.30 | 5.15 | 10.87 | 9.35 | 7.92 |
| 尺牍 | 1896 | 0.06 | 5.01 | 0.51 | 0.11 | 8.99 | 8.05 | 6.13 | 6.48 |
| 其他 | 1372 | 0.13 | 2.52 | 0.30 | 0.13 | 9.98 | 9.77 | 4.58 | 9.64 |
| 词 | 352 | 0.36 | 2.34 | 0.23 | 1.63 | 5.01 | 11.89 | 7.96 | 5.44 |
| 奏议 | 343 | 0.63 | 3.29 | 0.23 | 0.01 | 5.25 | 5.39 | 3.72 | 8.67 |
| 论策 | 111 | 0.39 | 2.78 | 0.10 | 0.16 | 16.10 | 4.46 | 2.95 | 8.08 |
| 碑铭 | 108 | 0.13 | 0.96 | 0.14 | 0.06 | 5.92 | 6.52 | 4.62 | 7.74 |
| 记 | 62 | 0.23 | 1.73 | 0.41 | 0.12 | 12.81 | 7.51 | 4.93 | 7.67 |
| 祭文 | 62 | 0.19 | 1.69 | 0.42 | 0.22 | 4.06 | 14.19 | 5.29 | 10.67 |
| 赋 | 24 | 0.24 | 2.15 | 0.07 | 0.07 | 7.16 | 7.79 | 4.78 | 6.14 |
加粗为该维度的最大值。
每个维度的极值体裁与语言学解释
把这张表的极值排一下。
D1 政治姿态最高在奏议(0.63),最低在尺牍(0.06),跨度 0.57。奏议是写给皇帝的报告,讥讽 / 讪 / 圣德 / 圣朝等政治词必然高密度;尺牍是私人书信,这些词几乎不用。
D2 自我修正最高在尺牍(5.01),最低在碑铭(0.96),跨度 4.06。尺牍里苏轼会向友人坦承悔 / 愧 / 误 / 过,这条信号在私人书信里最强;碑铭是公开纪念文体,自我反思几乎完全缺席。
D4 处变能力最高在词(1.63),最低在奏议(0.01),跨度 1.62。词的随遇 / 自适 / 闲适是词体本身的语汇集合(尤其密州出猎后的词作);奏议是严肃政治文书,不会用这种闲适语汇。
D5 决断力最高在论策(16.10),最低在祭文(4.06),跨度 12.04。论策是辩论体,速行 / 毋得 / 须 / 决 / 宜 / 以为等决断词密集;祭文是悼亡文,决断动词被悲伤动词替代。
D6 情感深度最高在祭文(14.19),最低在论策(4.46),跨度 9.73。祭文的哀 / 悲 / 苦 / 忧 / 泣 / 涕 / 恸 / 忆 / 思 / 念是体裁固有信号。
D7 隐逸倾向最高在诗(9.35),最低在论策(2.95),跨度 6.40。诗的归 / 闲 / 老 / 病是抒情诗高频词;论策不会用这些词。
D8 三教融合最高在祭文(10.67),最低在词(5.44),跨度 5.23。祭文用仁 / 义 / 礼 / 禅 / 佛 / 空 / 道 / 玄论生死归宿,三教词集中;词更多写情景,三教词相对少。
体裁混淆对 ITS 推断的威胁
pre/post 体裁失衡的机制
回到第 1 章:1079 ITS 估出 D2 自我修正 。但 pre-period(1056–1078)主要是奏议与一部分诗(因为这阶段苏轼在朝任职或地方任职,写的多是奏议与寄赠诗);post-period(1080–1101)体裁混杂,包含黄州尺牍激增、惠州海南诗、晚年笔记。体裁切换是 pre/post 的混杂因素。
尺牍在体裁画像表中 D2 = 5.01,是所有体裁的最大值;而奏议 D2 仅 3.29,诗 D2 仅 1.94。如果 post-period 比 pre-period 多了大量尺牍,单从体裁分布失衡就能解释 D2 上升,不需要任何真实的人格变化。第 1 章 ITS 看到的 +3.71 level shift 可能只是体裁混淆的副产品。
扣除体裁混淆:双 FE 回归
其中 是篇目 的某维度评分, 是体裁, 是体裁 fixed effect(用 个 dummy 表示), 当 写于 。体裁 FE 吸收体裁本身的语气差异, 估的就是扣除体裁混淆之后的 1079 后跳跃。
扣除体裁混淆后的 1079 净效应
表 5·2 8 维度在 naive 回归与体裁 FE 回归下的 post 系数
| 维度 | naive | FE | FE − naive |
|---|---|---|---|
| D1 政治姿态 | −0.489 | −0.486 | +0.003 |
| D2 自我修正 | +0.111 | +0.076 | −0.036 |
| D3 实践导向 | −0.079 | −0.055 | +0.024 |
| D4 处变能力 | −0.025 | −0.008 | +0.017 |
| D5 决断力 | −1.143 | −1.153 | −0.010 |
| D6 情感深度 | −1.722 | −1.505 | +0.217 |
| D7 隐逸倾向 | −0.317 | −0.058 | +0.259 |
| D8 三教融合 | +2.636 | +2.581 | −0.055 |
8 维度中,大多数维度 FE 与 naive 几乎相等(差 以内),说明体裁混淆对这些维度的影响轻微,ITS 在第 1 章给出的结论稳健。
唯一显著的例外是 D7 隐逸倾向:naive −0.317 在 FE 下变为 −0.058,差 +0.259,体裁解释了原效应的 82%。这条结果有 strong implication:第 1 章 ITS 显示 D7 隐逸在 1079 后的 level shift 为 −2.77(,不显著),但这条 "1080 后隐逸下降" 的方向本身就是体裁混淆造成的——post-period 的诗(D7 = 9.35)/ 尺牍(D7 = 6.13)/ 笔记大量进入,这些体裁的 D7 baseline 不同。扣除体裁后,D7 的 net post 跳跃几乎为零(−0.058)。
D6 情感深度也有 13% 被体裁解释(naive −1.72 → FE −1.51),但效应方向稳定。
D8 三教融合几乎不受体裁影响(naive +2.64 → FE +2.58,差 −0.06)。这条结果强化第 4 章合成控制的结论:D8 在 1080 后的 +5.86 偏离是真实的,不是体裁混淆假象。
D7 隐逸倾向的体裁混淆诊断
D7 是第 1 章 ITS 与第 3 章断点检测都没看到效应、第 4 章合成控制偏离仅 +0.37 也无效应的维度。三方法一致的负面结论现在加上第 5 章体裁 FE 的诊断:D7 在 naive 回归下显示的 −0.32 post 系数本身就是体裁假象,扣除后 −0.058 几乎为零。
这条四方法一致的负面结论意味着:1079 乌台诗案没有在 D7 隐逸维度上引发可检测的人格变化。传统苏轼研究中常被强调的 "黄州让苏轼归隐" 在数据上找不到支撑。
代笔诊断:剔除 821 篇内制外制前后的效应对比
本书的项目级 CLAUDE.md 约束 2 要求把 1086–1089 翰林学士期间起草的内制外制打 is_ghostwriting=true 标签。code/annotate_metadata.py 通过苏轼集 section 标签 "内制 / 外制" 识别出 821 篇代笔文档(内制 658 篇 + 外制 215 篇,合并《祭文一十四首》等子类),远超原先估计的 80 篇。
代笔篇目分布
821 篇代笔覆盖以下子类:内制诏敕 149 篇、内制口宣 250 篇、内制批答 57 篇、内制敕书 34 篇、内制祝文 33 篇、内制国书 18 篇、内制表本 16 篇、内制斋文 17 篇、内制祭文 14 篇、内制疏文 11 篇、内制朱表 3 篇、内制赦文 3 篇、内制导引歌辞 2 篇、内制其他 51 篇;外制制敕 215 篇。
这 821 篇虽然数量上占苏轼集 6,375 篇的 12.9%,但字数占比更高——这些诏书普遍偏长。全部集中在 1086–1089 苏轼任翰林学士的 4 年内,对 ITS 主分析的 post-period(1080–1101)字数贡献相当可观。
ITS 在 4 版本切片下的对比
code/rerun_with_filters.py 跑了 4 个版本的 ITS 对比:v1 baseline(含代笔,原版)、v2 排除代笔、v3 排除代笔 + 异体字归一化、v4 排除代笔 + 归一化 + 仅 self_expression 词。关键序列结果列在下表。
表 5·3 4 版本 ITS 在 7 个关键序列上的 level shift 与 值
| 序列 | v1 baseline | v2 排代笔 | v3 + 归一化 | v4 + 仅自抒词 |
|---|---|---|---|---|
| D2 自我修正 | +3.76() | +3.36() | +3.36() | +3.70() |
| D7 隐逸倾向 | −3.87() | −3.42() | −3.42() | −2.98() |
| D8 三教融合 | +1.86() | +1.92() | +1.92() | +1.08() |
| 贬谪 | +2.51() | +2.42() | +2.42() | +2.35() |
| 黄州 | +4.23() | +4.23() | +4.23() | +4.38() |
| 佛家 | +1.91() | +2.42() | +2.42() | +1.25() |
| 归隐 | +0.41() | +1.21() | +1.21() | +0.99() |
注:v1 数字与第 1 章相近但不完全一致,源于聚合精度差异(本节用 annotated 版重算)。
对比 v1 与 v2 给出代笔污染的具体度量。
D2 自我修正: 值从 +2.02 下降到 +1.84,下降 9%。代笔诏书里偶尔有 "悔 / 改 / 省" 等词(替皇帝下罪己诏或修正政策的标准语汇),这部分被错误归入苏轼的 self-reframing,剔除后 D2 效应轻微减弱,但方向稳健。
贬谪主题: 值从 +2.63 下降到 +2.50,下降 5%。代笔诏书也用 "谪 / 贬" 讨论被贬官员,但密度不高,影响有限。
黄州主题: 值从 +3.65 几乎不变到 +3.66。这一稳健符合预期——代笔诏书不会出现 "黄州 / 东坡 / 雪堂 / 临皋" 这些苏轼私人地标。这条 sanity check 通过,证实黄州主题在代笔污染下仍然是干净信号。
佛家主题: 值从 +0.91 上升到 +1.08。代笔诏书几乎不用佛家词汇(祝文与斋文除外,但量小),剔除代笔反而让佛家信号略显,因为分母变小。
D7 隐逸倾向在 4 个版本里都不显著,进一步确认第 5 章前节的结论:D7 在 1080 前后没有可检测的变化。
总体而言,代笔污染对方向没有反转,但对强度的影响在 5–10% 量级。第 1 章的 ITS 主要结论(D2 / 贬谪 / 黄州 三个显著效应)在 v2 剔除代笔后依然成立,仅 值略减。
异体字归一化与词应酬性的边际贡献
code/annotate_metadata.py 的异体字归一化命中 63 篇,占总篇 6,375 的约 1%。修正的字符包括:壊 → 坏 / 巳 → 已 / 嵗 → 岁 / 逰 → 游 / 髪 → 发 / 酧 → 酬 / 爲 → 为 / 於 → 于 / 與 → 与等。v2 与 v3 的 ITS 结果完全一致(差异 ),说明归一化在 ITS 主分析上的边际贡献接近零——这并不意味着归一化没价值,而是说明这 63 篇修正分散在各时段,没系统偏向 pre 或 post。
词应酬性标注把 352 首词分为五类:self_expression 175(49.7%)、social_courtesy 127(36.1%)、topic_painting 32(9.1%)、funereal 11(3.1%)、commemoration 7(2.0%)。v4 仅保留 self_expression 后,D2 自我修正 值反弹回 +2.02(与 v1 相近),这一反弹的机制是:剔除 social_courtesy 应酬词后,词的 D2 噪声降低,信号纯度上升。
被验证的与被推翻的预期
剔除代笔之前,本章预期三条变化,后验情况如下。
预期 1:D1 政治姿态在剔除代笔后更显著。本节数据未给出 D1 对比(D1 在所有版本下 都接近 0,不在关键序列里),但代笔诏书本身就是政治姿态信号源,剔除后 D1 的 post 跳跃应当减弱而不是增强。这条预期需要在后续 D1 专项分析中验证,不视为已证。
预期 2:D8 三教融合在剔除代笔后效应应当变化不大。实际数据: 从 +0.57 微涨到 +0.59,变化 ,预期得到验证。
预期 3:P4 元祐起复时段在散度分析中位置回移。本节未重跑散度分析,留作 chap02 后续 iteration。但 D2 自我修正与贬谪主题的 值下降 5–9% 表明代笔确实在 P4 时段贡献了不该归入苏轼本人的语料。
本章知识地图
表 5·4 第 5 章核心概念与常见误解
| 核心概念 | 核心内容 | 常见误解 | 为什么错 |
|---|---|---|---|
| 体裁混淆 | pre/post 体裁分布失衡造成假效应 | 以为 ITS 自动控制 | ITS 默认所有体裁同质,实际不是 |
| 体裁 FE | 把体裁作为固定效应吸收 | 以为可以替代切分子样本 | FE 假设效应同质,但体裁 × treatment 可能交互 |
| D7 隐逸 82% 体裁解释 | naive −0.32 → FE −0.058 | 以为 "黄州归隐" 是真效应 | 实际是体裁分布失衡假象 |
| D8 三教几乎不受体裁影响 | naive +2.64 → FE +2.58 | 以为也是体裁假象 | D8 真实效应大到突破体裁混淆 |
| 尺牍 D2 = 5.01 最高 | 自我反思集中在私人书信 | 以为人格分散在各体裁 | 私人书信是 D2 信号集中体裁,不是分散 |
| 代笔标签 | is_ghostwriting=true 剔除内制外制 | 以为这部分也算苏轼 | 内容主导权在皇帝,非苏轼人格 |