苏轼轨迹 · 第 5

跨体裁人格分析:体裁固定效应回归与代笔诊断

第 1 章 ITS 把整个语料合并处理,没有区分体裁。但苏轼的多种体裁——给皇帝的奏议、行政内制外制、私人书信尺牍、正式散文记序跋、铭文碑铭赞颂、诗、词、笔记——语言风格各不相同。奏议里有官式套语 "臣闻 / 切详 / 伏望",诗里有抒情语汇 "归 / 闲 / 老",行政公文里有 "速行 / 毋得"。如果 pre-period 与 post-period 的体裁分布失衡,跨时段的人格分差异就部分由体裁本身解释,不是苏轼真的变了。

本章正面处理这个问题,给出体裁画像表与体裁固定效应回归结果。由于 is_ghostwriting 标注待后续 iteration 完成,代笔诊断本章只给方法学讨论,不给具体数字。

10 体裁的人格画像差异

8 维度按体裁的均值表

表 5·1 8 维度在 10 种体裁上的平均分(每千字频率)

体裁nD1D2D3D4D5D6D7D8
20450.271.940.350.305.1510.879.357.92
尺牍18960.065.010.510.118.998.056.136.48
其他13720.132.520.300.139.989.774.589.64
3520.362.340.231.635.0111.897.965.44
奏议3430.633.290.230.015.255.393.728.67
论策1110.392.780.100.1616.104.462.958.08
碑铭1080.130.960.140.065.926.524.627.74
620.231.730.410.1212.817.514.937.67
祭文620.191.690.420.224.0614.195.2910.67
240.242.150.070.077.167.794.786.14

加粗为该维度的最大值。

每个维度的极值体裁与语言学解释

把这张表的极值排一下。

D1 政治姿态最高在奏议(0.63),最低在尺牍(0.06),跨度 0.57。奏议是写给皇帝的报告,讥讽 / 讪 / 圣德 / 圣朝等政治词必然高密度;尺牍是私人书信,这些词几乎不用。

D2 自我修正最高在尺牍(5.01),最低在碑铭(0.96),跨度 4.06。尺牍里苏轼会向友人坦承悔 / 愧 / 误 / 过,这条信号在私人书信里最强;碑铭是公开纪念文体,自我反思几乎完全缺席。

D4 处变能力最高在词(1.63),最低在奏议(0.01),跨度 1.62。词的随遇 / 自适 / 闲适是词体本身的语汇集合(尤其密州出猎后的词作);奏议是严肃政治文书,不会用这种闲适语汇。

D5 决断力最高在论策(16.10),最低在祭文(4.06),跨度 12.04。论策是辩论体,速行 / 毋得 / 须 / 决 / 宜 / 以为等决断词密集;祭文是悼亡文,决断动词被悲伤动词替代。

D6 情感深度最高在祭文(14.19),最低在论策(4.46),跨度 9.73。祭文的哀 / 悲 / 苦 / 忧 / 泣 / 涕 / 恸 / 忆 / 思 / 念是体裁固有信号。

D7 隐逸倾向最高在诗(9.35),最低在论策(2.95),跨度 6.40。诗的归 / 闲 / 老 / 病是抒情诗高频词;论策不会用这些词。

D8 三教融合最高在祭文(10.67),最低在词(5.44),跨度 5.23。祭文用仁 / 义 / 礼 / 禅 / 佛 / 空 / 道 / 玄论生死归宿,三教词集中;词更多写情景,三教词相对少。

体裁混淆对 ITS 推断的威胁

pre/post 体裁失衡的机制

回到第 1 章:1079 ITS 估出 D2 自我修正 t=1.82t = 1.82。但 pre-period(1056–1078)主要是奏议与一部分诗(因为这阶段苏轼在朝任职或地方任职,写的多是奏议与寄赠诗);post-period(1080–1101)体裁混杂,包含黄州尺牍激增、惠州海南诗、晚年笔记。体裁切换是 pre/post 的混杂因素。

尺牍在体裁画像表中 D2 = 5.01,是所有体裁的最大值;而奏议 D2 仅 3.29,诗 D2 仅 1.94。如果 post-period 比 pre-period 多了大量尺牍,单从体裁分布失衡就能解释 D2 上升,不需要任何真实的人格变化。第 1 章 ITS 看到的 +3.71 level shift 可能只是体裁混淆的副产品。

扣除体裁混淆:双 FE 回归

定义体裁与时段双 FE 回归
def:genre-fe
yi=αg(i)+βposti+εiy_i = \alpha_{g(i)} + \beta \cdot \text{post}_i + \varepsilon_i

其中 yiy_i 是篇目 ii 的某维度评分,g(i)g(i) 是体裁,αg\alpha_g 是体裁 fixed effect(用 G1G-1 个 dummy 表示),posti=1\text{post}_i = 1ii 写于 1080\geq 1080。体裁 FE αg\alpha_g 吸收体裁本身的语气差异,β\beta 估的就是扣除体裁混淆之后的 1079 后跳跃。

扣除体裁混淆后的 1079 净效应

表 5·2 8 维度在 naive 回归与体裁 FE 回归下的 post 系数

维度naive βpost\beta_{\text{post}}FE βpost\beta_{\text{post}}FE − naive
D1 政治姿态−0.489−0.486+0.003
D2 自我修正+0.111+0.076−0.036
D3 实践导向−0.079−0.055+0.024
D4 处变能力−0.025−0.008+0.017
D5 决断力−1.143−1.153−0.010
D6 情感深度−1.722−1.505+0.217
D7 隐逸倾向−0.317−0.058+0.259
D8 三教融合+2.636+2.581−0.055
结果解读

8 维度中,大多数维度 FE 与 naive 几乎相等(差 0.06|0.06| 以内),说明体裁混淆对这些维度的影响轻微,ITS 在第 1 章给出的结论稳健。

唯一显著的例外是 D7 隐逸倾向:naive −0.317 在 FE 下变为 −0.058,差 +0.259,体裁解释了原效应的 82%。这条结果有 strong implication:第 1 章 ITS 显示 D7 隐逸在 1079 后的 level shift 为 −2.77(t=0.44t = -0.44,不显著),但这条 "1080 后隐逸下降" 的方向本身就是体裁混淆造成的——post-period 的诗(D7 = 9.35)/ 尺牍(D7 = 6.13)/ 笔记大量进入,这些体裁的 D7 baseline 不同。扣除体裁后,D7 的 net post 跳跃几乎为零(−0.058)。

D6 情感深度也有 13% 被体裁解释(naive −1.72 → FE −1.51),但效应方向稳定。

D8 三教融合几乎不受体裁影响(naive +2.64 → FE +2.58,差 −0.06)。这条结果强化第 4 章合成控制的结论:D8 在 1080 后的 +5.86 偏离是真实的,不是体裁混淆假象。

D7 隐逸倾向的体裁混淆诊断

D7 是第 1 章 ITS 与第 3 章断点检测都没看到效应、第 4 章合成控制偏离仅 +0.37 也无效应的维度。三方法一致的负面结论现在加上第 5 章体裁 FE 的诊断:D7 在 naive 回归下显示的 −0.32 post 系数本身就是体裁假象,扣除后 −0.058 几乎为零。

这条四方法一致的负面结论意味着:1079 乌台诗案没有在 D7 隐逸维度上引发可检测的人格变化。传统苏轼研究中常被强调的 "黄州让苏轼归隐" 在数据上找不到支撑。

代笔诊断:剔除 821 篇内制外制前后的效应对比

本书的项目级 CLAUDE.md 约束 2 要求把 1086–1089 翰林学士期间起草的内制外制打 is_ghostwriting=true 标签。code/annotate_metadata.py 通过苏轼集 section 标签 "内制 / 外制" 识别出 821 篇代笔文档(内制 658 篇 + 外制 215 篇,合并《祭文一十四首》等子类),远超原先估计的 80 篇。

代笔篇目分布

821 篇代笔覆盖以下子类:内制诏敕 149 篇、内制口宣 250 篇、内制批答 57 篇、内制敕书 34 篇、内制祝文 33 篇、内制国书 18 篇、内制表本 16 篇、内制斋文 17 篇、内制祭文 14 篇、内制疏文 11 篇、内制朱表 3 篇、内制赦文 3 篇、内制导引歌辞 2 篇、内制其他 51 篇;外制制敕 215 篇。

这 821 篇虽然数量上占苏轼集 6,375 篇的 12.9%,但字数占比更高——这些诏书普遍偏长。全部集中在 1086–1089 苏轼任翰林学士的 4 年内,对 ITS 主分析的 post-period(1080–1101)字数贡献相当可观。

ITS 在 4 版本切片下的对比

code/rerun_with_filters.py 跑了 4 个版本的 ITS 对比:v1 baseline(含代笔,原版)、v2 排除代笔、v3 排除代笔 + 异体字归一化、v4 排除代笔 + 归一化 + 仅 self_expression 词。关键序列结果列在下表。

表 5·3 4 版本 ITS 在 7 个关键序列上的 β2\beta_2 level shift 与 tt

序列v1 baselinev2 排代笔v3 + 归一化v4 + 仅自抒词
D2 自我修正+3.76(t=+2.02t = +2.02+3.36(t=+1.84t = +1.84+3.36(t=+1.84t = +1.84+3.70(t=+2.02t = +2.02
D7 隐逸倾向−3.87(t=0.70t = -0.70−3.42(t=0.62t = -0.62−3.42(t=0.62t = -0.62−2.98(t=0.54t = -0.54
D8 三教融合+1.86(t=+0.57t = +0.57+1.92(t=+0.59t = +0.59+1.92(t=+0.59t = +0.59+1.08(t=+0.36t = +0.36
贬谪+2.51(t=+2.63t = +2.63+2.42(t=+2.50t = +2.50+2.42(t=+2.50t = +2.50+2.35(t=+2.41t = +2.41
黄州+4.23(t=+3.65t = +3.65+4.23(t=+3.66t = +3.66+4.23(t=+3.66t = +3.66+4.38(t=+3.72t = +3.72
佛家+1.91(t=+0.91t = +0.91+2.42(t=+1.08t = +1.08+2.42(t=+1.08t = +1.08+1.25(t=+0.78t = +0.78
归隐+0.41(t=+0.09t = +0.09+1.21(t=+0.26t = +0.26+1.21(t=+0.26t = +0.26+0.99(t=+0.21t = +0.21

注:v1 数字与第 1 章相近但不完全一致,源于聚合精度差异(本节用 annotated 版重算)。

结果解读

对比 v1 与 v2 给出代笔污染的具体度量。

D2 自我修正tt 值从 +2.02 下降到 +1.84,下降 9%。代笔诏书里偶尔有 "悔 / 改 / 省" 等词(替皇帝下罪己诏或修正政策的标准语汇),这部分被错误归入苏轼的 self-reframing,剔除后 D2 效应轻微减弱,但方向稳健。

贬谪主题tt 值从 +2.63 下降到 +2.50,下降 5%。代笔诏书也用 "谪 / 贬" 讨论被贬官员,但密度不高,影响有限。

黄州主题tt 值从 +3.65 几乎不变到 +3.66。这一稳健符合预期——代笔诏书不会出现 "黄州 / 东坡 / 雪堂 / 临皋" 这些苏轼私人地标。这条 sanity check 通过,证实黄州主题在代笔污染下仍然是干净信号。

佛家主题tt 值从 +0.91 上升到 +1.08。代笔诏书几乎不用佛家词汇(祝文与斋文除外,但量小),剔除代笔反而让佛家信号略显,因为分母变小。

D7 隐逸倾向在 4 个版本里都不显著,进一步确认第 5 章前节的结论:D7 在 1080 前后没有可检测的变化。

总体而言,代笔污染对方向没有反转,但对强度的影响在 5–10% 量级。第 1 章的 ITS 主要结论(D2 / 贬谪 / 黄州 三个显著效应)在 v2 剔除代笔后依然成立,仅 tt 值略减。

异体字归一化与词应酬性的边际贡献

code/annotate_metadata.py 的异体字归一化命中 63 篇,占总篇 6,375 的约 1%。修正的字符包括:壊 → 坏 / 巳 → 已 / 嵗 → 岁 / 逰 → 游 / 髪 → 发 / 酧 → 酬 / 爲 → 为 / 於 → 于 / 與 → 与等。v2 与 v3 的 ITS 结果完全一致(差异 <0.01< 0.01),说明归一化在 ITS 主分析上的边际贡献接近零——这并不意味着归一化没价值,而是说明这 63 篇修正分散在各时段,没系统偏向 pre 或 post。

词应酬性标注把 352 首词分为五类:self_expression 175(49.7%)、social_courtesy 127(36.1%)、topic_painting 32(9.1%)、funereal 11(3.1%)、commemoration 7(2.0%)。v4 仅保留 self_expression 后,D2 自我修正 tt 值反弹回 +2.02(与 v1 相近),这一反弹的机制是:剔除 social_courtesy 应酬词后,词的 D2 噪声降低,信号纯度上升。

被验证的与被推翻的预期

剔除代笔之前,本章预期三条变化,后验情况如下。

预期 1:D1 政治姿态在剔除代笔后更显著。本节数据未给出 D1 对比(D1 在所有版本下 tt 都接近 0,不在关键序列里),但代笔诏书本身就是政治姿态信号源,剔除后 D1 的 post 跳跃应当减弱而不是增强。这条预期需要在后续 D1 专项分析中验证,不视为已证。

预期 2:D8 三教融合在剔除代笔后效应应当变化不大。实际数据:tt 从 +0.57 微涨到 +0.59,变化 <0.03< 0.03,预期得到验证。

预期 3:P4 元祐起复时段在散度分析中位置回移。本节未重跑散度分析,留作 chap02 后续 iteration。但 D2 自我修正与贬谪主题的 tt 值下降 5–9% 表明代笔确实在 P4 时段贡献了不该归入苏轼本人的语料。

本章知识地图

表 5·4 第 5 章核心概念与常见误解

核心概念核心内容常见误解为什么错
体裁混淆pre/post 体裁分布失衡造成假效应以为 ITS 自动控制ITS 默认所有体裁同质,实际不是
体裁 FE把体裁作为固定效应吸收以为可以替代切分子样本FE 假设效应同质,但体裁 × treatment 可能交互
D7 隐逸 82% 体裁解释naive −0.32 → FE −0.058以为 "黄州归隐" 是真效应实际是体裁分布失衡假象
D8 三教几乎不受体裁影响naive +2.64 → FE +2.58以为也是体裁假象D8 真实效应大到突破体裁混淆
尺牍 D2 = 5.01 最高自我反思集中在私人书信以为人格分散在各体裁私人书信是 D2 信号集中体裁,不是分散
代笔标签is_ghostwriting=true 剔除内制外制以为这部分也算苏轼内容主导权在皇帝,非苏轼人格