定价中的可解释人工智能:将“黑箱”模型转化为值得信赖的决策
作者:Sunil Yoon,RNA Analytics首席精算顾问
1.导言
随着数据科学领域的持续快速发展,许多企业对利用机器学习或深度学习进行建模表现出日益浓厚的兴趣,并将这些技术应用于实际业务运营中。这些技术虽具有预测性能高的优势,但在许多情况下,却难以清晰地解释模型是如何得出结果的。此类模型通常被称为“黑箱模型”。
实际上,即使是精算师,也可能难以直观地解释复杂的模型结构和内部计算过程。因此,在对外应用基于人工智能的建模结果或将其纳入决策时,可能会存在一定局限性。
最近,为解决这些实际限制,应用XAI(可解释人工智能)的努力正在不断扩展。XAI是一种方法论,有助于用户更轻松地解读人工智能模型的结果,并理解模型在决策过程中所依据的变量和模式。本文将介绍XAI的主要方法论,并探讨如何将其应用于保险定价和建模实践中。
2. XAI的各种方法论
根据国际汽车协会(IAA)人工智能特别工作组于2025年11月发布的《人工智能治理框架》白皮书,可解释的人工智能(XAI)方法论大致可分为局部度量和全局度量两类。这两类方法论分别具有以下特征。
局部指标侧重于解释每个输入变量如何影响单个预测结果。代表性方法包括个体条件期望(ICE)、局部可解释模型无关解释(LIME)以及夏普利加性解释(SHAP)。这些方法能够展示每个变量对特定观测值或合同的最终预测结果所产生的影响的方向和程度。以下是一个SHAP结果的示例。
通过SHAP结果,我们可以确定每个变量对特定观测值的最终模型输出贡献了多少。例如,如果最终模型输出计算结果为-2.83,而输入变量BonusMalus的值为50,则可以解释为:与基准预测值相比,该变量导致最终输出降低了约0.15。 通过这种方式,我们可以确定每个输入变量对单个预测的影响方向和幅度,并更直观地理解模型针对特定合同或数据点做出决策背后的依据。
另一方面,全局指标并不关注单个预测,而是从整个模型的角度评估每个变量对预测结果的影响。代表性方法包括偏相关图、特征重要性稳定性和公平性指标。当使用多个变量构建模型时,全局指标有助于了解哪些变量在整个模型中具有相对更大的影响。 以下是R3S GIP生成的特征重要性结果的可视化示例。
这些结果是基于SHAP的特征重要性分析结果,展示了每个变量对模型输出的相对影响。如果将总重要性归一化为100,且变量NV2的值约为26,则可理解为NV2在模型生成预测的过程中具有相对较大的影响。 但需要注意的是,该数值并不代表对实际损失率或理赔金额的直接因果贡献,而仅是基于模型输出得出的相对重要性。
重要性较低的变量可作为审查候选变量剔除或模型简化的起点。不过,实际剔除哪些变量,应在通过重新训练检查模型的性能、稳定性和业务有效性后确定。通过这一过程,既可在检查模型预测性能的同时,又有助于审查构建一个更轻量且更易于解释的模型。
3. 注意事项与替代方案
通过使用可解释人工智能(XAI)技术,可以确保基于人工智能的模型具备一定程度的可解释性。然而,仅靠这些方法无法解释一切,且存在若干重要局限性。
例如,特征重要性可以显示某个变量对模型预测结果或输出的贡献程度。然而,这并不一定意味着该变量与实际结果之间存在直接的相关性或因果关系。此外,当变量之间存在相关性时,某个特定变量的重要性可能会被高估或低估。
同样,仅凭特征重要性无法清晰地解释当某个特定变量增加一个单位时,最终输出值会发生多大变化,也无法说明这一变化从实际业务角度来看意味着什么。因此,XAI结果应作为理解模型的参考资料,在将其视为完整的解释或因果证据时需谨慎对待。
弥补这些局限性的一种方法是考虑采用代理广义线性模型(Surrogate GLM Model)的方法。 代理广义线性模型(Surrogate GLM Model)是一种方法,它通过学习复杂人工智能模型(如神经网络或梯度提升模型)的预测结果,构建一个能够近似解释这些结果的广义线性模型。具体而言,机器学习模型首先针对待分析的数据集生成预测结果,随后将这些预测结果设为目标值,并拟合一个能产生最相似结果的广义线性模型。
GLM 的优势在于其结构相对直观,能够帮助用户识别待解释的预测值与输入变量之间的关系,以及每个变量的系数和影响方向。因此,使用替代 GLM 可以以更易于理解的方式,补充基于人工智能的定价结果的可解释性。
然而,代理广义线性模型(Surrogate GLM)并非直接解释原始机器学习模型本身的模型,而是一个能够近似再现现有模型预测结果的辅助模型。因此,将其用于辅助解释目的——以理解AI模型中变量影响的整体模式和方向——是合适的,而非将其作为实际定价模型的替代品。
4. 结论
自机器学习得到广泛应用以来,精算师们利用人工智能技术提升建模水平的努力一直在持续推进。近年来,随着包括大型语言模型(LLMs)在内的各类人工智能技术的发展,基于机器学习/深度学习的建模——这一曾被视为数据科学家专属领域的技术——正逐渐变得更易于掌握。因此,基于人工智能的建模在保险实务中的应用范围正在不断扩大。
精算师通过丰富的工作经验积累了深厚的专业知识。当这些专业知识与基于人工智能的建模技术相结合时,有望开发出更精密且更具实用价值的定价和建模框架。
可解释人工智能将精算师利用人工智能生成的建模结果以更易于理解的形式呈现出来,并有助于将其与传统的解释框架相结合。通过这种方式,它能够提高基于人工智能的建模结果的可靠性,并有助于这些结果更顺畅地体现在公司的实际决策过程中。
作为一家全球性的精算软件公司,RNA拥有多种相关产品线,并计划与客户携手继续开发相关功能和解决方案。