近年来,深度神经网络在复杂任务上取得传统算法难以企及的效果,深度神经网络已经被广泛应用于社会和工业生产等各大领域。然而深度神经网络的“黑箱”特性同样引起了学术界和工业界的研究兴趣。本文提出的神经网络可解释算法以特征的冗余和解耦、与权重相关的信息流两个角度为切入点,借助类激活映射和层级相关性传播为研究方法,对神经网络的可解释性研究进行探讨。
首先,本文以图卷积神经网络为研究对象,针对现有的类激活图算法没有考虑到非目标区域也包含与目标相关的激活,生成的显著性图包含了来自不相关区域的噪声的问题,提出了一种新的基于互信息的类激活图生成算法——双极信息类激活图BI-CAM,旨在生成更关注目标区域的显著性图。首先,将图卷积神经网络推广到包含卷积神经网络的统一描述理论框架;接着,使用基于双流信息的框架来生成类激活图;然后,对特征图区域的权重进行优化;最后,对不同特征图在信息论层面的相对权重进行优化。实验结果表明,与其他可解释算法相比,所提出的BI-CAM从可视化和定量分析的角度在忠实度评估方面取得了显著更好的性能。
然后,本文从单一数据中特征的流形空间距离出发,通过对比特征的类间距离,提出了两种类激活图生成算法,分别为对比-排序类激活图(CR-CAM)算法和扩展对比-排序类激活图(CR-CAM++)算法。首先,针对非目标区域包含目标区域的相似特征这一特点,基于流形空间的概念,提出了类间映射对比的概念,根据分类的排序来评估特征图对于目标类别的权重,并基于此提出了CR-CAM算法。CR-CAM++是对CR-CAM的扩展。在CR-CAM的基础上,针对特征图区域的重叠问题,从特征图在流形空间中的距离的角度,考虑特征图间的相似性,提出了CR-CAM++算法。在拓扑图和图像上的实验结果表明,与其他可解释算法相比,所提出的CR-CAM算法和CR-CAM++算法从定性的可视化分析和定量的统计分析的角度取得了更好的性能和更忠实于模型的可信度。
最后,针对现有的层级相关性传播算法对于基准的定制与权重无关的问题,本文从消息传递的角度切入,提出了一种新的层级相关性传播算法,提供对神经网络的实例级解释。首先,提出一种具有与权重相关的基准的层级相关性传播算法,名为基于权重相关基准的层级相关性传播算法(WB-LRP),并据此提出模长不变性规则m-rlue。接着,在仅关注权重的正向激活的情况下,模长不变性规则m-rlue延伸出正向权重模长不变性规则8)+-rlue。最后,将提出的WB-LRP的理论扩展到不同的基准设置,由此构建一个囊括当下几乎所有的LRP算法和少部分由梯度反向传播的算法的框架。基于相关性的解释取决于模型权重和样本特征两个因素,本章的实验结果表明,提出的WB-LRP算法可以通过设计不同的基准,从而可以调整可视化结果中,来自模型权重和来自样本特征的比例,进而分别可视化样本特征对于目标类别的相关性和模型权重对于目标类别的相关性。 摘要译文