图源摄图网
摘要:以ChatGPT为代表的生成式人工智能技术被誉为第二次信息革命, 其强大的数据深入分析能力为企业智能化内部审计提供了新思路. 针对现有审计风险预警中传统机器学习泛化能力提升有限以及特征分析维度不足等问题, 提出一种基于ChatGPT技术内核的深度自编码网络方法, 来对往来款项这一重要会计活动中的风险做出事前判别. 首先, 根据影响因素从业务匹配、 期限结构、 减值损失、 关联交易、 单体统计和文本信息多个角度筛选提取审计特征; 随后, 考虑到风险样本的不平衡性以及业财指标在经营周期下的前后时变特性, 基于无监督和深度学习思想, 构建了以添加注意力机制双向长短期记忆 (Bi-LSTM) 作为神经网络的深度自编码器 (DAE) 预训练模型, 并借鉴多任务学习思想, 利用融合模型迁移的集成框架量化审计风险概率以保证预警的稳定性; 最后, 通过大数据技术采集企业往来业务和财务的真实数据对上述方法进行了多方面对比验证. 试验结果表明, 该方法有助于不同预警时间窗口下审计特征的高效精准挖掘, 相较常用的监督学习和迭代聚类法能显著提升审计风险预警的精度和鲁棒性, 同时能识别出导致风险产生的关键因素以快速定位审计疑点, 为企业改善内部审计的质量和效率提供智能化决策支持.
关键词:深度自编码器;内部审计风险预警;应收及应付账款;智能审计
一、研究背景与意义
随着近年来经济增长趋缓与地缘冲突加剧,外界的巨大风险和不确定性使得企业的经营环境更为多变化、复杂化,作为保障企业运营安全和提升治理水平的监督评价手段,内部审计的重要性不断凸显。然而面对这种信息熵的激增,传统以人工为主导的审计方法已经难以满足企业日益增长的内部审计需求。为此,中央审计委办公室在《“十四五”国家审计工作发展规划》第十七条“坚持科技强审”的要求中明确提出,需“加强审计技术方法创新,充分运用现代信息技术开展审计,提高审计质量和效率”。在上述指引下,云会计、区块链、RPA等信息技术快速发展演变,正逐步推动着内部审计乃至整个会计行业向数字化、智能化的方向转型。顺应上述形态变化,23年6月,中国内部审计协会修订发布的《第1101号——内部审计基本准则》在第三章“作业准则”中也新增要求指出:“内部审计人员在实施审计时,应当关注数字化环境对内部审计工作的影响”。数字化转型是驱动企业治理方式变革的关键要素,而人工智能作为数字经济时代的重要赋能引擎,将为内部审计数字化发展提供核心动力。特别是,22年底被誉为第二次信息革命代表的ChatGPT应用的问世,更进一步加剧了新型通用人工智能对传统审计方式的冲击,驱使转型步伐再度加快。因此,如何借助有效的人工智能技术实现审计智能化愈发受到了学术界与实务界的广泛关注。
二、主要内容
ChatGPT为代表的生成式人工智能技术为智能化内部审计带来了新的变革。为克服现有实践应用的研究中传统机器学习泛化能力提升有限、鲁棒性欠佳和特征分析维度不足等缺陷,基于ChatGPT中无监督学习、深度学习和多任务学习的核心技术思想,以企业会计活动中较为重要的往来账款管理为审计对象,综合考虑结构化和非结构化数据,在筛选多个审计维度下的特征信息并完成降维后,提出一种基于深度自编码网络的方法来构建内部审计预警模型。具体为:
1)首先,根据影响因素从业务匹配、期限结构、减值损失、关联交易、单体统计和文本信息多个角度提取审计特征,在基于过滤法(Filter)进行特征初选的基础上,进一步采用递归特征消除(RFE)的原理使用包裹法(Wrapper)进行更加精确的选择,得到各审计维度下应收/应付、其他应收/应付等财务及部分业务上拥有较强解释能力的预警指标。
2)随后,考虑到风险样本的不平衡性,基于ChatGPT的无监督学习思想,借鉴其Seq2seq结构搭建自编码器架构用以计算原始输入与生成输出的重构误差,利用其异常检测特性将审计正常情况下的业财数据重构误差最小化,从而提取出企业往来数据中的异常值特征。在上述基础上,基于深度学习思想,将引入Attention机制的Bi-LSTM作为上述自编码器的编、解码网络,以此形成本文用于审计预警的深度自编码器预训练(pre-training)模型,来深入挖掘风险发生前后的时变数据特征差异。
3)最后,进一步融合多任务学习策略,通过迁移学习(transfer-learning)的方式实现各不同待审计样本对企业当前所有风险信息的针对性精准获取,来对上述预训练模型进行微调。此处通过减少源域和目标域特征最大均值差异(MMD)的方法来寻找可迁移成分以实现目标领域适应,从而确保模型的稳定性和通用性以得到最终的预警量化结果。
三、主要结论与启示
基于上述方法使用大数据技术采集某非上市企业的真实业财数据开展实例分析,将所提方法与过往研究常用的传统监督学习、K-means聚类,以及基础的自编码器等算法进行多方效果对比。试验结果充分验证了本文方法的有效性,在各对比模型中泛化能力和鲁棒性均达到了最优。并且进一步分析发现,随着审计预警时间窗口的提前,上述方法相较而言能够更为前瞻地揭示企业未来可能面临的风险。同时还可利用输出的重构误差占比来识别导致企业风险产生的关键因素,从而实现审计疑点的快速定位。
此外,在推广应用方面,本文所筛选的审计特征集具有普适性,并在算法构建上由于采用ChatGPT的“预训练-微调”开发策略,使得模型能够适应不同企业之间的预警问题,从而具备较好的底层通用能力。在具体应用时,上述审计预警模型的正常运行以及自我升级也需要诸多方面的支持,例如后续可通过财务共享中心的流程再造来更为高效地收集企业的业财数据,同时企业的审计部门也可构建审计数据知识库,并不断地根据模型运行结果结合自身持续审计工作、行业变化及时更新知识,来反哺模型的继续预训练,从而确保审计预警模型的先进性。
四、边际贡献与未来拓展
边际贡献:1)在审计样本选择上,过往研究对象多集中于上市公司,且预警频率多为年度,本文从更为微观、更高频率的上市企业之外的某一具体会计活动样本数据层面出发,丰富了财务审计工作尤其是内部审计的应用场景。2)在审计特征提取过程中,从多个角度拓展了往来款项内部审计财务及业务层面的结构化数据分析指标。同时,考虑到现有上市公司的财务违规行为研究中对于MD&A、临时公告等非结构化数据的逐渐关注,针对往来款项这一会计活动的特点,还引入了财务往来凭证摘要、业务购销合同条款中蕴含的文本信息特征指标,实现对企业风险的多类型数据表征。3)在审计算法应用方面,为克服传统机器学习因结构简单难以适应企业复杂场景下的预警分析问题,以及在风险这类非均衡数据集上泛化能力、鲁棒性欠佳和未能考虑财务指标的时变性等缺陷,借鉴ChatGPT的技术内核,提出了更为有效的无监督深度学习技术来实现风险预判,弥补了现有财务审计领域中相关实例方法研究的不足,从而帮助企业在AIGC时代下运用智能化技术提高内部审计的质量和效率。
未来拓展:当然,本文研究也存在局限,如文章仅是借鉴ChatGPT的预训练技术思想构建审计预警模型,且方法中所用的审计特征信息仍大多为数值型的结构化数据。而实际上ChatGPT更多的是作为一个大语言模型被使用。现阶段,随着企业尤其是上市公司盈余管理或舞弊手段的愈发高明,除一般性的财务指标审计之外,还需要从动机角度来进行探析。在未来进一步的研究方向上,可充分借鉴、利用ChatGPT技术思想中的自然语言处理优势,将预警模型拓展至A股制造业公司的非结构化数据审计分析视角(如财报中的MD&A、监管问询函回复、投资者交流互动文本中的语义和语调等),来对其中蕴含的潜在动机信息做出表征,从而更好地实现预警的最终目标。
本文摘编自《系统工程理论与实践》2024年,第44卷,第1期论文《ChatGPT时代下基于深度自编码网络的企业内部审计智能预警——以往来款项审计为例》(点击题目链接全文);
作者:程平1,博士后,教授,博士生导师,副院长,云会计大数据智能研究所所长,研究方向:云会计,大数据智能财务,RPA财务机器人;喻畅1, 硕士研究生,研究方向:云会计,会计大数据.;王健俊2,3
1. 重庆理工大学 云会计大数据智能研究所, 重庆 400054;
2. 浙江吉利汽车有限公司 财务中心, 余姚 315400;
3. 余姚领克汽车部件有限公司 财务部 管理会计科, 余姚 315400
2024年第1期以“人工智能与数字经济”为专辑,汇聚全国高校科研人员力量,对中国数字经济实践中碰到的问题进行深入研究,为理解数字经济运行规律添砖加瓦,为数字中国建设贡献高校智慧。入选论文共22篇,涵盖了三个方向:1) 数字经济机理与机制;2) 数字经济发展对经济社会影响;3) 人工智能技术在经济社会中的应用。