2021-06-10 10:43
来源:审计号公众号
作者:审计号公众号
我要收藏
公共资源调用站点
文章分享
【字体:
大 中 小】
打印
从想法到模型的距离,不亚于谈论嫦娥和谈论“嫦娥一号”的差距。
什么是数字化审计模型?
很多人谈到数字化审计,言必称模型。但很多时候提到的“模型”,其实只是个想法,只是有个目的的期望。 而从想法到模型的距离,不亚于谈论嫦娥和谈论“嫦娥一号”的差距。这个差距中的寂寞只有做过系统建设和模型开发的人才能体会。 广义上的模型是指通过主观意识借助实体或者虚拟表现、构成客观阐述形态、结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟、不限于平面与立体)。 参考OCC模型风险监管指南中对模型的定义,可以认为数字化审计模型是指基于专家意见、判断;或应用统计、数学理论等技术构建的定量方法或系统,可在一定假设条件下,根据输入的数据输出定量估计等决策参考信息。 模型只不过是我们根据对现实世界、复杂事物和具体问题的理解,遵循一定规则进行的重塑,努力拼接出世界的模样。 数字化审计模型的构建,是围绕数字化审计过程中涉及的审计主体和客体等展开的。主要来源于如下五个方面:数据自身、规章制度、常识经验、经典模型和分析技术。
来源之一:数据自身
数据自身的模型思路还可以分为两个方面:统计学范畴中的描述性特征和数据产生过程中积累的特征。1. 统计学范畴中的描述性特征
基于描述性统计中的求和、均值、极值、方差、众数、中位数、分位数等基本分析要素,可以对数据的分布特征、趋势变动有形象、直观、深刻的了解。 通过描述性统计可以快速掌握数据的整体概貌,也能发现数据中存在的大量细节。这些概貌和细节与审计目的相结合,可以有效抓住审计重点,提高审计效率。2. 数据产生过程中积累的特征
数据是业务的结果,因此数据产生过程中的一些特征也会折射出业务在量纲上的变化。 比如,字段比较多,交叉关联比较多的一般就是业务主档。字段相对固定,但新增数据量变动幅度较大的一般是交易明细表。对比数据仓库中的表清单,新增的表可能意味着新业务的发生。来源之二:规章制度
规章制度包括内外部制度,主要是指各种规范性要求、限制性条文、内控规范要求和监管要求。制度对比是分析和发现内部控制缺陷的基本功。 这一类的数字化审计规则比较简单,只需要将规章制度条款分解后,根据条款的内容设置相关的阈值,即可对数据进行批量监测和检查。检查的效果很大程度取决于基础数据的质量,还需要关注制度的变化和应对制度的规避。 如,对扶贫补贴情况进行审计,首先根据制度要求,将可以享受扶贫补贴的人员标准,如年收入、财产情况等,量化为阈值,在多源整合后的居民数据中进行检索,比对已享受扶贫补贴人员的名单,即可识别出不符合条件但享受补贴的人员和应享受补贴但未享受补贴的人员。来源之三:常识经验
常识的背后往往站着真相,而常识往往表现为一些固定的特征。 在数字化审计过程中,利用常识和经验捕捉到这些特征进行分析检查,是非常有效的检查方法。审计人员可以通过常识性经验、历史审计案例、检查经验、业务规律、数据勾稽关系、条线管理部门的风险提示、同业案例和行业热点问题等提取特征,形成数字化审计思路,构建审计模型,从海量数据中获取疑点数据,有的放矢进行检查。 比如,在项目建设过程中,有些工程施工在雨量较大的气候条件下是无法进行的。在工程施工审计过程中,可以将逐日施工情况数据与国家气象科学数据中心网站提供的逐日网格降水量实时分析数据集进行时间配对,对明显不符合行为特征的施工行为进行重点检查。来源之四:经典模型
这里所说的模型是广义上的模型,是指一些分析和解决问题的客观规律或者“套路”,不仅仅是指数理模型。 比如,描述同一类记录中的数字首位分布规律的Benford定律,对内部控制流程进行分析的瑞士奶酪模型,反舞弊检查领域的舞弊三角理论模型等。 这些模型是来源于大样本的归纳提炼,是智慧的结晶,也经受得住时间的考验,可以用来进行业务分析,为数字化审计探索方向和路径。当然,模型应用过程中,需要注意模型成立或者应用的前提条件或假设,否则也可能出现南辕北辙的笑话。来源之五:分析技术
基于信息技术工具和分析编程语言,从大量的数据中,通过数据挖掘、机器学习的算法分析挖掘隐蔽的信息,可以利用关联分析、时序分析、聚类分析等查找数据中的群组和关联关系。 也可以通过复杂网络、链路预测、人脸识别、自然语言处理等方法,识别数据中的网络关系、特定社群、提取文本信息中的关键信息。 还可以利用决策树、神经网络、支持向量机(SVM)、逻辑回归等,基于已有的历史数据和标签,找到数据中隐含的规律,对新业务进行预测和分类。