【作 者】
谢志明1,2,蔡 琴3,李俊杰1,2
【作者单位】
1.汕尾职业技术学院信息工程系,广东汕尾 516600;2.汕尾市创新工业设计研究院,广东汕尾516600;3.汕尾市审计局,广东汕尾516600
【摘 要】
【摘要】时下正在兴起的云计算与大数据技术给传统的审计技术和方法提供了新的发展方向,同时也对审计组织和审计人员提出了新的挑战。面对无规律的海量电子审计数据,如何才能快速准确地从这些数据中挖掘出有价值的信息是现代审计学重要的研究课题。本文依据上述情形提出了将此类数据交付于Hadoop系统进行并行化处理,以提高数据利用率和数据挖掘效率,更好地指导行业和被审计单位的经营和管理,提高审计服务工作效率。
【关键词】云计算;大数据;审计;Hadoop系统
【中图分类号】F239 【文献标识码】A 【文章编号】1004-0994(2016)04-0068-3目前,伴随着云计算技术的发展,大数据正在对全球经济和社会生活产生巨大的影响。自从李克强总理在2015年提出了“互联网+”的战略发展目标以及《国务院关于印发促进大数据发展行动纲要的通知》正式发布后,云计算和大数据给现代审计提供了新的方法。传统的手工审计和单机审计已不能完全适应现代的数据审计工作,联网审计将成为今后审计工作的主要模式,云计算平台与大数据中心将成为应用这一模式的主要依托。同时,这也对审计组织和审计人员提出了更高的要求,他们不仅需要把握云计算技术和大数据的内容与特征,还需要掌握最新的审计技术和方法,提高审计数据分析能力,积极应对云计算与大数据时代带来的深刻变革。
一、传统审计模式遇到瓶颈
目前,我国大部分城市的审计数据都以电子数据的方式保存,这就有利于我们利用计算机完成审计工作。如何在现有条件下最大化地从审计数据中挖掘出有价值的信息,是每一位审计工作者都要思考的问题。从IT时代进入DT时代,各种规则、算法及应用不断深入到各行各业,所处理的数据规模也日益快速增长。传统的数据挖掘模式大多是以单节点的机器为平台,所处理的数据对象也主要是小到中等规模的,当面对海量、多维、分散的数据集合时,传统的数据挖掘模式往往显得力不从心。
本文将海量审计数据与目前国内外研究较成熟的Hadoop系统相结合,该系统具有大数据分布式处理能力和海量数据存储能力,为解决当前海量审计数据挖掘问题提供了一种全新、有效的方案。
二、云计算和大数据引发审计变革
2014年,国务院出台了《关于加强审计工作的意见》(以下简称《意见》),审计“全覆盖”被首次写入审计法规条文。《意见》指出,要加大审计力度,创新审计方式,加快推进审计信息化,提高运用信息化技术查核问题、评价判断、宏观分析的能力,探索运用大数据分析技术,加大数据综合利用力度,提升审计工作能力、质量和效率。实行审计“全覆盖”模式将使多元异构、跨领域的大数据作为今后审计人员面对的主要数据集合,且将原先受局限的被审计单位的内部数据信息扩展到与其相关的所有外部数据信息,如来自电信运营商、银行、互联网运营商、交通枢纽等机构的数据。显然,传统的审计数据分析方法已经不能满足现代审计的要求,如何更好地从大数据中快捷有效地挖掘出有价值的信息,才是当务之急。
值得注意的是,运用传统的审计工具软件和技术方法对被审计单位进行审查时,所查出的问题大多属于表面上的问题,很难深挖其根源。云计算与大数据不仅改变了传统数据采集、处理和应用的技术与方法,还促进了人们思维方式的转变,这些转变将改变人们理解和研究社会经济现象的技术和方法。从审计线索、审计人员、审计技术、审计内容这四个方面进行分析,我们发现,云审计是通过将所有的电子审计数据联网到云计算数据中心来完成审计任务的。因此,审计人员也必须掌握好云计算和大数据相关应用技术,掌握好云计算环境下获取审计证据的技术手段,以确保审计质量。同时,由于审计结果由协议的第三方交付给审计组织单位,从而保证了审计结果的真实性、公平性和公正性。三、云计算和大数据体系下审计模式的转变
目前,我国使用最多的是将传统手工审计和单机审计相结合的混合审计模式。该审计模式的优点在于相对较直观,因而更容易被审计人员理解和掌握,使其能够快速运用于实际工作中;缺点在于处理的数据量较小,且以样本为单位进行审计分析,虽然在样本范围内结论较准确,但有些以偏概全,同时审计结果信息较单一,难以给被审计单位提供全面的指导。
邓川和杨文莺(2012)认为,云审计是基于云计算这一互联网超级计算模式,使审计人员协同运用存储在“云”中的各种数据和审计资源,从而更有效率、更科学地进行审计的过程。将云审计模式引入审计部门,使审计人员不仅能对被审计单位的全部数据了如指掌,甚至对整个行业的数据都能全部掌握,审计人员可充分利用云计算数据挖掘工具对所有数据进行全面挖掘,不留盲点和死角,再通过审计分析云将挖掘到的有价值的信息快速、全面地上传到审计部门,这些感性的数据及丰富多维的图表信息可以作为审计人员分析被审计单位或行业是否存在违法违规现象或潜在风险的重要依据。
1. 传统桌面管理与云桌面管理比较。国内外许多生产商都在积极研发桌面云的运用,如华为桌面云、联想桌面云等。图1将传统桌面与云桌面作了业务模式处理对比。
传统桌面系统可以直接接入业务系统,获取业务数据,对数据安全及保密性高的审计部门来说,因其数据可以随便拷入或拷出,这就要求审计组织单位要时刻监视审计工作人员的办公电脑,以免发生数据泄漏。采用云桌面管理模式后,员工就不能直接从客户端进入业务系统,而必须通过应用交付平台预设的桌面进入业务系统。在此应用交付平台上,用户只能读取和写入,不能使用外部设备将数据备份出来,从而大大提高了数据安全性及保密性,就算审计人员的办公电脑失窃,也不必再为数据的丢失而担忧了。此外,云计算业务平台使审计单位不用再严密监视审计工作人员的电脑,从而使工作氛围得到了极大的改善。
2. 数据采集处理:构建开源的Hadoop数据中心平台。传统的数据中心资源承载有限,且所能处理的数据也多为结构化数据,如MySQL和Oracle等关系型数据库中所存放的数据。而NoSQL技术的出现将来自数字信息、媒体信息、物联网络、移动互联网等机构的数据交织在一起,数据结构类型将不再是单一的结构化数据,而更多的是半结构化数据和非结构化数据,具体如图2所示。
由于存放这些数据会占用巨大的空间,传统的数据库将无法胜任,同样,传统的审计数据分析方法也不能满足现代审计的要求,而通过构建开源的Hadoop数据中心能够很好地解决这一难题。Hadoop系统以HDFS和MapReduce为关键技术,将上传来的数据进行分布式存放和处理,且具有动态负载均衡,可以通过热插拨方式快速增加磁盘空间并进行维护处理,大大降低了维护和管理成本。每一热备均有三份(可动态增删热备数量),分处不同地方,如果出现某一数据节点读取中断或宕机,可从存放该热备的数据节点中继续读取数据以保证数据处理正常进行,同时再以该热备为主备备份出一份数据以保证网络中至少有三份热备存在。由于基于Hadoop系统搭建起来的数据中心具有海量存储功能和出色的容灾技术,因此将海量电子审计数据存放于Hadoop数据中心将是不错的选择。
3. 批处理分析海量审计数据。Hadoop系统具有处理海量异构数据的能力,可将大数据系统采集到的数据(大部分数据是过去无法采集到的)通过大数据分析系统处理后得到可视化分析图表及相关信息,也可利用相应的数据挖掘算法获得需要的预测性分析等。将Hadoop系统运用到审计过程中将使审计人员的办公流程得到明显改善,并使审计工作效率得到极大提升。如今,使用云审计办公的审计人员无需再关注使用何种计算机程序,也无需再关注数据的存储、共享和工作时效性问题,审计人员唯一需要关注的就是审计任务本身。文峰(2011)认为,云审计是利用互联网的云计算概念,过数据的云存储,使各种审计资源(审计工作人员、程序和相关的硬件设备)通过云来协同,从而使审计人员更有效率、更科学地进行审计的过程。云审计除了要构建审计存储云之外,还要对云中的数据进行分析、挖掘,这就需要构建审计分析云,其工作流程如图3所示。
审计分析云主要包括以下业务流程:首先,相关工作人员依据自身业务需求,向审计分析云提出数据分析申请。然后,审计分析云根据相关目录指引向审计数据云提出数据分析要求。最后,审计数据云接收申请后,将数据云中已有的业务数据和基础系统分发到审计分析云的一体机中。
审计人员在云计算平台中录入或导入数据,在数据中心选择相应的算法进行数据挖掘,并不需要知晓相关技术方面的情况,而只需提出审计分析要求,审计云就能及时有效地为审计人员提供数据模型、分析结果等。由于云审计使用的是分布式文件处理技术,因而上传的数据被分到多个数据节点进行处理,速度提升了多个数量级,而且挖掘出来的信息更加丰富、全面。这种以整体的思维模式来分析问题、解决问题的方法必然会有助于国家审计的发展。使用云审计方法,将会进一步打破“信息孤岛”,对实现全行业、全省乃至全国各审计部门的数据共享,实现国家各省、市审计系统规范化、系统化起到重要的推进作用。
4. 实时分析海量审计数据。构建审计分析云虽能方便存储和快速分析处理海量的审计数据,但也存在不足之处,即需要这些数据形成一定规模后方可取出进行批量分析,不利于对行业、企业、被审计单位等进行实时跟踪、调查及反馈,这就会造成一些漏洞被不法分子所利用。审计人员有责任和义务遵循国家法律法规,保护国家和人民财产不受侵犯。我国目前还没有城市或地区对审计数据进行实时分析,更多的还是传统的单机分析模式或刚开始使用审计分析云进行海量异构审计数据挖掘。十八届三中全会以来,国家一直倡导作风建设在路上,同样,审计建设也在路上,我们只有不断地努力去改良、改进现有的审计方法,才能给不法分子迎头痛击,树立国家威信,形成不敢腐、不能腐、不想腐的体制机制。
大数据的处理模式有两种:批处理和流处理。随着人类社会生活日益被大数据所包围,审计数据的时效性显得更为突出,这也是大数据给审计人员带来的最大挑战。目前,在实时分析大数据系统中使用较多的有基于拓扑的流式实时计算系统Storm,该系统具有优秀的大数据处理结构及实时分析模式,与Hadoop等批处理系统相比,其在实时性、高效性、容错性、扩展性等方面都表现出了明显的优势。Storm流处理系统在许多知名企业中早已开始商业化,如百度、淘宝、支付宝、Facebook、Groupon等。其中,支付宝就使用Storm系统来计算实时交易量、交易排行榜、用户注册量等,每日处理的数据量都为上亿条,处理的日志文件也是TB级以上。国外著名团购网站Groupon则主要使用Storm系统对实时数据进行快速的数据清洗、格式转换和数据分析等。由此可见,Storm系统作为大数据实时处理系统已经比较成熟,若能将这类具有实时分析处理功能的大数据系统为国家审计部门所使用,实现审计的实时监测,我国审计部门的工作效率将会极大提高,用数据说话、用数据道出真相的一天也将离我们不远。
四、总结与展望
云计算与大数据技术的兴起对审计工作的影响将是全面的、多层次的,并将朝着纵深方向发展。本文从审计人员的角度出发,认为一旦进入信息化大数据时代,如果不能及时转变审计工作模式和研究方式,审计部门将不能为行业或被审计单位提供有建设性意义的优质服务。
而将海量电子审计数据存储于基于Hadoop系统的云计算环境实现并行化处理,能够在短时间内高效挖掘出许多有价值、有意义的信息,用挖掘出的这些信息来规范被审计单位的后续工作是非常有指导意义的。在未来,审计部门将不会只扮演“猫捉老鼠”的角色,或仅仅只管“秋后算账”,它将更多地成为一个能帮助行业和被审计单位预先了解风险、抵御风险的职能服务部门。
主要参考文献:
岳利敏.云计算在审计中的应用[J].群文天地,2013(1).
秦荣生.云计算对会计、审计的挑战与对策[J].当代财经,2013(1).
涂新莉,刘波,林伟伟.大数据研究综述[J].计算机应用研究,2014(6).
张滨,陈吉荣,乐嘉锦.大数据管理技术研究综述[J].计算机应用与软件,2014(11).
张蕾.基于云计算的大数据处理技术[J].信息系统工程,2014(4).
解鹏里,胡友良,王开一.云计算技术对审计组织管理模式的影响[J].审计月刊,2014(2).