抽丝剥茧大数据,立显端倪助审计 ——计算机辅助审计在农村危房改造资金审计中的运用
一、引言
2015年3月至5月,安庆市审计局对某区2014年度实施的农村危房改造资金管理、分配、使用情况进行了专项审计。
审计组采取全覆盖与抽查相结合的方式,对农村危房改造项目涉及的财政、发展改革、住房城乡建设、民政等部门和具体实施的各乡镇、村(社居委)的农村危房改造资金管理、使用等情况进行了审计,并延伸调查了部分农户。审计过程中,由于数据较多,通过单纯手工筛选比对,容易出现疏漏,且工作量较大。鉴于此状,审计组引入计算机辅助审计技术,采用数据库软件SQL SERVER搭建数据检索平台对农户基本信息数据进行比对筛选,根据筛选出的疑点户,再进一步到乡镇、村,针对疑点对象进行了重点抽查。
二、计算机审计方法的应用
1、数据准备
(1)《申请人员基本情况表》
从“全国扩大农村危房改造试点农户档案管理信息系统”(wfgz.mohurd.gov.cn)中下载《申请人员基本情况表》,此处需要从住建局获得用户名和密码。
(2)《补助资金清册表》
从财政局获取《补助资金清册表》。
(3)《贫困户名单》
从民政局获得《贫困户名单》。
2、数据检索平台的搭建及数据规整
(1)数据检索平台搭建
使用数据库软件SQL SERVER,将上述《申请人员基本情况表》、《补助资金清册表》和《贫困户名单》分别导入SQL SERVER软件,搭建数据检索平台。
(2)关键词提取
提取已导入SQL SERVER的三个文件的关键词,为后续编程比对筛选提供基础。各文件关键词分别如下:
《申请人员基本情况表》的关键词:县区名,乡镇名,村民委员会,户主姓名,身份证号,补助金额,列入计划的年度,享受补助资金类型,各级政府补助资金。
《补助资金清册表》的关键词:户主编码,户主姓名,身份证号,银行账号,补助金额,村名,组名。
《贫困户名单》的关键词:乡镇名,村民委员会,村民小组,户主姓名,身份证号,家庭人员,农户贫困类型。
(3)数据规整
由于上述三个数据文件来源于三个不同的部门,数据的收集、汇总、编写与存储由不同的工作人员完成,个人的操作习惯和所使用数据文件模板存在差异,而且数据还会经过多次跨平台存储与传输,这些都可能会造成数据文件中一些数据格式不规范、不统一,不能直接被SQL SERVER程序调用。因此,在编程筛选比对前需要对数据文件中各关键词所对应的数据格式进行规整,以达到规范和统一。
例如,在实际操作时我们发现,上述数据文件中身份证号存在非标准18位的情况,而且身份证号多是以文本数据类型存储的,有的甚至通过在身份证号数字前增加字符的形式来实现数字格式向文本格式的转换,这会引起身份证号数位的增加。对于此种情形,可以通过语句“right(身份证号,18)”或“SUBSTRING(身份证号,2,19)”将身份证号规整为以数字格式存储的标准18位。
3、计算机审计编程实践
审计过程中,我们对其中可能存在的疑点进行了分类归纳,制定相应的审计策略,编写相应的程序语句,实现计算机审计。
(1)疑点一、重复申请危房改造资金
根据政策规定一户只能享受一次危房改造补助,对《申请人员基本情况表》以身份证号为关键字进行筛选,查找重复申请危房改造资金的人员情况。
程序代码:
select* from dbo.镇申请人员基本情况
where 身份证号 in (select 身份证号 from dbo.镇申请人员基本情况
group by 身份证号 having count(1) >= 2)
(2)疑点二、非补助申请人员享受补助
以身份证号为关键字,将《补助资金清册表》与《申请人员基本情况表》进行比对,查询出超范围享受补助的情况。
程序代码:
select * from dbo. 镇补助资金清册表
where 身份证号 not in
(select distinct身份证号from dbo.镇申请人员基本情况)
(3)疑点三、一人多次领取危房改造资金补助
以身份证号为关键字,在《补助资金清册表》中查询身份证号重复出现的情况,即可得到是否存在一人多次领取危房改造资金补助的信息。
程序代码:
select * from dbo.镇补助资金清册表
WHERE 身份证号 in
( select 身份证号 from dbo.镇补助资金清册表
group by 身份证号
having count(*)>1 )
order by 身份证号
(4)疑点四、发放补助金额与各级政府补助资金不一致
将《补助资金清册表》和《申请人员基本情况表》两张表格全连接,生成一张表格即《某镇对比表》进行比对,核对发放补助金额与各级政府补助资金是否一致,以防止资金发放不足或者多领的情况。
程序代码:
select a.身份证号,a.户主姓名,b.农户贫困类型,a.补助金额,b.各级政府补助资金,a.银行帐号,b.改造方式, a.村名,a.组名
into 某镇对比表
from dbo.镇补助资金清册表 a full join dbo.镇申请人员基本情况 b on a.身份证号=b.身份证号
order by 农户贫困类型
(5)疑点五、非《贫困户名单》内的人员享受贫困户补助资金
以身份证号为关键字,通过对比前述生成的《某镇对比表》和《贫困户名单》两张表格,查询是否存在不在民政提供的《贫困户名单》内人员享受贫困户补助资金的情况。
程序代码:
select * from dbo.某镇对比表
where 身份证号 not in (
SELECT 身份证号 FROM 贫困户名单)
and 农户贫困类型 like \'%五保户%\'
此处可以根据需要,通过类似“农户贫困类型 like \'%五保户%\'”对五保户,低保户,残疾人分别筛选。
(6)疑点六、“其他贫困户”享受的补助金额与政策规定不符
以身份证号为关键字,在《某镇对比表》中筛出领取与政策规定不符金额的“其他贫困户”。
程序代码:
select * from dbo.某镇对比表
where 农户贫困类型 like \'%其他贫困户%\'
and 补助金额!=4000 and 补助金额!=10000
三、计算机审计取得的成果
通过采用上述计算机审计方法的实践,发现了以下问题:
1、财政信息平台有误
财政部门前期资金发放平台信息录入不准确,存在部分户主姓名与身份证号不一致的问题,导致将申请人身份证号码与领取人的身份证号码进行数据比对的时候,出现不一致。
2、“一户多报”
户籍分离仍居住同一住宅的家庭以分户形式分别申报或同一户籍家庭成员多人申报。
3、重复享受多种补助
将申请户的身份证号与享受渔民上岸的申请户身份证号数据比对,数据一致的,即为重复享受。
4、“申、领脱节”
抽查发现,47户补助资金申请人与领受人信息(“打卡”)不一致,出现“申、领脱节”现象。
5、集中供养五保户享受危房改造
从敬老院采集的集中供养五保户的身份证号与申请的分散供养五保户身份证号数据比对,数据一致的,即为集中供养五保户享受危房改造。集中供养五保户由当地政府安排居住当地敬老院,不符合危房改造的条件。审计发现,某区建设局以分散供养五保户名义,为实际集中供养户申领危改补助资金,共计29户。
四、总结与展望
安庆市审计局在某区2014年农村危房改造资金的专项审计过程中,针对其数据量大、采用手工筛选比对容易出现疏漏、工作量大等特点,引入计算机辅助审计技术,采用数据库软件SQL SERVER搭建数据检索平台,对审计中可能存在的疑点进行分类归纳,并制定相应的审计策略,编写对应的程序代码,成功地实施了计算机辅助审计,高效、准确地完成了审计任务,发现了譬如财政信息平台有误、“一户多报”、“申、领脱节”等多个问题。
计算机辅助审计方法的成功实施,将审计人员从简单、重复、枯燥的数据筛选比对工作中解放出来,其高效性和准确性也为审计项目的出色完成提供了技术支撑。
本文中采用的计算机辅助审计方法可以广泛推广应用于其他涉及大数据项目的审计中。