作为无时无刻不在和数据打交道的税务人员,数据可以带给我们很多信息。我们可以通过分析申报表寻找纳税人可能存在的涉税问题,可以通过数据对纳税人的税负进行分析。随着信息爆炸时代的到来,如何在税收现代化中运用好大数据,成为我们新的挑战。
一、税收大数据特征
1、数据量的变化。
近年来,税务信息化系统数据呈爆炸性增长,仅广东地税的信息化数据总量已达到53个太字节,相当于5万多G的数据量。
2、数据类型的变化。
数据呈现异构特点和多样性,既有结构化数据(如发票明细数据等),又有半结构化数据(如网上申报数据等)和非结构化数据(如文本、影像等)。
并且随着信息技术的发展,越来越多的申报数据、图像信息涌现,“半结构化数据”、“非结构数据”呈几何速度增长,2010年“结构化数据”占比75%,而到了2016年,这一数字就倒过来了,“半结构化数据”、“非结构数据”达到了75%。
数据量如此之多,而且都是不易处理的非结构数据,要想分析利用这些数据,在之前几乎是无解之题。云计算的出现,却使之成为可能。以云计算为基础的信息存储、分享和挖掘手段,可以将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。通过云计算对大数据进行分析、预测,可以挖掘出数据的隐藏价值。
但仅有大数据和云计算还不够,这些工具终究需要我们税务人员去运用,那么如何转变化思维就变得尤为重要。
二、转变思维,拥抱大数据
1、更多——不是随机样本,而是全体数据
很长一段时间以来,因为记录、存储和分析数据的工具都不够好,为了让分析变得简单,我们尝试缩减数据量,采用样本分析,以小见大,得到想要问题的答案。虽然样本分析可以在技术落后的情况下比较快速、比较准确的解决问题,但由于样本分析存在随机性很难实现、无法细分类、不能回答事先未设定的问题等缺陷,让我们放弃这种看似高效的分析方法,转而投向运用全体数据的方法。在这里,大数据中的“大”,并不是绝对意义上的大,而是要采用所有数据。与样本分析相比,使用全体数据可以让我们看到样本无法提示的细节信息。
比如在为纳税人提供个性化服务时,运用全体数据可以让我们做到以纳税人需求为导向,通过强大的税务云,实现线上线下的互动,为纳税人提供更多的量身订制的服务,以达到"个性化需求个性化满足”。
2、更杂——不是精确性,而是混杂性
大数据的允许不精确包含三个方面:一是由于数据量非常大,有个别错误可以忽略不计,对于结果没有影响。
二是大数据的测量结果一定有不准确的地方,但运用大数据分析可以看到其他技术手段无法看到的问题,这点不准确可以容忍。
三是如果不接受不精确,95%的非结构化数据都无法被利用。比如在调查纳税人虚开发票时,现在多为团伙做案,做案趋向专业化,敏感度很高,一有风吹草动,便会立刻逃走。这就需要我们对得到的信息迅速处理,这时再追求精确性已经不可能,虽然样本分析可以做到准确,但这时候的滞后是不能容忍的。
3、更好——不是因果关系,而是相关关系
建立在相关关系分析基础上的预测是大数据的核心。
2011年,美国联邦税务局局长道格拉斯•舒尔曼先生在美国全国媒体俱乐部做演讲时讲到一个愿景:如果联邦税务局能够不懈努力,改变主要依靠事后评查的运作模式,那么纳税人、税务部门的第三方和其他政府部门能够得到更优质的服务。他提到的改变就是将风险管理从事后变为事前。对税务局来说就是把对过去的分析变为对未来的预测。
大数据可以赋予我们洞察未来的能力。例如:阿里巴巴通过数据分析预测到2008年的经济危机。可以想象,这样的方法用于税务风险管理的情景:大量的包括各类传感器、互联网、企业账户变动等等源自第三方的信息汇集到税务局;税务局对这些大量数据进行风险预测、提前预警,应对和解决可能的税收遵从问题,将大部分涉税问题解决在事前,提高纳税人的税收遵从水平,改善税务局对纳税人的服务水平。这对于纳税人和政府来说,必将是一个双赢的局面。
三、如何运用大数据
1、要尽可能扩大数据量
微软曾经做过对算法的实验,当数据量少的时候复杂算法优于简单算法,而当数据量大到一定程度时,所有算法的准确率都大幅提高,尤其是最简单的算法准确率从75%提高到了95%,成为准确率最高的算法。这就是数据分析界古老的“拇指法则”,数据分析工作至少有70%~80% 的工作量花在搜集和准备数据上,仅有20%~30%的工作量花在分析本身上。因此要花大力气加强基础信息资源库建设,全面搜集并整合纳税人基础信息、财务核算数据、生产经营数据、纳税申报数据等,使得可供分析的数据足够多,这样我们才能得到想要的结果。
2、要实现信息共享
过去,不同政府部门拥有自己的信息系统,但很多数据相互隔离,形成了一个个信息孤岛,大数据的一大应用就是要实现数据信息共享,最大限度地发挥数据的功效,为经济社会发展服务。
广东地税借助大数据平台,积极推进第三方涉税信息共享,明确28个部门交换共享涉税信息的内容和方式,涉税信息的跨部门共享,突破了以往的单兵经验管理模式。目前,工商税务信息每天都进行实时交换,推动了地税机关在办证服务上的大创新,从原来的限时办证发展到现在的即时办证,从原来填写多达100多项登记信息,升级到填写8项必要信息内容,甚至可以享受免填服务。
3、要培养高素质人才
大数据时代对人才特别是高端人才的需求十分迫切。大数据时代的税收管理人才,应具备在数据的海洋中探索发现的能力。他们需要把大量散乱的涉税数据变成结构化、可供分析的数据,整合各种数据源并清理成结果数据集,揭示蕴含在数据中的税收经济规律和涉税疑点问题。
大数据可以帮助税务人员发现很多问题,但并非一个放之四海皆准的万能工具。大数据在给我们的工作带来很多便利的同时,也会带来很多问题,比如信息共享带来的信息安全问题等。人类学家克利福德—吉尔兹在《文化的解释》中说过:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”这是我们对待所有新事物应有的态度。
在大数据运用的路上我们只是迈出了第一步,以后还有很多任务需要我们去探索,我们还需要不断的实践与思考,才能真正将大数据运用到税收现代化上。