数据会说话

作为无时无刻不在和数据打交道的税务人员,数据可以带给我们很多信息。我们可以通过分析申报表寻找纳税人可能存在的涉税问题,可以通过数据对纳税人的税负进行分析。随着信息爆炸时代的到来,如何在税收现代化中运用好大数据,成为我们新的挑战。

一、税收大数据特征

1、数据量的变化。

近年来,税务信息化系统数据呈爆炸性增长,仅广东地税的信息化数据总量已达到53个太字节,相当于5万多G的数据量。

2、数据类型的变化。

数据呈现异构特点和多样性,既有结构化数据(如发票明细数据等),又有半结构化数据(如网上申报数据等)和非结构化数据(如文本、影像等)。

并且随着信息技术的发展,越来越多的申报数据、图像信息涌现,“半结构化数据”、“非结构数据”呈几何速度增长,2010年“结构化数据”占比75%,而到了2016年,这一数字就倒过来了,“半结构化数据”、“非结构数据”达到了75%。

    数据量如此之多,而且都是不易处理的非结构数据,要想分析利用这些数据,在之前几乎是无解之题。云计算的出现,却使之成为可能。以云计算为基础的信息存储、分享和挖掘手段,可以将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。通过云计算对大数据进行分析、预测,可以挖掘出数据的隐藏价值。

但仅有大数据和云计算还不够,这些工具终究需要我们税务人员去运用,那么如何转变化思维就变得尤为重要。

二、转变思维,拥抱大数据

1、更多——不是随机样本,而是全体数据

很长一段时间以来,因为记录、存储和分析数据的工具都不够好,为了让分析变得简单,我们尝试缩减数据量,采用样本分析,以小见大,得到想要问题的答案。虽然样本分析可以在技术落后的情况下比较快速、比较准确的解决问题,但由于样本分析存在随机性很难实现、无法细分类、不能回答事先未设定的问题等缺陷,让我们放弃这种看似高效的分析方法,转而投向运用全体数据的方法。在这里,大数据中的“大”,并不是绝对意义上的大,而是要采用所有数据。与样本分析相比,使用全体数据可以让我们看到样本无法提示的细节信息。

比如在为纳税人提供个性化服务时,运用全体数据可以让我们做到以纳税人需求为导向,通过强大的税务云,实现线上线下的互动,为纳税人提供更多的量身订制的服务,以达到"个性化需求个性化满足”。

2、更杂——不是精确性,而是混杂性

大数据的允许不精确包含三个方面:一是由于数据量非常大,有个别错误可以忽略不计,对于结果没有影响。

二是大数据的测量结果一定有不准确的地方,但运用大数据分析可以看到其他技术手段无法看到的问题,这点不准确可以容忍。

三是如果不接受不精确,95%的非结构化数据都无法被利用。比如在调查纳税人虚开发票时,现在多为团伙做案,做案趋向专业化,敏感度很高,一有风吹草动,便会立刻逃走。这就需要我们对得到的信息迅速处理,这时再追求精确性已经不可能,虽然样本分析可以做到准确,但这时候的滞后是不能容忍的。

3、更好——不是因果关系,而是相关关系

建立在相关关系分析基础上的预测是大数据的核心。

2011年,美国联邦税务局局长道格拉斯•舒尔曼先生在美国全国媒体俱乐部做演讲时讲到一个愿景:如果联邦税务局能够不懈努力,改变主要依靠事后评查的运作模式,那么纳税人、税务部门的第三方和其他政府部门能够得到更优质的服务。他提到的改变就是将风险管理从事后变为事前。对税务局来说就是把对过去的分析变为对未来的预测。

大数据可以赋予我们洞察未来的能力。例如:阿里巴巴通过数据分析预测到2008年的经济危机。可以想象,这样的方法用于税务风险管理的情景:大量的包括各类传感器、互联网、企业账户变动等等源自第三方的信息汇集到税务局;税务局对这些大量数据进行风险预测、提前预警,应对和解决可能的税收遵从问题,将大部分涉税问题解决在事前,提高纳税人的税收遵从水平,改善税务局对纳税人的服务水平。这对于纳税人和政府来说,必将是一个双赢的局面。

三、如何运用大数据

1、要尽可能扩大数据量

微软曾经做过对算法的实验,当数据量少的时候复杂算法优于简单算法,而当数据量大到一定程度时,所有算法的准确率都大幅提高,尤其是最简单的算法准确率从75%提高到了95%,成为准确率最高的算法。这就是数据分析界古老的“拇指法则”,数据分析工作至少有70%~80% 的工作量花在搜集和准备数据上,仅有20%~30%的工作量花在分析本身上。因此要花大力气加强基础信息资源库建设,全面搜集并整合纳税人基础信息、财务核算数据、生产经营数据、纳税申报数据等,使得可供分析的数据足够多,这样我们才能得到想要的结果。

2、要实现信息共享

过去,不同政府部门拥有自己的信息系统,但很多数据相互隔离,形成了一个个信息孤岛,大数据的一大应用就是要实现数据信息共享,最大限度地发挥数据的功效,为经济社会发展服务。

广东地税借助大数据平台,积极推进第三方涉税信息共享,明确28个部门交换共享涉税信息的内容和方式,涉税信息的跨部门共享,突破了以往的单兵经验管理模式。目前,工商税务信息每天都进行实时交换,推动了地税机关在办证服务上的大创新,从原来的限时办证发展到现在的即时办证,从原来填写多达100多项登记信息,升级到填写8项必要信息内容,甚至可以享受免填服务。

3、要培养高素质人才

大数据时代对人才特别是高端人才的需求十分迫切。大数据时代的税收管理人才,应具备在数据的海洋中探索发现的能力。他们需要把大量散乱的涉税数据变成结构化、可供分析的数据,整合各种数据源并清理成结果数据集,揭示蕴含在数据中的税收经济规律和涉税疑点问题。

大数据可以帮助税务人员发现很多问题,但并非一个放之四海皆准的万能工具。大数据在给我们的工作带来很多便利的同时,也会带来很多问题,比如信息共享带来的信息安全问题等。人类学家克利福德—吉尔兹在《文化的解释》中说过:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”这是我们对待所有新事物应有的态度。

在大数据运用的路上我们只是迈出了第一步,以后还有很多任务需要我们去探索,我们还需要不断的实践与思考,才能真正将大数据运用到税收现代化上。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容