论税收数据深度利用的4项核心要素来源:中国税务学会作者:谭荣华蔡金荣日期:2008-02-25字号[ 大 中 小 ] 近年来,税收信息化的所作所为基本上是朝着一个方向前进的,那就是数据集中、系统整合,其最终目的是凸显税收数据在科学管理和优化服务上的重要作用。当全国范围内大规模的税收数据逐步集中之后,不同于以往的税收数据的深度利用便会提上日程。这是金税工程三期建设的一项重要任务,也是进一步开创税收现代化新局面的实践需要。  为了实现税收数据的深度利用,我们认为必须把握4项核心要素,即:对象选择、指标体系、模型应用和系统构建。这是既有各自内涵,又有相互联系的一个统一整体。  一、对象选择  事实上,漫无边际的税收数据利用是没有任何意义的。税收数据的利用总是针对着某项事务、某项主题、某项政策、某一时间地域而展开分析的,因而是现实的、具体的、有着既定分析目标和对象的。因此,税收数据深度利用的一个首要问题便是确定分析目标和对象,只有确定了分析目标和对象,税收数据的应用边界才能被确定,与分析无关的税收数据才能被屏蔽,这一点很重要,要知道,如何从海量税收数据中实现相关数据的精准供给绝不是件容易的事情。  以纳税评估为例,并非纳税评估的对象越多越好,如果对所有企业普遍实施纳税评估,其结果很可能是成本与效益不成比例!因此,科学选择纳税评估对象就很有必要。常见的纳税评估对象的选择方法有申报资料勾稽法、逻辑错误检索法、综合评分法、判别分析法、Tobit模型估测法、神经网络预测方法等。利用适宜的方法和模型可以初步筛选出疑点纳税人,按照纳税人疑点指标总得分情况,由高分至低分排列,分高者存在问题可能性大,先评估。可见,使用一定的方法和模型有助于科学选择分析目标和对象,从而减少税收数据的分析量以及系统开销,并且有效提高分析的效率。  随着金税工程三期建设全面启动,税收数据的集中是不可逆转的,当大量税收数据呈现在我们眼前的时候,能不能保持清醒头脑的确是个现实问题。不管税收数据在实现科学管理和优质服务方面具有多么重要的作用,但实质上还是要服从于人们工作和实现职能的需要,任何浪费时间、人力、物力和财力,没有既定分析目标和对象的所谓税收数据的“深度利用”都是不可取的。  二、指标体系  一旦分析对象确定,围绕分析对象所需要的税收数据也已经齐备,接下来的问题就是如何实现对税收数据的解析。现实的选择之一是根据分析问题的需要设立或选择相关的科学指标体系。  科学的指标体系是税收数据有效利用,乃至深度利用的工具。以税收与经济关系分析为例,较为重要的分析主题有:税收收入与GDP总量的关系、消费总量对税收收入的影响、投资规模与税收总量的关系、产业结构对税收的影响、税源结构变动对税收收入级次的影响、工商业增值税与工商业增加值的关系、所得税与利润总额分析、劳动者报酬与个人所得税的关系、税收收入预测等。对应于这些分析主题,较为重要的分析指标有:GDP值、财政收入、税收收入、税收负担率、税收收入弹性、税收增长率、居民消费、政府消费、固定资产投资总额、分产业的GDP和税收收入、工资报酬、中央收入、地方收入、工业增加值、商业增加值、利润总额、所得税、所得税负、劳动者报酬、个人所得税、个人所得税负、个人所得税收弹性系数、全社会固定资产投资总额(IFA)、最终消费(FCE)、资本形成总额(GCF)、货物和服务净出口(NE)等等。每一个指标都有自身的社会经济含义,它在时间、地区、行业、机构、单位、经济类型、税种诸方面(统称维度)的真实数据,经过充分的横向、纵向比较后,会清晰地展现出税收与经济关系的状况,有助于做出政策调整或应对举措,这正是税收数据有效利用或深度利用的本意。  除了以上所说税收经济分析主题和分析指标外,税源监控、征收管理、税务稽查、税收法制、人事教育等税务工作亦有相当丰富的分析主题和分析指标,亦可广泛应用于税收数据的利用。利用科学的指标体系不断加深对税收数据的分析利用,优点是简单易懂、有一定基础、易于推广、收效甚快。局限是不能更自由地在更大范围内综合利用复杂的数据资源,从而难以创造性地揭示更深层的规律。即使如此,对于大部分税收数据分析来说,指标分析法已经够用,没有必要弃而不用,它在税收数据深度利用阶段的生命力依然毋庸置疑。为此,对纷繁多样的税收经济指标的透彻理解和熟练运用仍是当前必修功课。  三、模型应用  如果说,指标分析法代表了目前我国税务系统税收数据分析应用的现实水平,则更复杂的方法和模型应用被视为税收数据深度利用的高阶和标志。与自然科学领域中大部分模型是对真实世界研究对象的物理模拟不同,社会科学领域的模型可以是代数形式的一个公式或一组公式,可以是一张或一组表格。一般而言,模型具有的基本特征是:能够比较真实地刻画现实世界,能够根据我们感兴趣的对象有取舍地抽象,能够为我们的决策提供有价值的参考。具体到税收数据深度利用的模型而言,大致可以分为两类:*9类是以科学化、精细化管理为内在思想的管理工具和手段所形成的管理模型;第二类是以研究税收经济关系协调发展为目的的税收经济模型。本文集中讨论税收数据深度利用中的经济模型。  1.经济模型发挥的作用  主要是采用代数形式的定量分析把税收经济理论模型化,然后根据实践情况适当对理论模型予以修正,并将相关数据应用到修正模型中,对模型结果进行经验分析,从中发现经济运行线索,为政策制定提供科学依据。这种经济模型利用的过程是阶段性的,是从初级到高级的过程,是一个水平不断提高、效果不断改进的发展过程,当然,模型应用水平取决于税务部门对实际经济关系的理解程度、对税收经济关系的符号抽象能力。  然而,进一步结合税收数据深度利用来看,或许经济模型所发挥的作用还存在着另一方面的功能,即数据集中过程中对数据组织的导向性作用,这种导向性作用的发挥是通过经济模型应用过程中对各类数据提出要求而加以实现的。通过该作用,随着时间推移,数据集中的有效性与目的性不断加强,继而模型应用的空间不断扩展。其实,在数据大集中的初期阶段,很多税务部门从事信息化工作的同志都在讨论一个话题,要集中什么样的数据?对于该问题的回答也是众说纷纷。该问题的本质其实是模型应用的导向性作用的反映,是否可以换位思考:通过若干模型(包括管理和经济两种类型模型)作为导向以指导数据大集中的数据选择。  2.税收经济关系模型的分类  对于税收经济关系模型的分类目前有多种做法可做参考,然而,从税收数据深度利用的需求出发,似乎可以对分类做进一步的规整。结合实际的应用需求和已往经验来看,以下问题应纳入分类的研究视野:*9,可以从现有的数据中开始相应的计算,如果没有数据的支持,经济模型应用将无从谈起,再完美的理论也只是空中楼阁;第二,必须具有相应的计算工具支持,模型应用在现代经济研究中迅速发展的基石之一就是现代计算技术的发展,没有计算工具的支持,具有庞大计算量的各种税收经济模型的完成无法想象。支持税收经济模型应用的计算工具包括硬件具备的计算能力和软件具有的算法能力两种,尤其是计算软件的支持,在理论与现实应用之间架起了宽阔的“桥梁”,使许多税收经济研究者不再困惑于具体的计算算法实现等技术细节之中。  因此,我们认为,税收经济模型分类应该具有以下特点:  (1)以宏观数据的计算为主要特征的模型:其主要应用方法包括时间序列方法(以ARMA模型族为主)、回归分析(多元回归)和联立方程组法(大中型宏观计量模型),着重于自身数据的发展变化、各个总量数据之间关系的发展变化,这方面有一些计算平台,如Eviews、SAS、SPSS等。  (2)以中观数据的计算为主要特征的模型:其主要应用方法包括一般均衡分析(CGE)、投入产出分析(IO)等,着重于分类/部门之间关系的发展变化,其计算工具如GEMPACK、GAMS和一些具有矩阵计算功能的工具如Matlab等,还有一些专用的工具。  (3)以微观数据的计算模拟为主要特征的模型,其主要应用方法包括仿真、离散等,着重于对微观数据发展变化的模拟,其计算工具如ASPEN、Swarm等为主,当然也有专门开发的应用软件,如美国的个人所得税模拟软件。  图1是税收数据深度利用中的税收经济模型分类框架:  图1税务数据深度利用中的税收经济模型分类框架  以上模型体系我们可以得出那些结论呢?  (1)从税收经济模型依赖的数据来看,该模型体系中包括具有不同性质的数据。具体而言,包括宏观数据、中观数据和微观数据。宏观数据的含义比较明确,主要包括一些税收经济总量方面的数据,例如税收收入总量、投资额、进出口、贸易额等等。微观数据主要指税收经济中的个体数据,例如基于纳税人的数据。中观数据是相对于宏观数据和微观数据而言,主要包括部门数据,纳税人分群数据等等。  (2)从税收经济模型的计算工具而言,模型应用依赖于不同性质的计算工具。从目前存在的模型应用计算工具来看,有些工具擅长计算以总量作为特征的数据,有些工具擅长分析以群体进行划分的数据,而有些工具则致力于微观数据的模拟。当然也不排除有些工具具有比较全面的功能,能够应用于三种类型的数据计算。  (3)从税收经济模型应用的目标来看,模型组成部分的功能和目标各有不同。从功能来看现有的税收收入预测模型,在政策稳定情况下,有的模型是针对总量进行的建模,有的模型是针对结构做的分析,在政策变动情况下,也有相应政策执行的税收效应分析,甚至还有针对突发事件的分析预测模型。  (4)从税收经济模型得出的结果来看,模型应用所得出的结果应该是多方面的,不仅包括税收经济的各方面情况,有总量情况,也有结构情况,有静态情况,也有动态增长变化态势,而且包括对相关经济情况的预测,当然,对税收模型所依赖的若干外生经济变量也可以依赖外部模型,直接对接有关经济指标。  掌握税收数据深度利用中的方法和模型对知识结构是一种巨大挑战。在理论基础方面,要具备经济学、统计学、计量学和计算机科学的相关知识;在分析工具方面,要具备一般数理统计方法、计量经济学分析方法、计算经济学分析方法、宏观经济模型方法和计算机技术在税收数据分析中的方法。为此,有意识地学习一些方法和模型知识也许是税务系统广大干部所面临的一项新任务,教育培训一定要跟上。  四、系统构建  税收数据深度利用最终要落实到计算平台上,不能设想,当税收数据是丰富、准确、一致、完整和连贯的,方法和模型也在逐渐普及,应用研究日益深入,但是,真正开始工作的时候却发现没有数据获取、传递、加工、存储和使用,模型建立、维护和调配的管理信息系统或决策支持系统!因此,必须建立一个能够统辖数据、方法和模型管理与使用的计算平台。这是税收数据深度利用的技术依托,也是决定税收数据深度利用持续发展的关键。如何构建税收数据深度利用的计算平台呢?试以税收政策分析模型支持系统为例。  简单说,税收政策分析模型支持系统是封装了税收经济分析模型的计算机应用系统,它不仅可以用来分析税收政策的经济效应,而且提供模型维护功能。其构建方法如下:  (1)研制中国税收政策分析模型。虽然国内外已经建立了多种税收宏观经济计量模型和CGE模型,但这些模型基本是根据某国、某地、某时期具体的税收制度制定的,不一定适合我国当前的税收政策。所以需要在中国宏观经济计量模型和中国CGE模型的基础上,较为全面的地引入税收政策变量,研制专门的税收宏观经济计量模型和税收CGE模型,模型的税收变量涵盖增值税、营业税、消费税、企业所得税(内资企业和外资企业)、个人所得税、房产税、资源税和海关进出口税等主要税种,对每一个税种引入税目、税率和税基等处理要素,以达到全面分析当前税收经济关系的目的。特别需要研制的是,如何将新税种引入模型中,然后研究新税种的加入对整个经济发展和税收收入的影响。  (2)构建税收政策分析模型支持系统。*9,制定税制表示方法。要全面描述税制,需要从税收实体法和税收程序法两个方面来完成,重点分析税收政策和经济变量之间相互关系。为了奠定税收政策建模分析的基础,全面反映税收政策与经济变量之间的关系,需要研制一种较为科学的方法来形式化描述各种税种,包括其税基、税目、税率和税收调整措施等税收要素,制定税收制度表示方法。用这种形式化的税收制度表示方法刻画的税种将在税收政策模型中全面或部分体现,这样能够确保在制定税收政策分析模型时能够把握相关税种的分析深度和广度。第二,中国税收政策分析模型描述和解析语言。在对现有税收经济模型进行梳理、归类的基础之上,参照现有的其他领域描述语言,建立一套较为完整的税收政策分析模型描述语言(Taxpolicyanalysismodelingmarkuplanguage,TPAMML),不仅能够准确描述各类税收经济模型,而且可以很好地兼容计量经济计算软件平台。这样,通过该套描述语言体系,在现有的各种理论模型方法建立的税收经济分析模型、各个地区或行业的相应分析模型都能够用一致的方法加以描述。这就具备和现有模型复用的基础。第三,研制中国税收政策分析模型支持系统。通过利用信息技术封装各类税收经济分析模型,以降低模型使用的难度,扩大模型使用的范围。税收政策模型支持系统由税收政策分析模型库系统、税收政策分析方法库系统、税收政策分析数据库系统和税收政策分析人机界面四个主要部分,如图2所示。  图2税收政策模型支持系统构成示意图  税收政策模型库系统负责管理税收经济分析模型,包括构建模型、更新模型和删除模型等功能。模型库系统中用模型字典描述所有模型的功能和接口,模型库中用组件的方式存储模型。每个组件包装的模型,需要调用的分析软件或组件都从方法库中调用,需要获得的外部数据从数据库系统中获得,模型的内部数据则从内部数据库获取,模型的生成结果可以存到模型的内部数据库中,也可以存储到分析者的私有数据库中。模型库系统能够将系统模型库中的模型下载到私有模型库,也能够上载私有模型库模型,并为该模型提供运行平台。  税收政策分析方法库系统包括一系列支撑工具软件的调用接口,这些外部分析方法软件用组件接口的方式存在于方法库中,成为模型库系统模型运行和分析的支撑软件平台。方法库系统中也可以是方法建造者构造的专门组件。  税收政策分析数据库系统包括数据库、数据仓库及其管理系统,有两个组成部分:一是核心数据仓库,围绕各类分析主题存放税收政策分析所需的数据,这些数据来源于各种税收业务系统和外部经济、社会统计数据;二是外部数据的存取接口,用于存取税收经济分析需要的、存放在核心数据仓库以外的数据。  税收政策分析人机界面包括三个部分的功能:一是人机接口功能,是分析者使用税收经济分析系统的接口,负责提供各种税收经济分析业务功能的使用界面,接受和检验分析者的分析请求,用多种方式直观地显示分析的结果;二是分析业务预处理功能,对分析者的分析请求进行校验和检查,然后调用模型库中的相应模型进行分析,或者生成数据库/数据仓库系统的查询分析请求,负责接受模型库或数据库返回的结果;三是私有数据库和私有模型库的管理功能,每个分析者都可以建立自用的独特的数据库和模型库。私有数据库中的数据可以从系统公共数据库中根据分析者的权限下载获得,也可以存储分析者的分析请求和分析的结果。私有模型库中的模型可以从模型库系统获取,或者根据模型构造的规则建立分析者自用的模型,分析者进行分析时,将私有模型上载到模型库系统,在模型库系统环境中运行分析,然后将分析结果传到会话管理系统。  概括而言,税收数据的深度利用,一是选定分析对象、分析主题,在这一环节也有可能用到某种方法或模型;二是根据分析主题的需要选择最适宜的分析指标或方法模型;三是实现过程最终是建立在计算平台之上的。也就是说,有针对性的管理信息系统和决策支持系统已经能够集成多种分析方法和模型,具备多种数据接口,实现多种主题分析,不是让做税收数据深度分析的人自己去逐一构筑指标、方法和模型,而是向他们提供已经携带好了指标、方法和模型库的管理信息系统和决策支持系统,操作这些系统就是了!