摘要 耗费不菲且形式意义远大于实质意义的任务式绩效评价,亟需全面精简和升级为高度实用的“3-3-3-4实效式绩效评价”:(1)3项预算门槛测试,即成本效益分析、最低费用法和预算缺口测试;(2)3步骤评价,即把少量关键绩效指标(KPI)首先编入预算草案,预算执行阶段定期自动跟踪KPI,预算评审阶段对KPI进行考核并与奖罚挂钩;(3)3层级评价,即依次评价总额绩效、配置绩效和运营(支出使用)绩效;(4)4项参与式评价,即评价预算编制阶段的公众需求表达,公众在预算草案审查阶段的方案反映,公民的预算执行评论,以及预算评审阶段的公众抱怨与救济。若伴随坚定持续的政治承诺,此举可望迅速把“全面预算绩效管理”推进到一个花钱最少、收效最大的轨道上。
关键词 任务式绩效评价 实效式绩效评价3-3-3-4绩效评价 KPI
作者|王雍君(公司政府预算研究中心主任)
引言
自2015年新《预算法》实施和2018年《中共中央 国务院关于全面实施预算绩效管理的意见》颁布后,预算绩效管理进入了一新的“爆发期”。各级政府为此投入了巨额资金用于推进此项工作,第三方评价机构继续增长。这些机构大多没有专业资质门槛,但这并不影响从部门与机构委托评价中获得大量“订单”。日趋激烈的“订单竞争”不断压缩获利空间,但巨大的订单规模使这些机构仍可获利,诱发更多的新增机构参与竞争。
基于若干理由,“对当前的绩效评价运动本身立即实施绩效评价”的重要性和紧迫性日益突出。最重要的理由是:任务式绩效评价模式主导下的绩效评价运动,其评价质量和收益令人存疑,但投入其中的财政资金相当可观,全国而言很可能是天文数字,并且仍在增加。
如果采用需求面视角,令人存疑将变得更加可信。一般地讲,纳税人关切的目标与利益是否得到充分改善,才是“评价绩效评价收效”的普适标准。纳税人有权设问:我们为绩效评价运动支付了这么多钱,究竟获得了什么改善?公共服务的数量、质量、成本、及时性、平等性、可得性的改善(如果存在),究竟反映在何处?这样的设问,不只是纳税人的权利,也十分契合“以人民为中心”的发展理念。
另一个合理设问的视角是供给侧:公共预算和公共支出管理(PEM)绩效是否被改善?改善发生于总额绩效、配置绩效还是支出使用绩效层级上?这些改善与付出的巨额投入相称吗?
一旦从纸面话语转向正视客观真实,两类设问的答案很可能令人失望。如果情形确实如此,认真审视当前盛行的任务式绩效评价的缺陷和弱点,就变得合情合理并极具重要性紧迫性。
考虑到应对新冠疫情的冲击,更是如此。时下的中国仍在为应对三大冲击而不懈努力,这就是经济冲击、公共卫生(与相关服务)冲击,以及财政收入冲击。一方面财政压力如此之大,另一方面任务式绩效评价消耗的支出如此之多而收效存疑,两者间的鲜明对照,客观上要求把象征意义远大于实质意义的任务式绩效评价模式,尽快转换和升级为“花钱极少、收效极大”实效式绩效评价模式。巨额的财政资金将从中释放出来,转入其他优先级更高的政策领域和用途上。
更重要的是,实效式绩效评价蕴含的收益潜能大得多。当务之急,莫过于在坚定持续的政治承诺下,充分激发这些潜能。支出节约和潜能激发带来的“双重改革红利”之大,很可能远高于想象。
本文接下来将致力澄清实效式绩效评价框架和关键细节,即“3-3-3-4绩效评价”模式。
一、3项预算门槛测试:预算筹划阶段
预算筹划阶段指预算草案编制之前,确定哪些项目(和其他事项)应“纳入预算”的阶段。哪些项目纳入或不纳入预算不仅攸关错综复杂的利益取舍,也直接影响公共预算的所有功能与目标。
这个主题即预算竞争(budgetary competition),本质上由政治力量主导以引导政策方向的正确性,但技术健全性对防止“劣币驱逐良币”同样至在紧要。此类现象相当常见,既损害公众利益,也损害治理能力。狭隘利益驱使的寻租活动、腐败和舞弊,加剧了“劣币驱逐良币”的风险。
因此,把预算筹划阶段的技术健全性测试作为推进实效式绩效评价模式的起点,既是适当的也是必需的。在项目是否纳入预算主要由“领导决定”,以及“财政投资评审”机制颇不充分的现状下,尤其如此。
技术健全性的以下3项测试有助于系统降低“劣币驱逐良币的”风险:
·成本效益分析测试
即便对“领导项目”或“政治项目”而言,采用严格的、符合商业标准的成本效益分析,也有助于提前预见可预见的非意愿后果,从而作为弥足珍贵的纠错机制,在公共决策程序中发挥独特作用。该机制帮助阻止总成本大于总效益的“劣币”进入预算,但只有在被当作一项正式的门槛条件时,才有此效。
·最低费用选择法测试
即便总效益大于总成本的项目,亦需接受最低费用选择法测试,以确保那些最优解决方案(best solution)被优先选择。在“污水治理”项目中,可供选择的解决方案包括关闭污染源、化学方法的水体净化、生物方法的水体净化等。在达成相同目标的前提下,费用最低的方案应被优先选择。
·预算缺口测试
通过以上两项测试的项目,其成本(cost)、支出(expenditure)和资金也可能被人为低估或高估,从而预留缺口。伴随项目投资决策而来的配套资金缺口被系统低估的现象,在实践中相当常见,涉及项目生命周期的前期筹划、建设和运营阶段。为降低“完工即闲置”的风险,以及项目维护不及时招致服务不充分的风险,在预算筹划阶段即准确估算完工后至少1-3年的维护运营支出和相应资金来源,有必要作为“纳入预算”的重要门槛条件。同样重要的是:成本核算不实的项目不应被允许开工建设。
多年来,预算的门槛条件一直相当松弛且模糊不清,引发和加剧一系列负面后果,包括盲目投资、过度举债、项目进度缓慢、成本超支和过于频繁的预算调整。许多此类大型项目的损失浪费十分惊人。松弛而模糊的门槛条件还诱发各种形式的“折腾”,助长腐败、寻租和舞弊的系统性风险。现行的任务式绩效评价模式,对此无能为力。
二、3步骤评价:把KPI嵌入预算编制、执行、评审阶段
在预算筹划与编制阶段取得突破,正是“预算绩效管理”取得成功的关键。然而,任务式绩效评价几无事前预防(防火)功能,因为其关注点几乎全部投向事后的“救火”(木已成舟)阶段。不言而喻,对一种既成事实进行滞后的绩效评价几乎无事无补,尤其在纠错机制未被嵌入决策程序的情况下。
预算编制阶段的实效式绩效评价非常简明扼要:把3-5个KPI编入预算作为各部门的一项强制条件,其他绩效指标作为参考绩效指标(CPI)不纳入考核和问责范围。
步骤1:把3-5个KPI编入预算
就“支出使用绩效”而言,支出部门与机构把4个KPI编入预算足矣:
·评价“有支出必有投入”的经济性(economy)
投入(inputs)即部门与机构花钱从供应商得到的“物力”(商品与服务及资产)和“人力”。现代社会把大量物力和人力投入于公共组织和项目中,并由纳税人埋单。支持经济性评价的管理实践,要求部门与机构在预算草案中承诺“成本节约”目标。
·评价“有投入必有产出”的效率(efficiency)
清晰区分投入和产出非常重要。投入“被购买”,产出“被生产和被交付”。污水处理数量(吨数)即为污水处理项目的一项重要产出。区分为内部产出(撰写内部报告)和外部产出(服务对象和公众受益)也是必要的。效率评价的焦点是“进度”,包括预算执行进度和项目建设进度。
·评价“有产出必有成果”的有效性(effectiveness)
如果污水处理项目的目标成果是“80%的水质达标”,实际成果是“40%的水质达标”,那么,有效性=实际成果/目标成果=50%。
·评价“有成果必有影响”的效应(effects)
影响评价聚焦效应,通常应区分经济效应(项目对经济和就业的拉动效应)、分配效应(穷人获益的范围与程度)和生态环境效应。行为效应亦需评价。扶贫项目可能使穷人变懒,这是行为效应的例子。效应评价通常针对完工项目。
就“支出配置绩效”而言,财政部门和支出部门把3个KPI编入预算足矣:
·评价预算与政策间衔接程度的“重点支出/支出总额”
重点支出由一系列的相关法律、法规和政策文件确定,无论政府整体还是特定支出部门的支出安排,均应优先满足这些强制要求。
·评价关键服务可得性的“短板支出/支出总额”
如果某年某地区、某部门或某级政府的“必需公共卫生支出”为1000万元,实际支出为600万元,则此项服务的短板支出即资金缺口(400万元)相当于总支出的40%,这会直接影响此项服务的质量、数量、及时性、可得性和平等性。该指标编入预算有助于引导此项关切,尤其在“法定支出”严重脱离当地实际的现状下。
·评价经济分类的支出组合比率
“支出结构”(优化)的一个关键方面是三类组合比率:(1)资本支出与经常支出间的组合比率,(2)资本支出内部成分(如固定资产与在建工程)间的组合比率,(3)经常支出内部成份(如工薪支出与非工薪支出)间的组合比率。支出组合的重大失衡意味着某些支出被系统低估或高估,在实践中成为招致绩效失败的重要根源,但至今仍是绩效评价的一个重大盲点。
就“财政总额绩效”而言,财政部门把2个KPI编入预算足矣:
·偿债支出/总支出——以不超过1/12为宜
财政总额绩效的焦点是:“满足政策目标所需”(支出、收入、债务与赤字)下的财政可持续性。丧失偿债能力为财政不可持续的显著标志。该指标值若超过1/12,则表明全年支出中超过一个月的支出被用于偿债,暗示提供公共服务的能力受损。这里存在一个重要的合理预设:偿债支出优先于服务支出。
·偿债现金流/偿债支出——以100%为宜
小于100%意味着不得不考虑其他来源偿付到期债务本息。其他来源指现金偿债以外的各种来源,包括变卖资产,这是债务危机的显著信号。
编入预算的每个KPI均应确立:(1)充分性标准,(2)充分改善标准。在污水治理规划中,水质改善10%、20%或者更高才是“充分的”? 充分改善(adequate improvement)指实际改善达成充足性标准的程度。如果充分性标准是20%,实际改善只是5%,那么,改善程度仅为5%/20%=25%,明显地属于“改善不充分”。
当前绩效评价实务对“指标体系”孜孜以求,但至关紧要的充分性标准和充分改善标准依然成为重大盲点,成为预算绩效管理所依赖的“约束力”明显不足的重要原因。
步骤2:预算执行阶段自动定期跟踪3-5个KPI
在预算编制阶段采用少量KPI,有助于从根本上纠正任务式绩效评价的一个严重误区——“指标痴迷症”。“建立绩效评价指标体系”在很大程度上已经形式化为一场竞赛,直接导致绩效评价偏离正轨,招致诸多负面后果。
给定其他条件,采用的绩效评价指标越多,越易失去重点,也越易诱发成败得失及其原因方面的解释不清,还与被不断强调的“评价结果应用”相悖。基于著名的“二八定律”,“评价结果应用”聚焦仅占20%的KPI是适当的。其他负面后果包括不必要地增加大量额外的信息与成本负荷。在绩效评价运动的初期阶段,“指标痴迷症”尤其有害无益。
为增强“少量KPI取代指标痴迷症”的有效性,确保预算执行阶段“自动按月份、季度、半年度和年度跟踪KPI”至关紧要。时下的任务式绩效评价模式忽视“自动定期跟踪”KPI数据值的特殊重要性,以至“事前事中控制偏差”明显不足,当发现问题所在时,采取明智纠偏行动为时已晚。
现代信息与通讯技术(ICT)在财政管理中应用相当成熟、成本亦可承受的事实,强化了快速推进“预算执行阶段自动定期跟踪KPI”取代任务式评价的重要性,可谓万事具备、只欠东风(政治承诺和常识性的专业共识)。
步骤3:预算评审阶段考核KPI并与适当奖罚挂钩
任务式绩效评价模式明显缺失适当激励与问责机制,以至很难引导机构和公仆真正关注绩效与绩效目标,尤其难以对“自己的努力”与“组织的绩效”之间的积极关系抱有信心。可以预料,没有庞大机构与公仆队伍行为预期上的积极变化,很难设想绩效运动能够带来实质性成果。
总的来说,激励与问责机制对促进绩效评价与管理的特殊意义,目前依然被系统低估,甚至成为重大盲点,与发达国家的不懈努力形成鲜明对照。
可供选择的奖赏机制至少包括:(1)增加拨款,(2)免除报告要求,(3)增加资金的可转移性,(4)颁发奖品或奖金,(5)赋予更多职责,(6)扩大与供应商签订合同的自主权。
可供选择的惩罚机制至少包括:(1)减少拨款,(2)取消拨款,(3)限制拨款,(4)扣留拨款,(5)延缓支出,(6)冻结编制,(7)保留空缺职位,(8)
冻结租赁,(9)临时解雇,(10)提早退休,(11)减少资金可转移性,(12)取消部分职权。
需要指出的是:“评价结果与预算拨款挂钩”虽然一再被强调,但造成偏差和非意愿后果的风险很高,因而通常应予避免,尤其在早期阶段。
不妨举一个明显的例子:设想针对某个警察局的绩效评价结果表明“绩效很差”,按照“评价结果与预算拨款挂钩”的逻辑,这意味着应削减其预算拨款。但这会造成什么后果呢?很可能是绩效更差!
在这里,强调“挂钩”的认知偏差与盲点在于:把“需要花多少钱”(支出需求评估),直接混同于绩效评价。实际上,这是两个独立的问题,必须被分开考虑:前者由政策重要性决定,通常不应受绩效评价结果的影响。易言之,即使某个组织、某项服务或项目的绩效评价结果显示绩效很差,只要在政策上具有显著的重要性,其预算拨款即应予以确保甚至增加。
三、3层级评价:总额、配置与运营绩效
预算绩效评价的基础理论,根植于当代公共支出管理(PEM)文献鉴别的核心财政绩效的三个层级:总额财政纪律、配置有效性和运营绩效。指标痴迷症的形成与强化,源于对这三个核心层级及其逻辑关系缺失认知。
可以预料,只要这三个逻辑层级的财政绩效未得到专业认知并形成常识性共识,从根本上扭转任务式绩效评价并升级为实效式绩效评价,即便是可能的也是困难的。
因此,这里有必要概括一般结论:聚焦总额、配置和运营这三个核心层级的绩效时,实效式绩效评价才可能被牢固确立;在此基础上,扩展到“财政风险评价”和“财政透明度评价”也是适当的和必要的。
首要的是评价总额财政绩效:总的支出、收入、债务和赤字(盈余)水平的合意性。只有在一并满足(1)与达成政策目标的需求相一致和(2)财政可持续性的意义上,总额财政绩效才是合意的。
总额财政绩效作为“首要绩效”的优先地位,根植于“硬预算约束”这一公共财政活动的先决条件,理论渊源可追溯至“公地悲剧”:对所有有资格“索取”财政资金的预算单位和从中受益的群体而言,财政资金都是免费午餐,没有人具有节制索取的合理动机,由此诱发“共同崩溃”。
尽管如此,总额财政纪律典型地属于“攸关所有人利益、但所有人都甚少关注”的一类棘手问题。主要由于这一原因,由财政部门担负起评价总额绩效的专属职责是必要的和适当的。
总额财政绩效的优先地位还与以下事实相连:总额财政纪律直接联结作为发展目标的“稳定”目标。评价总额绩效,本质上就是评价公共部门为经济社会稳定发展创造中长期财政持续性的能力和意愿。
配置绩效(有效性)为第二个核心层级,满足“平等”(财政蛋糕公平分享)和“配置效率”(公共回报)这两项条件。两者结合为“政策重点”和“优先性排序”,作为支出结构优化的一项关键含义。理论上,政策重点和优先性取决于社会偏好与满足这些偏好的成本。
与总额绩效评价职责专属财政部门不同,配置绩效评价职责由财政部门和支出部门分担:财政部门负责评价政府整体的支出配置绩效,支出部门负责评价特定政策(如农业和教育)领域的配置绩效。
第三个核心层级是财政运营绩效(operational performance),也称支出“使用”绩效,焦点是支出部门与机构以合理成本交付满足公众偏好的公共服务,与“服务型政府”紧密相连。
以上三个核心层级的逻辑关系亦需被清晰认知:总额绩效联结一般发展政策的“稳定”目标,其地位和优先级高于配置绩效和运营绩效;配置绩效联结一般发展政策的“平等”目标和“增长”目标(蛋糕做大),其地位和优先级高于运营绩效;运营绩效联结一般发展政策的“增长”目标,相对于配置绩效和总额绩效而言,其地位是从属性的。
这种正确的逻辑关系在任务式绩效评价中被颠倒过来:运营绩效评价几乎被当作“绩效评价”的同义词;相比之下,总额绩效和配置绩效在很大程度上不受重视,甚至成为盲点。
四、4项参与式评价导入预算过程
参与式绩效评价与协商民主概念相连,旨在将公众的声音导入评价领域。十九届四中全会《决定》规定:“构建程序合理、环节完整的协商民主体系,完善协商于决策之前和决策实施之中的落实机制,丰富有事好商量、众人的事情由众人商量的制度化实践。”
以此言之,实效式绩效评价应涵盖预算过程的四项参与式评价。
参与式评价1:评价公众在预算编制阶段的需求表达
在此阶段,支出部门与机构编制预算草案,编制质量直接影响随后的预算审查和执行质量,最终影响公共服务数量、质量、成本、及时性、可及性和平等性。因此,把公民需求表达与政策目标相结合,确立为预算编制的中心任务很重要,而“预算目标”以产出(outputs)目标表达最为适当,比如就业规划的“培训人数”和“就业率提高百分比”。这些产出类别应在预算草案中予以鉴别,确保可核实性和公开性,使民众能看清“上面的钱”如何帮助改进他们关心的公共服务。
需求表达制度旨在确保公众对服务需求的表达权。公众表达的需求信息连同政策目标被转换为具体的产出目标,进而形成相应的支出安排。操作机制是:地方人大代表应深入、深入社区、深入民众采集这些信息,或者在预算听证等直接参与机制中保持对公众意见和建议的详细记录,并协调公众与支出机构对支出安排的意见和建议,以确保预算草案中有所回应。
参与式评价2:评价公众在预算草案审查阶段的方案反映
此阶段的焦点是审查支出分配方案,主要涉及服务(产出)交付的数量、类别和优先性排序,分为两个关键方面。首先是实际支出方案,即关于花多少钱、钱花在何处、需要实现哪此产出目标的财务安排;其次是非财务层面的技术方案,比如引导公民遵循“正确垃圾分类”应设计哪些具体活动,包括宣传、监督和奖罚等。
把预算目标转换为支出方案和解决方案的过程相当复杂,其中许多依赖专业技术,并且属于典型的机构内部运作。正因为如此,促进当地民众对两类方案的意见表达很重要。许多情况下,公民对如何以最省钱和最有效的方案解决问题,往往比官员甚至专业人士了解更多。
参与式评价3:评价公众的预算执行评论
评价内容包括:公众是否把评论撰写为预算执行报告,提交人大有关机构和相关的支出责任部门,并在规定的媒体或网站上公开。评论既针对预算执行规则,也针对预算执行过程和实际效果,可望作为减少形式主义和官僚主义的有效机制发挥作用,从而促进预算执行的质量。
参与式评价4:评价预算评审阶段的公众抱怨与救济
预算执行结果的关键方面是公共服务绩效。绩效管理的终极功能是政策与服务充分持续地惠及公众,公共支出的价值和公共治理的主要目的也在这里。
此阶段的评价关注公众表达抱怨并要求救济的权利,以及把预算执行的公民评价报告提交给审计机关的权利。如果审计结果确认服务交付绩效不佳,并且主要原因在于负责相关服务交付的部门和官员没有采取适当的行动解决公民抱怨,那么,审查机关和公民可以要求这些部门与官员予以适当救济。
结语
本文建构的“3-3-3-4实效绩效评价”模式,可望作为任务式绩效评价模式的最优替代方案,带来可观的“改革红利”。本质上讲,该模式非常简洁、切中要害且极易实施。在伴随坚定持续的政治承诺和常识基础上的专业性共识时,可实施性和巨大的潜能激发将得到有力保证。