当下人工智能(AI)应用逐渐深入各行各业,如何依托全面数字化电子发票推广赋能企业开票,将传统需要人工判别的开票内容,转变为规则自动化、判别智能化的AI链路数智化开票,值得关注和探索。
人工开票面临“选码”难题
随着经济的快速发展,新兴产品快速涌现。传统开票系统依赖开票员人工选取每个商品的开票信息,存在个体主观认知偏差且人工处理速度较慢等问题,难以适应复杂的行业特性与政策变迁。
商品编码、税目及税率的选择需同时匹配国家税务总局、国家市场监督管理总局及海关总署颁布的《商品和服务税收分类编码表》《全国主要产品分类与代码》《商品名称及编码协调制度》等多套编码体系。
以常见的薯片为例,因工艺不同,在税收分类编码中分为两个不同的条目。原切薯片的税收分类编码条目为“焙烤松脆食品”(编码103020105),对应中国物品编码中心产品通用名“原切马铃薯片”;薯泥压制薯片的税收分类编码条目为“膨化食品”(编码103020104),对应中国物品编码中心产品通用名“膨化食品”。有的财务人员未接触过生产线,见“薯片”即选“膨化食品”,将不同工艺混为一谈,导致选错、用错、开错发票。
一方面,目前的商品编码体系较多,有待统一;另一方面,编码设计滞后于新业态的发展速度。一些新兴产品、复合型商品等没有与之完全对应的条目,存在“无码可选”的问题。有的企业“自主创标”,根据自有业务管理便利创建内部类目,无法与现有商品编码直接对应。有的电商平台自建分类标签,对部分携带附加服务属性的复合型商品等,开票选码依赖电商平台财务人员主观判断,不同电商平台开具发票信息可能不同。
当前人工智能同样可能误判商品信息
全面数字化的电子发票推广后,纳税人可将原税控设备中的客户和商品编码等信息批量导入电子发票服务平台,通过特有名词、关键词匹配的线性逻辑实现快速开票,解决了人工选码效率低、跨平台数据割裂等问题。但是商品编码体系较多、对复合商品的赋码标准缺乏等影响因素依然存在。
笔者认为,可探索“数据获取—语义理解—多维校验—动态优化”的AI全流程链路开票模式,以更好应对复杂开票场景。依托AI语义处理能力,理解复杂的业务并简单描述,再将其自动匹配到最接近的编码,结合业务合同、支付记录等多维数据交叉校验,不断优化匹配规则。
从目前来看,实现链路开票尚存待解难题。
数据质量有待加强。数据校验和机器学习对数据质量要求较高,目前纳税人自行填写商品信息开票的模式让开票行为自由度更高,一定程度上也导致了有效数据与无效数据掺杂的情况。例如,有的物业管理公司兼营物业管理和停车服务,开票时惯性思维选择“现代服务”税目,适用6%的增值税率,未将停车服务对应的销售数据正确开具为不动产经营租赁发票,适用9%的增值税率。这使得日常税收征管中预警模型对风险识别的误判率上升,需要人工耗费大量精力追溯数据链路、校准算法逻辑。自由填报数据后失真的错误数据可能“污染”AI模型,AI可能将错误模式视为合理行为,导致错误推荐编码、税率错配等。
AI应用的技术水平也有待加强。当前AI对非结构化数据解析能力有限,开票项目名称中出现多种规格名、品牌名等数据时,会对商品适用税率判断造成干扰。如开票项目名称为“柚子味鱼排”,AI可能误判商品为“柚子”。同时,在诸如混合销售或减免税政策等复杂业务场景下,AI误判率增加,需要人工介入复核。
此外,各个行业的商品分类逻辑差异显著,单一AI模型难以兼顾各行业特征,每个垂直领域模型调试都需要耗费大量时间,并且随着行业发展、政策变动等因素还需要模型能够快速迭代响应,调试成本较高。
“链路开票”落地的解决方案设计
针对上述问题,笔者建议,进一步优化商品编码,升级税率、征收率的智能推荐系统等,推动实现销售货物或劳务过程的争议前置、校验前移、标准先定、链路闭环。
构建商品全生命周期溯源体系。在商品编码与《商品和服务税收分类编码表》《全国主要产品分类与代码》等现有编码规则匹配之外,拓展匹配中国物品编码中心的GS1编码数据,构建开放共享的商品服务编码知识库。可通过AI自动生成基础词条,匹配对应商品,根据行业标准、优惠政策等变化及时更新对应词条,供纳税人和税务人实时查询使用。通过应用程序编程接口实时调取商品名称、规格、材质等基础信息,依托GS1编码基础标识体系,为每个商品生成独有的“税收数字身份证”,保证企业开具发票时可以“识码寻码”,通过单个商品唯一的“税收数字身份证”选择与之对应且正确的商品编码和税率、征收率。通过管理商品“税收数字身份证”,获取相关商品的流通路径和销售情况,为行业趋势和经济分析提供数据支撑。
推动分类体系规范融合。基于增值税暂行条例的服务注释条款,探索构建“业务场景—服务类型—编码税率”模型。在数电发票开票平台通过自然语言处理技术解析业务合同和商品关键词,根据关联属性强、中、弱三层清分处理。对于强关联的关键词自动关联匹配相应商品编码和税率,初步清分出标准化商品征收信息。对于中、弱关联的商品做好人工复核标记,提示转入人工确认环节,可人工一键处理的简单复核业务在确认后更新开票模型知识库。同时,由税务与行业领域的专家代表组成编审委员会,对清分后无法判别的弱关联争议条目进行人工裁定,将可能存在的争议环节前置,提供企业异议申诉渠道,会商解决后定期更新商品服务编码知识库,通过动态增补尽量实现所有货物服务商品代码、名称及税率、征收率的正列举和更新维护。
打造智能开票精准智控系统。探索扫码开票、人工预填开票和图像识别开票三类开票模式,提升企业规范开票效能。针对已有商品“税收数字身份证”的规范化商品,通过扫描对应的商品“税收数字身份证”码,自动匹配对应商品税收分类编码和税率开具发票,并根据购买方付款的账户信息自动发送给购买方。在开票环节,依托数电发票提高开票效率,同时推进智慧税务场景建设辅助校正开票准确率,实现商品流通全链路自动化“无感”开票。
通过“系统智能化预填+人工校验修正”的人机协同模式,自动获取纳税人前期人工预填数据,根据业务类型自动预填必填项目,纳税人仅需人工核对补充,解决标准化系统难以覆盖复杂交易场景的问题,同时通过人工修正结果反哺系统迭代开票监测,双向反馈降低误开率。开票系统增设描述词过滤模型,自动屏蔽“柚子味”“芝士味”等风味描述词,聚焦核心商品词预填,当人工核对时弹出提示框“检测到风味描述词,请确认实际商品是否为鱼排?”确认即开票,修正即通过人工修正补充商品特征描述,训练模型提示预填准确度。
对未纳入GS1编码体系的非标商品,如定制商品、手工制品等,可以采用“图像特征提取+语义分析”技术识别商品外观、结构,智能生成推荐编码,并按照对应税率开具相应发票。