大连海关基层首创“数智筛”技术取得进口商品税收风险智能筛查新突破
发稿人:发布时间:2023-11-06
在科技司、关税司指导下,大连海关依托“海关商品信息智能应用创新实验室”和“关税新技术应用工作室”的研究课题,深入实践改革和科技“双轮驱动”、业务技术一体化的科研创新模式,将人工智能和大数据新技术与商品涉税风险防控场景深度融合,取得阶段性成果,首创进口商品税收风险智能筛查工具“数智筛”。
一、研发税收风险多维度筛查的新工具
“数智筛”通过智能识别申报文本及文本中的数值,提取归纳出申报商品的关键特征,并将具有相同特征的商品申报记录进行聚合分析,对比分组形式给出归类错误、价格异常、伪瞒报原产地等风险线索。其主要创新内容包括:
一是申报要素的智能提取。根据商品申报文本信息是由若干个申报要素组合而成的“半自然语言”这一特点,从源头入手研究税则商品及品目注释,重新梳理商品申报要素,累计分析上万种申报要素表达形式,并以此为基础设计算法逻辑,从申报文本中自动拆分和提取申报要素。针对申报要素中的规格尺寸、成分含量等错综复杂的数值、计量单位、数学符号等内容,定制频带滤波模型,按税则标准进行临界值判断和智能转换,将申报文本转化为按业务规则精确表达的数字化模型。
二是商品特征的智能识别。组织业务专家,以商品历史申报记录中的商品品名、品牌、用途等商品特征信息为攻关对象,结合相关商品专业知识,标注商品的专用名、通用名、学名、外文名、同义词、上位词、下位词等信息,累计完成近100万条历史申报记录的人工标注。依托人工标注形成的商品特征词库,运用自然语言处理技术,开发设计能够自动完成海量报关单数据清洗、过滤、转换、匹配的标注程序,实现对商品关键特征信息的智能识别,显著降低了申报文本的不同表达、品名的不同表述乃至文本中的错别字对商品识别的干扰。
三是风险线索的智能筛查。“数智筛”提供“税差筛”、“价格筛”、“产地筛”三种工具,支持业务人员灵活设置参数对归类、价格、原产地等税收征管要素实施差异比对。根据相同特征商品归入不同税率税号产生的税差,筛查归类风险;通过动态概率分布计算“合理”价格,判断具体申报价格是否偏离合理范围,筛查价格风险;根据不同国别地区进口相同商品的征税数额差异,筛查原产地风险。
二、实现税收风险防控“多准快”的新成效
与传统的参数、指令、模型工具相比,“数智筛”在税收风险筛查方面表现出多、准、快的特色,优势明显。
一是风险线索检出量多。“数智筛”不预设“风险点”,而是将商品申报信息与大数据池中具有相同特征的所有申报记录进行比较。报关单数据量越大,特别是多口岸、多个纳税人有进口记录的商品数据越多,其风险线索检出数量也越多。例如,在相同参数条件下,同样以大连海关的税收风险为分析目标,分析两年的数据,与只分析一年的数据相比,风险检出率可提升150%;有部分其他关区的数据参与计算,与仅以大连关区数据参与计算相比,风险检出率可提升100%。
二是风险筛查有效率高。由于“数智筛”提高了商品识别的准确性,其输出的税收风险线索具有较高的研判价值。2023年3月,“数智筛”在由科技司、关税司、风控司共同组织的机电类商品的业务验证测试中,对归类、原产地和价格风险的筛查有效率分别达到71.4%、42.1%和37.5%。
三是系统计算速度快。“数智筛”采用内存计算方法,不依赖数据库性能,解决了传统算法的数据库瓶颈等问题,在相同量级的数据规模下计算速度优于大多数主流算法模型,即使在普通的PC服务器上也能获得优异的性能,千万级数据量的分析可在数秒内完成。
三、树立税收风险管理数智化的新标杆
“数智筛”创新成果契合智慧海关“数字化转型”“智能化升级”的建设思路。
一是实践了“管理要素数字化”。“数智筛”紧紧围绕商品文本申报信息这一税收征管领域管理要素,通过大量分析商品申报要素表达形式,累积形成了基于申报要素的机电和动植类商品结构化、标准化的底层数据模型和编码,为大数据、人工智能新技术在进口商品税收风险智能筛查方面的应用创造了条件,是海关管理要素数字化的有益实践。
二是实现了“知识经验数字化”。“数智筛”不仅通过业务专家对商品历史申报数据的人工标注,成功将专家知识经验转化为数字化的商品特征词库,而且进一步引入机器学习技术,搭建人机交互训练模型,由业务专家介入评估系统自动标注的结果,准确的予以正面反馈,错误的予以负面反馈,持续对模型进行监督训练,通过这一循环过程,使系统在迭代升级中逐渐具备专家智慧,是“知识经验数字化”的成功范例。
三是探索了“作业管理智能化”。“数智筛”研发之前,大连海关投入50人历时两年才完成100万条历史报关单数据的人工标注,“数智筛”最新版本1秒内即可完成相同量级数据的自动标注,并保持了较高的准确率。在此基础上,业务人员只需设定参数,系统执行智能分析比对、输出各类风险线索,较大幅度提高了工作效能,能够在一定程度上缓解税收风险防控人力资源不足问题。
2023年6月,关税司将“数智筛”列入新版税管中心作业平台应用建设计划,标志着“数智筛”的成果转化应用进入了快车道。下一步,大连海关将持续致力于基层科技创新,深入新技术探索与攻关,拓展新领域创新与实践,为推进“智慧海关”建设,全面构建安全、智能的科技应用新生态贡献力量。
舟山海关宣