数据报告
审批准确率分析报告
基于对 22,241 张真实报销单据的复盘数据
数据来源与方法论
样本构成
- • 样本量:22,241 张真实报销单据
- • 时间跨度:2024年7月 - 2025年10月
- • 企业数量:52 家样本企业
- • 抽样规则:每个企业至少授权 1 个月范围内,按提交时间连续 200 条样本(避免跨时间抽样带来的偏差)
- • 单据类型:差旅、日常费用、招待、办公用品采购 4 个场景
评估标准
准确率 = "通过/不通过决策正确"的比例
由客户财务团队与Seal AI数据团队共同复盘并定义最终标准答案,对比人工审核与 Seal AI 审核结果。
详细数据表
| 发票数量 | 10条以下 | 10条以上 | ||
|---|---|---|---|---|
| 准确数 | 不准确数 | 准确数 | 不准确数 | |
| 1 张发票 | 1,382 | 107 | 151 | 72 |
| 2 张发票 | 2,678 | 436 | 321 | 294 |
| 3 张发票 | 4,892 | 1,235 | 1,294 | 1,593 |
| 4 张发票 | 876 | 339 | 709 | 1,061 |
| 5-10 张发票 | 743 | 439 | 1,014 | 2,122 |
| >10 张发票 | 83 | 6 | 91 | 303 |
注:大于 10 张发票 + 10 条以下审核点的准确率异常高,经排查,准确数中有 74 条来自同一个企业,均为同一个月的加班餐费,该企业加班餐费由各部门对应的财务 BP 统一收集提交。
数据脱敏
所有数据已脱敏处理,仅保留统计特征,不涉及任何企业或个人的敏感信息。
研究局限性
- • 因数据脱敏缘故,我们仅对单据数量进行了分析,无法评估金额口径的准确率;
- • 样本集中在“3发票”和“复杂规则”较多的场景,可能代表了中大型企业的痛点,对于只有1-2张发票的小微报销场景,人工审核的准确率依然高达80%-90%。
核心发现
为何人工准确率仅为 64%?
我们必须首先强调,这并非财务人员不够专业,恰恰相反,在共同复盘分析本报告时,我们得到了来自客户财务部门的真诚、专业的支持。在这个过程中,他们展现了出色的职业素养与优秀的专业能力。
但我们也要看到,平均每个财务人员,每天要连续处理 50-80 张单据,这意味着平均每张单据只有 6-10 分钟审核时间。平均每张单据有3.7张发票、涉及7.9个审核要点,这意味着留给财务人员审查每个要点的时间只有12-20秒。要想在如此高强度的处理作业中不犯错误,是不现实的。
注:本数据来自被调研企业的同期、同单据类型的全量数据,是得出准确率数据的样本集的超集。
通过这两组维度的对比,我们可以更直观的看到随着发票数量增加,给财务人员带来的认知负荷(Cognitive Load)所导致的准确率下降。以及当规则≥10条时,准确率直接断崖式跌破40%。人类的工作记忆(Working Memory)通常只能同时处理7±2个组块。当审核要点达到10个以上时,审核人员必须频繁查阅文档或依赖模糊记忆,出错率必然飙升。
人工审核准确率 vs 发票数量
发票数量增加后,准确率呈断崖式下跌
人工审核准确率 vs 规则数量
审核规则数量达到 10 条后,准确率骤降至 39.7%
此外,我们还发现存在审核制度与实际执行情况不符带来的偏差。如某华南快消品牌,在修订 7 次规则后,样本数据的人工审核准确率从 87% "上升" 到 97%(n=300)。但其实这个过程中审核结果没变化,而是评判标准(审核制度)发生变化了。通过定性分析,我们发现主要有 2 种情况:
- •一些审核标准事实上已经发生变化,但是并未及时反映到制度上;
- •一些审核标准过于严格(例如强制要求报销日期必须填写当月最后一天),在实际执行时财务部门会选择适当"放水"(只要月份正确即放行)。
Seal AI 如何达到 94.7% 准确率?
人工审核局限
- ×工作时间:8小时/天,状态波动
- ×处理速度:6-10分钟处理一张单据
- ×规则记忆:有限,易遗忘
- ×情绪影响:存在人际顾虑
- ×持续性:疲劳导致准确率下降
Seal AI 优势
- ✓工作时间:7×24小时不间断
- ✓处理速度:1分钟完成上千个风险特征扫描
- ✓规则记忆:永不遗忘,实时更新
- ✓客观公正:无人际顾虑(空船效应)
- ✓持续性:准确率不随时间衰减
