解析CIFS| 华夏银行王彦博:商业银行基于Group Testing技术创新的图像识别应用研究
2024-11-08
尊敬的各位领导、各位专家、嘉宾朋友们:
大家上午好!非常荣幸参加中国银行数智峰会,也借这个好平台给大家汇报一下我们过去一段时间做的一些工作。我今天分享的题目是“商业银行基于Group Testing技术创新的图像识别应用研究”,这里面有几个关键词:
首先,我们是面向商业银行做的应用研究工作;
第二,这项工作主要聚焦于计算机视觉图像识别技术;
第三,这是基于Group Testing(群组检测)概念做的创新性工作。下面进入到具体分享,内容主要分为三个方面:
一是商业银行计算机视觉图像识别技术应用情况;
二是基于Group Testing的目标检测技术方案,主要介绍Group Testing的概念以及基于Group Testing我们在图像目标检测方面形成了什么样的方案;
三是商业银行群组目标检测应用实证分析,实证表明群组目标检测(Group Testing)方法在商业银行相关业务场景具有应用优势。
01商业银行计算机视觉图像识别技术应用
2023年5月,习近平总书记在中央财经委员会第一次会议上明确指出,要把握数字化、网络化、智能化方向,推动制造业、服务业、农业等产业数字化;推动互联网、大数据、人工智能同产业深度融合。今年《政府工作报告》上提出,要加快发展新质生产力,并强调要“深化大数据、人工智能等研发应用”。人民银行《金融科技发展规划(2022-2025年)》明确提出,要抓住全球人工智能发展新机遇,以人为本全面推进智能技术在金融领域的深化应用。我们看到人工智能在金融领域已经进入到深化应用的阶段。
计算机视觉(Computer Vision)是人工智能领域重要分支,图像识别又是计算机视觉领域的重要研究方向,在商业银行众多业务场景已经得到广泛应用。比如,人脸识别作为图像识别的一个具体技术,在移动支付、信贷业务等方面已经有了很好的应用;OCR(光学符号识别)相关工作在银行证照、票据等方面的应用也很广泛。今天我们聚焦于目标检测(Object Detection)技术应用。目标检测在图像识别工作的基础上对物体进行定位,给出物体在图像中的位置和尺寸大小。这项技术在银行中的应用包括防伪鉴别、AI换脸识别、背景相似度分析、智能风控等。在智能风控场景,对于企业提供给银行作为押品的相关物品,通过5G物联网技术对仓储物流进行7×24小时连续监测,利用图像识别相关技术对仓库的货物进出、人员入库作业等行为进行有效监管,提升信贷业务风险管理智能化水平。
目标检测技术经历了不断迭代发展,传统技术是以人工设计特征提取的方法与经典机器学习技术相结合,但存在着一些问题,比如:对复杂场景适应性较弱,识别准确率较低;手工设计特征工作量较大,检测效率较低。当前,我们看到一些运用深度学习的目标检测技术方法,其中非常有代表性的就是YOLO算法系列,运用深度学习有效提升了模型的识别准确性,同时在易用性方面有很好的表现。
目标检测作为一种图像识别任务,需要不断提升模型训练和测试资源利用效率及速度,因为深度神经网络使模型变得越来越复杂,模型训练和测试推理都很耗资源。目前的提升方案包括三类:
一是在计算方法(Method)层面,比如:对网络结构做优化或对参数配置做一些改进;
二是在数据算料(Material)层面,比如:做特征压缩或做一些特征增强;
三是在算力设备(Machine)层面,比如:采用分布式计算框架或使用一些高效硬件设备来加速运算。
我们提出在机制设计(Mechanism)层面做改进,形成“4M”方法论框架。实际上,机器学习和模式识别类任务在测试推理时一直采用逐一检测(One-by-one Testing)的机制,将测试数据集的每一个样本逐一通过模型,最终得到AUC、KS、查全率、查准率等模型评估指标。我们现在要改变这个机制,不是让每一个样本逐一通过,而是要用群组检测的方法把多个样本拼接起来一起通过,由此来节省时间、提高效率。
02基于Group Testing的目标检测技术方案
群组检测(Group Testing)是1943年提出的概念,最早应用于第二次世界大战,当时美国征召了大量士兵入伍,美军希望对士兵做血液检测,以发现士兵是不是携带某种传染病病毒,因为每个士兵逐一做血液检测成本高昂、效率低下,因此提出群组检测方案。新冠疫情期间,大家采用“十混一”做核酸检测就是用了这样的方法。
我们尝试把核酸检测或血液检测的Group Testing方法用到机器学习和模式识别工作中。进一步来看,假设有1000张图片,这里面可能有20张是有问题的图片,我们要把它们检测出来。比如,我们按照每组20张图片拼成一张大图,我们可以拼出50张大图,已知有20张小图是要检测的目标,那么最糟的情况就是这20张小图分布在50张大图的20张大图中,而另外30张大图(包含600张小图)无论如何都是应该快速排除的,这就是为什么这个新方案能够节省时间和计算资源。
03商业银行群体目标检测应用实证分析
我们对企业客户用作贷款抵押物的生产设备进行监测,判断图像中是否有人员擅自闯入设备作业区域。我们对999张图像进行识别,其中有20张图像是有人员的,979张图像是没有人员的,我们按照三张小图拼接成一张大图,形成了333张大图。图像识别目标检测模型是采用YOLOv5预先训练好的。我们采用AUC、KS、准确率、查全率、查准率指标进行模型评估。从实证分析结果来看:逐一检测999张图片的AUC是0.9842,而我们用“三混一”群组检测得到的AUC则提升到了0.9959;KS也有明显提升,从0.9214提升到了0.9847;准确率从0.938提升到了0.984;查全率是一致的,都是0.95;查准率从0.2375提升到了0.5588。最重要的是时间节省了一半:999张图片逐一检测需要140秒完成;而我们用“三混一”群组检测只需要60秒,再加上图片合并拼接所用的时间是10秒,总计耗时为70秒,是逐一检测所需时间的50%。
最后做个总结,我们将核酸检测或血液检测所使用的Group Testing群组检测方法引入到了机器学习和模式识别类任务上,使人工智能模型在推理测试环节的时间大幅度缩减,有效节省了计算能耗,对人工智能向绿色低碳发展有一定的借鉴意义。以上是我分享的内容,谢谢大家!