导读:当前,世界百年未有之大变局加速演进,改革发展稳定任务之重、矛盾风险挑战之多、治国理政考验之大都前所未有,给我国国家安全体系和能力现代化建设带来新的挑战。与此同时,以人工智能、大模型为代表的新一轮科技革命和产业变革加速演进,公安科技创新发展提质升级面临前所未有的历史机遇。
本文介绍了北京清思智能科技有限公司(原:北京瑞莱智安科技有限公司)运用人工智能和大模型技术,突破计算机视觉领域瓶颈、实现视频智能化能力大幅跃迁、提升视频智能化应用水平的一些思考。
一 “专业+机制+大数据”的新型警务运行模式全面提速
2023年5月29日,全国公安工作会议指出:将现代科技手段与治理实践深度融合,公安机关把大数据智能化建设作为科技兴警的重要抓手,把大数据作为推动公安工作创新发展的强大引擎、培育战斗力生成新的增长点,加快推进警务工作数据化、智能化建设,全面助推公安工作质量变革、效率变革、动力变革。
面对新形势、新任务对公安工作提出的新要求、新挑战,各级公安机关已经充分认识到加快形成和提升新质公安战斗力的内在要求,并将牢牢把握新征程建立完善新型警务运行模式的着力点,以做专警种为关键、以运行机制为牵引、以大数据赋能为支撑,大力推进公安智能化建设应用,加快形成和提升新质公安战斗力。同时伴随着人工智能技术的不断成熟,公安机关也要进一步向“科技智能”聚焦发力,聚焦最前沿科技,以突破关键核心技术为重点,借助大数据、人工智能、大模型等前沿技术,推进公共安全治理基础性、战略性、前沿性技术研发布局,加快推进科技手段与警务实战融合应用,努力打造新质公安战斗力重要增长极。
二 深度挖掘视频全要素信息,激活海量沉睡数据价值
视频数据不仅是公安工作中不可或缺的一部分,更是提升公安工作效率和效能的关键因素。通过视频数据,公安机关能够实现对公共安全和社会治安的精准监控和管理,从而快速响应和精准指挥,有效预防和打击犯罪。?
视频数据具备数据规模庞大、信息内容丰富、时效性要求高等特点,蕴含巨大的实战价值。因此,全面挖掘并发挥视频数据潜力,是提升新质公安战斗力的关键举措。
过去10年国内,视频基础设施的大规模建设已经取得长足发展,视频监控数量、覆盖度、清晰度、联网率等条件均已具备,为视频智能应用打下了稳固基础。同时,随着人工智能技术大力发展,以计算机视觉为基础的“清晰”人脸识别技术逐渐成熟,被广泛应用于线索发现、目标定位、目标拦截、固定证据等场景,服务于治安、刑侦、禁毒、反恐和出入境等领域,取得了显著成效。
但随着公安业务需求不断变化和视频智能应用的不断深入,社会治安防控的重心已经从实时预警及事后处置,转变为对敏感人员、敏感行为的事前预测、预防、预警。事前管控需求对海量视频监控全面利旧以及视频数据深度挖掘提出了更高要求,,也对人工智能技术提出了巨大挑战,体现在以下几个方面:
挑战一:如何充分利旧、激活存量视频摄像机。城市视频监控已基本实现了重点区域和场所的全面覆盖,但目前城市视频监控仅有10%实现了基础智能应用,仍有90%视频监控仍处于人工调阅监看的传统使用模式,持续消耗大量人力,存在大规模智能“盲区”,难以将“视频数据”转化为强大的新质生产力。而采用智能摄像机替换现有存量普通视频摄像机的模式,又带来建设成本高、应用效果差等问题,无法从根源上解决“视频数据”智能化应用的问题,因此如何充分利旧、激活大规模存量视频摄像机,充分挖掘视频数据价值,是各地公安机关面临的首要难题。
挑战二:如何突破清晰人脸识别算法技术瓶颈。人脸识别技术是当前视频智能化的主要支撑技术,“清晰”人脸条件下的布控、检索虽然有效推动了“智慧警务”的发展。但在城市全量视频监控中,90%以上的数据均为低清、低质量数据,其中不乏大量的逆光、遮挡、夜间低清、大人流量、换装等复杂场景。而传统计算机视觉算法对“清晰人脸”高度依赖,而低清低质量数据无法准确识别和高精度应用。因此,人工智能算法如何突破清晰人脸识别算法技术瓶颈,是视频智能化大规模应用必须攻克的难题。
挑战三:如何提升视频智能化应用实战能力。现阶段利用人脸识别技术在少量特定点位实现目标的发现和定位,与公安业务要求依靠视频数据实现目标智能发现、目标智能追踪、敏感行为预警的目标存在较大差距。随着实战方向的拓展和转变,目标事后布控追踪转变为事前预测、预防和预警成为首要目标。因此,需要利用新一代人工智能技术实现对海量视频图像数据进行态势感知和智能分析,从中发现行为异常、挖掘潜在风险,并在事件发生前进行及时处置。可见,传统的智能应用已经难以适应新形势下的警务实战需求,如何通过人工智能及大模型技术实现对于风险的事前预警已经成为当前视频智能化实战应用的重点。
挑战四:视频线索规模巨大,难以深度挖掘。在海量视频图像线索中,存在大量的复杂动作、敏感行为、异常着装、异常样貌、人群关系等丰富的社会信息。通过现有视频结构化系统难以对视频数据中蕴含的线索进行全场景、全要素、全语义进行智能的关联串并和有效挖掘。而利用传统算法训练模式解决泛化场景识别问题,需要大量的人工标注的训练数据,训练周期长,定制成本高,因如何能够快速低成本的实现视频泛化目标线索挖掘,也是视频智能化应用需要突破的一个技术难题。
三 行人再识别ReID2.0技术,突破视频智能应用边界
为解决实战场景中跨镜目标智能追踪问题,清思智能公司首席科学家、清华大学王生进教授,提出 Part-based Convolutional Baseline(PCB)算法 ,首次将行人再识别ReID技术的准确率提升至90%以上,达到了可商用水平。这一突破性的成果,极大地提高了ReID技术在实际应用中的可靠性和有效性。在现实世界中,行人再识别(ReID)面临诸多复杂情况,远比单场景下ReID的应用要苛刻。例如,行人在移动过程中可能会被障碍物体或人遮挡,导致识别系统无法获取完整其图像。再如,阴雨天或夜晚等光照条件不足条件,也会对图像的清晰度和识别准确性造成影响。为解决低清、低质量视频数据要素的应用难题,王生进教授创新性的提出了多模态REID技术,标志着行人再识别进入REID 2.0阶段。清思智能基于多模态REID技术,成功研发多种算法来提高ReID在复杂场景下的准确性和鲁棒性,显著提高了ReID系统在复杂环境下的识别能力,使其更加适应现实世界的需求。该技术广泛应用于社会治安防控业务,突破了传统人脸识别算法应用瓶颈,带动传统视频监控大规模利旧,奠定海量低清、低质量视频数据实战应用的基础,大幅提升视频数据实战应用价值。
四 从实战需求出发,打造大模型时代视频应用新方向
随着大模型技术横空出世,如何立足实战,将大模型技术深入赋能公安视频智能化,支撑公安视频侦查工作是重要探索方向。在线索挖掘方向,充分利用多模态大模型技术的泛化识别能力,实现了对视频画面中大量潜在线索的全场景、多要素、多维度分析和检索,极大的提升了公安对于视频线索挖掘的全面性、广泛性和时效性能力,为后续的警情处理提供了有力的支持;在人员追踪方向,通过充分利旧各类视频监控采集的全量人像数据,可以对犯罪嫌疑人进行高精度、高密度、高质量的活动轨迹刻画,为公安机关在案件侦破当中提供强大的轨迹追踪和证据固定能力;在智能分析方向,基于对人脸、人体、非机动车、车辆等多要素数据的全自动智能化融合分析,为公安实战分析研判构建线索丰富的一站式智能应用能力,同时利用大模型技术的分析推理能力,实现对于异常行为进行及时预警,减轻一线民警对于“人盯人式”的常态化监管压力。
综上,在大模型技术蓬勃发展的时代背景下,视频智能化应用正以前所未有的速度推进公安工作的现代化进程。这一变革不仅将大幅提升公安视频智能化实战应用的整体水平,更将广泛而深刻地渗透到治安管控、案件侦破、反恐维稳、民生服务等众多业务场景中,更好的服务日常警务工作,实践“向科技要警力”的“科技兴警”大战略。
结束语
科技引领,赋能强警之路。随着以大模型技术为代表的人工智能技术的突破,秉承技术创新理念,以先进的人工智能技术赋能一线实战业务,支撑“专业+机制+大数据”新型警务运行模式将成为提升新质公安战斗力的重要方式。清思智能愿同行业伙伴携手发展,以新技术应用促进公安“智能”战斗力的快速成型与高效提升,共同推进智慧公安升级建设,奋力开创长治久安的现代化新局面,以公安警务工作的现代化支撑和服务中国式现代化。