超AI说|「上面千条线,下面一根针」,谁来拯救007工作制的警察?
论坛时间:2021/10/12

Introduction

为什么警察总在加班?如何改变“跑腿式”的工作方法?《扫黑风暴》照进现实,新技术如何帮助警察破案?摆脱翻卷宗、查系统,怎么能让线索自己“跳”出来?是什么技术让人人都能成为“神探”?打破数据壁垒,建设一体化平台,需要做哪些准备?

Reivew

Details

小明:

有句话说“有困难找警察”,小到邻里纠纷,大到违法犯罪,我们总是第一时间想到求助警察。我们想先问问,每天这么多工作,警察叔叔忙得过来吗?

 

孙德毅:

我个人感觉其实是忙不过来的。警察基本上都是特别高强度地工作,甚至是全年无休。

一方面是因为警察确实负责的工作内容比较多、比较杂,管理和服务的对象范围也比较大;另一方面,也存在机制上的一些背景。比如我们常说的“上面千条线,下面一根针”,上面就是从公安部到省厅、市局、区县的分局,再到下边的派出所,是这么一条线下去的,有好多警种负责不同的业务线;但是到了下面派出所,很可能就是一个社区民警对接很多的警种,去解决所有的业务问题。所以就会导致“上千条线”的业务到了下面,就只集中到一个社区民警身上去解决。

比如他们做的人口管理工作,跟咱们老百姓打交道比较多,工作内容包括常住人口管理、暂住人口管理、境外人口管理、工作对象管理、人户分离的理、房屋租赁的治安管理等,都属于派出所一线民警的工作范围。这些事情集中到一个人身上之后,会有特别大的工作量。民警几乎没有休息时间,用很多精力去完成这个工作。

在传统的工作过程中,都是靠“跑腿”。这种情况通过我们的系统可以去做出一些改变。就人口管理工作来说,我们可以通过智慧社区的一些感知手段、数据信息采集的手段,分析到社区里最近人口有什么变化,比如新来了哪些暂住人口,有哪些人已经搬走了、房屋已经过户交易给新的屋主了,或者是变成了出租屋。我们可以通过感知的前端手段或者一些管理系统,采集到这些信息,然后把这个信息精准地给到社区民警,让他去做定点的服务和管理。这样就不用像以前那样,走街串巷挨家挨户地去做敲门的工作。把信息变成精准的推送和精准的服务,其实就会减少很多的工作量。

再比如说一些工作对象、重点关注人员的管理。这其实是社区民警日常工作中的一个重点,需要在重点时期去关注异常的行为。其实民警很难很综合地去分析哪一个人近期可能会有一些什么异常情况出现。但是我们通过大数据的手段帮他分析之后,就可以对这些工作对象做一个类似风险分析的排序推荐。这样,他就可以优先去处理推荐出来的近期可能会有异常行为的人员。这样一来,就可以及时地处理稳控的工作,防止很多异常或者过激行为的出现,就可以在突发事件或者群体性事件发生前将其控制掉,避免未来的恶性事件或者应急工作出现。这样其实也可以帮助民警减轻日常工作量和应急处置的工作量。

 

小明:

前一阵子电视剧《扫黑风暴》讨论度特别高,剧情背后的4个真实大案让很多观众感到特别震撼,其中好几个案子是追查了很多年,在新技术手段的帮助下才终于破获的。现今,新技术是怎样帮助警察破案的?

 

孙德毅:

先说一下公安的信息化和智能化建设吧,这也是围绕着公安的业务去开展的。早期公安业务可能会提“打防管控”,现在又提“打防管控服”,延伸了这种服务的内容,信息化建设也是一直服务于这个核心业务的。

公安的信息化建设从90年代开始,那时候有大量单机的局部应用,去解决人工效率低下的问题。

2003年到2006年,金盾工程一期建设了很多条线的业务应用,也是解决业务效率提升的问题。

2007年到2012年,金盾工程二期,在之前的系统建设之上做了一些综合应用,比如说我们经常听到的情报指挥、警务综合,以及老百姓看到最多的视频监控的图像信息系统。

再到2013年之后,随着刚才我提到的这些信息系统的建设,积累了大量数据资源之后,就开始了大数据的建设。从2013年到现在,警务大数据的综合智能化应用进入蓬勃发展的阶段。尤其是在2016年公安部正式提出建设公安大数据智能化的重点任务之后,这一块儿的发展越来越快。

刚才提到的建设那么多系统、积累那么多数据,但是其实这些系统之间的打通、融合以及各种数据的统一应用、深度挖掘,其实是手段和能力都还比较有限。我们的公安知识图谱也正是基于这样一个背景,去帮助他们做海量数据以及跨系统知识体系的融合和应用挖掘。

举个例子,我们其实可以针对重点工作对象的全维度信息,在各种系统里收集过来之后,做一个全息的画像。比如人口系统、车架管的系统、执法办案的系统、警综的系统、图像信息系统,把这些多系统的数据融合到同一个维度,去刻画一个对象。这样其实就可以基本做到全息档案,把一个工作对象或者一类对象的全息的信息综合刻画出来,在我们的检索系统或者图谱分析系统里面就可以做到一次查询、全面评估,帮助他更高效地分析案件线索和工作对象。

在服务方面,我们的知识图谱也可以有很多延伸。比如说我们做的家族图谱,可以很好地构建族系的结构,相当于通过数据分析和数据连接知识抽取的方式,构建一个比较完整的多代的图谱。这样一个图谱可以在公安的人口管理、甚至是在家族式的犯罪方面都会有很多帮助。

针对电视剧里面提到的涉黑、美丽贷、套路贷,我们都做过一些扫黑除恶系统的专项模型。它可以结合犯罪的特征以及犯罪团伙的人员结构、涉案背景、资金流的关系、通联的关系,去分析和挖掘出这样的涉黑团伙,从而帮助公安机关更快地发现这些团伙,去做相关的打击工作。

 

小明:

在我们普通人的工作里,很多时候也要做像警察找线索破案一样的工作。一些企业或者组织在数字化转型的过程中就遇到了这样一种问题:明明已经用上了数字化的系统,但似乎只是把原来翻纸质材料的工作变成了翻电子档案,工作的本质并没有改变。

那我们应该怎么把宝贵的工作时间从这些琐碎的工作里解脱出来呢?有没有一种办法能够让我们快速的找到“破案”的关键线索呢?

 

孙德毅:

其实这个问题在企业里面包括在公安系统里面都是存在的。

我们企业里有大量的纸质材料,公安系统里其实有大量的卷宗和工作文件。刚才提到的《扫黑风暴》里面咱们也看到,专案组会在一个大会议室里翻阅很多的纸质历史资料。这种查阅的效率其实是很低的。

知识图谱的相关技术,包括OCR,先把它变成电子版的可识别的材料,再通过 NLP技术把里边知识和信息要素提取出来,再通过知识图谱技术去做数据层面的连接以及信息层面的连接,这样就可以把纸质的材料变成这种可识别、可被检索、可被连接的有用的信息文件。

这样的话,不管是在我们查找的时候还是做扩展分析的时候,甚至是在卷宗的推荐上,都可以有效提高工作效率。就不用再去翻阅大量的纸质卷宗,不用在纸质卷宗里面逐字逐天地看,而是通过知识图谱的搜索和关联分析的方式,很方便地把想要的资料信息,以及可能是埋在某句话里边的一个关键线索检索出来。

我举个例子,比如刚才提到的文档,可能每一份卷宗里都有对作案过程以及嫌疑人的描述。我们把这些卷宗拿到之后,可以先把卷宗里边的嫌疑人特征以及嫌疑人的一些身份信息直接提取出来。之后还可以通过图的方式,把不同的卷宗之间有相似特征或者相同嫌疑人身份信息的线索给他连接起来。这个连接其实就是跨单条数据、跨单系统的连接,解决了传统检索系统单一目标对象的检索方式。通过这个连接,可以帮助使用者把有用的线索或者是相似的线索快速从系统里边导出来,不仅提升效率提升,也能帮助很多没有研判思路、经验不丰富的人找到一些比较有用的检索路径,或者说帮助他找到他不知道的一些线索。

 

小明:

我们看到在很多文艺作品中,破案总是要依靠神探或者老警察来指明方向,帮助大家走出迷雾,那这种极度依赖于少数专家的情况对于组织来说其实风险系数是非常高的。那么在专业程度极高的领域里面,如何让新手或者普通人能够尽可能快速的掌握并且应用专业技能呢?

 

孙德毅:

破案的第一件事可能就是找线索。目前最多的手段就是去搜索。但是面对特殊的案件,往往又不知道该找什么,或者说也不知道怎么找。因为一些民警的信息化技术的储备没有那么多,或者对信息化系统并不是很了解,不是特别容易能够用高科技的系统。

其实民警有很多信息系统或者搜索系统,甚至在资源比较丰富的地方,还有几十个搜索系统可以用。他会在浏览器里打开几十个页面,每个页面可能都是一次搜索的记录。对于某一个系统里边的信息,有些可能是搜索系统的,甚至有些是业务系统的,他会在里面找各种各样的信息,在很多系统之间来回操作、来回比对,甚至还要去做一些手工的记录和导出,再去Excel里边做一些统计。

比如说他要找“2019年3月28号,在某个地点入住了某个酒店的男性”,他可能需要到宾馆管理系统里筛选这样一个时间段,再去这些记录里面找男性。那么他就需要去那个系统里面一直搜,直到锁定一个目标范围。然而这个时间范围内可能会有多个人入住,但这些人的其他信息,比如涉案背景、有什么前科,民警是不知道的,这些在宾馆管理系统里面或者一些常规的警种系统里面是不存在的。比如拿到了十条疑似目标对象数据,民警还需要把这十条数据导出来,再去其他的系统里面逐条核实。例如要看他是不是在逃人员,就需要去在逃人员管理信息系统里面去查,查到这个人是在逃,才算完成这个工作。

其实我们可以通过一种更自然的方式使用搜索系统。可以去通过一句话描述“我要找2019年3月28号在某个地点入住某某酒店的男性”,作为检索的输入。我们可以通过自然语言处理能力和意图识别的能力,去帮助他把这句话里面需要找到信息解析出来,然后在我们的系统里面做跨系统的、多步的查询找到这个结果,帮助他更快、更自然地使用。

在我们的系统里面,我们会把宾馆的数据以及在逃系统的数据都汇集到一块儿,比如同样查到了十个结果,在逃人员的标签我们已经把它打好了,民警就可以直接在这个结果里面找到在逃人员。这个其实就是综合运用了知识图谱、智能问答、自然语言处理、意图识别的能力,并结合了民警在使用系统中的行为习惯。

刚才那个表达里,既有时间要素,也有人员特征要素,还有时空的描述信息,其实这些东西都是有使用规律或查询规律的。我们通过长时间在公安行业的积累,可以让我们的模型更好地理解民警的表述,通过知识图谱这样一个技术手段或者一个产品,帮助他们把跨系统的数据、跨系统的连接比对需求都在我们的产品平台里去实现。这样一来,就可以在我们一个平台上去实现一次性的检索、全面的信息获取。接下来他的比对分析,以及扩线的挖掘都可以在我们这个可视化图谱平台上实现,而不用在多个系统之间切来切去,也不用自己再做离线的处理。这样的话,不光是提高效率、准确性、最终输出的研判结果的统一性,跨警种之间的协作都会变得更方便。

 

小明:

我们知道公安系统组织庞大,部门繁多,想要搭建一个整合的信息流通共享的平台都需要做哪些准备呢?

 

孙德毅:

数据的壁垒不管是在公安系统,还是在很多大型企业里面都是存在的。拿公安系统来说,其实情报部门、科技部门、网安部门都有自己的数据资源和自己的技术手段,这些手段都是多年建设或者应对这种治安刑事过程中发展出来的,各有各的优势。但是现在跨区域的流动作案,或者是网络空间的案件,都越来越复杂,越来越难通过单一手段去破案,所以就很急迫地需要把各个警种之间的优势手段或者数据资源汇聚起来,做融合的应用和统一处置。

公安系统里面也有很多解决方案,比如合成作战。传统的合成作战更多的是机制上合成,就是把各种人员或者工作系统都拉到一个指挥中心的空间里,大家坐在一起协同工作。但这种工作的模式其实还是每一个警种的人员用自己的系统,去共同处理一个专案或者一个重要案件。这样的效率其实还是要靠人之间的协作去支撑,不管从数据传递的效率上,还是人工的投入上,以及大数据的分析上,都有很多的限制。

这种情况下,必须要解决就是数据合成的问题,需要通过大数据和知识图谱的技术手段,把这些数据打通。但这个打通的过程中,其实存在各种各样的数据壁垒,甚至还包括一些安全防护的问题。比如说不同警种的数据安全防护的等级要求是不一样的,不能够随随便便就融合到同一个网路空间或者同一个环境去使用的。所以在这样一个过程中,我们既要能够对不同的数据做不同分级分类的处理和管理,以及对后期对这些大数据融合的使用的分级分类,这样配套的安全防护的机制也是必须的。

所以在整个大数据的融合过程中,或者说在公安各警种的数据破墙统一规划的过程中,既要解决机制上的问题,也要解决安全防护的技术手段上的问题,这就需要从顶层设计入手,也就是说需要从一把手的角度去推进这个事情落地。

我们明略科技在这里面所扮演的角色其实就是帮助他们做早期的设计和规划,帮助他们更好地规划系统建设,设计未来的系统形态、系统数据交换的机制、数据管理的机制、数据防护的方式。这样就可以帮助他们更好地解除前期对系统建设的顾虑,也可以通过我们成熟产品的落地,帮助他们更快地发现系统建设带来的效率提升,这样也可以帮助各个部门之间更加有意愿拿出自己的资源和技术手段优势,来促进系统建设,得到双向的促进作用,也就是说可以实现从机制到系统的一个闭环,这样的话就可以帮助我们在建设大数据融合系统过程中更好地解决机制上的壁垒和技术问题。

 

Tel

Business Hotline

4006-538-899

Reception

010-64303888
Online Consult

Scan QR code
Consult Now

Back to Top