背景介绍
警察作为一个国家的重要机构,肩负着维护社会稳定,打击违法犯罪的重要职责,面对着越来越狡猾的犯罪分子,警方需要有效提升预防和打击犯罪的能力,单靠警员人工破案已无法满足社会需求,因此国家提出“科技强警”的发展战略,借助高科技装备、信息化手段帮助警方打击违法犯罪,“金盾工程”更是将公安信息化建设推向了高潮。然而,随着信息时代的到来,犯罪分子作案手段越发多变、隐蔽,传统的信息化手段已很难帮助警方快速分析研判。
近年来,“物联网”、“大数据”越来越被人们所熟知,著名的“谷歌汽车”、“大数据流感预测”更是成为物联网技术与大数据预测应用的经典案例。这两个在几年前还不为人知的技术名词,仿佛是在一夜之间闯入了我们的生活,将人们拉入了科幻电影中的场景。那什么是“物联网”、“大数据”呢?
物联网技术是利用互联网等通信技术手段把传感器、控制器、机器、人与物通过新的方式联系在一起,形成人与物、物与物互联,实现信息化,远程管理控制和智能化的网络。
作为物联网之后IT行业又一大颠覆性的技术革命,大数据是信息爆炸时代的产物,人们每天上网、交流、购物、订票……产生了数以亿级的数据,而这项技术的意义并不在于掌握了庞大的数据信息,而在于对这些含有意义的数据进行专业化的预测处理。
警方分析研判的关键是挖掘人员、组织、案(事)件、阵地以及物品五要素之间的关联关系,如果能够借助物联网技术获取五要素信息,那么将大大提升警方获取线索信息的效率,同时也能避免人为错误。而面对庞杂的线索信息,则可以借助大数据分析技术实现深入,高效的挖掘分析,进而快速找出五要素之间的关联关系。
本文试图探讨构建一套基于物联网技术的警务大数据分析模型,借以提高警方线索采集和分析研判过程的准确性和效率。
技术架构
基于物联网技术的警务大数据分析模型是一种利用大数据分析算法对海量警务物联网线索信息进行深度挖掘分析的系统模型。它包括了物联感知层、数据传输层、数据分析层以及数据展示层,同时,它还要与现有的公安信息网有效融合,实现信息共享碰撞。
物联感知层
警务物联网,是指利用感知技术与智能装置对警务工作关注对象进行自动感知识别,通过网络,技术处理和智能分析,实现对关注对象状态和态势信息的实时掌握,达到对关注对象动态监测、精确管理和科学指挥的目的。目前警方所应用的场景有旅客身份证查验、警车警员GPS定位、城区视频监控、道路卡口车辆监控、重点部位报警防范、重点人员手机定位、枪支RFID标签定位等,可以采集到人员、车辆以及物品的城市时空数据,为警方建立基本要素排查提供大量真实可靠的原始数据。
数据传输层
经过移动互联网、有线网络等媒介传输到系统模型的物联网数据,具有数据量大,且分布在不同时域,空域的特点,是无法直接使用的,为此需要按照一定的标准规则对它们进行初步的筛选和归类整合,将其转化为兼容系统模型的,具有统一规范标准的“元数据”。
数据分析层
经过初步归类整合的数据依旧是海量且缺乏直观联系关系,无法为警方提供研判依据,为此需要借助专业的数据挖掘算法对这些数据进一步分析、整合。同时还要与公安信息网中的线索与情报进行碰撞,以降低单一数据源造成的信息可靠性低等问题。常用的分析算法有分类分析、回归分析、聚类分析以及关联分析。
分类分析
根据一定的分类准则将具有不同特征的数据划分到不同类别的过程。以某地区团伙作案为例,该区域近一段时期是团伙犯罪高发期,警方对该区域以及邻近区域娱乐场所以及出租屋的人员进行集中排查,采集到大量的身份证信息和手机串号信息。
通过对午夜时段的身份证号以及手机串号进行碰撞,可以筛选出一批经常出入于犯罪高发区的可疑人员名单,进而帮助警方缩小排查范围。
回归分析
通过对自变量和因变量做一定的相关性分析,由此建立回归方程,用以预测变量的依赖关系。加利福尼亚警方曾利用火灾预警系统来预测建筑物火情以及分析纵火案。
加利福尼亚警方通过将一年内火灾案件与当天天气,建筑物自身因素等资料数据化,形成了一套火灾级别与火灾因素的拟合函数,当火灾因素点越丰富时,拟合出来的火灾隐情拟合函数曲线就越细腻平滑,精准度也就越高,进而形成经验数据,有效提升火灾预警能力。同时,警方也不放过那些异常点,因为往往异常点代表着具有“人为纵火”嫌疑,警方再通过对这些异常点的分析,找出隐藏在火灾背后的案情。
聚类分析
不同于分类分析,聚类分析没有先验知识,一般是将一堆看似毫无规则的数据根据某种特征进行划分,不同属性的数据分到不同的组。警方可以根据时间或者空间为基准属性,对采集到的身份证号,报警信息,手机串号等进行分组,进而发现可疑线索。
例如,某文物保护单位午夜时分发生文物盗窃案件,通过对该单位近一周内的监控录像、手机串号等数据的采样,警方首先将可疑目标锁定在午夜时段出现的四个手机串号上,因为该时段不可能是正常游客参观时段,具有可疑性,但由于作案人带了头套和手套,未能取得有价值的作案监控录像。警方再对其余时间进行排查碰撞发现,在案发前三天,可疑目标手机串号出现在文物展览时段,通过对该时段的监控录像与手机串号进行排查定位,就可以有效缩小排查范围。
关联分析
用于在大量杂乱无章的数据中寻找有价值数据间的相关关系。
通过分析犯罪嫌疑人的基本信息、亲朋好友、交通工具、银行账户以及出行记录等,就能绘制出一张犯罪嫌疑人的关系网,进而为警方快速掌握犯罪嫌疑人动向提供有力线索。
数据展示层
伴随着大数据应用而出现的技术还有可视化展示技术,它能够很直观的将大数据分析产生的晦涩难懂的数据以图表的形式展示出来,帮助警方根据图表特征快速研判。本模型针对警务案件研判特点,选取了几种常见的图表模型做展示。
关联关系图
关联关系图与关联分析算法配套使用,用于展示研判分析结果各元素之间的关系,该图将各元素分为中心元素和关联元素,关联元素围绕着中心元素展开。通常用于犯罪嫌疑主体与客体之间的关联关系。【注:中心元素和关联元素的要素类型可以相同,也可以不同】
时空时序图
通常与分类分析算法、聚类分析算法配合使用,按照时空属性,展示行为主体在一定时空范围内的行为轨迹,通常用于展示犯罪嫌疑人或嫌疑车辆的行为轨迹。
热点分布图
通常与聚类分析算法配合使用,用于碰撞挖掘人员行为习惯,关联关系以及异常行为之间的“共性”。
应用架构
基于物联网技术的警务大数据分析模型本身不能直接破案,但它可以帮助警方缩小排查范围,缩短排查用时。由于它需要整合多方信息资源,因此是一套跨部门,跨警种的分析应用模型。
水平维度
警方在办案过程中经常会遇到多警种配合工作的情况,而各警种获取线索信息的渠道可能有所不同,导致对同一个目标元素得到不同的数据,这时就需要对大家获取的信息进行核实,并以某一个或多数人的信息为最终结论数据。(注:依靠物联网技术获取的数据会降低数据的差异性概率,但案件线索并非只有物联网采样数据,还有很多数据要通过其他渠道获得)
垂直维度
在应用这套模型时,应该按照不同级别,职能分工使用。基层单位主要负责线索的采集,实际办案单位则肩负线索采集和分析研判过程,而省厅则作直接利用分析研判结果,对各区域的治安情况,警员的工作情况进行分析考核。
建设难点
虽然物联网、大数据已经不再是个陌生的技术,它也已经被广泛应用到各行各业,小到“物品标签”,大到“百度大数据分析计划”,似乎这两类技术无所不能,但事实上,要想充分发挥技术的优势,还需要一定的条件。
物联网,它被憧憬的应用形式之一便是连接城市,各种各样的传感器,视频监控无处不在,追中人们的行动并生成大量的数据,从而更高效的管理城市,但物联网技术的软硬件缺乏一个统一或者相对统一的标准,很难靠一家技术公司就能对接,整合各家的设备或系统。
大数据,一项伟大的发明,它将“星占卜”变成了“现实”,但从它的词意就可以知道,它的样本即全部,需要大量且非单一的数据做支撑,“共享”必不可少,但首先要解决各部门间的信息壁垒,以及跨公安网信息交互引起的信息安全问题。
文章总结
虽然笔者通过理论依据以及工作实践总结出了这套系统模型,但模型应用到实际,并构建出完整的可实用的软件系统仍然有很长一段路需要走,这需要公安干警以及相关行业技术从业者的共同努力。
技术手段不可能直接用于破案,但如果能够科学合理的应用,充分发挥它的作用,就能大大提升警方办案效率。而这些都是建立在完备的管理机制和人员认识之上的,需要警方、科学工作者以及社会共同的努力。