大数据的特征是大量性(规模超大、不断攀升)、高速性(高速产生、处理高效)、多样性(种类多样、来源多样)、低密性(有用数据提纯)。海量数据给常规技术(获取存储管理、处理传递共享、关联聚类分析)带来了众多挑战——虽然数据很多,但是有用的数据只有34%,好用的数据仅有7%,被分析的数据更是少到只有1%。如何在海量的数据中提取出有价值的信息需要多学科多技术的研究。当前的特点是大数据、小模型、小定律交叉,即使是同一类问题,每个系统也都不一样,所以模型和程序要针对数据设计。结构化数据通过数据库或者数据仓库解决,半结构化数据使用网页和搜索引擎等技术解决,非结构化数据使用深度学习、网络交互和群体智能解决。
干警在实战使用中,最主要的操作应用是查询车牌信息和其他过车记录以便掌握线索。面对动辄几十亿、上百亿甚至千亿级别的海量过车数据的存储和查询压力,如何进行可靠存储和高效应用?传统的普通关系型数据库解决方案和技术手段存在检索难、并发难、挖掘难、扩容难、应用难等一系列问题,速度慢、准确性差,需要投入大量的精力和资源进行技术升级改造。因此,及时准确获取各类相关数据并构建大数据处理模型是建设平安城市大数据中心的前提,而这一难题目前正逐步通过先进的大数据技术进行解决。
以天地伟业推出的Easy7大数据分析检索系统为例,该系统立足平安城市系统建设应用,结合智慧城市系统规划需求,支持在海量大数据信息中快速检索和研判分析。该系统可全面接入公安自建监控网、社会面监控资源以及主流厂家的交通卡口和电警设备,将采集到的数据以结构化语义存储。系统采用基于大规模集群分布式并行运算存储的Hadoop作为底层数据分析存储框架,在工作调度、负载平衡、容错容灾、设备运维等方面进行了深度整合,保证了大数据访问的可靠性、安全性和高性能,彻底消除了传统存储系统的瓶颈,可以满足高带宽和高并发的海量数据存取需求。系统将音视频信息和用户业务产生的结构化数据构建成图像资源特征库,使用Hbase进行分布式存储,解决了传统关系型数据库在超大规模和高度并发方面的限制,为百亿级别的数据量提供秒级访问性能,并针对各行业对业务数据的实际需求应用,构建了多样化的数学分析模型,提供了直观的图形化数据结果展现。
该系统提供的功能包括:
(1)分类检索:按照行人、三轮车、汽车分类检索,点击结果可播放相应图片或者对应片段的视频。
(2)大数据全文检索:支持精确车牌查询、模糊车牌查询、路口过车查询、区域过车查询、车辆类型查询、车辆品牌查询、无牌车查询、车身颜色查询,还支持多种条件组合查询,可在秒级提供检索结果。例如在一个月内的过车记录中对车牌号码进行模糊查询,可在2秒返回结果。
(3)车辆研判分析:为车辆信息深度研判系统提供应用计算的加速作用,在车辆多点碰撞、初次入城分析、跟车策略分析、出入案发现场车辆分析、伴随车辆分析、车辆频次分析、连续违法分析、落脚点分析、频繁入城分析、频繁夜出分析、弃置车辆分析、区域徘徊分析、疑似假牌、昼伏夜出分析、嫌疑套牌等技战法策略中可以大幅提升运算效率。系统基本可在10秒内提供检索结果。
车辆大数据分析检索系统是针对数据快速增长的云存储、云计算、大数据等多种综合技术集合,不仅能够轻松处理海量的音视频等结构化数据,还能结合车辆信息深度研判系统发掘视频图片及数据中的关联情况,为业务处理和决策分析提供有力支持。
相关链接
http://www.1330.cn/ask/63.html
http://www.1330.cn/ask/61.html
http://www.1330.cn/ask/38.html