2013(第四届)中国物联网大会在北京国际会议中心隆重开幕。本次大会由中国电子学会主办,中国电子物联网专家委员会承办。中国工程院院士邬贺铨出席大会并以《物联网与大数据》为题作了主题报告。
以下是文字实录:
尊敬的各位院士专家来宾早上好,很高兴来参加今天大会,高兴看到这么多领导专家参加,说明大家非常关注物联网,今天以物联网大数据跟大家分享,主要讲三个方面内容:一个是物联感知,物联网通过感知帮助我们进行决策。ITU的物联网定义是物理和虚拟的,我们过去理解物联网都认为物联网对象一定是物理的,实际上ITU认为虚拟也是物联网对象,其中虚拟物件是指什么,是指存储处理结构内容,利用多媒体内容和应用软件,物联网提供满足安全要求,物联网中的实物和虚拟相联合的。
实物有类,一是身份识别,比如说条码,还有非身份识别类,需要识别,你可以ID进去,对这个物体我们不是靠ID识别,是需要物体的实体体征和属性。
物联网所需要感受的物件对象范围非常之宽,物联网收集数据,我们刚刚说虚拟东西也是物联网对象,我们看很多东西收集,如浏览器、搜索引擎、智能终端、游戏终端、GPS等,他通过大家日常网络留下痕迹和脚印获取大量的数据。
物联网产生大数据。美国人前几年医院一年产生500个数据,IMT1。4TB数据等各种的数据通过传感器产生,也有在网上直接产生的,我们现在处于大数据时代,物联网一分钟可以产生非常多的东西,苹果下载2万余次,一分钟会上传10万条新微博,全世界物联网上虚拟网络上,产生了大量的数据。
国外的这些公司数据量不一定有中国大,中国淘宝网在双十一一天创收10。5亿,新浪微博晚上有100万以上的响应请求,中国联通也进行大数据搜集,他们以前给用户每一个月发一个帐单,很多用户认为我没有上这么多,中国联通改制就详细记录客户的上网记录一秒钟83万条。
虚拟运行管理产生数据量更大,这个比较是美国,每天是80个,发动机引擎收据588,企业资源管理客户关系管理等现在是大数据,企业本身也是每时每刻产生大量数据。
2012年IDC公司指出在2005年由机器产生的数据占到数据总量的11%,2020增加到42%。比如说医疗,现在到医院看病都要CT,清晰度很高300多兆,一个病人CT影响往往多大两千幅,数据量已经到了几十个GB,如今中国大城市的医院每天门诊上完人,全国每年住院已经达到了两亿人次,按照医疗行业的相关规定,一个患者的数据通常需要保留50年以上。
物联网数据类型这是澳大利亚一个大学,他计算机科室研究,量很大,从2010年到2015年涨五倍,以及产业还有实业、物流,这是公共设施以及我们汽车,智慧城市发展智慧医疗、家具等,都会带动物联网发展。
物联网产生的大数据与一般的大数据有不同的特点。物联网的数据是异构的、多样性的、非结构和有噪声的,更大的不同是它的高增长率。物联网的数据有明显的颗粒性,其数据通常带有时间、位置、环境和行为等信息。物联网数据可以说也是社交数据,但不是人与人的交往信息,而是物与物,物与人的社会合作信息。
物联网的混搭将使物联网的数据变得更有用,将物联网感知的数据与通过社会媒体获得的数据结合,也就是人跟机器的社会联网,将使决策更科学。
与隐私与法律有关的特殊性,谁是物联网数据的拥有者,通过物联网可以控制家用电器。
最后,大数据助力物联网,不仅仅是收集传感性的数据,实物跟虚拟物要结合起来。今天北京交通堵塞,但是并不知道堵塞原因,如果政府发布消息和市民微博发布消息结合起来就知道发生什么事,物联网要过滤,过滤要有一定模式。
决策的时候还要考虑发布什么东西,会带来什么影响,最近有地震,他能预测60%地震,总有一天会说准。
物联网数据挖掘涉及到数据存储,从实物虚拟物获取存储,然后进行一些虚拟化和找出数据摘要,是要加标签的。
数据挖掘模式,合并压缩、清洗过滤、格式转换,法阶段数据分析、知识发现、可视化、数据阶段,关联规则,分类、聚类、序列、路径。因此后面工作更大更重要而且更难。
我举例子泥石流,最近发生芦山和宝兴地震,很容易发生泥石流,把这些数据收集,收集完了根据已有的数据模式进行分析
最近大家关注PM2。5,另外云南西北边、西川西南边干旱容易发生火灾,利用雷达、飞机可以搜集数据,也需要进行分析,然后产生判断。
在水面取样,通过卫星发出去,利用云计算、中心数据挖掘,河流的环境污染,数字化的模式,我们可以发现有的地方有环境污染,所污染本身需要异源数据,除了传感器、物联网数据有噪声的不干净的,所以需要多种数据的结合,历史数据的挖掘,然后进行分析预感、预警,所以数据后面的处理,食品现在也是大家所关注的,手机拍下来食品到后台去查,是哪个公司的食品,在什么地方生产,食品生产日期等等,包括食品安全不安全,营养成分怎么样,食品监控,运用后台数据等等。最近禽流感流行,怎么去监测,凡是产生流感病人在网上寻找,吃什么药好,哪个地方看病好,或者微博交流。
智能交通虚拟化和可视化。交通管理中心再大,也装不上所有的视频,因此10秒钟,这样看上去每时每刻只有能够监控很小一部分内容,通过软件把整条路上变成一个视频,再进一步我把所有马路都通过大数据软件后台分析组成图象,这图象像上海市领导人坐飞机俯视地面一样。所以这些都是后台数据分析。
大数据在社会管理上有很好的作用。美国纽约的警察分析交通用度与犯罪发生地点的关系有效改进治安。北京交通一卡通每天产生4千万条刷卡记录,地铁每天1千万人次,分析这些数据可改善城市交通状况。新加坡的公共交通部门十年来已经使用个人位置数据做交通需求的预测。荷兰的交通部门利用移动电话的定位功能预测汽车和行人的拥堵状况。
最后讲M2M的总量,全世界的M2M到2011年将有20亿,2020年180亿,预测2020年有500亿连接,主要是在消费电子和智能建筑两个领域,将占70%。
2011年M2M全市场为2000亿美元,2022年12000亿美元,三分之二收入来自设备与安装,三分之一来自服务,2020年最大的M2M市场在中国和美国,分别占20%和19%。
经济学人预测2013年年底10亿物品连接,物联网产生大数据,大数据助力物联网。