早在“大数据”概念诞生之前,搜索引擎行业便已经是大数据应用的践行者。只不过,那时候的大数据便是指海量数据,与现在所说的大数据涵义并不相同。近日,笔者有幸采访到了即刻搜索产品总监张玉睿。在这个搜索逐渐个性化的时代,即刻搜索将自己定位为主打民生的搜索引擎。那么,我们就来看一看在新技术的推动下,我们有了哪些更好的搜索体验。
即刻搜索产品总监张玉睿
据了解,即刻搜索除了传统服务外,还上线了食品安全、曝光台和医药等民生相关产品。比较巧合的是,笔者采访时间恰逢其食品安全浏览器插件上线不久,张玉睿便以此为例向笔者介绍。
小插件背后的大数据
即刻食品安全助手是一款浏览器插件,在浏览器上安装后,用户在网上购买食品时,如果打开的是有质量问题的食品,这款插件便会跳出提示,显示这款食品的不安全信息,及时为消费者提个醒。目前,该插件已经支持淘宝、1号店、京东、苏宁、当当等主流购物平台。
在这个吃什么都得加个小心的时代,有这么一款插件,确实挺方便。实际上在这款小小的插件背后,便隐藏着即刻庞大的食品信息库。据张玉睿介绍,即刻搜索食品信息库在2012年年底上线,进入即刻搜索食品安全主页,用户可以根据个人的使用习惯和信息需求快速浏览阅读。新增食品搜索功能后,用户只要输入相关关键词,食品安全搜索模块便可同时支持“新闻”、“不合格食品”、“食品库”等三维度的搜索服务。同时,食品信息库按照属性归类的分类模式,就可在第一时间快速查询了解到相关信息。
张玉睿提到,即刻的民生产品,都是基于千亿级别的网页数据挖掘和分析的解决方案,能从网页中提取出准确的信息特征元素,并基于这些特征建立网页之间的关联和用户需求的关联。像上面提到的食品安全,正是通过数据的逻辑分析和用户的情感分析相结合,生成对特定信息服务的信息内容,为用户在信息查询、消费决策、吃的安全吃的健康层面提供参考和帮助。
此外,这些信息也可以通过数据计算框架,输出给业务上下游和合作伙伴,比如食品、药品经营企业,协助他们在问题医药的追查曝光、政府管理层面打通信息流。同时即刻也开放数据给互联网同业者,通过数据对用户产生价值。张玉睿举例说360最近上线的良医数据就用了即刻医药的药品类数据。
通过大数据的开放架构,搜索引擎不仅可以提供更加贴心的服务,还能够将数据通过共享发挥更大的作用。
数据关联打通壁垒
有人曾将大数据比喻为一座大金矿,但要想发现金子就必须有淘金工具。搜索引擎便是这个工具。
对于搜索引擎来说,张玉睿认为其核心也是在“挖掘”上,他说,“即刻民生平台用到的大数据,核心就是数据特征的挖掘和数据关联关系的计算。”他表示,传统的信息发布是以行业或者学科分类来做区隔的,这导致很多信息之间的事理关联缺失。通过数据挖掘技术,可以实现对数据关联及其关联度进行量化分析,从而建立起跨界的数据之间的耦合。比如在医药上,我们通过药品、药店、医生、药师、医院、发改委的定价数据进行关联,可以在药品的购药安全和售药安全上打通信息不通畅的壁垒。同时我们通过网页新闻数据、社区论坛、微博、SNS的数据挖掘,形成对产品的基本评价分析,在于药品说明书、用药禁忌等数据进行关联分析,在用户用药的时候,进行必要的健康指导和提醒。
笔者认为,对于现在的搜索引擎来说,叫民生也好,个性化也好,都是指更加智能的个性化的服务。我们已经看到像Google、百度、即刻等搜索引擎已经不再把资源牢牢的控制在自己手里,而是更多的开放给第三方。他们所扮演的角色正在向一个更加智能并且个性化的服务平台转变。
正如张玉睿所说,大数据正在使得原来的泛相关性的网页级别的搜索,变得更精细更具体。原来针对用户的搜索需求,只需给出相应的网站或者网页URL把用户引导过去就好,而现在大量的相似内容的,则需要更精细的数据特征识别和索引,以面对用户需求给出更准确的信息条目。
大数据的趋势正在引发技术新一轮的变革,但根本上都是为了提供一个更加方便、智能的生活。搜索引擎已经在这条路上先行,相信其他行业也不会落后太远。