今天上午11:30,IBM超级电脑沃森的中国团队专家、IBM中国研究院资深经理潘越做客新浪《微访谈·微观科技》,与网友交流在上周人机大战中战胜人类的超级电脑沃森(Watson)的背后故事。潘越表示,IBM中国研究院前后有六位同事参与沃森项目,由他们组成中国团队对用结构化数据回答问题、排除“愚蠢”的答案,以及两阶段学习方面做出了贡献。
对于网友有关超级电脑超越人类智慧的担心,潘越表示,目前机器只是在某些特定领域表现出和人类可比的智力水平,还有很多领域机器还差得很远,因此不必担心。潘越还表示,目前沃森使用了机器学习的技术,已经具有一定的学习能力;不过这个学习还是有指导的,完全的自学习能力还有待进一步研究和开发。
上周,IBM超级电脑“沃森”(Watson)在美国最受欢迎的智力竞猜电视节目《危险边缘》中以绝对优势击败了两名人类选手。沃森最终答题总成绩高达 77147分,远高于两位人类选手21600分和 24000分的成绩。这也成为继1997年超级电脑深蓝战胜国际象棋大师卡斯帕罗夫后的又一次人机大战。
以下为今天微博访谈问答实录:
徐英钟 :CRL(IBM的中国研究院)有多少人参与这个项目
潘越:CRL(IBM的中国研究院)前后有六位同事参与Watson项目
Naiyin_Tan :请问沃森是用什么计算机语言开发的?其中中国团队都做了哪些贡献?沃森将来的发展方向是什么?
潘越:沃森用Java, C/C++, Prolog语言开发,中国团队对用结构化数据回答问题、排除“愚蠢”的答案,以及两阶段学习方面做出了贡献。沃森将来会在各个行业应用。
张结魁 :项目涉及的关键技术有哪些?会对这些研究领域产生怎样的影响?
潘越:项目用到的关键技术包括自然语言处理、搜索、机器学习等。
dogstar :看到很多媒体说沃森的技术可用于医疗方面,他到底可以怎样在医疗方面服务于人?
潘越:医生们需要研究大量的数据来提高诊断和治疗效果,但是现在医学数据的数量之多已经超出了人类能够有效 处理的能力范围。为了了解病人的情况,他们还需要提出复杂的问题并且做出高度结构化的推论。因此,大约15%的诊断都是不准确的或者不全面的。沃森可以为 医生提供帮助,把问答集成到日常决策流程中。
郭晓光 :每次有电脑战胜人脑的事发生,都会有担忧“终结者”之类的问题,您怎么看这种反应?
潘越:沃森的技术和个人电脑、互联网、搜索引擎的技术一样,对人类更多的是帮助。 实际上,我们人工智能研究做的越深入,对于人类大脑的能力就越感到敬畏。
李波Energy :电脑沃森在今后何去何从?是否在商业领域有很好的前景?
潘越:目前看来,沃森计划能在以下行业领域有所应用:电子、能源与电力、政府、卫生保健、保险、石油天然气、零售、通信、交通、银行与金融市场。
四正 :请问关于沃森的系统结构,比如架构、指令集之类的资料,哪里能查到?
潘越:沃森系统使用了 UIMA 为基本框架,系统为松散的Cluster,使用的是Power7芯片。我们后续会在IBM R&D Journal上发表关于软件架构的论文。谢谢张雷帮忙解答。
飞象网陈翔 :看到人机智力问答的结果,内心感觉其实很复杂,机器肯定在很多方面比人类强,但人类的某些方面也是机器无法超越的,发展人机对抗究竟是希望发展人类能力强的那部分还是希望利用机器来替代某些机器更擅长的工作呢?真担心有一天因为机器,人的感官,思维越来越局限~
潘越:随着社会的进步也包括技术的进步,人类自身的发展也很快啊 ~~ 我的女儿学的东西比我小时候就多很多阿。 还是那句话,我们对人工智能越了解,对人类大脑就越敬畏。
祎祎 :沃森以后是否会具有自主学习成长的能力?
潘越:目前沃森使用了机器学习的技术,已经具有一定的学习能力。不过这个学习还是有指导的,完全的自学习能力还有待进一步研究和开发。谢谢张雷帮助回答。
撇VV :潘总好,请问Watson的功耗(功率)大概是多少?和人类相比呢?
潘越:沃森需要 2880 个处理器内核(体积与 10 台冰箱相当),需要 80 千瓦的能量。只需一个大小与鞋盒相当的大脑,可以由金枪鱼三明治提供能量,并且只需使用手中的纸扇散热。 谢谢晓菲帮忙回答。
小口香糖 :听说沃森在比赛期间当机,让2小时的录制变成了4小时,真的吗?
潘越:我没听说过。
萧不遥 :跟中国的银河相比,沃森有什么特点,双方的适用范围有啥不同?
潘越:和银河相比,沃森的计算能力还较弱。沃森可能进入不了超级计算机的计算能力前100名。但是沃森是一 个我们称之为“为特定负荷进行优化的系统” (workload optimized system). 它能把一件事情(智力问答)干到最好。而像银河这类的通用型超级计算机则被设计用来完成各种各样不同的应用。通用性较好。张雷。
weiruanruan :请问潘工,沃森解答问题是通过自己的数据库给出答案还是其他方式?
潘越:沃森不与网络连接,但并不意味着只是简单的数据库查询。 问题和知识库都是自然语言表述的, 中间要经过复杂的计算。
zr27 :虽然危险边缘需要分析语言中微妙含义、讽刺口吻、谜语等,但对如今的技术来说并不太难。危险边缘本质在于庞大的知识量和思考速度,这些恰是电脑的强项;而对于国际象棋来说战略战术中的阴险狡诈才是人脑的强项。这次IBM是否有意利用该优势?沃森下国际象棋又有几分胜率?
潘越:多年前深蓝系统战胜了国际象棋前世界冠军。沃森的强项并不在于国际象棋,但日常知识类的问题的挑战不在国际象棋之下,甚至有过之而无不及。
Lyonszhang :请问沃森的硬件设备主要是什么配置。
潘越:沃森使用的是IBM Power750服务器。每个服务器有4块P7 CPU芯片,每个芯片8个CPU核。整个系统由90台服务器构成,总共2880个CPU核,15TB内存。片上带宽为每秒500GB。计算能力为80 Teraflops。谢谢张雷帮助回答。
我的钢铁 :所提问题是从题库中随机抽取的吗?
潘越:不是, Jeopardy!的问题都是只用一次的,而且所有选手都未曾见过。
中国围观 :请问IBM此活动是表明Power处理器的硬件性能很强大呢?还是说IBM的软件很“智能”? 谢谢
潘越:沃森系统是软硬件能力的一种很好的结合
木白羽 :我觉得与其说是人工智能的胜利不如说是搜索引擎的胜利,您怎么看待这个问题?
潘越:搜索技术只是沃森问答系统中用到的技术之一, 其它包括自然语言处理、机器学习等等。
Mouri_劳累 :沃森如何解决语言的歧义性?如何解决语音、语调对语义的影响?
潘越:沃森的一种做法是将问题的不同的解读都进行探索, 将决定留到最后。目前沃森不涉及语音和语调的问题。
wildgun :沃森这算是通过图灵测试了吗?谢谢。
潘越:不算。 目前好像还没有机器能通过图灵测试。
judecan :由于人类语言有模糊性和二义性,想知道Watson在自然语言识别中对双关语二义性语句这一块上是怎么解决的?
潘越:我们更多的依赖上下文来去歧义。比如,考察上下文中提到的人、事件、地点等其它相关对象。同时,我们 从多个证据的角度去解释这一问题。即使在一个算法中的去歧义失败了,其它上百个算法会从其它方面给出答案是否正确的证据。这就削弱了对单个算法去歧义能力 的依赖。谢谢张雷回答。
小考拉2012 :潘总,请问watson在抢答速度上是否有优势?感觉最后两天问题全部被watson抢到了
潘越:呵呵 我们的统计是第一场Jeopardy一轮中沃森抢到了约2/3的问题。但是另一方面,仅仅速度上优势并不一定等价于结果上的优势。因为答错了要扣分。沃森实际上也要判断自己是否要抢答。
dogstar :您作为沃森项目中国团队之一,中国团队此次主要做了哪方面工作,以确保沃森能够顺利的与人对决?
潘越:在研制Watson系统的全球团队中,作为来自IBM中国研究院的团队,我们负责为Watson系统采集、分析和使用各种结构化的知识,利用结构化和高可靠的知识提供问题解答,排除让系统显得”愚蠢“的答案,以及帮助Watson系统提高其学习能力。
海豚大熊猫 :潘总您好,我很好奇,参加那个问答竞赛,沃森的知识储备完全就是靠事先录入的?让我更好奇的是,后来在网上看到过沃森参加一个脱口秀节目,在节目里沃森能正常聊天,能听懂笑话并“笑出声”,自己还能讲笑话,这是真的么?还有,沃森与人的交流有局限性么?谢谢!
潘越:脱口秀估计超过了Watson的能力,应该是娱乐一下吧。
看世界的紫紫 :请问身为设计战胜人类计算机系统科学家的一份子会否存在身为设计者以及身为人类的一种矛盾呢?或者说一种尴尬呢?是否希望它能超越人类的同时又希望它始终under自己?
潘越:目前机器只是在某些特定领域表现出和人类可比的智力水平,还有很多领域机器还差得很远,因此不必为此担心。
老有腔调额侬 :沃森是否是基于power处理器架构,运行AIX操作系统的通用计算机,还是像当年深蓝用了很多协处理板,这样的架构适合高性能计算还是适合商业环境?谢谢!
潘越:沃森采用的Power750。 “为特定负荷进行优化的系统”(workload optimized system). 它能把一件事情(智力问答)干到最好。是高性能计算还是适合商业环境是可配置的。
QLUQ :Watson目前能够回答任何人类提出的问题吗?它背后的逻辑是基于统计建立的吗?
潘越:沃森现在擅长回答有唯一正确答案的事实型问题。它背后同时使用了逻辑推理和统计推理。谢谢张雷帮助解答。
王向东 :人机大战什么时候能延伸到动手能力?
潘越:看看这个 http://sinaurl.cn/h5hy21
张结魁 :Watson的领域知识库是怎样建立起来的?现在已建立的领域知识库有哪些?建立在不同领域上的知识库及其推理规则一般来说是不一样的,Watson的学习/推理机制具有多大程度的通用性?
潘越:沃森的领域知识库包括百科全书、字典、地理类娱乐类的专题数据库、新闻报道、经典著作等约70GB。几个知识库的来源举例:世界图书百科全书、维基百科、纽约时报的大部分过刊以及圣经。谢谢张雷帮助回答
Bill歐 :虽然中国人有份参与研发,但中国人有使用的权力吗?
潘越:IBM技术是服务全球市场的,欢迎中国的客户与IBM合作。中国对IBM全球是非常重要的一部分。
抢书狂人 :沃森主要擅长的方面是什么?
潘越:对自然语言的理解。
潘越:时间的原因,今天的交流就先到这里,欢迎大家继续关注沃森和IBM。