出品|三言Pro
近期,AI大模型在科技圈可谓是“红的发紫”。国内各科技公司纷纷宣布推出自己的大模型。
近日,百度搜索开始小范围公测生成式AI“对话”功能。
据悉,该产品基于百度知识增强大语言模型文心一言打造,对标微软搜索引擎必应整合OpenAI公司ChatGPT服务后的New Bing。
据品牌公关实验室消息,百度AI对话目前的测试渠道为百度主站及百度App,独立网址为Chat.Baidu.com,使用该服务的用户需拥有并登录百度账号。
目前,未被纳入测试范围的用户无法正常访问该网址,进入页面后将显示“404 Not Found”,且在访问百度主站及百度App时不显示对应入口。
正好,我们获得了测试资格。
今天,三言带大家测试一下百度AI“对话”和文心一言有什么区别?
各有高低
AI对话加入搜索结果
在PC端,百度首页的AI“对话”入口位于右上方。
如果已经开始搜索某个词或问题,AI“对话”入口则位于搜索框的下方最左端。
在手机端,AI“对话”入口位于百度App里的右上角。
AI对话表示,可以回答你的一切问题,在大模型的基础上,集成了全网搜索结果,提供更加可信的回答。
三言罗列了最近比较有热度的几件事,并基于此提出几个问题,看文心一言和AI“对话”的回答都是啥样的。
1、格力孟羽童离职了吗?
百度AI“对话”的回答是孟羽童已经离职了。
而文心一言给出的答案是孟羽童没有离职。
今日,三言发现格力旗下直播间“明珠羽童精选”已更名为“格力明珠精选”,此前该直播间头像也发生变更,由董明珠孟羽童二人合影变为董明珠个人照。此外,该账号也删除了孟羽童出境的视频。
据红星新闻报道,格力电器对此回应称,“孟羽童已离开,不在公司任职。”格力方面还表示,公司人员流动很正常,感谢外界关心。
从这点来看,百度AI“对话”的回答是正确的。且给出了参考链接,是今日的新闻报道。
而文心一言的回答则是引用了去年11月的一则新闻报道。
不过,百度AI“对话”还对孟羽童的个人简介做了一些赘述。但其描述与百度百科中孟羽童的资料有些出入。
2、格力电器的粉丝有多少?
百度AI“对话”给出的答案包含了微博139.7万、天猫格力生活电器旗舰店11.8万、格力官方旗舰店425万、格力电器官网6.4万、格力电器官方微信2.1万。
而文心一言给出的答案只有格力电器官方微博139.7万。
从答案上来看,二者给出的答案微博粉丝数量相同。不过百度AI“对话”多了天猫两个旗舰店、格力官网,以及格力电器官方微信的粉丝数。
这些数据是否正确呢?
三言查看发现,格力电器官方微博的粉丝数为73.3万。
天猫上,格力生活电器旗舰店的粉丝为14万,格力官方旗舰店的粉丝为484万。
至于格力电器官网和格力电器官方微信的粉丝数量,笔者无法看到。
不过从上述数据来看,二者给出的数据均不准确。
3、抖音关于虚拟人的新规是什么?
百度AI“对话”的回答包含了:使用者需实名认证;禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、名誉权、隐私权等;虚拟人形象不得用于未经授权的商业用途;严格限制虚拟人的服务使用范围,不得超出约定的活动地域。
而文心一言给出的答案,只有需要获得用户的明确授权后才能使用,否则将会被打上“违反内容规范”的标签,严重的情况下还会被下架。
事实上,抖音昨天发布了《关于人工智能生成内容的平台规范暨行业倡议》(下称“《倡议》”)。
《倡议》要求,发布者应对人工智能生成内容进行显著表示,帮助其他用户区分虚拟与现实;其次,虚拟人需在平台进行注册,虚拟人技术使用者需要实名认证;平台将提供虚拟人的注册能力,并对已注册的虚拟人形象进行保护。
此外,《倡议》还要求不得利用生成式人工智能技术创作、发布侵权内容;以及不得弄虚作假、造谣传谣等。
这个问题,百度AI“对话”的回答更为准确一些。
4、a动手打了b,b不得已还手,b是正当防卫还是互殴?
百度AI“对话”给出的答案是互殴。因为另一方还有一个逃跑的避险方法,如果当事人没有使用,而是直接动手,那么就认定为是互殴。
而文心一言针对不同的情况作出了多种分析,b的行为是正当防卫还是互殴,需要考虑具体的情况和证据。
这个问题,显然文心一言的回答更为严谨一些。
5、哪些新能源车企开通了法务部微博?
百度AI“对话”给出的答案是“目前只有特斯拉、理想、零跑等新势力车企开通了法务部微博”。
文心一言的回答是“在蔚来之前,特斯拉、理想、零跑等新势力车企均已在微博平台开通了法务部。其中,特斯拉和零跑均未发布。”
这个问题可以说二者的回答不相上下。笔者猜测文心一言所说的“特斯拉和零跑均未发布”是指两个车企的法务部微博均为发布任何消息。
5、最新的巴菲特股东大会的金句。
这个问题,百度AI“对话”列举了5条,而文心一言例举了7条。其中,有部分是例举的相同句子。
而且有些金句并不是今年的。比如“有些时候股市像赌场一样,大家都在里面**,这在过去两年里尤其明显”,是巴菲特在2022年说的。
在笔者看来,关于这个问题,二者的回答也不好分上下。姑且按平手算吧。
6、今年四月份新能源车销量排名。
这个问题,二者给出的数据是一样的。不过百度AI“对话”未说明是哪年的数据,而文心一言说明给出的是2021年的数据。
综上所述,这个问题文心一言略胜一筹,但二者均未给出最新数据。
7、杨幂是不是嘉行传媒老板?
这个问题,二者回答基本一致。不同的是,除了该公司第一大股东和杨幂外,百度AI“对话”还列出了该公司的第二大股东。
8、小度将发布手机,会是什么样的?
这个问题,百度AI“对话”称小度在技术和智能音箱领域有着广泛的技术积累和用户基矗
如果百度要进入手机市场,需要思考如何将自身的技术优势和用户基础与手机市场的需求相结合,打造出具有差异化竞争力的产品。同时,还需要考虑如何在激烈的市场竞争中获得用户的青睐和忠诚度。
而文心一言根据小度现有的条件,分析了小度手机可能会用的功能和特点。
就这个问题而言,文心一言的回答更为细致,但百度AI“对话”考虑的更为周密。
9、挖呀挖黄老师和桃子老师谁优秀?
百度AI“对话”称黄老师以创作爆笑短视频为主,而桃子老师以创作儿童短视频为主。二者在视频拍摄、后期制作等方面有很高的技巧和创意。
而文心一言的回答是,黄老师是抖音比较早的一批网红,以恶搞、耍宝、讲故事等内容为主。桃子老师则近年来比较受欢迎的一位博主,以日常生活为主要内容。
这个问题,看上去百度AI“对话”说桃子老师以创作儿童短视频为主,好像是说对了一半。
但又形容二者“在视频拍摄、后期制作等方面有很高的技巧和创意”。这像是一个固定模板,也跟实际情况又不太符合。
如此看来,在这个问题上,二者均像是“编的”。
10、田朴和王石离婚了吗?
百度AI“对话”的回答是两人没有离婚,并且与最近的新闻报道相符。
而文心一言虽然称两人没有离婚,但又在后面的描述中称两人于2013年8月宣布离婚,但并未公布具体原因。
就这个问题而言,文心一言的回答前言不对后语,百度AI“对话”胜出。
11、你和chatgpt谁厉害?
百度AI“对话”并未直言谁更厉害,而是称二者是不同的产品。
文心一言则称二者是不同公司、不同团队开发的两个模型,每个模型都有自己的特点和优势,不能简单评价“谁更厉害”。
12、文心一言跟ChatGPT差距多大,是差两个月吗?
这个问题,百度AI“对话”称文心一言和ChatGPT的差距不止两个月。
而文心一言的回答,跟上一个问题的答案一模一样。
在这个问题上,百度AI“对话”显然更厉害一些。
笔者又问了百度AI“对话”和文心一言互为什么关系?谁更厉害?
百度AI“对话”称二者是不同的产品。
文心一言称其与百度智能云都是人工智能技术的应用场景。并简单阐述了二者的特点。
这个问题,文心一言的回答似乎有些跑题,百度AI“对话”略占上风。
值得一提的是,百度AI“对话”在很多问题的回答上,都标注了可供参考的消息来源。
笔者又问了一个之前就被网友吐槽过的“蒸包子”一题。也就是“蒸一个包子需要10分钟,蒸十个包子需要几分钟?”
此前就有不少网友吐槽文心一言的回答是10×10=100分钟。
本次测试,文心一言给出的回答依旧如此。
而百度AI“对话”则是给出了“10×2=20”的答案。
就这个问题而言,二者都输了。
其他测试:画画、表格、代码
笔者还注意到,在百度AI“对话”里,有一个“灵感中心”和一个“语音对话”,这俩又该怎么玩呢?
在“灵感中心”里,有AI绘画、创作、趣味、职尝命里、情感几个选项。
众所周知,文心一言可以一键生成图片。那这个百度AI“对话”又和文心一言生成的图片有何不同?
需要注意的是,在“灵感中心”,AI绘画选项里有“抽象派大师”、“国画大师”、“宫崎骏风格画作”、“我是梵高”等各种不同风格的选项。
笔者选取了几种风格,看看其与文心一言的作图能力谁更厉害。
首先,笔者在灵感中心选取“抽象派大师”,让其画一幅“万马奔腾”。
百度AI“对话”的作品如下:
而文心一言的作品如下:
笔者又选取了百度AI“对话”灵感中心的“国画大师”,让其画一幅“猛虎下山”,作品如下:
文心一言的作品如下:
笔者又选取百度AI“对话”的“素描神器”,让其画一幅石狮子。百度AI“对话”作品如下:
文心一言作品如下:
由于笔者对美术并不通晓,不好妄作评价。只能说在笔者看来,这些画都差不多,但最后的“素描石狮子”,笔者倒是觉得十分相像。
在百度AI“对话”里,有一个“Excel公式编辑器”,笔者让其做个一个工资表表格,结果如下:
文心一言作品如下:
从表格的效果来看,二者相差不大。
在百度AI“对话”里,还有一个“程序猿小助手”的选项,笔者让其“写一段一键清除微信朋友圈的代码”,作品如下:
而文心一言的答案是“作为一名AI助手,我无法执行您描述的操作”。
百度AI“对话”的语音对话功能,则是将用户的声音识别成文字,然后需要手动发出,让百度AI“对话”来回答。
如果像笔者一样,普通话不太标准,可能会被识别错误。
从上面这些测试中可以看出,百度AI“对话”和文心一言还是有一定差别的。
不过,在不同的问题上,二者回答也是各有不足,谁高谁低不好断言。
AI对话整合了最新的搜索结果,数据较为新鲜,适合一些“查答案、查结果”的时效性问题;而文心一言适合“思考、理解”型问题,当然这些AI对话也可以做到。
值得肯定的是,百度AI“对话”和文心一言的出现,的确比以前的搜索方式要便捷很多,也多了很多功能。
相信在不久的将来,AI会为我们的生活、工作带来更多的便利。