APP下载

必应版 ChatGPT 内测资格海量发放,知乎大佬:别作死,就很强

消息来源:baojiabao.com 作者: 发布时间:2024-11-28

报价宝综合消息必应版 ChatGPT 内测资格海量发放,知乎大佬:别作死,就很强

    ChatGPT 版必应对一些网友已经开放测试了,综合大家的反馈,总的来说就是 -- 它很强。

小编还在 waiting list 上望眼欲穿地苦等,但是幸运的人已经有必应的内测资格了!

话不多说,下面上一波国内外网友的测评。

知友测评

知友「ccskai」表示,相对于 ChatGPT,新必应响应速度真的太快了,汉字刷刷地出,几乎不卡壳。

其次在引用上,相对于 ChatGPT,必应的 AI 会去搜索网页,然后总结网页的内容给出答案。这样,在信息的时效性上,必应就比 ChatGPT 领先了不少。

要求他将文章改成某种风格,它会先去搜某种风格怎么改,然后他自己再改。

能看懂「月色真美,适合刺猹」,这个必应厉害了。

图源:ccskai

不同于 ChatGPT 的没主见,必应 AI 在坚持观点方面做得很好。

图源:ccxkai

当被「ccskai」突然表白时,必应受宠若惊,使用了大量的流汗黄豆(大概是中文数据集的特色吧😅)。可以脑补一下日本动漫中那种羞涩挠头说着「いやあ~いやあ~」的男生。

OMG,这也太会卖萌了吧……

知友「hez2010」发现,必应配合 Edge 的网页上下文理解能力太强了。

图源:hez2010

它不仅推测出了正确的 label,还知道如何使用 GitHub 搜索来筛选,让网友大呼震撼。

图源:hez2010

「知友钛科闹了技 Tech」表示,新必应相比于之前 ChatGPT 有两个很恐怖的提升:

1.接入网络了,可以获取实时信息

2.可以通过我的提示和网络上的消息来自我验证,还能看到纠错后的正确结果

所以再用一段时间,训练多了,反馈多了,准确率会越来越高。

「钛科闹了技 Tech」问了必应「Time 获得了中国星际有史以来第一个冠军」这个消息,必应并不知道。

图源:钛科闹了技 Tech

可以看出,必应虽然联网了,但对最新消息的收录仍有一定的门槛。但是,它可以纠错了。

下图可以看出,必应的纠错能力很强大。

图源:钛科闹了技 Tech

「知友钛科闹了技 Tech」问了必应一个他自己都存疑的内容。

图源:钛科闹了技 Tech

结果必然居然正面回答了,「知友钛科闹了技 Tech」当场表示:「它带给我的震撼已经无可言表……」

图源:钛科闹了技 Tech

知友「永遇乐」也说,「体验有点恐怖。本来以为只是简单的给 bing 加个 chatgpt 访问借口,没想到是直接汇总你问题的查询结果,以人话给你说明并标记参考资料。这比普通搜索或不知道信息来源的原生 ChatGPT 强多了。」

随便问个问题,都可以直接查看答案信息来源(图源:永遇乐)

答主「幽幽夜」表示,新必应比起 ChatGPT 更快、更稳定。

写的代码段质量很高,还可以自动解析代码内容。

图源:幽幽夜

以后用 ChatGPT 和不用 ChatGPT 的程序员,或许效率会有天壤之别了。

图源:幽幽夜

新必应 vs.ChatGPT

下面,咱们来看看一位外国网友的测评。他把新必应和 ChatGPT、老必应、谷歌、Bard 都做了一番全方位的比较。

众所周知,ChatGPT 的训练数据只有 2021 年之前的。

而新必应不仅可以访问网页和最新的数据,同时还能在结果中给出参考资料的来源。

举个例子,你要是问 ChatGPT 推特的现任 CEO 是谁,它肯定答不上来。但新必应就可以脱口而出。

此外,新必应还将搜索提示一并加到了聊天框和精选摘要里。

不管用户点击哪一个,都可以体验到更具沉浸感的聊天体验。

新必应 vs.老必应

新必应与老必应的核心搜索结果实际上是相同的,唯一的区别是聊天机器人的存在。

过去的十几年,必应的目标是让核心搜索结果达到谷歌的标准。但在这之前,必应需要改进的地方还有很多。

尤其在广告方面,微软这些为了年确保收益采用了太多的「黑科技」。

具体而言,老必应存在有 3 个核心问题:

  • 广告数量过多:必应会在搜索结果中展示 5 个广告,而谷歌最多是 4 个。

  • 广告差异极小:必应故意将搜索结果之间的差异做得很小,用户难以区分词条之间的差别,很可能会意外点中广告。

  • EMD 权重过大:不可否认,搜索结果中必应给予精确匹配占比很大,可以说已经到了泛滥的地步。

而新必应在 AI 的加持下,看起来确实更具吸引力。

当然,目前这个功能还存在一些 bug。

比如下面就是没有被触发时候的样子 --AI 就是把其中一个结果「框起来」了而已。

新必应 vs.谷歌

以必应现在的市场份额,即便是搜索结果有了 AI 的加持,也远不足以推翻谷歌的地位。

然而,万万没想到到的是,谷歌在首次发布 Bard 时,就打了自己的脸。

注意看,Bard 的其中一个回复是「JWST 拍摄了我们太阳系以外的行星的第一批照片」,然而这并不准确。

实际上,有史以来第一张关于太阳系以外的行星,也就是系外行星的照片,是在 2004 年由智利的甚大射电望远镜(Very Large Array, VLA)拍摄的。

这颗系外行星被称为 2M1207b,大小约为木星的五倍,位于离地球约 170 光年处。

是的,正如新必应给出的结果所说的那样。

显然,在目前的形式下,新必应的确有能力从谷歌手里夺走一些潜在的流量。

新必应 vs.Bard

谷歌发布的 Bard,其重点是在于有 NORA(没有一个正确答案)的查询,这似乎与新必应使用的方法不同。

在发布会上,谷歌重点强调了 Bard 在处理 NORA(没有一个正确答案)问题时的能力。

在谷歌给出的示例中,Bard 提到最好的星座是猎户座、仙后座、大熊座和飞马座。

而新必应则详细介绍了一组不同的建议,包括金牛座、剑鱼座,以及其他几个谷歌没有提到的星座。

至于哪个答案「更好」,基本上全凭大家都主观判断,不过从传统搜索的使用体验上来看,谷歌通常会更胜一筹。

总结一下:

  • 新必应有近乎实时(有延迟)的网络访问,可以找到 ChatGPT 没见过的数据。

  • 新必应并没有取代精选摘要等 SERP 功能,而是将聊天功能作为一个扩展。在部分情况下,新必应会提供「双倍」的答案,让页面显得非常混乱。

  • 老必应还有很长的路要走,毕竟有很多阻碍着它与谷歌竞争的问题,至今都还没得到解决。

  • 在 Bard 给出的建议里,谷歌并没有给出作为参考的信息来源,而新必应则有大量的链接可供用户点击。

目前来说,虽然在搜索引擎中加入由 AI 驱动的聊天结果这件事还处于初期阶段,但进展迅速。

而这些变化对传统搜索所产生的影响,也不一定是负面的。

毕竟,每隔几年都会有人提出这样那样的担忧,但搜索行业却仍在快速地增长。

参考资料:

  • https://www.zhihu.com/question/583588366

  • https://dkb.blog/p/bing-ai-cant-be-trusted

  • https://brodieclark.com/new-bing-review/

特别鸣谢:

「ccxkai」https://www.zhihu.com/question/583588366/answer/2889780355

「钛科闹了技 Tech」https://www.zhihu.com/ question / 583588366 / answer / 2891347604

「hez2010」https://www.zhihu.com/question/583588366/answer/2892199436

「永遇乐」

https://www.zhihu.com/question/583588366/answer/2892200163

本文来自微信公众号:新智元 (ID:AI_era)

2023-02-24 15:42:11

相关文章