最后，国产大型机型在综合能力上可以与GPT-4o抗衡。

在12项指标的测试中，该模型有11项超过了GPT-4o，整体能力高出10个百分点。

而且，其优势在诗歌欣赏等中国特色领域更加明显，“最难汉语标杆”智障吧也取得了重大突破。

不过，这并不是大型模型厂商单打独斗的结果，而是由16家厂商组成的“联合团队”。

团队发起方为360，除自身参与外，包括BAT在内的主要厂商包括百度、火山引擎、腾讯、阿里巴巴、华为、国产大型模型“五小虎”、智普AI、月之暗面、MiniMax、百川智能、灵一物物、商汤科技、科大讯飞、好未来、环泉定量、面墙智能等五家头带厂商，共16家厂商到场。（注：以上排名排名不分先后）

现在，这个“联合团队”已经被纳入AI助手中的产品——中，所有用户都可以免费使用。

十多个大模型给你打工

AI助手中，聚集了16家厂商的大模型。您可以在同一平台上直接交谈并选择您想要的。

而且，在此过程中您可以随时切换模型。系统会记住之前的上下文，让后续的模型继续完成对话。

比如下面的对话窗口，我们问智普9.11和9.8哪个大，然后把模型切换到Spark，直接问比较怎么样。

从对话中可以看出，后来被替换的星火准确地理解了“如何比较”四个字是在询问小数大小的比较。

当然，对于同样的问题，你也可以直接召唤其他公司的模型进行现场PK。

在对模型进行PK的同时，我们还可以看到更多的信息或答案，这不仅使答案更加详细，而且还可以进行交叉验证。

例如，我们问了一个关于电视剧《雍正王朝》中两个角色之间关系的问题。这个问题首先向智浦提出。

然后我们就请温心一言来解答，看看是否能得到更多的信息。结果智浦的回答是正确的，文心一言给出了更详细的补充。

更重要的是，360人工智能助手对于选择困难、或者不知道哪种机型更适合的用户也极其友好。

只要你选择“AI助手”本体作为对话模型，系统就会根据对话内容判断你的意图，然后根据任务类型自动匹配最合适的模型。

比如，在完成写作任务时，AI助手会给我们分配擅长文案写作的豆袋。

当遇到编程问题时，就会调用到编码能力较强的DeepSeek。

主要基于逻辑推理的问题可以通过智慧谱来回答。

当然，界面中显示的任务分类比较笼统。在实际操作过程中，AI助手还将任务进行了更细粒度的划分。

此外，在选择车型的同时，AI助手也会先进行在线搜索。

因此，使用AI助手的另一个好处是，你可以获取最新的信息，而不必担心模型的知识库更新时间。

对于一些常见的任务，AI助手平台还准备了专门的助手来更好地实现这些功能。

除了在网页上使用外，AI助手还有另外两个主要入口，——桌面和360安全浏览器。

例如，在360安全浏览器中，安装AI助手插件后，您在浏览网页时会看到右下角有一个浮动球。

一键即可召唤右侧边栏的AI助手，在书写时还可以与同窗口的AI快速对话。

此外，当鼠标移到浮动球上时，其上方会出现一个新按钮。点击后可以一键汇总当前浏览的页面。

您还可以向AI助手询问页面详情。

它还支持总结英文内容。

此外，对于页面上的个别单词和短语，选择后，会出现AI助手的工具栏，可以对所选部分进行翻译和解释，或者在线搜索更多相关信息。

桌面端基于360安全卫士实现。其功能与浏览器类似，但文字调用的范围从网页扩展到整个系统。

在11项指标上击败GPT4o！ 360游戏让16家大型模特公司联手出战

那么AI助手背后到底采用了什么样的技术呢？

独创“专家协同”架构

其实这种按需求调度大模型的使用，恰好是360推出的一项新技术，——CoE（Collaboration-of-Experts），也就是专家的协同架构。

我们知道，国内很多模型在单项指标上已经追平甚至超越了OpenAI，但从整体实力上来说，差距就显露出来了。

360的想法是改变这种“单打独斗”的模式，打造一个大模型“专家集群”，形成混合型大模型，让各自发挥所长，与GPT-4o进行“联合团队”的方式。

结果，基于360 CoE架构、由16个国产大模型组成的混合大模型在12项指标的测试中取得了80.49分的综合成绩，超越了GPT-4o的69.22分。

并且除了代码之外，其他11个指标都优于GPT-4o。

尤其是在“弱智酒吧”、诗歌欣赏等具有中国特色的问题上，CoE的领先优势更加明显。

与MoE（Mixture-of-Experts，混合专家）架构相比，360的CoE模型在速度、智能和成本方面具有显着优势。

CoE通过意图识别和任务调度优化推理资源分配，提高效率，降低成本，推理成本降低90%。

为了能够以最高效的方式调度CoE架构中的模型，至少有两个方面的工作是不可或缺的。

首先是对这些模型能力的综合评估。只有这样，我们才能了解每个模型擅长的领域，知道应该给模型分配哪些任务。

为此，360对专家库中的模型在12个领域的性能进行了全面测试，以找出模型的独特能力。

除GPT-4o外，其他型号名称均已隐藏

另一方面，对用户意图的解读——了解任务需求，这显然是分配模型不可或缺的基础。

基于过去10年作为搜索引擎积累的技术和数据，360训练了一个专用模型，可以识别超过1亿个意图分类。

让AI更加普惠

除了技术功底，我们不禁也想问，360是如何组织比赛，让15家大型模型厂商“入局”的？

360公司创始人兼董事长周鸿祎表示，厂商合作的出发点是大车型投入巨大。只有使用它们才能覆盖成本并不断改进产品。

360拥有大量用户，能够开启桌面和浏览器两大明星场景，能够为这些机型带来庞大的用户群体。

与插件相比，这两个入口可以让用户非常接近大模型的能力。如今大模型最大的需求恰恰就是贴近场景、贴近用户，让用户用得着。

此外，集成的AI助手避免了单一大模型的缺点，可以通过优势互补来超越GPT-4o。这给了厂商给用户使用的机会，未来还会发布更多的场景。

可以说，360人工智能助手的这个模型是在AGI到来之前提高模型水平的一个很好的解决方案，同时也有利于提高AI的渗透率。

近期，国内大型模型厂商开始形成共识，变得更加开放，纷纷提供更便宜的Token API。

因此，360向桌面和浏览器两个入口开放，不仅是为了“广纳天下英才”，更是顺应了这种开放的大趋势。

更高层面上，360也希望将AI带给更多人。

周鸿祎认为，AI不会消灭人，而是会消灭不会使用AI的人；对于那些能够使用它的人来说，人工智能将是一个强大的工具。

但同时，人工智能本身不应该居高临下，而应该给那些愿意学习它的人掌握的机会。

这就是360所说的AI普惠——，让每个人都能享受AI带来的能力，避免在AI时代落后。

AI助手门户：https://bot.360.com

- 超过-

用户评论

旧事酒浓

厉害了！360这操作太震撼了吧，16家大模型联动作战

有20位网友表示赞同！

回忆未来

期待体验一下这个“攒局”效果。GPT-4O谁顶？

有18位网友表示赞同！

初阳

这么强悍的指标，肯定让人兴奋啊！360一直稳了

有8位网友表示赞同！

久爱不厌

11项指标全部击败GPT-4O，牛啊！希望能够看到更多应用

有6位网友表示赞同！

妄灸

这个“攒局”模型到底怎么做到的，感觉很新奇

有14位网友表示赞同！

淡抹烟熏妆丶

这么强的性能，应该会打破很多传统的AI应用模式吧？

有10位网友表示赞同！

浮光浅夏ζ

这下360的 AI 实力妥妥地提升了！

有13位网友表示赞同！

我就是这样一个人

终于有个模型敢挑战GPT-4O！期待它的发展

有19位网友表示赞同！

有些人,只适合好奇~

16家大模型联动作战，真没想到会有这样的效果

有14位网友表示赞同！

可儿

这绝对是AI领域的重大突破！

有7位网友表示赞同！

巷陌繁花丶

360越来越厉害了，各种科技都在领跑啊

有17位网友表示赞同！

铁树不曾开花

看来这次“攒局”要成为新的标杆了，其他模型压力山大吧哈哈

有15位网友表示赞同！

巷雨优美回忆

这个指标超越GPT-4O就很有意义了！

有6位网友表示赞同！

猫腻

360这波操作确实很高估！让人眼前一亮

有13位网友表示赞同！

喜欢梅西

“攒局” 的概念太棒了，希望能应用到更多领域

有18位网友表示赞同！

陌然淺笑

GPT-4O 压力山大啊！以后AI竞争更加精彩了

有18位网友表示赞同！

晨与橙与城

希望这个模型能帮助我们解决实际问题，带来更便利的生活

有13位网友表示赞同！

冷落了♂自己·

16家大模型联动作战，效率和精度肯定会上一个新的台阶吧

有13位网友表示赞同！

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：https://www.iotsj.com//kuaixun/4910.html

在11项指标上击败GPT4o！ 360游戏让16家大型模特公司联手出战

十多个大模型给你打工

独创“专家协同”架构

让AI更加普惠

用户评论

相关推荐

联系我们