最后,国产大型机型在综合能力上可以与GPT-4o抗衡。
在12项指标的测试中,该模型有11项超过了GPT-4o,整体能力高出10个百分点。
而且,其优势在诗歌欣赏等中国特色领域更加明显,“最难汉语标杆”智障吧也取得了重大突破。
不过,这并不是大型模型厂商单打独斗的结果,而是由16家厂商组成的“联合团队”。
团队发起方为360,除自身参与外,包括BAT在内的主要厂商包括百度、火山引擎、腾讯、阿里巴巴、华为、国产大型模型“五小虎”、智普AI、月之暗面、MiniMax、百川智能、灵一物物、商汤科技、科大讯飞、好未来、环泉定量、面墙智能等五家头带厂商,共16家厂商到场。 (注:以上排名排名不分先后)
现在,这个“联合团队”已经被纳入AI助手中的产品——中,所有用户都可以免费使用。
十多个大模型给你打工
AI助手中,聚集了16家厂商的大模型。您可以在同一平台上直接交谈并选择您想要的。
而且,在此过程中您可以随时切换模型。系统会记住之前的上下文,让后续的模型继续完成对话。
比如下面的对话窗口,我们问智普9.11和9.8哪个大,然后把模型切换到Spark,直接问比较怎么样。
从对话中可以看出,后来被替换的星火准确地理解了“如何比较”四个字是在询问小数大小的比较。
当然,对于同样的问题,你也可以直接召唤其他公司的模型进行现场PK。
在对模型进行PK的同时,我们还可以看到更多的信息或答案,这不仅使答案更加详细,而且还可以进行交叉验证。
例如,我们问了一个关于电视剧《雍正王朝》中两个角色之间关系的问题。这个问题首先向智浦提出。
然后我们就请温心一言来解答,看看是否能得到更多的信息。结果智浦的回答是正确的,文心一言给出了更详细的补充。
更重要的是,360人工智能助手对于选择困难、或者不知道哪种机型更适合的用户也极其友好。
只要你选择“AI助手”本体作为对话模型,系统就会根据对话内容判断你的意图,然后根据任务类型自动匹配最合适的模型。
比如,在完成写作任务时,AI助手会给我们分配擅长文案写作的豆袋。
当遇到编程问题时,就会调用到编码能力较强的DeepSeek。
主要基于逻辑推理的问题可以通过智慧谱来回答。
当然,界面中显示的任务分类比较笼统。在实际操作过程中,AI助手还将任务进行了更细粒度的划分。
此外,在选择车型的同时,AI助手也会先进行在线搜索。
因此,使用AI助手的另一个好处是,你可以获取最新的信息,而不必担心模型的知识库更新时间。
对于一些常见的任务,AI助手平台还准备了专门的助手来更好地实现这些功能。
除了在网页上使用外,AI助手还有另外两个主要入口,——桌面和360安全浏览器。
例如,在360安全浏览器中,安装AI助手插件后,您在浏览网页时会看到右下角有一个浮动球。
一键即可召唤右侧边栏的AI助手,在书写时还可以与同窗口的AI快速对话。
此外,当鼠标移到浮动球上时,其上方会出现一个新按钮。点击后可以一键汇总当前浏览的页面。
您还可以向AI助手询问页面详情。
它还支持总结英文内容。
此外,对于页面上的个别单词和短语,选择后,会出现AI助手的工具栏,可以对所选部分进行翻译和解释,或者在线搜索更多相关信息。
桌面端基于360安全卫士实现。其功能与浏览器类似,但文字调用的范围从网页扩展到整个系统。
那么AI助手背后到底采用了什么样的技术呢?
独创“专家协同”架构
其实这种按需求调度大模型的使用,恰好是360推出的一项新技术,——CoE(Collaboration-of-Experts),也就是专家的协同架构。
我们知道,国内很多模型在单项指标上已经追平甚至超越了OpenAI,但从整体实力上来说,差距就显露出来了。
360的想法是改变这种“单打独斗”的模式,打造一个大模型“专家集群”,形成混合型大模型,让各自发挥所长,与GPT-4o进行“联合团队”的方式。
结果,基于360 CoE架构、由16个国产大模型组成的混合大模型在12项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分。
并且除了代码之外,其他11个指标都优于GPT-4o。
尤其是在“弱智酒吧”、诗歌欣赏等具有中国特色的问题上,CoE的领先优势更加明显。
与MoE(Mixture-of-Experts,混合专家)架构相比,360的CoE模型在速度、智能和成本方面具有显着优势。
CoE通过意图识别和任务调度优化推理资源分配,提高效率,降低成本,推理成本降低90%。
为了能够以最高效的方式调度CoE架构中的模型,至少有两个方面的工作是不可或缺的。
首先是对这些模型能力的综合评估。只有这样,我们才能了解每个模型擅长的领域,知道应该给模型分配哪些任务。
为此,360对专家库中的模型在12个领域的性能进行了全面测试,以找出模型的独特能力。
除GPT-4o外,其他型号名称均已隐藏
另一方面,对用户意图的解读——了解任务需求,这显然是分配模型不可或缺的基础。
基于过去10年作为搜索引擎积累的技术和数据,360训练了一个专用模型,可以识别超过1亿个意图分类。
让AI更加普惠
除了技术功底,我们不禁也想问,360是如何组织比赛,让15家大型模型厂商“入局”的?
360公司创始人兼董事长周鸿祎表示,厂商合作的出发点是大车型投入巨大。只有使用它们才能覆盖成本并不断改进产品。
360拥有大量用户,能够开启桌面和浏览器两大明星场景,能够为这些机型带来庞大的用户群体。
与插件相比,这两个入口可以让用户非常接近大模型的能力。如今大模型最大的需求恰恰就是贴近场景、贴近用户,让用户用得着。
此外,集成的AI助手避免了单一大模型的缺点,可以通过优势互补来超越GPT-4o。这给了厂商给用户使用的机会,未来还会发布更多的场景。
可以说,360人工智能助手的这个模型是在AGI到来之前提高模型水平的一个很好的解决方案,同时也有利于提高AI的渗透率。
近期,国内大型模型厂商开始形成共识,变得更加开放,纷纷提供更便宜的Token API。
因此,360向桌面和浏览器两个入口开放,不仅是为了“广纳天下英才”,更是顺应了这种开放的大趋势。
更高层面上,360也希望将AI带给更多人。
周鸿祎认为,AI不会消灭人,而是会消灭不会使用AI的人;对于那些能够使用它的人来说,人工智能将是一个强大的工具。
但同时,人工智能本身不应该居高临下,而应该给那些愿意学习它的人掌握的机会。
这就是360所说的AI普惠——,让每个人都能享受AI带来的能力,避免在AI时代落后。
AI助手门户:https://bot.360.com
- 超过-
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/4910.html
用户评论
厉害了!360这操作太震撼了吧,16家大模型联动作战
有20位网友表示赞同!
期待体验一下这个“攒局”效果。GPT-4O谁顶?
有18位网友表示赞同!
这么强悍的指标,肯定让人兴奋啊!360一直稳了
有8位网友表示赞同!
11项指标全部击败GPT-4O,牛啊!希望能够看到更多应用
有6位网友表示赞同!
这个“攒局”模型到底怎么做到的,感觉很新奇
有14位网友表示赞同!
这么强的性能,应该会打破很多传统的AI应用模式吧?
有10位网友表示赞同!
这下360的 AI 实力妥妥地提升了!
有13位网友表示赞同!
终于有个模型敢挑战GPT-4O!期待它的发展
有19位网友表示赞同!
16家大模型联动作战,真没想到会有这样的效果
有14位网友表示赞同!
这绝对是AI领域的重大突破!
有7位网友表示赞同!
360越来越厉害了,各种科技都在领跑啊
有17位网友表示赞同!
看来这次“攒局”要成为新的标杆了,其他模型压力山大吧哈哈
有15位网友表示赞同!
这个指标超越GPT-4O就很有意义了!
有6位网友表示赞同!
360这波操作确实很高估!让人眼前一亮
有13位网友表示赞同!
“攒局” 的概念太棒了,希望能应用到更多领域
有18位网友表示赞同!
GPT-4O 压力山大啊!以后AI竞争更加精彩了
有18位网友表示赞同!
希望这个模型能帮助我们解决实际问题,带来更便利的生活
有13位网友表示赞同!
16家大模型联动作战,效率和精度肯定会上一个新的台阶吧
有13位网友表示赞同!