请使用手机微信扫码安全登录

切换账号密码登录

绑定手机号

应国家法规对于账号实名的要求,请您在进行下一步操作前,需要先完成手机绑定 (若绑定失败,请重新登录绑定)。了解更多

不绑定绑定手机号

360官网 | 360商城

推荐论坛版块360粉丝商城360用户活动常见问题

7月9日,国内权威大模型评测机构SuperCLUE发布《中文大模型基准测评2024上半年报告》,360智脑大模型(360gpt2-pro)在SuperCLUE基准6月测评中,取得总分72分,超过GPT-3.5-Turbo-0125,位列国内大模型第4名次,稳居大模型第一梯队,并入选SuperCLUE“卓越领导者”模型象限。







《中文大模型基准测评2024上半年报告》选取国内外具有代表性的33个大模型,采用多维度、多层次的综合性测评方案,通过理科、文科和Hard三大维度真实反映大模型通用能力。报告显示,国内大模型市场已形成三大梯队的格局,360gpt2-pro位列第一梯队,并凭借在基础和场景应用上的领先能力,入选“卓越领导者”模型象限,以快速迭代、技术积累和资源优势引领国内大模型发展,不断压缩国内外大模型差距。







值得关注的是,360gpt2-pro在文科方面取得75分的亮眼成绩,排名第2,其中生成创作单项排名第1,与GPT-4o处于同一水平。相较其他国内外头部大模型,360智脑大模型在高语言处理质量、内容生成及理解水平等文科任务上拥有更强的竞争力。



在SuperCLUE中文检索增强生成测评中,360智脑RAG排名第4,进一步缩小国内外模型差距,体现了在中文检索生成能力上的竞争力。此前,360宣布开源两款大模型360Zhinao-search和360Zhinao-1.8B-Reranking,两款模型聚焦于提升长文本检索效果,在RAG技术的检索、排序阶段进行模型优化,结合此前开源的360K长文本能力,全面打通了RAG技术链路,为行业提供可靠的降低大模型“幻觉”概率的能力。



目前,360智脑大模型已形成多参数、多模态、多场景应用的大模型矩阵,首批通过国家标准符合性测试,综合能力位列大模型第一梯队。此外,360不断夯实技术能力的同时,加速模型能力应用,打造新场景新应用,去解决用户刚需和痛点。今年以来,360重塑国民级产品,相继推出360AI浏览器、360AI搜索等产品,其中360AI搜索连续登榜全球AI产品数据增速榜榜首,领跑国内AI搜索引擎市场。



来源:360黑板报

共 1 个关于SuperCLUE最新测评发布,360智脑大模型稳居大模型第一梯队的回复 最后回复于 2024-7-11 16:44

评论

直达楼层

您需要登录后才可以回帖 登录 | 注册

本版积分规则

飞机飞行 超级版主

粉丝:184 关注:13 积分:268830

精华:357 金币:251728 经验:224852

IP属地: 未知

最后登录时间:2026-1-15

小水滴公测勋章 智能摄像机3C 摄像机APP V7.0 智能摄像机AP2C 360AI音箱MAX-M1 公测AI小水滴D903 安全卫士10周年纪念 版主 公测360摄像机标准版 儿童五周年纪念章 360家庭防火墙APP内测 公测360摄像机户外版 360手机f4 公测360摄像机变焦宠物版 公测360家庭防火墙V5S 公测摄像机D916 家庭安防套装 防火墙V5S增强版公测勋章 360粉丝达人勋章

私信 加好友

最新活动

【360文库创作大赛开启】参赛赢大疆Pocket3

排行榜

热度排行 查看排行
本月
    本月

      扫码添加360客服号,涨知识的同时还有超多福利等你哦

      快速回复 返回顶部 返回列表