当前位置:首页 > 技术分析 > 正文内容

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

ruisui883个月前 (02-21)技术分析7

西风 梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~

就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹

Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。

基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

祝大家新年快乐,特别祝Sam。

阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:

外面的烟花照亮了天空,我却坐在电脑跟前。

多模态能力展示

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。

代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:

有网友改造了一下,让球体内部有三个弹跳的黄色小球。

结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:

Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。

比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

现在,Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。

感兴趣的童鞋赶紧试试吧~

参考链接:
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/2144.html

标签: 阿里云游戏
分享给朋友:

“阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏” 的相关文章

亚马逊推出 Amazon Linux 2023 发行版,专为 AWS 云进行优化

稿源:IT之家3 月 19 日消息,本周早些时候,亚马逊宣布推出其第三代 Linux 发行版 Amazon Linux 2023(AL2023)。亚马逊表示,该版本将带来高安全性标准、可预测的生命周期和确定性更新。Amazon Linux 2023 针对 Amazon EC2 进行了优化,与最新的...

GitLab-创建分支

描述分支是独立的生产线,是开发过程的一部分。分支的创建涉及以下步骤。创建一个分支步骤1-登录您的GitLab帐户,然后转到“ 项目”部分下的项目。步骤2-要创建分支,请单击“ 存储库”部分下的“ 分支”选项,然后单击“ 新建分支”按钮。步骤3-在“ 新建分支”屏幕中,输入分支的名称,然后单击“ 创建...

10分钟搞定gitlab-ci自动化部署

gitlab-ci 是持续集成工具/自动化部署工具,类似 jenkins。持续集成 是将代码集成到共享存储库并尽可能早地自动构建/测试每个更改的实践 - 通常一天几次。概述在编码完成时都会进行打包发布过程,如果每次都手动操作这一步骤就会浪费时间,效率低下。所以就有了持续集成。准备事项请提前安装以下软...

GitLab 14.6发布,优化Geo高可用,安全更新等

昨天,GitLab官方按照管理发布了有一个月度版本GitLab 14.6的发布,这也是本年度收官版本。14.6中在安全合规性方面,在Geo方面以及MD代码块一键复制等方便做了优化,另外还在UI图标方面发布了一套全新的图标。详细情况请和虫虫一起学习。GitLab 14.6主要改进使用 Geo 实现无缝...

Excel中的FILTER函数详细介绍及使用示例

在Excel中处理大量数据时,经常需要根据特定条件筛选出符合条件的数据行或列。这正是Excel的FILTER函数发挥作用的地方。FILTER函数是Excel中一个非常强大的工具,它可以基于一个或多个条件动态地过滤数据,使数据分析和报告制作变得更加高效和准确。本文将详细介绍FILTER函数的用法,并提...

史上最全 vue-router 讲解 !!!

前端路由 前端路由是后来发展到SPA(单页应用)时才出现的概念。 SPA 就是一个WEB项目只有一个 HTML 页面,一旦页面加载完成,SPA 不会因为用户的操作而进行页面的重新加载或跳转。 前端路由在SPA项目中是必不可少的,页面的跳转、刷新都与路由有关,通过不同的url显示相应的页面。 优点:前...