当前位置:首页 > 技术分析 > 正文内容

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

ruisui884个月前 (02-21)技术分析14

西风 梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~

就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹

Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。

基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

祝大家新年快乐,特别祝Sam。

阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:

外面的烟花照亮了天空,我却坐在电脑跟前。

多模态能力展示

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。

代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:

有网友改造了一下,让球体内部有三个弹跳的黄色小球。

结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:

Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。

比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

现在,Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。

感兴趣的童鞋赶紧试试吧~

参考链接:
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/2144.html

标签: 阿里云游戏
分享给朋友:

“阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏” 的相关文章

「图解」父子组件通过 props 进行数据交互的方法

1.组件化开发,经常有这样的一个场景,就是父组件通过 Ajax 获取数据,传递给子组件,如何通过 props 进行数据交互来实现,便是本图解的重点。2.代码的结构3.具体代码 ①在父组件 data 中存放数据 ms。 ②将父组件 data 中的数据 ms 绑定到子组件中的属性 ms。 ③子组件在 p...

内存问题探微

这篇文章是我在公司 TechDay 上分享的内容的文字实录版,本来不想写这么一篇冗长的文章,因为有不少的同学问是否能写一篇相关的文字版,本来没有的也就有了。说起来这是我第二次在 TechDay 上做的分享,四年前第一届 TechDay 不知天高地厚,上去讲了一个《MySQL 最佳实践》,现在想起来那...

壹啦罐罐 Android 手机里的 Xposed 都装了啥

这是少数派推出的系列专题,叫做「我的手机里都装了啥」。这个系列将邀请到不同的玩家,从他们各自的角度介绍手机中最爱的或是日常使用最频繁的 App。文章将以「每周一篇」的频率更新,内容范围会包括 iOS、Android 在内的各种平台和 App。本期继续歪楼,由少数派撰稿作者@壹啦罐罐介绍他正在使用的...

再来一波黑科技工具,低调使用

静读天下静读天下是一个特别优秀的电子书阅读器。它上面有多个在线书库,像古登堡计划,很多种优秀的书杂志,都可以下载来阅读。它还能智能识别章节功能,还支持外置的语音阅读功能。它支持多种文本格式,比如说txt,pdf,epub,mobi等等。为了便于阅读它还有10 种配色方式,还有夜间模式。不过免费版有广...

12种JavaScript中最常用的数组操作整理汇总

数组是最常见的数据结构之一,我们需要绝对自信地使用它。在这里,我将列出 JavaScript 中最重要的几个数组常用操作片段,包括数组长度、替换元素、去重以及许多其他内容。1、数组长度大多数人都知道可以像这样得到数组的长度:const arr = [1, 2, 3]; console.log(a...

Vue进阶(幺叁捌):vue路由传参的几种基本方式

1、动态路由(页面刷新数据不丢失)methods:{ insurance(id) { //直接调用$router.push 实现携带参数的跳转 this.$router.push({ path: `/particulars/${id}`,...