开云体育略次于Qwen3.5-397B-A17B的88.4-开云「中国」kaiyun体育网址-登录入口
发布日期:2026-05-01 06:17 点击次数:107

开云体育
智东西
编译 | 杨京丽
剪辑 | 陈骏达
智东西4月23日报谈,昨晚,阿里通义千问团队文告开源Qwen3.6-27B——一款270亿参数的宽阔多模态模子,支捏想考与非想考模式。
与阿里上一代开源模子Qwen3.5-397B-A17B比较,Qwen3.6-27B以1/15的参数鸿沟,在SWE-bench Verified、SWE-bench Pro、Terminal-Bench 2.0以及SkillsBench上收尾了反超,其编程才智普及光显,同期还具备较强的文本和多模态推理才智。
与相通尺寸的Gemma 4-31B模子对比,Qwen3.6-27B在大部分维度上,展现出较大最初上风。

跟着Qwen3.6-27B的发布,阿里称Qwen3.6系列已圆善发布,包括开源模子Qwen3.6-35B-A3B和闭源模子Qwen3.6-Plus、Qwen3.6-Max-Preview。
阿里云百真金不怕火平台上,当今依然不错看到Qwen3.6-27B的价钱,每百万Token输入价钱3元,输出价钱18元。由于Qwen3.6-27B是宽阔模子,价钱并未低廉。

Qwen3.6-27B现已上线Qwen Studio,并以开源权重形态发布于Hugging Face和ModelScope,阿里云百真金不怕火API行将上线,届时将支捏preserve_thinking功能以适配智能体任务。该模子也可接入OpenClaw、Claude Code、Qwen Code等主流第三方编程助手。

体验地址: https://chat.qwen.ai/
开源地址:
https://huggingface.co/Qwen/Qwen3.6-27B
https://modelscope.cn/models/Qwen/Qwen3.6-27B
一、编程才智:界面好意思不雅、功能完备,复杂需求一次到位
官方对比了Qwen3.6-27B和Qwen3.5-397B-A17B,在编程基准上,Qwen3.6-27B在多方面最初:SWE-bench Verified(77.2 vs. 76.2)、SWE-bench Pro(53.5 vs. 50.9)、Terminal-Bench 2.0(59.3 vs. 52.5)以及SkillsBench(48.2 vs. 30.0)。在推理任务上,Qwen3.6-27B 在GPQA Diamond上获得了87.8的收获,略次于Qwen3.5-397B-A17B的88.4。

为直不雅考据Qwen3.6-27B编程才智,智东西进行了如下的几个测试。
起先,咱们先让它作念了一个跑酷小游戏,测试其编程和前端才智,条件满足变装动作、关卡身分、谈具系统、UI策动等多维度欺压。

它用时四分钟傍边,写结束1200多行代码。从实测遗弃来看,游戏策动与前端收尾上,Qwen3.6-27B基本还原了辅导词中列举的一齐中枢身分:玩家的卓绝、二段跳等均已收尾,添加了无东谈主机、针刺等阻隔物,能量电板、金币、磁铁等均可拾取。好意思术作风合乎设定,UI层圆善展示了血量、分数、速率、距离等目的,游戏可玩性强。

但细节层面仍存在一些小问题,针刺悬浮在天上有点怪;吃到电板后,莫得能量条线路;撞到箱子,就自动往时了,莫得扣除血量。
另外,咱们还让Qwen3.6-27B制作了个东谈主记账运用,检修的是模子运用开拓才智和对闭环策动的交融,包括统计逻辑怎么算、数据怎么捏久化、荒谬输入怎么阻难,比写一个静态页面要复杂得多。

在运用开拓上,Qwen3.6-27B的表现相对隆重。生成的运用圆善收尾了纪录的增改换查、按月份筛选、总收入/总支拨/结余的统计以及近7天出入趋势图表,刷新页面后数据莫得丢失,讲明localStorage捏久化已正确收尾。
唯独的小Bug是刷新页面后,7日收相沿状图一度不线路,再记一笔账后收复,属于“运行渲染时机”问题。模子在异步景色运行化的轨则上,没惩处到位。从界面上看,这个记账运用视觉策动较为从简,是一套偏实用向的尺度控件组合。业务逻辑维度上,它把一个普通器具该有的数据流、统计逻辑与荒谬惩处齐串起来了,关于运用开拓全历程的交融比较清醒。
之后,咱们还让它作念了个新闻网站前端策动,看起来如故预防其事的。

Qwen3.6-27B自行策划,分了科技、财经、体育、文娱、健康五大板块,设有国内新闻和国外新闻,界面右侧,还展示了热点排名、标签、北京的天气,以至把买卖化齐想好了,留出了告白的位置。界面档次清醒,内容圆善,可视化成果好,模子对“一个新闻网站长什么样”有较为锻练的清楚。
二、多模态才智:识别考据码、找不同,通通拿下
手脚原生多模态模子,Qwen3.6-27B支捏视觉话语想考与非想考模式,可惩处图像、视频与文本的联络交融,消失视觉推理、文档交融、视觉问答等场景,才智基本上与Qwen3.5-397B-A17B想当。

针对多模态才智,咱们也对Qwen3.6-27B进行了测试,起先让它识别了底下这几个考据码。

不错看到,它较为了了的判断出了绝大大齐考据码,只须第八个0AIs,他把s认成了6,其他齐判断的比较准确,同期也注明了我方不祥情的部分。这种带置信度反映的识别方式,对后续的自动化校验链路更友好,卑鄙系统不错基于置信度决定是否自动通过。

张开想考过程,咱们不错看到它屡次证据图8的考据码0AIs,终末一位它在b和6之间反复纠结,被支配字母骚动,在作假的谈路上越走越远了,而正确谜底s重新至尾莫得过问过它的候选集。
这么看下来,Qwen3.6-27B的图像识别和推理才智如故过关的,得到相对污秽的反映后,还需进行东谈主工考据。
另外,咱们还让Qwen3.6-27B进行了“找不同”测试,让它望望傍边两张图有什么分裂。

Qwen3.6-27B识别出了5处各异,不同难度的不同点齐防卫到了:鸟窝、大开的书、灯笼、神采各异,还有墙上的挂饰,这个我我方一起先齐没防卫到。

值得防卫的是,它的想考过程稀奇肤浅,肤浅比对就完成了分析,何况态状也很清醒,展示出模子的较强的视觉识别与推理才智。
结语:阿里开源计策渐趋聚焦,27B模子对准开拓者中枢需求
Qwen3.6系列的发布,折射出阿里在开源策略的转向。此前,阿里曾开源从几十亿参数目到数千亿参数目的各式模子,但本次Qwen3.6系列仅开源了小尺寸MoE模子和宽阔模子,体现出其开源计策的聚焦。
此类小模子面向开拓者、商酌者及小团队,不错径直腹地部署,或在其基础上作念进一步商酌和微调。Qwen3.6-27B赶巧卡在了这个需求的中心位置。
开源社区对这一尺寸的模子呼声很高;从实质价值看开云体育,27B的宽阔模子也更能满足开拓者对部署天真性和可控性的施行条件。