Qwen 3.5:Alibaba 对标 GPT 的答案——支持 201 种语言的开源模型
如果你在香港构建任何双语项目——老实说,这里构建的大多数东西都是双语的——Qwen 3.5 值得你关注。Alibaba 的模型家族现在支持 201 种语言,规模从微型设备端模型到完整的 397B 参数 MoE,全部以 Apache 2.0 授权。
Qwen 家族
Alibaba 发布的不是一个模型——他们在 Qwen 旗下发布了超过 100 个开源权重模型。Qwen 3.5 是最新一代,但整个家族涵盖:
- -Qwen 3.5 (397B MoE) ——旗舰模型。在基准测试中与 Sonnet 4.5 竞争。
- -Qwen 3.5 Medium ——用于生产环境的较小 MoE。品质和成本之间的良好平衡。
- -Qwen 2.5 系列 ——上一代,仍然优秀。从 0.8B 到 72B 密集型均有。
- -Qwen-VL ——用于图像理解的视觉语言模型。
- -Qwen-Audio ——音频理解模型。
全部为 Apache 2.0。全部在 Hugging Face 和 ModelScope 上。
为什么香港选择 Qwen
天生的双语能力
香港同时使用英语和中文。英文邮件。粤语 WhatsApp 消息。双语合同。需要在每种语言中都感觉自然的产品描述。
大多数西方模型把中文当作附带功能。Qwen 在大量中文语料和英语以及其他 199 种语言上同时训练。差异很明显——特别是在语码转换(在句子中间混合语言,这正是香港实际的沟通方式)、理解粤语口语表达以及生成自然的繁体中文文本方面。
201 种语言
香港是国际化的。你的使用者可能说英语、粤语、普通话、他加禄语、印地语、印尼语或日语。Qwen 3.5 的 201 种语言支持意味着一个模型就能服务你的整个使用者群。
尺寸范围
需要在手机应用上运行模型?Qwen 有 0.8B 和 2B 版本。需要复杂后端的前沿品质?397B MoE 在那里。这种灵活性意味着你可以在整个产品中使用同一个模型家族——从设备端推理到云端处理。
入门
通过 Alibaba Cloud (DashScope API)
托管选项。注册 Alibaba Cloud,获取 DashScope API 密钥,几分钟内就能开始 API 调用。定价与 DeepSeek 相当。
通过 Hugging Face
直接下载权重。每个 Qwen 模型都可在 Hugging Face 上取得。使用 transformers、vLLM 或任何标准推理框架。
通过 chat.qwen.ai
用于对话——Alibaba 的 ChatGPT 等效产品。免费使用,无需账户。
通过 Ollama
用于本地部署。按名称拉取 Qwen 模型并在你的机器上运行。较小的模型(7B、14B)在 MacBook 上舒适运行。
Qwen 对比 DeepSeek:香港开发者的抉择
这两个模型服务于不同的需求:
选择 Qwen 当:
- -你的应用是双语或多语言的
- -你需要强大的中文语言理解
- -你需要针对不同部署目标的多种模型尺寸
- -你在 Alibaba Cloud 上构建
选择 DeepSeek 当:
- -你需要强大的推理能力
- -你想要最简单的 API 体验
- -你专注于英语语言任务
- -你想要 MIT 授权(相比 Apache 2.0——两者都是宽松授权,但 MIT 稍微更宽松)
DeepSeek 的强项是推理和对话;Qwen 在任何涉及中文语言的方面都表现出色。对于编程,可以考虑在 SWE-bench 上得分更高的 MiniMax M2.5 或 GLM-5。
Apache 2.0 的优势
与 DeepSeek 的 MIT 授权一样,Qwen 的 Apache 2.0 意味着完全的商业自由。但 Apache 2.0 还包括明确的专利授权——意味着 Alibaba 不能在你使用模型后主张专利侵权。对于构建正式产品的公司来说,这是有意义的法律保护。
来源
- -Qwen 3.5 Official Blog
- -Qwen3.5-397B-A17B — Hugging Face
- -Qwen3.5 — GitHub
- -Alibaba Unveils Qwen-3.5 — SCMP
- -Alibaba Unveils Qwen3.5 — CNBC
- -Qwen3.5 Small Models Beat GPT-OSS-120B — VentureBeat
在香港构建双语产品?我们很想听听你正在使用哪些模型以及原因。订阅 Hong Kong AI Podcast 或联系 contact@hongkongaipodcast.com。
在我们发布新文章和节目时收到通知。没有垃圾邮件,只有信号。