中国 AI 模型指南:DeepSeek、Qwen、ERNIE 及更多
过去两年,中国 AI 领域发生了令人瞩目的事情。当西方科技媒体聚焦于 OpenAI 和 Anthropic 时,中国的 AI 实验室推出了数十个前沿模型——其中许多是开源的,许多确实非常优秀,而且几乎所有模型都可以从香港无限制地访问。
本指南涵盖截至 2026 年初的主要中国 AI 模型和公司。如果你是香港的开发者、研究人员或创办人,这些不是替代品——对许多人来说,这些就是你的主要工具。
DeepSeek
公司: DeepSeek(总部位于杭州,2023 年成立) 关键模型: DeepSeek-V3.2、DeepSeek-R1 授权: MIT(完全开源) 访问方式: API 位于 api.deepseek.com + 通过 Hugging Face 自行部署
DeepSeek 以其推理和对话能力引起了轰动。在短短两年多的时间里,他们从默默无闻成为 AI 界家喻户晓的名字。
DeepSeek-V3.2 是他们目前的旗舰模型——一个 671B 参数的混合专家模型,每个 token 有 37B 活跃参数。它在 2025 年 IMO 和 IOI 上都获得了金牌。MIT 授权,意味着你可以用于任何用途,包括商业应用。
DeepSeek-R1 是他们的推理模型,可与 OpenAI 的 o1 相比。它在数学和多步骤问题解决方面表现出色。
DeepSeek 的特别之处在于开放性,而不一定是原始品质。所有内容都是 MIT 授权的——你可以下载权重、微调、商业部署并检查架构。具体到编程方面,DeepSeek 可能较慢,也不是顶级表现者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的价格和自行部署故事很难被超越。
最适合: 推理/对话任务、自行部署、成本敏感的部署、任何需要 MIT 授权和完全模型控制的应用。
Alibaba Qwen
公司: Alibaba Cloud(Qwen 团队) 关键模型: Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授权: Apache 2.0 访问方式: Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai
Qwen 是 Alibaba 的模型家族,规模庞大——迄今已发布超过 100 个开源权重模型。Qwen 3.5 是目前的旗舰:高达 397B 参数(MoE),支持 201 种语言。
多语言能力是 Qwen 的超能力。对于开发需要同时支持英语和中文的产品的香港开发者来说,Qwen 通常是最佳选择。该模型理解语码转换、粤语语境,以及繁体中文和简体中文之间的细微差别。
Qwen 3.5 有多种尺寸,从可以在手机上运行的微型模型到完整的 397B MoE。全部为 Apache 2.0 授权。
截至 2026 年 3 月,香港应用如 8BitOracle 和 SixLines 已经在生产环境中使用 Qwen3 进行双语聊天。当地 AI 社群成员也观察到,较小的 Qwen 3.5 模型相对于其大小表现超出预期——值得在选择更大型号之前进行测试。
最适合: 双语应用、中文语言任务、多语言产品、设备端部署(较小模型)。
Baidu ERNIE
公司: Baidu 关键模型: ERNIE 4.5、ERNIE 5.0(预览) 授权: Apache 2.0(4.5 系列)、闭源(5.0) 访问方式: 千帆平台、Hugging Face
ERNIE 是最早的严肃中国 LLM 之一,Baidu 一直在持续推进。ERNIE 4.5 是一个由 10 个模型变体组成的家族,从 0.3B 密集型到 424B MoE,全部支持多模态,全部以 Apache 2.0 开源。
ERNIE 5.0 于 2025 年 11 月发布,拥有 2.4 万亿参数,支持全模态(文字、图像、音频、视频)。截至 2026 年初,它处于预览阶段,尚未开源。
最适合: 多模态应用、中文搜索/知识任务、已在 Baidu 云平台上的团队。
ByteDance(豆包)
公司: ByteDance 关键模型: Doubao-Seed-2.0 授权: 部分开放 访问方式: 豆包应用、火山引擎云
ByteDance 的 AI 布局是豆包——既是应用(超过 2 亿用户),也是模型家族。Doubao-Seed-2.0 是一个由四个模型组成的家族,其中 Pro 变体在 AIME 2025 上得分 98.3,Codeforces 评级达到 3020。
豆包不像 DeepSeek 或 Qwen 那样以开发者为导向——它更偏向消费者,类似于 ChatGPT 是 OpenAI 的消费者门面。但底层模型是认真的,API 访问可通过火山引擎获取。
最适合: 面向消费者的应用、在 ByteDance 生态系统上构建的团队。
Zhipu AI (Z.ai)
公司: Zhipu AI,国际品牌更名为 Z.ai(2025 年 7 月) 关键模型: GLM-5、GLM-4.7、GLM-4.5 授权: 开源(GLM-4.5) 访问方式: API,2026 年 1 月 8 日在 HKEX 上市
Zhipu 由清华大学研究人员共同创立,定位为中国的「开源冠军」。GLM-4.5 是一个 355B MoE 模型,在发布时被描述为中国最先进的开源 MoE。
GLM-5 是他们的最新模型——专注于自主编程和长上下文任务。香港当地从业者观察到,GLM-5 最初以「Pony Alpha」的名义出现在 OpenRouter 上时,在编程方面非常强大,他们在该模型身份公开之前就使用 OpenCode 进行了测试。Zhipu 的国际品牌更名为 Z.ai 以及 HKEX IPO 表明了其在中国大陆以外的认真野心。
最适合: 研究应用、编程任务、长上下文任务、重视学术严谨的团队。
Moonshot AI (Kimi)
公司: Moonshot AI(2026 年成为中国最快的十角兽公司) 关键模型: Kimi K2.5、Kimi k1.5 授权: 部分模型开放权重 访问方式: API、kimi.ai
Kimi K2.5 可能是你没听说过的最有趣的中国模型。它支持 262K 上下文,具备工具使用能力,并配备了一个「Agent Swarm」系统,使用名为 PARL 的技术可以同时启动 100 个并行子代理。
Moonshot 成为中国最快的十角兽——K2.5 发布后 20 天的收入超过了他们 2025 年的全年总和。这种增长速度引人瞩目。
最适合: 基于 Agent 的应用、工具使用工作流程、长上下文任务。
MiniMax
公司: MiniMax(2026 年 1 月 9 日在 HKEX 上市) 关键模型: MiniMax-M2.5、MiniMax-M1 授权: 修改版 MIT 访问方式: API、Hugging Face
MiniMax-M2.5 是让人刮目相看的模型:它在 SWE-Bench 上得分 80.2%,在多个基准测试中匹配 Claude Opus——成本约为其 1/20。以修改版 MIT 授权在 Hugging Face 上发布。
成本效率是头条,但模型品质才是故事。MiniMax 从相对默默无闻到在 HKEX 上市,用了不到一年。
最适合: 成本敏感的生产部署、编程任务、需要 Claude 级品质但不需要 Claude 级定价的团队。
StepFun
公司: StepFun(正在寻求 HKEX IPO) 关键模型: Step 3.5 Flash、Step 3 授权: Apache 2.0 访问方式: API、Hugging Face、NVIDIA NIM
StepFun 3.5 Flash 是一个效率故事。这是一个 196B MoE 模型,每个 token 只有 11B 活跃参数——意味着它运行快速且便宜,同时在 AIME 2025 上得分 97.3%,在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授权。
这是让 MoE 架构真正发挥作用的模型:你以小模型的速度获得大模型的品质。据报导 StepFun 正在寻求 HKEX IPO,延续中国 AI 公司在香港上市的趋势。
最适合: 对延迟敏感的应用、高效部署、数学和编程任务。
SenseTime(商汤日日新)
公司: SenseTime(总部位于香港,在 HKEX 上市) 关键模型: SenseNova V6、SenseNova-MARS、SenseNova-SI 授权: 部分开源 访问方式: API,部分模型在 Hugging Face 上
SenseTime 是香港自己的 AI 巨头——总部在此,在 HKEX 上市,市值约 77 亿美元。SenseNova V6 是其旗舰模型(620B 混合专家架构)。SenseNova-MARS(多模态自主推理,开源)和 SenseNova-SI(空间智能,开源)针对特定应用领域。
最适合: 计算机视觉、空间智能、想要与香港总部公司合作的团队。
如何选择
正确的模型取决于你的设定和你正在构建的东西:
- -使用 Cursor? Auto 模式处理模型路由。部分开发者偏好 Sonnet 的品质但会留意 token 使用量。
- -使用 OpenCode? 截至 2026 年 3 月,MiniMax M2.5 免费提供。
- -构建双语产品? Qwen 3.5 在 201 种语言中有强大的多语言支持。参见 8BitOracle 和 SixLines 的香港实例。
- -优化速度和成本? StepFun 3.5 Flash——以极低的成本实现前沿准确度。
- -构建 Agent 系统? Kimi K2.5 及其 PARL Agent Swarm 架构。
- -想要香港本地供应商? SenseTime SenseNova。
- -使用 OpenRouter? 模型会轮换——查看可用模型。Pony Alpha (GLM-5) 之前是一个很强的选择。
这些模型具有竞争力。授权是宽松的。而且没有一个会因为你住在哪里而封锁你。
来源
- -DeepSeek on Hugging Face
- -DeepSeek API Pricing
- -Qwen Official Blog
- -Qwen on Hugging Face
- -Baidu Unveils ERNIE 5.0 — PR Newswire
- -StepFun 3.5 Flash — Hugging Face
- -MiniMax Models
- -01.AI Yi — GitHub
- -Z.ai (Zhipu AI)
- -Ranking the Chinese Open Model Builders — Interconnects
本指南会随着新模型发布而定期更新。订阅 Hong Kong AI Podcast 获取香港可用 AI 工具和模型的最新资讯。
在我们发布新文章和节目时收到通知。没有垃圾邮件,只有信号。