首页/所有文章/chinese-ai-models
中国 AI 格局

中国 AI 模型指南:DeepSeek、Qwen、ERNIE 及更多

Hong Kong AI Podcast/2026-03-07/12 min read/DeepSeekQwenERNIEZhipuMiniMaxStepFunChinese AI

过去两年,中国 AI 领域发生了令人瞩目的事情。当西方科技媒体聚焦于 OpenAI 和 Anthropic 时,中国的 AI 实验室推出了数十个前沿模型——其中许多是开源的,许多确实非常优秀,而且几乎所有模型都可以从香港无限制地访问。

本指南涵盖截至 2026 年初的主要中国 AI 模型和公司。如果你是香港的开发者、研究人员或创办人,这些不是替代品——对许多人来说,这些就是你的主要工具。

DeepSeek

公司: DeepSeek(总部位于杭州,2023 年成立) 关键模型: DeepSeek-V3.2、DeepSeek-R1 授权: MIT(完全开源) 访问方式: API 位于 api.deepseek.com + 通过 Hugging Face 自行部署

DeepSeek 以其推理和对话能力引起了轰动。在短短两年多的时间里,他们从默默无闻成为 AI 界家喻户晓的名字。

DeepSeek-V3.2 是他们目前的旗舰模型——一个 671B 参数的混合专家模型,每个 token 有 37B 活跃参数。它在 2025 年 IMO 和 IOI 上都获得了金牌。MIT 授权,意味着你可以用于任何用途,包括商业应用。

DeepSeek-R1 是他们的推理模型,可与 OpenAI 的 o1 相比。它在数学和多步骤问题解决方面表现出色。

DeepSeek 的特别之处在于开放性,而不一定是原始品质。所有内容都是 MIT 授权的——你可以下载权重、微调、商业部署并检查架构。具体到编程方面,DeepSeek 可能较慢,也不是顶级表现者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的价格和自行部署故事很难被超越。

最适合: 推理/对话任务、自行部署、成本敏感的部署、任何需要 MIT 授权和完全模型控制的应用。

Alibaba Qwen

公司: Alibaba Cloud(Qwen 团队) 关键模型: Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授权: Apache 2.0 访问方式: Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai

Qwen 是 Alibaba 的模型家族,规模庞大——迄今已发布超过 100 个开源权重模型。Qwen 3.5 是目前的旗舰:高达 397B 参数(MoE),支持 201 种语言。

多语言能力是 Qwen 的超能力。对于开发需要同时支持英语和中文的产品的香港开发者来说,Qwen 通常是最佳选择。该模型理解语码转换、粤语语境,以及繁体中文和简体中文之间的细微差别。

Qwen 3.5 有多种尺寸,从可以在手机上运行的微型模型到完整的 397B MoE。全部为 Apache 2.0 授权。

截至 2026 年 3 月,香港应用如 8BitOracleSixLines 已经在生产环境中使用 Qwen3 进行双语聊天。当地 AI 社群成员也观察到,较小的 Qwen 3.5 模型相对于其大小表现超出预期——值得在选择更大型号之前进行测试。

最适合: 双语应用、中文语言任务、多语言产品、设备端部署(较小模型)。

Baidu ERNIE

公司: Baidu 关键模型: ERNIE 4.5、ERNIE 5.0(预览) 授权: Apache 2.0(4.5 系列)、闭源(5.0) 访问方式: 千帆平台、Hugging Face

ERNIE 是最早的严肃中国 LLM 之一,Baidu 一直在持续推进。ERNIE 4.5 是一个由 10 个模型变体组成的家族,从 0.3B 密集型到 424B MoE,全部支持多模态,全部以 Apache 2.0 开源。

ERNIE 5.0 于 2025 年 11 月发布,拥有 2.4 万亿参数,支持全模态(文字、图像、音频、视频)。截至 2026 年初,它处于预览阶段,尚未开源。

最适合: 多模态应用、中文搜索/知识任务、已在 Baidu 云平台上的团队。

ByteDance(豆包)

公司: ByteDance 关键模型: Doubao-Seed-2.0 授权: 部分开放 访问方式: 豆包应用、火山引擎云

ByteDance 的 AI 布局是豆包——既是应用(超过 2 亿用户),也是模型家族。Doubao-Seed-2.0 是一个由四个模型组成的家族,其中 Pro 变体在 AIME 2025 上得分 98.3,Codeforces 评级达到 3020。

豆包不像 DeepSeek 或 Qwen 那样以开发者为导向——它更偏向消费者,类似于 ChatGPT 是 OpenAI 的消费者门面。但底层模型是认真的,API 访问可通过火山引擎获取。

最适合: 面向消费者的应用、在 ByteDance 生态系统上构建的团队。

Zhipu AI (Z.ai)

公司: Zhipu AI,国际品牌更名为 Z.ai(2025 年 7 月) 关键模型: GLM-5、GLM-4.7、GLM-4.5 授权: 开源(GLM-4.5) 访问方式: API,2026 年 1 月 8 日在 HKEX 上市

Zhipu 由清华大学研究人员共同创立,定位为中国的「开源冠军」。GLM-4.5 是一个 355B MoE 模型,在发布时被描述为中国最先进的开源 MoE。

GLM-5 是他们的最新模型——专注于自主编程和长上下文任务。香港当地从业者观察到,GLM-5 最初以「Pony Alpha」的名义出现在 OpenRouter 上时,在编程方面非常强大,他们在该模型身份公开之前就使用 OpenCode 进行了测试。Zhipu 的国际品牌更名为 Z.ai 以及 HKEX IPO 表明了其在中国大陆以外的认真野心。

最适合: 研究应用、编程任务、长上下文任务、重视学术严谨的团队。

Moonshot AI (Kimi)

公司: Moonshot AI(2026 年成为中国最快的十角兽公司) 关键模型: Kimi K2.5、Kimi k1.5 授权: 部分模型开放权重 访问方式: API、kimi.ai

Kimi K2.5 可能是你没听说过的最有趣的中国模型。它支持 262K 上下文,具备工具使用能力,并配备了一个「Agent Swarm」系统,使用名为 PARL 的技术可以同时启动 100 个并行子代理。

Moonshot 成为中国最快的十角兽——K2.5 发布后 20 天的收入超过了他们 2025 年的全年总和。这种增长速度引人瞩目。

最适合: 基于 Agent 的应用、工具使用工作流程、长上下文任务。

MiniMax

公司: MiniMax(2026 年 1 月 9 日在 HKEX 上市) 关键模型: MiniMax-M2.5、MiniMax-M1 授权: 修改版 MIT 访问方式: API、Hugging Face

MiniMax-M2.5 是让人刮目相看的模型:它在 SWE-Bench 上得分 80.2%,在多个基准测试中匹配 Claude Opus——成本约为其 1/20。以修改版 MIT 授权在 Hugging Face 上发布。

成本效率是头条,但模型品质才是故事。MiniMax 从相对默默无闻到在 HKEX 上市,用了不到一年。

最适合: 成本敏感的生产部署、编程任务、需要 Claude 级品质但不需要 Claude 级定价的团队。

StepFun

公司: StepFun(正在寻求 HKEX IPO) 关键模型: Step 3.5 Flash、Step 3 授权: Apache 2.0 访问方式: API、Hugging Face、NVIDIA NIM

StepFun 3.5 Flash 是一个效率故事。这是一个 196B MoE 模型,每个 token 只有 11B 活跃参数——意味着它运行快速且便宜,同时在 AIME 2025 上得分 97.3%,在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授权。

这是让 MoE 架构真正发挥作用的模型:你以小模型的速度获得大模型的品质。据报导 StepFun 正在寻求 HKEX IPO,延续中国 AI 公司在香港上市的趋势。

最适合: 对延迟敏感的应用、高效部署、数学和编程任务。

SenseTime(商汤日日新)

公司: SenseTime(总部位于香港,在 HKEX 上市) 关键模型: SenseNova V6、SenseNova-MARS、SenseNova-SI 授权: 部分开源 访问方式: API,部分模型在 Hugging Face 上

SenseTime 是香港自己的 AI 巨头——总部在此,在 HKEX 上市,市值约 77 亿美元。SenseNova V6 是其旗舰模型(620B 混合专家架构)。SenseNova-MARS(多模态自主推理,开源)和 SenseNova-SI(空间智能,开源)针对特定应用领域。

最适合: 计算机视觉、空间智能、想要与香港总部公司合作的团队。

如何选择

正确的模型取决于你的设定和你正在构建的东西:

  • -使用 Cursor? Auto 模式处理模型路由。部分开发者偏好 Sonnet 的品质但会留意 token 使用量。
  • -使用 OpenCode? 截至 2026 年 3 月,MiniMax M2.5 免费提供。
  • -构建双语产品? Qwen 3.5 在 201 种语言中有强大的多语言支持。参见 8BitOracleSixLines 的香港实例。
  • -优化速度和成本? StepFun 3.5 Flash——以极低的成本实现前沿准确度。
  • -构建 Agent 系统? Kimi K2.5 及其 PARL Agent Swarm 架构。
  • -想要香港本地供应商? SenseTime SenseNova。
  • -使用 OpenRouter? 模型会轮换——查看可用模型。Pony Alpha (GLM-5) 之前是一个很强的选择。

这些模型具有竞争力。授权是宽松的。而且没有一个会因为你住在哪里而封锁你。



来源

本指南会随着新模型发布而定期更新。订阅 Hong Kong AI Podcast 获取香港可用 AI 工具和模型的最新资讯。

保持更新

在我们发布新文章和节目时收到通知。没有垃圾邮件,只有信号。

内容过时或有误?AI 发展迅速,我们希望做到正确。请通过以下方式告诉我们 contact@hongkongaipodcast.com