什么是香港AI播客？

香港AI播客是与香港 AI 从业者的真实对话，涵盖研究、金融科技、机器人、空间计算、医疗和文化。它是草根的、社区驱动的，提供英文、繁体中文和简体中文版本。

香港AI播客的主持人是谁？

节目由周倩彤（Tanya Chou）担任主持，陈敖桂（Augustin Chan）担任共同主持，陈永杰（Ricky Chan）担任摄影总监。他们为每集节目带来好奇心和从业者的专业知识。

香港AI播客涵盖哪些主题？

播客涵盖香港可用的 AI 工具、中国 AI 模型和平台、香港本地 AI 生态系统，以及 AI 从业者的实用指南。博客分为四大专栏：香港 AI 工具栈、中国 AI 格局、香港 AI 生态和从业者指南。

香港AI播客有中文版本吗？

有。网站和所有文章均提供英文、繁体中文和简体中文版本。节目主要以英文和广东话录制。

首页/所有文章/chinese-ai-models

中国 AI 格局

中国 AI 模型指南：DeepSeek、Qwen、ERNIE 及更多

Hong Kong AI Podcast/2026-03-07/12 min read/DeepSeekQwenERNIEZhipuMiniMaxStepFunChinese AI

过去两年，中国 AI 领域发生了令人瞩目的事情。当西方科技媒体聚焦于 OpenAI 和 Anthropic 时，中国的 AI 实验室推出了数十个前沿模型——其中许多是开源的，许多确实非常优秀，而且几乎所有模型都可以从香港无限制地访问。

本指南涵盖截至 2026 年初的主要中国 AI 模型和公司。如果你是香港的开发者、研究人员或创办人，这些不是替代品——对许多人来说，这些就是你的主要工具。

DeepSeek

公司： DeepSeek（总部位于杭州，2023 年成立） 关键模型： DeepSeek-V3.2、DeepSeek-R1 授权： MIT（完全开源） 访问方式： API 位于 api.deepseek.com + 通过 Hugging Face 自行部署

DeepSeek 以其推理和对话能力引起了轰动。在短短两年多的时间里，他们从默默无闻成为 AI 界家喻户晓的名字。

DeepSeek-V3.2 是他们目前的旗舰模型——一个 671B 参数的混合专家模型，每个 token 有 37B 活跃参数。它在 2025 年 IMO 和 IOI 上都获得了金牌。MIT 授权，意味着你可以用于任何用途，包括商业应用。

DeepSeek-R1 是他们的推理模型，可与 OpenAI 的 o1 相比。它在数学和多步骤问题解决方面表现出色。

DeepSeek 的特别之处在于开放性，而不一定是原始品质。所有内容都是 MIT 授权的——你可以下载权重、微调、商业部署并检查架构。具体到编程方面，DeepSeek 可能较慢，也不是顶级表现者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的价格和自行部署故事很难被超越。

最适合： 推理/对话任务、自行部署、成本敏感的部署、任何需要 MIT 授权和完全模型控制的应用。

Alibaba Qwen

公司： Alibaba Cloud（Qwen 团队） 关键模型： Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授权： Apache 2.0 访问方式： Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai

Qwen 是 Alibaba 的模型家族，规模庞大——迄今已发布超过 100 个开源权重模型。Qwen 3.5 是目前的旗舰：高达 397B 参数（MoE），支持 201 种语言。

多语言能力是 Qwen 的超能力。对于开发需要同时支持英语和中文的产品的香港开发者来说，Qwen 通常是最佳选择。该模型理解语码转换、粤语语境，以及繁体中文和简体中文之间的细微差别。

Qwen 3.5 有多种尺寸，从可以在手机上运行的微型模型到完整的 397B MoE。全部为 Apache 2.0 授权。

截至 2026 年 3 月，香港应用如 8BitOracle 和 SixLines 已经在生产环境中使用 Qwen3 进行双语聊天。当地 AI 社群成员也观察到，较小的 Qwen 3.5 模型相对于其大小表现超出预期——值得在选择更大型号之前进行测试。

最适合： 双语应用、中文语言任务、多语言产品、设备端部署（较小模型）。

Baidu ERNIE

公司： Baidu 关键模型： ERNIE 4.5、ERNIE 5.0（预览） 授权： Apache 2.0（4.5 系列）、闭源（5.0） 访问方式： 千帆平台、Hugging Face

ERNIE 是最早的严肃中国 LLM 之一，Baidu 一直在持续推进。ERNIE 4.5 是一个由 10 个模型变体组成的家族，从 0.3B 密集型到 424B MoE，全部支持多模态，全部以 Apache 2.0 开源。

ERNIE 5.0 于 2025 年 11 月发布，拥有 2.4 万亿参数，支持全模态（文字、图像、音频、视频）。截至 2026 年初，它处于预览阶段，尚未开源。

最适合： 多模态应用、中文搜索/知识任务、已在 Baidu 云平台上的团队。

ByteDance（豆包）

公司： ByteDance 关键模型： Doubao-Seed-2.0 授权： 部分开放 访问方式： 豆包应用、火山引擎云

ByteDance 的 AI 布局是豆包——既是应用（超过 2 亿用户），也是模型家族。Doubao-Seed-2.0 是一个由四个模型组成的家族，其中 Pro 变体在 AIME 2025 上得分 98.3，Codeforces 评级达到 3020。

豆包不像 DeepSeek 或 Qwen 那样以开发者为导向——它更偏向消费者，类似于 ChatGPT 是 OpenAI 的消费者门面。但底层模型是认真的，API 访问可通过火山引擎获取。

最适合： 面向消费者的应用、在 ByteDance 生态系统上构建的团队。

Zhipu AI (Z.ai)

公司： Zhipu AI，国际品牌更名为 Z.ai（2025 年 7 月） 关键模型： GLM-5、GLM-4.7、GLM-4.5 授权： 开源（GLM-4.5） 访问方式： API，2026 年 1 月 8 日在 HKEX 上市

Zhipu 由清华大学研究人员共同创立，定位为中国的「开源冠军」。GLM-4.5 是一个 355B MoE 模型，在发布时被描述为中国最先进的开源 MoE。

GLM-5 是他们的最新模型——专注于自主编程和长上下文任务。香港当地从业者观察到，GLM-5 最初以「Pony Alpha」的名义出现在 OpenRouter 上时，在编程方面非常强大，他们在该模型身份公开之前就使用 OpenCode 进行了测试。Zhipu 的国际品牌更名为 Z.ai 以及 HKEX IPO 表明了其在中国大陆以外的认真野心。

最适合： 研究应用、编程任务、长上下文任务、重视学术严谨的团队。

Moonshot AI (Kimi)

公司： Moonshot AI（2026 年成为中国最快的十角兽公司） 关键模型： Kimi K2.5、Kimi k1.5 授权： 部分模型开放权重 访问方式： API、kimi.ai

Kimi K2.5 可能是你没听说过的最有趣的中国模型。它支持 262K 上下文，具备工具使用能力，并配备了一个「Agent Swarm」系统，使用名为 PARL 的技术可以同时启动 100 个并行子代理。

Moonshot 成为中国最快的十角兽——K2.5 发布后 20 天的收入超过了他们 2025 年的全年总和。这种增长速度引人瞩目。

最适合： 基于 Agent 的应用、工具使用工作流程、长上下文任务。

MiniMax

公司： MiniMax（2026 年 1 月 9 日在 HKEX 上市） 关键模型： MiniMax-M2.5、MiniMax-M1 授权： 修改版 MIT 访问方式： API、Hugging Face

MiniMax-M2.5 是让人刮目相看的模型：它在 SWE-Bench 上得分 80.2%，在多个基准测试中匹配 Claude Opus——成本约为其 1/20。以修改版 MIT 授权在 Hugging Face 上发布。

成本效率是头条，但模型品质才是故事。MiniMax 从相对默默无闻到在 HKEX 上市，用了不到一年。

最适合： 成本敏感的生产部署、编程任务、需要 Claude 级品质但不需要 Claude 级定价的团队。

StepFun

公司： StepFun（正在寻求 HKEX IPO） 关键模型： Step 3.5 Flash、Step 3 授权： Apache 2.0 访问方式： API、Hugging Face、NVIDIA NIM

StepFun 3.5 Flash 是一个效率故事。这是一个 196B MoE 模型，每个 token 只有 11B 活跃参数——意味着它运行快速且便宜，同时在 AIME 2025 上得分 97.3%，在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授权。

这是让 MoE 架构真正发挥作用的模型：你以小模型的速度获得大模型的品质。据报导 StepFun 正在寻求 HKEX IPO，延续中国 AI 公司在香港上市的趋势。

最适合： 对延迟敏感的应用、高效部署、数学和编程任务。

SenseTime（商汤日日新）

公司： SenseTime（总部位于香港，在 HKEX 上市） 关键模型： SenseNova V6、SenseNova-MARS、SenseNova-SI 授权： 部分开源 访问方式： API，部分模型在 Hugging Face 上

SenseTime 是香港自己的 AI 巨头——总部在此，在 HKEX 上市，市值约 77 亿美元。SenseNova V6 是其旗舰模型（620B 混合专家架构）。SenseNova-MARS（多模态自主推理，开源）和 SenseNova-SI（空间智能，开源）针对特定应用领域。

最适合： 计算机视觉、空间智能、想要与香港总部公司合作的团队。

如何选择

正确的模型取决于你的设定和你正在构建的东西：

-使用 Cursor？ Auto 模式处理模型路由。部分开发者偏好 Sonnet 的品质但会留意 token 使用量。
-使用 OpenCode？ 截至 2026 年 3 月，MiniMax M2.5 免费提供。
-构建双语产品？ Qwen 3.5 在 201 种语言中有强大的多语言支持。参见 8BitOracle 和 SixLines 的香港实例。
-优化速度和成本？ StepFun 3.5 Flash——以极低的成本实现前沿准确度。
-构建 Agent 系统？ Kimi K2.5 及其 PARL Agent Swarm 架构。
-想要香港本地供应商？ SenseTime SenseNova。
-使用 OpenRouter？ 模型会轮换——查看可用模型。Pony Alpha (GLM-5) 之前是一个很强的选择。

这些模型具有竞争力。授权是宽松的。而且没有一个会因为你住在哪里而封锁你。

来源

本指南会随着新模型发布而定期更新。订阅 Hong Kong AI Podcast 获取香港可用 AI 工具和模型的最新资讯。

保持更新

在我们发布新文章和节目时收到通知。没有垃圾邮件，只有信号。

内容过时或有误？AI 发展迅速，我们希望做到正确。请通过以下方式告诉我们 contact@hongkongaipodcast.com