什麼是香港AI播客？

香港AI播客是與香港 AI 從業者的真實對話，涵蓋研究、金融科技、機器人、空間計算、醫療和文化。它是草根的、社群驅動的，提供英文、繁體中文和簡體中文版本。

香港AI播客的主持人是誰？

節目由周倩彤（Tanya Chou）擔任主持，陳敖桂（Augustin Chan）擔任共同主持，陳永杰（Ricky Chan）擔任攝影總監。他們為每集節目帶來好奇心和從業者的專業知識。

香港AI播客涵蓋哪些主題？

播客涵蓋香港可用的 AI 工具、中國 AI 模型和平台、香港本地 AI 生態系統，以及 AI 從業者的實用指南。網誌分為四大專欄：香港 AI 工具棧、中國 AI 格局、香港 AI 生態和從業者指南。

香港AI播客有中文版本嗎？

有。網站和所有文章均提供英文、繁體中文和簡體中文版本。節目主要以英文和廣東話錄製。

首頁/所有文章/chinese-ai-models

中國 AI 格局

中國 AI 模型指南：DeepSeek、Qwen、ERNIE 及更多

Hong Kong AI Podcast/2026-03-07/12 min read/DeepSeekQwenERNIEZhipuMiniMaxStepFunChinese AI

過去兩年，中國 AI 領域發生了令人矚目的事情。當西方科技媒體聚焦於 OpenAI 和 Anthropic 時，中國的 AI 實驗室推出了數十個前沿模型——其中許多是開源的，許多確實非常優秀，而且幾乎所有模型都可以從香港無限制地存取。

本指南涵蓋截至 2026 年初的主要中國 AI 模型和公司。如果你是香港的開發者、研究人員或創辦人，這些不是替代品——對許多人來說，這些就是你的主要工具。

DeepSeek

公司： DeepSeek（總部位於杭州，2023 年成立） 關鍵模型： DeepSeek-V3.2、DeepSeek-R1 授權： MIT（完全開源） 存取方式： API 位於 api.deepseek.com + 通過 Hugging Face 自行部署

DeepSeek 以其推理和對話能力引起了轟動。在短短兩年多的時間裡，他們從默默無聞成為 AI 界家喻戶曉的名字。

DeepSeek-V3.2 是他們目前的旗艦模型——一個 671B 參數的混合專家模型，每個 token 有 37B 活躍參數。它在 2025 年 IMO 和 IOI 上都獲得了金牌。MIT 授權，意味著你可以用於任何用途，包括商業應用。

DeepSeek-R1 是他們的推理模型，可與 OpenAI 的 o1 相比。它在數學和多步驟問題解決方面表現出色。

DeepSeek 的特別之處在於開放性，而不一定是原始品質。所有內容都是 MIT 授權的——你可以下載權重、微調、商業部署並檢查架構。具體到編程方面，DeepSeek 可能較慢，也不是頂級表現者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的價格和自行部署故事很難被超越。

最適合： 推理/對話任務、自行部署、成本敏感的部署、任何需要 MIT 授權和完全模型控制的應用。

Alibaba Qwen

公司： Alibaba Cloud（Qwen 團隊） 關鍵模型： Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授權： Apache 2.0 存取方式： Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai

Qwen 是 Alibaba 的模型家族，規模龐大——迄今已發布超過 100 個開源權重模型。Qwen 3.5 是目前的旗艦：高達 397B 參數（MoE），支援 201 種語言。

多語言能力是 Qwen 的超能力。對於開發需要同時支援英語和中文的產品的香港開發者來說，Qwen 通常是最佳選擇。該模型理解語碼轉換、粵語語境，以及繁體中文和簡體中文之間的細微差別。

Qwen 3.5 有多種尺寸，從可以在手機上運行的微型模型到完整的 397B MoE。全部為 Apache 2.0 授權。

截至 2026 年 3 月，香港應用如 8BitOracle 和 SixLines 已經在生產環境中使用 Qwen3 進行雙語聊天。當地 AI 社群成員也觀察到，較小的 Qwen 3.5 模型相對於其大小表現超出預期——值得在選擇更大型號之前進行測試。

最適合： 雙語應用、中文語言任務、多語言產品、裝置端部署（較小模型）。

Baidu ERNIE

公司： Baidu 關鍵模型： ERNIE 4.5、ERNIE 5.0（預覽） 授權： Apache 2.0（4.5 系列）、閉源（5.0） 存取方式： 千帆平台、Hugging Face

ERNIE 是最早的嚴肅中國 LLM 之一，Baidu 一直在持續推進。ERNIE 4.5 是一個由 10 個模型變體組成的家族，從 0.3B 密集型到 424B MoE，全部支援多模態，全部以 Apache 2.0 開源。

ERNIE 5.0 於 2025 年 11 月發布，擁有 2.4 萬億參數，支援全模態（文字、圖像、音訊、影片）。截至 2026 年初，它處於預覽階段，尚未開源。

最適合： 多模態應用、中文搜尋/知識任務、已在 Baidu 雲平台上的團隊。

ByteDance（豆包）

公司： ByteDance 關鍵模型： Doubao-Seed-2.0 授權： 部分開放 存取方式： 豆包應用、火山引擎雲

ByteDance 的 AI 布局是豆包——既是應用（超過 2 億用戶），也是模型家族。Doubao-Seed-2.0 是一個由四個模型組成的家族，其中 Pro 變體在 AIME 2025 上得分 98.3，Codeforces 評級達到 3020。

豆包不像 DeepSeek 或 Qwen 那樣以開發者為導向——它更偏向消費者，類似於 ChatGPT 是 OpenAI 的消費者門面。但底層模型是認真的，API 存取可通過火山引擎獲取。

最適合： 面向消費者的應用、在 ByteDance 生態系統上構建的團隊。

Zhipu AI (Z.ai)

公司： Zhipu AI，國際品牌更名為 Z.ai（2025 年 7 月） 關鍵模型： GLM-5、GLM-4.7、GLM-4.5 授權： 開源（GLM-4.5） 存取方式： API，2026 年 1 月 8 日在 HKEX 上市

Zhipu 由清華大學研究人員共同創立，定位為中國的「開源冠軍」。GLM-4.5 是一個 355B MoE 模型，在發布時被描述為中國最先進的開源 MoE。

GLM-5 是他們的最新模型——專注於自主編程和長上下文任務。香港當地從業者觀察到，GLM-5 最初以「Pony Alpha」的名義出現在 OpenRouter 上時，在編程方面非常強大，他們在該模型身份公開之前就使用 OpenCode 進行了測試。Zhipu 的國際品牌更名為 Z.ai 以及 HKEX IPO 表明了其在中國大陸以外的認真野心。

最適合： 研究應用、編程任務、長上下文任務、重視學術嚴謹的團隊。

Moonshot AI (Kimi)

公司： Moonshot AI（2026 年成為中國最快的十角獸公司） 關鍵模型： Kimi K2.5、Kimi k1.5 授權： 部分模型開放權重 存取方式： API、kimi.ai

Kimi K2.5 可能是你沒聽說過的最有趣的中國模型。它支援 262K 上下文，具備工具使用能力，並配備了一個「Agent Swarm」系統，使用名為 PARL 的技術可以同時啟動 100 個平行子代理。

Moonshot 成為中國最快的十角獸——K2.5 發布後 20 天的收入超過了他們 2025 年的全年總和。這種增長速度引人注目。

最適合： 基於 Agent 的應用、工具使用工作流程、長上下文任務。

MiniMax

公司： MiniMax（2026 年 1 月 9 日在 HKEX 上市） 關鍵模型： MiniMax-M2.5、MiniMax-M1 授權： 修改版 MIT 存取方式： API、Hugging Face

MiniMax-M2.5 是讓人刮目相看的模型：它在 SWE-Bench 上得分 80.2%，在多個基準測試中匹配 Claude Opus——成本約為其 1/20。以修改版 MIT 授權在 Hugging Face 上發布。

成本效率是頭條，但模型品質才是故事。MiniMax 從相對默默無聞到在 HKEX 上市，用了不到一年。

最適合： 成本敏感的生產部署、編程任務、需要 Claude 級品質但不需要 Claude 級定價的團隊。

StepFun

公司： StepFun（正在尋求 HKEX IPO） 關鍵模型： Step 3.5 Flash、Step 3 授權： Apache 2.0 存取方式： API、Hugging Face、NVIDIA NIM

StepFun 3.5 Flash 是一個效率故事。這是一個 196B MoE 模型，每個 token 只有 11B 活躍參數——意味著它運行快速且便宜，同時在 AIME 2025 上得分 97.3%，在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授權。

這是讓 MoE 架構真正發揮作用的模型：你以小模型的速度獲得大模型的品質。據報導 StepFun 正在尋求 HKEX IPO，延續中國 AI 公司在香港上市的趨勢。

最適合： 對延遲敏感的應用、高效部署、數學和編程任務。

SenseTime（商湯日日新）

公司： SenseTime（總部位於香港，在 HKEX 上市） 關鍵模型： SenseNova V6、SenseNova-MARS、SenseNova-SI 授權： 部分開源 存取方式： API，部分模型在 Hugging Face 上

SenseTime 是香港自己的 AI 巨頭——總部在此，在 HKEX 上市，市值約 77 億美元。SenseNova V6 是其旗艦模型（620B 混合專家架構）。SenseNova-MARS（多模態自主推理，開源）和 SenseNova-SI（空間智能，開源）針對特定應用領域。

最適合： 電腦視覺、空間智能、想要與香港總部公司合作的團隊。

如何選擇

正確的模型取決於你的設定和你正在構建的東西：

-使用 Cursor？ Auto 模式處理模型路由。部分開發者偏好 Sonnet 的品質但會留意 token 使用量。
-使用 OpenCode？ 截至 2026 年 3 月，MiniMax M2.5 免費提供。
-構建雙語產品？ Qwen 3.5 在 201 種語言中有強大的多語言支援。參見 8BitOracle 和 SixLines 的香港實例。
-優化速度和成本？ StepFun 3.5 Flash——以極低的成本實現前沿準確度。
-構建 Agent 系統？ Kimi K2.5 及其 PARL Agent Swarm 架構。
-想要香港本地供應商？ SenseTime SenseNova。
-使用 OpenRouter？ 模型會輪換——查看可用模型。Pony Alpha (GLM-5) 之前是一個很強的選擇。

這些模型具有競爭力。授權是寬鬆的。而且沒有一個會因為你住在哪裡而封鎖你。

來源

本指南會隨著新模型發布而定期更新。訂閱 Hong Kong AI Podcast 獲取香港可用 AI 工具和模型的最新資訊。

保持更新

在我們發布新文章和節目時收到通知。沒有垃圾郵件，只有訊號。

內容過時或有誤？AI 發展迅速，我們希望做到正確。請通過以下方式告訴我們 contact@hongkongaipodcast.com