首頁/所有文章/chinese-ai-models
中國 AI 格局

中國 AI 模型指南:DeepSeek、Qwen、ERNIE 及更多

Hong Kong AI Podcast/2026-03-07/12 min read/DeepSeekQwenERNIEZhipuMiniMaxStepFunChinese AI

過去兩年,中國 AI 領域發生了令人矚目的事情。當西方科技媒體聚焦於 OpenAI 和 Anthropic 時,中國的 AI 實驗室推出了數十個前沿模型——其中許多是開源的,許多確實非常優秀,而且幾乎所有模型都可以從香港無限制地存取。

本指南涵蓋截至 2026 年初的主要中國 AI 模型和公司。如果你是香港的開發者、研究人員或創辦人,這些不是替代品——對許多人來說,這些就是你的主要工具。

DeepSeek

公司: DeepSeek(總部位於杭州,2023 年成立) 關鍵模型: DeepSeek-V3.2、DeepSeek-R1 授權: MIT(完全開源) 存取方式: API 位於 api.deepseek.com + 通過 Hugging Face 自行部署

DeepSeek 以其推理和對話能力引起了轟動。在短短兩年多的時間裡,他們從默默無聞成為 AI 界家喻戶曉的名字。

DeepSeek-V3.2 是他們目前的旗艦模型——一個 671B 參數的混合專家模型,每個 token 有 37B 活躍參數。它在 2025 年 IMO 和 IOI 上都獲得了金牌。MIT 授權,意味著你可以用於任何用途,包括商業應用。

DeepSeek-R1 是他們的推理模型,可與 OpenAI 的 o1 相比。它在數學和多步驟問題解決方面表現出色。

DeepSeek 的特別之處在於開放性,而不一定是原始品質。所有內容都是 MIT 授權的——你可以下載權重、微調、商業部署並檢查架構。具體到編程方面,DeepSeek 可能較慢,也不是頂級表現者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的價格和自行部署故事很難被超越。

最適合: 推理/對話任務、自行部署、成本敏感的部署、任何需要 MIT 授權和完全模型控制的應用。

Alibaba Qwen

公司: Alibaba Cloud(Qwen 團隊) 關鍵模型: Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授權: Apache 2.0 存取方式: Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai

Qwen 是 Alibaba 的模型家族,規模龐大——迄今已發布超過 100 個開源權重模型。Qwen 3.5 是目前的旗艦:高達 397B 參數(MoE),支援 201 種語言。

多語言能力是 Qwen 的超能力。對於開發需要同時支援英語和中文的產品的香港開發者來說,Qwen 通常是最佳選擇。該模型理解語碼轉換、粵語語境,以及繁體中文和簡體中文之間的細微差別。

Qwen 3.5 有多種尺寸,從可以在手機上運行的微型模型到完整的 397B MoE。全部為 Apache 2.0 授權。

截至 2026 年 3 月,香港應用如 8BitOracleSixLines 已經在生產環境中使用 Qwen3 進行雙語聊天。當地 AI 社群成員也觀察到,較小的 Qwen 3.5 模型相對於其大小表現超出預期——值得在選擇更大型號之前進行測試。

最適合: 雙語應用、中文語言任務、多語言產品、裝置端部署(較小模型)。

Baidu ERNIE

公司: Baidu 關鍵模型: ERNIE 4.5、ERNIE 5.0(預覽) 授權: Apache 2.0(4.5 系列)、閉源(5.0) 存取方式: 千帆平台、Hugging Face

ERNIE 是最早的嚴肅中國 LLM 之一,Baidu 一直在持續推進。ERNIE 4.5 是一個由 10 個模型變體組成的家族,從 0.3B 密集型到 424B MoE,全部支援多模態,全部以 Apache 2.0 開源。

ERNIE 5.0 於 2025 年 11 月發布,擁有 2.4 萬億參數,支援全模態(文字、圖像、音訊、影片)。截至 2026 年初,它處於預覽階段,尚未開源。

最適合: 多模態應用、中文搜尋/知識任務、已在 Baidu 雲平台上的團隊。

ByteDance(豆包)

公司: ByteDance 關鍵模型: Doubao-Seed-2.0 授權: 部分開放 存取方式: 豆包應用、火山引擎雲

ByteDance 的 AI 布局是豆包——既是應用(超過 2 億用戶),也是模型家族。Doubao-Seed-2.0 是一個由四個模型組成的家族,其中 Pro 變體在 AIME 2025 上得分 98.3,Codeforces 評級達到 3020。

豆包不像 DeepSeek 或 Qwen 那樣以開發者為導向——它更偏向消費者,類似於 ChatGPT 是 OpenAI 的消費者門面。但底層模型是認真的,API 存取可通過火山引擎獲取。

最適合: 面向消費者的應用、在 ByteDance 生態系統上構建的團隊。

Zhipu AI (Z.ai)

公司: Zhipu AI,國際品牌更名為 Z.ai(2025 年 7 月) 關鍵模型: GLM-5、GLM-4.7、GLM-4.5 授權: 開源(GLM-4.5) 存取方式: API,2026 年 1 月 8 日在 HKEX 上市

Zhipu 由清華大學研究人員共同創立,定位為中國的「開源冠軍」。GLM-4.5 是一個 355B MoE 模型,在發布時被描述為中國最先進的開源 MoE。

GLM-5 是他們的最新模型——專注於自主編程和長上下文任務。香港當地從業者觀察到,GLM-5 最初以「Pony Alpha」的名義出現在 OpenRouter 上時,在編程方面非常強大,他們在該模型身份公開之前就使用 OpenCode 進行了測試。Zhipu 的國際品牌更名為 Z.ai 以及 HKEX IPO 表明了其在中國大陸以外的認真野心。

最適合: 研究應用、編程任務、長上下文任務、重視學術嚴謹的團隊。

Moonshot AI (Kimi)

公司: Moonshot AI(2026 年成為中國最快的十角獸公司) 關鍵模型: Kimi K2.5、Kimi k1.5 授權: 部分模型開放權重 存取方式: API、kimi.ai

Kimi K2.5 可能是你沒聽說過的最有趣的中國模型。它支援 262K 上下文,具備工具使用能力,並配備了一個「Agent Swarm」系統,使用名為 PARL 的技術可以同時啟動 100 個平行子代理。

Moonshot 成為中國最快的十角獸——K2.5 發布後 20 天的收入超過了他們 2025 年的全年總和。這種增長速度引人注目。

最適合: 基於 Agent 的應用、工具使用工作流程、長上下文任務。

MiniMax

公司: MiniMax(2026 年 1 月 9 日在 HKEX 上市) 關鍵模型: MiniMax-M2.5、MiniMax-M1 授權: 修改版 MIT 存取方式: API、Hugging Face

MiniMax-M2.5 是讓人刮目相看的模型:它在 SWE-Bench 上得分 80.2%,在多個基準測試中匹配 Claude Opus——成本約為其 1/20。以修改版 MIT 授權在 Hugging Face 上發布。

成本效率是頭條,但模型品質才是故事。MiniMax 從相對默默無聞到在 HKEX 上市,用了不到一年。

最適合: 成本敏感的生產部署、編程任務、需要 Claude 級品質但不需要 Claude 級定價的團隊。

StepFun

公司: StepFun(正在尋求 HKEX IPO) 關鍵模型: Step 3.5 Flash、Step 3 授權: Apache 2.0 存取方式: API、Hugging Face、NVIDIA NIM

StepFun 3.5 Flash 是一個效率故事。這是一個 196B MoE 模型,每個 token 只有 11B 活躍參數——意味著它運行快速且便宜,同時在 AIME 2025 上得分 97.3%,在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授權。

這是讓 MoE 架構真正發揮作用的模型:你以小模型的速度獲得大模型的品質。據報導 StepFun 正在尋求 HKEX IPO,延續中國 AI 公司在香港上市的趨勢。

最適合: 對延遲敏感的應用、高效部署、數學和編程任務。

SenseTime(商湯日日新)

公司: SenseTime(總部位於香港,在 HKEX 上市) 關鍵模型: SenseNova V6、SenseNova-MARS、SenseNova-SI 授權: 部分開源 存取方式: API,部分模型在 Hugging Face 上

SenseTime 是香港自己的 AI 巨頭——總部在此,在 HKEX 上市,市值約 77 億美元。SenseNova V6 是其旗艦模型(620B 混合專家架構)。SenseNova-MARS(多模態自主推理,開源)和 SenseNova-SI(空間智能,開源)針對特定應用領域。

最適合: 電腦視覺、空間智能、想要與香港總部公司合作的團隊。

如何選擇

正確的模型取決於你的設定和你正在構建的東西:

  • -使用 Cursor? Auto 模式處理模型路由。部分開發者偏好 Sonnet 的品質但會留意 token 使用量。
  • -使用 OpenCode? 截至 2026 年 3 月,MiniMax M2.5 免費提供。
  • -構建雙語產品? Qwen 3.5 在 201 種語言中有強大的多語言支援。參見 8BitOracleSixLines 的香港實例。
  • -優化速度和成本? StepFun 3.5 Flash——以極低的成本實現前沿準確度。
  • -構建 Agent 系統? Kimi K2.5 及其 PARL Agent Swarm 架構。
  • -想要香港本地供應商? SenseTime SenseNova。
  • -使用 OpenRouter? 模型會輪換——查看可用模型。Pony Alpha (GLM-5) 之前是一個很強的選擇。

這些模型具有競爭力。授權是寬鬆的。而且沒有一個會因為你住在哪裡而封鎖你。



來源

本指南會隨著新模型發布而定期更新。訂閱 Hong Kong AI Podcast 獲取香港可用 AI 工具和模型的最新資訊。

保持更新

在我們發布新文章和節目時收到通知。沒有垃圾郵件,只有訊號。

內容過時或有誤?AI 發展迅速,我們希望做到正確。請通過以下方式告訴我們 contact@hongkongaipodcast.com