中國 AI 模型指南:DeepSeek、Qwen、ERNIE 及更多
過去兩年,中國 AI 領域發生了令人矚目的事情。當西方科技媒體聚焦於 OpenAI 和 Anthropic 時,中國的 AI 實驗室推出了數十個前沿模型——其中許多是開源的,許多確實非常優秀,而且幾乎所有模型都可以從香港無限制地存取。
本指南涵蓋截至 2026 年初的主要中國 AI 模型和公司。如果你是香港的開發者、研究人員或創辦人,這些不是替代品——對許多人來說,這些就是你的主要工具。
DeepSeek
公司: DeepSeek(總部位於杭州,2023 年成立) 關鍵模型: DeepSeek-V3.2、DeepSeek-R1 授權: MIT(完全開源) 存取方式: API 位於 api.deepseek.com + 通過 Hugging Face 自行部署
DeepSeek 以其推理和對話能力引起了轟動。在短短兩年多的時間裡,他們從默默無聞成為 AI 界家喻戶曉的名字。
DeepSeek-V3.2 是他們目前的旗艦模型——一個 671B 參數的混合專家模型,每個 token 有 37B 活躍參數。它在 2025 年 IMO 和 IOI 上都獲得了金牌。MIT 授權,意味著你可以用於任何用途,包括商業應用。
DeepSeek-R1 是他們的推理模型,可與 OpenAI 的 o1 相比。它在數學和多步驟問題解決方面表現出色。
DeepSeek 的特別之處在於開放性,而不一定是原始品質。所有內容都是 MIT 授權的——你可以下載權重、微調、商業部署並檢查架構。具體到編程方面,DeepSeek 可能較慢,也不是頂級表現者——Claude Opus 4.6、MiniMax M2.5 和 GLM-5 等模型在 SWE-bench 上得分更高。但 DeepSeek 的價格和自行部署故事很難被超越。
最適合: 推理/對話任務、自行部署、成本敏感的部署、任何需要 MIT 授權和完全模型控制的應用。
Alibaba Qwen
公司: Alibaba Cloud(Qwen 團隊) 關鍵模型: Qwen 3.5、Qwen 3-Max、Qwen 2.5-VL 授權: Apache 2.0 存取方式: Alibaba Cloud DashScope API、Hugging Face、chat.qwen.ai
Qwen 是 Alibaba 的模型家族,規模龐大——迄今已發布超過 100 個開源權重模型。Qwen 3.5 是目前的旗艦:高達 397B 參數(MoE),支援 201 種語言。
多語言能力是 Qwen 的超能力。對於開發需要同時支援英語和中文的產品的香港開發者來說,Qwen 通常是最佳選擇。該模型理解語碼轉換、粵語語境,以及繁體中文和簡體中文之間的細微差別。
Qwen 3.5 有多種尺寸,從可以在手機上運行的微型模型到完整的 397B MoE。全部為 Apache 2.0 授權。
截至 2026 年 3 月,香港應用如 8BitOracle 和 SixLines 已經在生產環境中使用 Qwen3 進行雙語聊天。當地 AI 社群成員也觀察到,較小的 Qwen 3.5 模型相對於其大小表現超出預期——值得在選擇更大型號之前進行測試。
最適合: 雙語應用、中文語言任務、多語言產品、裝置端部署(較小模型)。
Baidu ERNIE
公司: Baidu 關鍵模型: ERNIE 4.5、ERNIE 5.0(預覽) 授權: Apache 2.0(4.5 系列)、閉源(5.0) 存取方式: 千帆平台、Hugging Face
ERNIE 是最早的嚴肅中國 LLM 之一,Baidu 一直在持續推進。ERNIE 4.5 是一個由 10 個模型變體組成的家族,從 0.3B 密集型到 424B MoE,全部支援多模態,全部以 Apache 2.0 開源。
ERNIE 5.0 於 2025 年 11 月發布,擁有 2.4 萬億參數,支援全模態(文字、圖像、音訊、影片)。截至 2026 年初,它處於預覽階段,尚未開源。
最適合: 多模態應用、中文搜尋/知識任務、已在 Baidu 雲平台上的團隊。
ByteDance(豆包)
公司: ByteDance 關鍵模型: Doubao-Seed-2.0 授權: 部分開放 存取方式: 豆包應用、火山引擎雲
ByteDance 的 AI 布局是豆包——既是應用(超過 2 億用戶),也是模型家族。Doubao-Seed-2.0 是一個由四個模型組成的家族,其中 Pro 變體在 AIME 2025 上得分 98.3,Codeforces 評級達到 3020。
豆包不像 DeepSeek 或 Qwen 那樣以開發者為導向——它更偏向消費者,類似於 ChatGPT 是 OpenAI 的消費者門面。但底層模型是認真的,API 存取可通過火山引擎獲取。
最適合: 面向消費者的應用、在 ByteDance 生態系統上構建的團隊。
Zhipu AI (Z.ai)
公司: Zhipu AI,國際品牌更名為 Z.ai(2025 年 7 月) 關鍵模型: GLM-5、GLM-4.7、GLM-4.5 授權: 開源(GLM-4.5) 存取方式: API,2026 年 1 月 8 日在 HKEX 上市
Zhipu 由清華大學研究人員共同創立,定位為中國的「開源冠軍」。GLM-4.5 是一個 355B MoE 模型,在發布時被描述為中國最先進的開源 MoE。
GLM-5 是他們的最新模型——專注於自主編程和長上下文任務。香港當地從業者觀察到,GLM-5 最初以「Pony Alpha」的名義出現在 OpenRouter 上時,在編程方面非常強大,他們在該模型身份公開之前就使用 OpenCode 進行了測試。Zhipu 的國際品牌更名為 Z.ai 以及 HKEX IPO 表明了其在中國大陸以外的認真野心。
最適合: 研究應用、編程任務、長上下文任務、重視學術嚴謹的團隊。
Moonshot AI (Kimi)
公司: Moonshot AI(2026 年成為中國最快的十角獸公司) 關鍵模型: Kimi K2.5、Kimi k1.5 授權: 部分模型開放權重 存取方式: API、kimi.ai
Kimi K2.5 可能是你沒聽說過的最有趣的中國模型。它支援 262K 上下文,具備工具使用能力,並配備了一個「Agent Swarm」系統,使用名為 PARL 的技術可以同時啟動 100 個平行子代理。
Moonshot 成為中國最快的十角獸——K2.5 發布後 20 天的收入超過了他們 2025 年的全年總和。這種增長速度引人注目。
最適合: 基於 Agent 的應用、工具使用工作流程、長上下文任務。
MiniMax
公司: MiniMax(2026 年 1 月 9 日在 HKEX 上市) 關鍵模型: MiniMax-M2.5、MiniMax-M1 授權: 修改版 MIT 存取方式: API、Hugging Face
MiniMax-M2.5 是讓人刮目相看的模型:它在 SWE-Bench 上得分 80.2%,在多個基準測試中匹配 Claude Opus——成本約為其 1/20。以修改版 MIT 授權在 Hugging Face 上發布。
成本效率是頭條,但模型品質才是故事。MiniMax 從相對默默無聞到在 HKEX 上市,用了不到一年。
最適合: 成本敏感的生產部署、編程任務、需要 Claude 級品質但不需要 Claude 級定價的團隊。
StepFun
公司: StepFun(正在尋求 HKEX IPO) 關鍵模型: Step 3.5 Flash、Step 3 授權: Apache 2.0 存取方式: API、Hugging Face、NVIDIA NIM
StepFun 3.5 Flash 是一個效率故事。這是一個 196B MoE 模型,每個 token 只有 11B 活躍參數——意味著它運行快速且便宜,同時在 AIME 2025 上得分 97.3%,在 SWE-bench 上得分 74.4%。全部以 Apache 2.0 授權。
這是讓 MoE 架構真正發揮作用的模型:你以小模型的速度獲得大模型的品質。據報導 StepFun 正在尋求 HKEX IPO,延續中國 AI 公司在香港上市的趨勢。
最適合: 對延遲敏感的應用、高效部署、數學和編程任務。
SenseTime(商湯日日新)
公司: SenseTime(總部位於香港,在 HKEX 上市) 關鍵模型: SenseNova V6、SenseNova-MARS、SenseNova-SI 授權: 部分開源 存取方式: API,部分模型在 Hugging Face 上
SenseTime 是香港自己的 AI 巨頭——總部在此,在 HKEX 上市,市值約 77 億美元。SenseNova V6 是其旗艦模型(620B 混合專家架構)。SenseNova-MARS(多模態自主推理,開源)和 SenseNova-SI(空間智能,開源)針對特定應用領域。
最適合: 電腦視覺、空間智能、想要與香港總部公司合作的團隊。
如何選擇
正確的模型取決於你的設定和你正在構建的東西:
- -使用 Cursor? Auto 模式處理模型路由。部分開發者偏好 Sonnet 的品質但會留意 token 使用量。
- -使用 OpenCode? 截至 2026 年 3 月,MiniMax M2.5 免費提供。
- -構建雙語產品? Qwen 3.5 在 201 種語言中有強大的多語言支援。參見 8BitOracle 和 SixLines 的香港實例。
- -優化速度和成本? StepFun 3.5 Flash——以極低的成本實現前沿準確度。
- -構建 Agent 系統? Kimi K2.5 及其 PARL Agent Swarm 架構。
- -想要香港本地供應商? SenseTime SenseNova。
- -使用 OpenRouter? 模型會輪換——查看可用模型。Pony Alpha (GLM-5) 之前是一個很強的選擇。
這些模型具有競爭力。授權是寬鬆的。而且沒有一個會因為你住在哪裡而封鎖你。
來源
- -DeepSeek on Hugging Face
- -DeepSeek API Pricing
- -Qwen Official Blog
- -Qwen on Hugging Face
- -Baidu Unveils ERNIE 5.0 — PR Newswire
- -StepFun 3.5 Flash — Hugging Face
- -MiniMax Models
- -01.AI Yi — GitHub
- -Z.ai (Zhipu AI)
- -Ranking the Chinese Open Model Builders — Interconnects
本指南會隨著新模型發布而定期更新。訂閱 Hong Kong AI Podcast 獲取香港可用 AI 工具和模型的最新資訊。
在我們發布新文章和節目時收到通知。沒有垃圾郵件,只有訊號。