从 ChatGPT 转换到 DeepSeek:有什么改变、什么不变
无论你是主动选择还是因为 OpenAI 切断了你的访问权,从 ChatGPT 迁移到 DeepSeek 出奇地顺畅。API 格式兼容,在推理和对话任务上 DeepSeek 表现出色——虽然在代码方面它不是最强的选项。
以下是实际会改变和不会改变的部分。
不会改变的
API 格式
DeepSeek 使用 OpenAI 兼容的 API。如果你的应用程序调用 OpenAI API,切换到 DeepSeek 通常只需更改两件事:base URL 和 API key。你现有的代码、提示词和集成保持不变。
像 OpenAI Python SDK 这样的函数库,只需设定自定义 base URL 就可以直接与 DeepSeek 配合使用。大多数封装函数库和工具(LangChain、LlamaIndex、Cursor 等)都有「自定义端点」选项,使用方式完全相同。
提示词结构
对话补全格式——系统消息、用户消息、助手消息——工作方式相同。你现有的提示词在大多数情况下无需修改即可使用。
流式传输
DeepSeek 支持 server-sent events 流式传输,与 OpenAI 相同。即时 token 流式传输的工作方式完全一致。
函数调用 / 工具使用
DeepSeek 支持与 OpenAI 相同格式的函数调用。在请求中定义你的工具,即可收到结构化的函数调用响应。
会改变的
模型选择
你不再选择 gpt-4、gpt-4-turbo 或 gpt-3.5-turbo,而是在 DeepSeek-V3.2、DeepSeek-R1、DeepSeek-Coder 等之间选择。命名不同但概念相同:选择匹配你任务的模型。
大致对应:
- -GPT-4 / GPT-4o → DeepSeek-V3.2(通用)
- -GPT-4 用于推理 → DeepSeek-R1(思维链推理)
- -GPT-3.5 Turbo → DeepSeek-V3 或更小版本(成本优化)
定价
DeepSeek 显著更便宜——V3 输入 token 每百万 $0.14,而 GPT-4 约 $1-3/M。(来源:DeepSeek Pricing)如果成本是使用 OpenAI 时的顾虑,使用 DeepSeek 就不太是问题了。
响应风格
DeepSeek 的响应风格略有不同。通常更简洁、不如 ChatGPT 那么「话多」。对于代码任务,许多开发者更喜欢 DeepSeek 更直接的风格。对于创意写作,你可能会注意到差异。
中文能力
如果你的应用程序的任何部分涉及中文文字,DeepSeek 比 GPT-4 更强。这在香港尤为重要,因为应用程序经常需要处理中英双语。
推理方式
DeepSeek-R1 使用在响应中可见的显式思维链推理。这与 GPT-4 的隐式推理不同。对于复杂问题,R1 的逐步方法通常产生更好的结果,但响应更长。
迁移清单
1. 取得 API key: 从 platform.deepseek.com 获取
2. 更新 base URL: 在你的应用程序设定中修改
3. 更新模型名称: 从 gpt-4 改为你选择的 DeepSeek 模型
4. 测试你的提示词。 大多数可直接使用。如果看到品质差异,通常微调提示词即可解决。
5. 更新错误处理。 错误码和速率限制响应可能略有不同。测试你的重试逻辑。
6. 基准测试。 对 DeepSeek 运行你的测试套件并比较结果。对于大多数应用,品质相当或更好。对于边界情况,你可能需要调整。
实际更好的方面
有些方面使用 DeepSeek 确实更好:
推理。 DeepSeek-R1 的显式思维链推理在数学和多步骤问题解决方面表现强劲。逐步方法能捕捉 GPT-4 隐式推理遗漏的错误。
对话/通用。 对于会话式 AI 和通用任务,DeepSeek 表现稳定,这也是让它成名的体验。
成本。 每 token 便宜 5-10 倍。在生产规模下,这非常显著。
开放性。 MIT 授权意味着你可以自建、微调和检视模型。这在 GPT-4 上是不可能的。
无地理限制。 直接可用。无需 VPN、无需变通方案、不用担心 API 访问被撤销。
不如的方面
坦白说:
多模态。 GPT-4o 的图像理解很强。DeepSeek-V3.2 原生支持工具使用,但 GPT-4o 在某些图像任务上仍有优势。
生态系统。 OpenAI 的生态系统(插件、GPTs 等)在 DeepSeek 上不存在。你使用的是直接的 API,而非平台。
文档。 OpenAI 的文档更为完善。DeepSeek 的文档足够但不太精致。
代码。 对于重度代码工作,DeepSeek 可能感觉较慢且不是顶尖表现者——MiniMax M2.5、GLM-5 和 Kimi K2.5 等模型在 SWE-bench 上得分更高。如果代码是你的主要用途,考虑这些替代方案或 Cursor 的 Auto 模式。
对于通用和推理任务,转换很简单,且成本节省是实实在在的。
来源
- -DeepSeek API Documentation
- -DeepSeek API Pricing
- -DeepSeek-R1 — Hugging Face
- -DeepSeek-R1 MIT License — GitHub
- -DeepSeek V3 vs R1 Comparison — PromptLayer
- -Complete Guide to DeepSeek Models — BentoML
已经从 ChatGPT 转到 DeepSeek 了?我们很想听听你的经验。订阅 Hong Kong AI Podcast 或通过 contact@hongkongaipodcast.com 联系我们。
在我们发布新文章和节目时收到通知。没有垃圾邮件,只有信号。