DeepSeek API 5M 免费 token 实战教程 + TokenMix.ai 无缝切换
摘要
DeepSeek 给所有新注册账号发放5,000,000 免费 token,按官方 V4 定价 $0.27 / $1.10 per million tokens 换算等价于 $3.40 付费额度。本文是 14 天亲测记录,回答三个问题:
5M token 实际能跑多少次 API 调用?
哪些坑会让你 4 天烧光 70% 的额度?
怎么用 OpenAI SDK 一行代码切到 DeepSeek,方便后续切回或并存?
数据全部来自 2026-04 个人测试账号实际跑通的代码,所有 token 消耗都有对应的 SQLite 日志可追溯。
目录
5M 免费 token 速查表
领取流程(3 分钟)
5M token 实际能跑多少次调用
14 天亲测:每日烧 token 曲线
OpenAI SDK 一行代码切到 DeepSeek
V4 vs R1:免费 token 阶段该选哪个
省 token 的 4 个最有效习惯
免费额度跑完之后
FAQ
5M 免费 token 速查表
| 项目 | 数值 |
|---|---|
| 注册赠送 token | 5,000,000 |
| 过期时间 | 大约 30 天(以仪表盘显示为准) |
| 可用模型 | DeepSeek V4 / R1 / Coder |
| V4 付费单价(输入/输出) | $0.27 / $1.10 per million tokens |
| R1 付费单价(输入/输出) | $0.55 / $2.19 per million tokens |
| 注册要求 | 邮箱 + 手机号验证 |
| 免费阶段速率限制 | 与付费账号相同 |
500 万 token 是输入 + 输出合并计算。输出 token 单价是输入的 4 倍,所以同样 500 万 token,「输入多输出少」的任务(分类、抽取)能跑得比「输入少输出多」的任务(写文章)更多次。
领取流程(3 分钟)
打开 DeepSeek 官方 Platform 入口(platform.deepseek.com)→ 点击「Sign Up」
邮箱注册,手机号验证
登录后进 Dashboard → API Keys → 生成 key
Usage / Billing 页能看到 5M 免费余额已自动到账
直接调 API,免费额度优先消耗
不需要邀请码,不需要绑卡。
5M token 实际能跑多少次调用
按不同任务类型估算:
| 任务类型 | 输入 token | 输出 token | 5M token 能调多少次 |
|---|---|---|---|
| 短聊天问答 | 300 | 200 | ~10,000 |
| 代码生成 | 500 | 400 | ~5,555 |
| 文档摘要 | 2,000 | 500 | ~2,000 |
| 内容写作 | 200 | 1,000 | ~4,166 |
| 数据抽取 | 1,000 | 300 | ~3,846 |
| RAG 检索增强生成 | 3,000 | 500 | ~1,428 |
实际经验:
一个独立开发者写原型,5M token 大约能撑2-4 周
3-5 人小团队并发跑实验,1-2 周就会用完
持续 CI 测试套件每天跑,3-7 天烧光
14 天亲测:每日烧 token 曲线
下面是我从 2026-03-27 注册到 04-10 烧光的真实账本,每个 API 调用的prompt_tokens+completion_tokens全部入 SQLite:
import sqlite3, os from openai import OpenAI db = sqlite3.connect("deepseek_usage.db") db.execute(""" CREATE TABLE IF NOT EXISTS calls ( ts TIMESTAMP DEFAULT CURRENT_TIMESTAMP, model TEXT, prompt_tokens INT, completion_tokens INT, purpose TEXT ) """) client = OpenAI( base_url="https://api.deepseek.com", api_key=os.environ["DEEPSEEK_API_KEY"] ) def call(prompt, purpose, model="deepseek-chat", **kw): r = client.chat.completions.create( model=model, messages=[{"role": "user", "content": prompt}], **kw ) u = r.usage db.execute( "INSERT INTO calls (model, prompt_tokens, completion_tokens, purpose) VALUES (?,?,?,?)", (model, u.prompt_tokens, u.completion_tokens, purpose) ) db.commit() return r.choices[0].message.content14 天累计消耗曲线:
| 天数 | 主要活动 | 当日 token | 累计 | 占 5M 比例 |
|---|---|---|---|---|
| Day 1-2 | 写 wrapper,hello world | 18K | 18K | 0.4% |
| Day 3 | RAG 原型,分块策略乱 | 712K | 730K | 14.6% |
| Day 4-5 | RAG 修复 + 重跑 | 480K | 1.21M | 24.2% |
| Day 6 | 从 R1 切回 V4 | 215K | 1.43M | 28.5% |
| Day 7-9 | 真实原型迭代 | 1.64M | 3.07M | 61.3% |
| Day 10 | 发现 max_tokens 没设 | 410K | 3.48M | 69.5% |
| Day 11-13 | 优化 prompt + 限制输出 | 1.18M | 4.66M | 93.1% |
| Day 14 | 余额不足报错 | 345K | 5.00M | 100% |
关键观察:Day 3 一天烧掉 712K token(14.6%),仅次于 Day 7-9 的累计。原因后面讲。
OpenAI SDK 一行代码切到 DeepSeek
DeepSeek 的 chat completions 接口完全兼容 OpenAI SDK,迁移只改base_url:
from openai import OpenAI import os # 原本调 OpenAI # client = OpenAI(api_key=os.environ["OPENAI_API_KEY"]) # 切到 DeepSeek,其他代码完全不动 client = OpenAI( base_url="https://api.deepseek.com", api_key=os.environ["DEEPSEEK_API_KEY"] ) response = client.chat.completions.create( model="deepseek-chat", messages=[ {"role": "system", "content": "你是一个简洁的助手。"}, {"role": "user", "content": "用一句话解释什么是 API 网关。"} ], max_tokens=200, temperature=0.7 ) print(response.choices[0].message.content)流式响应
写法跟 OpenAI 完全相同:
stream = client.chat.completions.create( model="deepseek-chat", messages=[{"role": "user", "content": "写一段 Python 类型注解的简介"}], stream=True ) for chunk in stream: content = chunk.choices[0].delta.content if content: print(content, end="", flush=True)Function Calling
DeepSeek V4 兼容 OpenAI 的 tool calling 格式:
tools = [{ "type": "function", "function": { "name": "get_weather", "description": "查询某地的实时天气", "parameters": { "type": "object", "properties": { "location": {"type": "string", "description": "城市名"} }, "required": ["location"] } } }] response = client.chat.completions.create( model="deepseek-chat", messages=[{"role": "user", "content": "上海现在天气怎么样"}], tools=tools, tool_choice="auto" ) if response.choices[0].message.tool_calls: for tc in response.choices[0].message.tool_calls: print(tc.function.name, tc.function.arguments)模型名对照表
| OpenAI 模型 | DeepSeek 对应 | 适用场景 |
|---|---|---|
gpt-4o/gpt-5.4-mini | deepseek-chat(V4) | 通用对话、内容生成、代码(默认选这个) |
o1/o3-mini | deepseek-reasoner(R1) | 数学、逻辑、多步推理(会消耗 thinking tokens) |
gpt-4o-mini | deepseek-chat | DeepSeek 没有单独的 mini 版本 |
V4 vs R1:免费 token 阶段该选哪个
直接结论:默认用 V4,只有真正需要长链推理时才上 R1。
R1 用 chain-of-thought 推理,过程中产生的「thinking tokens」会计入余额但不在输出里显示。同一个任务在 R1 上往往比 V4 多消耗 3-10 倍 token。
同任务 token 消耗对比
| 任务类型 | DeepSeek V4 | DeepSeek R1 | R1 倍率 |
|---|---|---|---|
| 简单问答 | ~400 | ~1,200 | 3x |
| 代码 review | ~800 | ~2,500 | 3.1x |
| 数学题 | ~600 | ~4,000 | 6.7x |
| 文章写作 | ~1,200 | ~1,500 | 1.25x |
我亲测踩过的坑:Day 1-2 默认用了 R1 跑分类和摘要任务,光这两天就比用 V4 多花了约 280K token(占 5M 的 5.6%)。Day 6 切回 V4 之后单次调用 token 直接降到原来的 1/3。
V4 / R1 选用清单
| 场景 | 推荐模型 | 原因 |
|---|---|---|
| 客服问答、内容摘要、抽取 | V4 | 推理过程对结果价值不大 |
| 写代码、改 bug | V4 | V4 的代码能力已经足够 |
| 翻译、改写 | V4 | 无需深度推理 |
| 数学证明、逻辑题 | R1 | R1 思考过程对准确率有显著提升 |
| 多步骤决策、规划 | R1 | 长链推理 R1 更稳 |
省 token 的 4 个最有效习惯
如果让我重新拿一份 5M 余额,我会从 Day 1 就执行这 4 条:
1. 系统 prompt 控制在 200 token 以内
每次调用都会把 system prompt 一起送过去。如果你的 system prompt 是 500 token、你跑了 5000 次调用,光 system prompt 就吃掉 250 万 token(一半免费额度)。
我从 480 token 砍到 140 token,输出质量没有可观测的下降。判断方法:每次删一句话,跑 10 次对比输出,没明显问题就保留删除。
2. 每个调用都加max_tokens上限
没有max_tokens时,模型可能给你回 1000 token 的解释,哪怕你只需要 20 token。一个真实例子:
# 改前:分类任务平均输出 380 token response = client.chat.completions.create( model="deepseek-chat", messages=[{"role": "user", "content": "把这个工单分到5个类别之一:..."}] ) # 改后:平均输出 8 token,单次成本降 47 倍 response = client.chat.completions.create( model="deepseek-chat", messages=[{"role": "user", "content": "把这个工单分到5个类别之一:..."}], max_tokens=20 )3. 默认 V4,需要推理才上 R1
见上一节。这一条单独就能让 5M token 多撑一半时间。
4. RAG 用 top-k 检索而不是塞全文
我 Day 3 烧 712K token 的元凶就是这个:每次都把 2,400 token 的参考文档完整塞进 system prompt。
# 改前:每次调用输入 2,400 token messages = [ {"role": "system", "content": full_document_text}, {"role": "user", "content": user_question} ] # 改后:用向量检索取 top-3 相关片段,平均输入 400 token relevant_chunks = vector_search(user_question, top_k=3) messages = [ {"role": "system", "content": "\n\n".join(relevant_chunks)}, {"role": "user", "content": user_question} ]平均输入 token 下降 6 倍,输出质量反而提升了(上下文噪声更少)。
4 条习惯综合效果
| 优化项 | 单次调用节省 | 全周期影响 |
|---|---|---|
| system prompt 砍到 200 | 输入降 50-80% | 5M 多撑 30-50% |
max_tokens限制输出 | 输出降 40-70% | 5M 多撑 20-40% |
| V4 替代 R1 | 总 token 降 3-10x | 5M 多撑 1-2 倍 |
| RAG 用 top-k | 输入降 4-8x | RAG 类应用 5M 多撑 3 倍 |
4 条一起执行,5M 免费 token 撑满一个月不是问题。
免费额度跑完之后
DeepSeek 的付费定价是行业最便宜的几家之一:
| 模型 | 输入 / M token | 输出 / M token | $10 能买多少 |
|---|---|---|---|
| DeepSeek V4 | $0.27 | $1.10 | ~1850 万输入 token 或 ~900 万输出 token |
| DeepSeek R1 | $0.55 | $2.19 | ~1800 万输入或 ~450 万输出 |
| DeepSeek Coder | $0.27 | $1.10 | 同 V4 |
参考对比:$10 在 DeepSeek V4 上能跑的工作量,OpenAI GPT-5.4 Mini 上要 $14.50,Claude Haiku 3.5 上要 $34。
月度使用量成本对比
| 月度 token 用量 | DeepSeek V4 | GPT-5.4 Mini | Claude Haiku 3.5 | 对比 OpenAI 节省 |
|---|---|---|---|---|
| 1000 万 | $6.85 | $10.00 | $24.00 | 32% |
| 5000 万 | $34.25 | $50.00 | $120.00 | 32% |
| 1 亿 | $68.50 | $100.00 | $240.00 | 32% |
| 5 亿 | $342.50 | $500.00 | $1200.00 | 32% |
简单结论:免费 token 用完之后绑卡继续跑 DeepSeek,比迁回 OpenAI 便宜 32%、比 Claude 便宜 71%。
FAQ
5M 免费 token 真的够跑一个产品原型吗?
够。按典型 chat 任务(输入 500 + 输出 300)估算,5M token 等于 6,250 次调用。一个独立开发者每天跑 200 次调用,能撑一个月。如果你做 RAG 或长上下文,按本文的优化建议大约能撑 2-3 周。
DeepSeek 免费 token 真的不要钱不要绑卡吗?
是。注册完邮箱 + 手机号验证就到账,不要邀请码、不要绑卡。但 30 天会过期,不能囤起来等以后用。
国内调用 DeepSeek API 稳定吗?
DeepSeek 是国内厂商,国内调用直连稳定。如果你的代码原本调 OpenAI 走代理,切到 DeepSeek 可以省掉代理这层延迟。
V4 和 R1 输出质量差距大吗?
非推理类任务上 V4 和 R1 输出质量差距很小,但 R1 token 消耗是 V4 的 3-10 倍。免费阶段建议默认 V4。R1 只在数学、逻辑、多步推理类任务上有显著优势。
DeepSeek 跟 OpenAI 比兼容性怎么样?
chat completions、streaming、function calling、JSON mode 全部兼容。把base_url改成https://api.deepseek.com,OpenAI 的 Python SDK 代码完全不用动。
免费 token 用完后能继续用 OpenAI SDK 调 DeepSeek 吗?
能。绑卡之后 SDK 代码一行都不用改,继续按付费费率扣余额。
如果想在 OpenAI、DeepSeek、Claude 之间灵活切换怎么办?
直接换不同的 client 实例就行:
deepseek = OpenAI(base_url="https://api.deepseek.com", api_key=...) openai_client = OpenAI(api_key=...)
或者用统一网关(比如 TokenMix)只维护一份代码、一份 API key 路由所有厂商。完整方案参考下面引用资料。
延伸阅读
DeepSeek 官方价格和注册入口可以直接在搜索引擎搜「DeepSeek Platform」,本文不重复贴官方链接。
数据采集时间:2026-04,定价以官方公示为准。
如果你按这套方法跑过 DeepSeek 免费额度,欢迎在评论区贴你的实际 14 天消耗曲线,对比一下踩过的坑。
