所有价格以元 / 百万 Tokens 为单位。价格可能根据平台活动及供给调整,最终以平台账单为准。
| 模型名称 | 系列 | 适用场景 |
|---|---|---|
qwen3.6-plus | 通义千问 | 标准推理,逻辑复杂、精度要求高的场景 |
qwen3.6-flash | 通义千问 | 极速推理,高并发、对响应延迟极其敏感的场景 |
deepseek-v4-flash | DeepSeek | 高频低成本调用,缓存命中率高的场景 |
deepseek-v4-pro | DeepSeek | 深度推理,复杂分析、代码生成等高质量场景 |
| 能力 | 说明 |
|---|---|
| 上下文长度 | 最大支持 1M(1,000,000 Tokens) 全文理解 |
| 最大输出长度 | 单次最大输出 8K Tokens |
| 显式缓存(Context Caching) | 支持,大幅降低长上下文重复调用成本 |
| 缓存命中优惠 | 命中部分仅为原价 10%(0.12元/百万Tokens) |
| JSON Schema / Structured Outputs | ✅ 支持 |
| Tool Calls(函数调用) | ✅ 支持 |
| Batch 批处理模式 | ✅ 支持,输入输出成本降低 50% |
| 多模态输入 | ✅ 支持文本、图片、文档(PDF/Word等) |
| 思考模式 | ✅ 支持 |
| 能力 | 说明 |
|---|---|
| 上下文长度 | 最大 1M |
| 最大输出长度 | 最大 384K Tokens |
| 思考模式 | ✅ 支持(思考 / 非思考可切换) |
| JSON Output | ✅ 支持 |
| Tool Calls | ✅ 支持 |
| 对话前缀续写 | ✅ 支持(Beta) |
| FIM 补全 | ✅ 支持(Beta,仅非思考模式) |
| KV 缓存 | ✅ 支持,缓存命中价格极低 |
| 计费项 | 官方原价(元/百万tokens) | 平台价(6折) |
|---|---|---|
| 输入 | 2.00 | 1.20 |
| 输出 | 12.00 | 7.20 |
| 显式缓存创建 | 2.50 | 1.50 |
| 显式缓存命中 | 0.20 | 0.12 |
| 输入(Batch File) | 1.00 | 0.60 |
| 输出(Batch File) | 6.00 | 3.60 |
| 输入(Batch Chat) | 2.00 | 1.20 |
| 输出(Batch Chat) | 12.00 | 7.20 |
| 计费项 | 官方原价(元/百万tokens) | 平台价(6折) |
|---|---|---|
| 输入 | 1.20 | 0.72 |
| 输出 | 7.20 | 4.32 |
| 显式缓存创建 | 1.50 | 0.90 |
| 显式缓存命中 | 0.12 | 0.072 |
| 输入(Batch File) | 0.60 | 0.36 |
| 输出(Batch File) | 3.60 | 2.16 |
| 输入(Batch Chat) | 1.20 | 0.72 |
| 输出(Batch Chat) | 7.20 | 4.32 |
| 计费项 | 官方原价 = 平台价(元/百万tokens) |
|---|---|
| 输入(缓存命中) | 0.02 |
| 输入(缓存未命中) | 1.00 |
| 输出 | 2.00 |
| 计费项 | 官方原价(元/百万tokens) | 平台价(约2.5折/原价) |
|---|---|---|
| 输入(缓存命中) | 0.10 | 0.025 |
| 输入(缓存未命中) | 12.00 | 3.00 |
| 输出 | 24.00 | 6.00 |
DeepSeek 系列后续如有活动将另行公告。
| 计费项 | 说明 |
|---|---|
| 输入 Token | 用户发送给模型的内容:文本、上下文、系统提示词等 |
| 输出 Token | 模型生成的回复内容 |
| 缓存命中 | 请求复用已存在缓存上下文时,以更低单价计费 |
| 缓存未命中 | 需重新计算推理时,按标准输入价格计费 |
| 显式缓存创建 | 适用 Qwen 模型,主动创建缓存时的费用 |
| 显式缓 存命中 | 显式缓存被命中时,价格为创建价格的 10% |
qwen3.6-flash 或 deepseek-v4-flash,成本远低于 Pro 版deepseek-v4-pro 支持超长输出(384K),适合深度分析