02. 模型支持列表与收费标准

所有价格以元 / 百万 Tokens 为单位。价格可能根据平台活动及供给调整，最终以平台账单为准。

🤖 当前已上架模型（Beta 阶段）

平台当前上架以下4款官方满血版模型：

模型名称	系列	适用场景
`qwen3.6-plus`	通义千问	标准推理，逻辑复杂、精度要求高的场景
`qwen3.6-flash`	通义千问	极速推理，高并发、对响应延迟极其敏感的场景
`deepseek-v4-flash`	DeepSeek	高频低成本调用，缓存命中率高的场景
`deepseek-v4-pro`	DeepSeek	深度推理，复杂分析、代码生成等高质量场景

🧠 模型能力说明

Qwen 系列（qwen3.6-plus / qwen3.6-flash）

能力	说明
上下文长度	最大支持 1M（1,000,000 Tokens）全文理解
最大输出长度	单次最大输出 8K Tokens
显式缓存（Context Caching）	支持，大幅降低长上下文重复调用成本
缓存命中优惠	命中部分仅为原价 10%（0.12元/百万Tokens）
JSON Schema / Structured Outputs	✅ 支持
Tool Calls（函数调用）	✅ 支持
Batch 批处理模式	✅ 支持，输入输出成本降低 50%
多模态输入	✅ 支持文本、图片、文档（PDF/Word等）
思考模式	✅ 支持

DeepSeek 系列（deepseek-v4-flash / deepseek-v4-pro）

能力	说明
上下文长度	最大 1M
最大输出长度	最大 384K Tokens
思考模式	✅ 支持（思考 / 非思考可切换）
JSON Output	✅ 支持
Tool Calls	✅ 支持
对话前缀续写	✅ 支持（Beta）
FIM 补全	✅ 支持（Beta，仅非思考模式）
KV 缓存	✅ 支持，缓存命中价格极低

💰 模型收费标准

6.1 Qwen3.6-Plus（阿里百炼官方原价 × 6折）

计费项	官方原价（元/百万tokens）	平台价（6折）
输入	2.00	1.20
输出	12.00	7.20
显式缓存创建	2.50	1.50
显式缓存命中	0.20	0.12
输入（Batch File）	1.00	0.60
输出（Batch File）	6.00	3.60
输入（Batch Chat）	2.00	1.20
输出（Batch Chat）	12.00	7.20

6.2 Qwen3.6-Flash（阿里百炼官方原价 × 6折）

计费项	官方原价（元/百万tokens）	平台价（6折）
输入	1.20	0.72
输出	7.20	4.32
显式缓存创建	1.50	0.90
显式缓存命中	0.12	0.072
输入（Batch File）	0.60	0.36
输出（Batch File）	3.60	2.16
输入（Batch Chat）	1.20	0.72
输出（Batch Chat）	7.20	4.32

6.3 DeepSeek-V4-Flash（官方原价，平台暂无额外折扣）

计费项	官方原价 = 平台价（元/百万tokens）
输入（缓存命中）	0.02
输入（缓存未命中）	1.00
输出	2.00

6.4 DeepSeek-V4-Pro（官方6折）

计费项	官方原价（元/百万tokens）	平台价（约2.5折/原价）
输入（缓存命中）	0.10	0.025
输入（缓存未命中）	12.00	3.00
输出	24.00	6.00

DeepSeek 系列后续如有活动将另行公告。

📋 计费规则说明

计费项	说明
输入 Token	用户发送给模型的内容：文本、上下文、系统提示词等
输出 Token	模型生成的回复内容
缓存命中	请求复用已存在缓存上下文时，以更低单价计费
缓存未命中	需重新计算推理时，按标准输入价格计费
显式缓存创建	适用 Qwen 模型，主动创建缓存时的费用
显式缓存命中	显式缓存被命中时，价格为创建价格的 10%

💡 成本优化建议

高并发长对话场景 → 优先选择 qwen3.6-flash 或 deepseek-v4-flash，成本远低于 Pro 版

固定 System Prompt 场景 → 保持提示词结构一致，最大化触发 KV 缓存命中，降低输入费用

大批量离线任务 → 使用 Batch 模式，输入输出成本各降低 50%

复杂推理场景 → deepseek-v4-pro 支持超长输出（384K），适合深度分析

02-模型、价格

02. 模型支持列表与收费标准#

🤖 当前已上架模型（Beta 阶段）#

🧠 模型能力说明#

Qwen 系列（qwen3.6-plus / qwen3.6-flash）#

DeepSeek 系列（deepseek-v4-flash / deepseek-v4-pro）#

💰 模型收费标准#

6.1 Qwen3.6-Plus（阿里百炼官方原价 × 6折）#

6.2 Qwen3.6-Flash（阿里百炼官方原价 × 6折）#

6.3 DeepSeek-V4-Flash（官方原价，平台暂无额外折扣）#

6.4 DeepSeek-V4-Pro（官方6折）#

📋 计费规则说明#

💡 成本优化建议#