1. token配置和使用手册
silievo用户使用手册
  • token配置和使用手册
    • 01-概要
    • 02-模型、价格
    • 03-模型接入
    • 04-常见问题
    • 05-合作伙伴与法律声明
    • 06-联系我们
    • 周活动特辑-免费模型接入指南
    • CC-Switch接入指南
  1. token配置和使用手册

02-模型、价格

02. 模型支持列表与收费标准#

所有价格以元 / 百万 Tokens 为单位。价格可能根据平台活动及供给调整,最终以平台账单为准。

🤖 当前已上架模型(Beta 阶段)#

平台当前上架以下4款官方满血版模型:
模型名称系列适用场景
qwen3.6-plus通义千问标准推理,逻辑复杂、精度要求高的场景
qwen3.6-flash通义千问极速推理,高并发、对响应延迟极其敏感的场景
deepseek-v4-flashDeepSeek高频低成本调用,缓存命中率高的场景
deepseek-v4-proDeepSeek深度推理,复杂分析、代码生成等高质量场景

🧠 模型能力说明#

Qwen 系列(qwen3.6-plus / qwen3.6-flash)#

能力说明
上下文长度最大支持 1M(1,000,000 Tokens) 全文理解
最大输出长度单次最大输出 8K Tokens
显式缓存(Context Caching)支持,大幅降低长上下文重复调用成本
缓存命中优惠命中部分仅为原价 10%(0.12元/百万Tokens)
JSON Schema / Structured Outputs✅ 支持
Tool Calls(函数调用)✅ 支持
Batch 批处理模式✅ 支持,输入输出成本降低 50%
多模态输入✅ 支持文本、图片、文档(PDF/Word等)
思考模式✅ 支持

DeepSeek 系列(deepseek-v4-flash / deepseek-v4-pro)#

能力说明
上下文长度最大 1M
最大输出长度最大 384K Tokens
思考模式✅ 支持(思考 / 非思考可切换)
JSON Output✅ 支持
Tool Calls✅ 支持
对话前缀续写✅ 支持(Beta)
FIM 补全✅ 支持(Beta,仅非思考模式)
KV 缓存✅ 支持,缓存命中价格极低

💰 模型收费标准#

6.1 Qwen3.6-Plus(阿里百炼官方原价 × 6折)#

计费项官方原价(元/百万tokens)平台价(6折)
输入2.001.20
输出12.007.20
显式缓存创建2.501.50
显式缓存命中0.200.12
输入(Batch File)1.000.60
输出(Batch File)6.003.60
输入(Batch Chat)2.001.20
输出(Batch Chat)12.007.20

6.2 Qwen3.6-Flash(阿里百炼官方原价 × 6折)#

计费项官方原价(元/百万tokens)平台价(6折)
输入1.200.72
输出7.204.32
显式缓存创建1.500.90
显式缓存命中0.120.072
输入(Batch File)0.600.36
输出(Batch File)3.602.16
输入(Batch Chat)1.200.72
输出(Batch Chat)7.204.32

6.3 DeepSeek-V4-Flash(官方原价,平台暂无额外折扣)#

计费项官方原价 = 平台价(元/百万tokens)
输入(缓存命中)0.02
输入(缓存未命中)1.00
输出2.00

6.4 DeepSeek-V4-Pro(官方6折)#

计费项官方原价(元/百万tokens)平台价(约2.5折/原价)
输入(缓存命中)0.100.025
输入(缓存未命中)12.003.00
输出24.006.00
DeepSeek 系列后续如有活动将另行公告。

📋 计费规则说明#

计费项说明
输入 Token用户发送给模型的内容:文本、上下文、系统提示词等
输出 Token模型生成的回复内容
缓存命中请求复用已存在缓存上下文时,以更低单价计费
缓存未命中需重新计算推理时,按标准输入价格计费
显式缓存创建适用 Qwen 模型,主动创建缓存时的费用
显式缓存命中显式缓存被命中时,价格为创建价格的 10%

💡 成本优化建议#

1.
高并发长对话场景 → 优先选择 qwen3.6-flash 或 deepseek-v4-flash,成本远低于 Pro 版
2.
固定 System Prompt 场景 → 保持提示词结构一致,最大化触发 KV 缓存命中,降低输入费用
3.
大批量离线任务 → 使用 Batch 模式,输入输出成本各降低 50%
4.
复杂推理场景 → deepseek-v4-pro 支持超长输出(384K),适合深度分析
修改于 2026-05-08 00:20:27
上一页
01-概要
下一页
03-模型接入
Built with