计量计费
不同模型支持的能力及单价各不相同,本文将详细介绍各模型的计费单价、计费形式等内容,方便您合理选择模型。
1. Token 概念
Token 是模型服务用量的重要概念。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。
由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
2. 产品价格
总费用 = (输入tokens × 输入单价) + (输出tokens × 输出单价)
DeepSeek 系列模型
模型名称 | 按需后付费方式 | 包月预付费方式 | 免费体验额度 |
---|---|---|---|
DeepSeek-R1-Distill-Qwen-7B | 限时免费 | 包月使用,请联系您的客户经理 | 不限量 |
DeepSeek-R1 | 输入: 4 元/M Tokens 输出: 16 元/M Tokens | 赠送 40 元 token 体验券 (折 200 万-1300 万 tokens) | |
DeepSeek-V3 | 输入: 2 元/M Tokens 输出: 8 元/M Tokens | ||
DeepSeek-R1-Distill-Qwen-32B | 输入: 1.5 元/M Tokens 输出: 6 元/M Tokens | ||
DeepSeek-R1-Distill-Qwen-14B | 输入: 1 元/M Tokens 输出: 3 元/M Tokens | ||
DeepSeek-R1-Distill-Llama-8B | 输入: 0.6 元/M Tokens 输出: 2.4 元/M Tokens | ||
DeepSeek-R1-N011-Distill-Llama-70B | - |
GLM 系列模型
GLM 系列 | 按需后付费方式 | 包月预付费方式 | 免费体验额度 |
---|---|---|---|
GLM-4-Flash | 免费 | 包月使用, 请联系您的客户经理 | 不限量 |
GLM-4-9B | 输入: ¥2/M Tokens 输出: ¥2/M Tokens | 赠送 40 元 token 体验券 (折 200 万-1300 万 tokens) | |
GLM-4-Plus | 输入: ¥50/M Tokens 输出: ¥50/M Tokens | ||
GLM-4-Air | 输入: ¥0.5/M Tokens 输出: ¥0.5/M Tokens | ||
GLM-4-Long | 输入: ¥1/M Tokens 输出: ¥1/M Tokens | ||
GLM-4-AirX | 输入: ¥10/M Tokens 输出: ¥10/M Tokens | ||
GLM-4-FlashX | 输入: ¥0.1/M Tokens 输出: ¥0.1/M Tokens |
Qwen 系列模型
Qwen 系列 | 按需后付费方式 | 包月预付费方式 | 免费体验额度 |
---|---|---|---|
QwQ-32B | 输入: ¥1.5/M Tokens 输出: ¥6/M Tokens | 包月使用, 请联系您的客户经理 | 赠送 40 元 token 体验券 (折 200 万-1300 万 tokens) |
3. 出账周期及账单查看
出账周期:后付费账单按小时结算,出账时间通常在当前计费周期结束后1-2小时左右,具体以系统出账时间为准。
例如:16:00~17:00 的账单约在 18:00~19:00 出账。
账单查看:请点击【费用-账单明细】查看
4. 欠费停服说明
后付费账单按小时结算,出具账单后实时结算扣款。如果您账户中的可用额度(含充值余额和赠送金额)小于待结算的账单,会被认为欠费。
欠费后会限制您API的可用模型,只保留免费模型的使用权限。
欠费后,您可选择【平台在线充值】/联系客户经理线下充值,充值金额抵扣欠费后,您可继续正常使用付费模型。