计量计费

  不同模型支持的能力及单价各不相同,本文将详细介绍各模型的计费单价、计费形式等内容,方便您合理选择模型。

1. Token 概念

  Token 是模型服务用量的重要概念。在调用模型推理服务时,会将输入内容进行分词(tokenize),转化为模型可以理解的 token ,经过模型处理后,同样输出 token,并转化为您需要的文本或者其他内容载体。而模型处理(包括输入、输出)的 token 数量会被作为模型推理服务用量的一个重要计量单位。

  由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。

2. 产品价格

总费用 = (输入tokens × 输入单价) + (输出tokens × 输出单价)

DeepSeek 系列模型

模型名称按需后付费方式包月预付费方式免费体验额度
DeepSeek-R1-Distill-Qwen-7B限时免费包月使用,请联系您的客户经理不限量
DeepSeek-R1输入: 4 元/M Tokens
输出: 16 元/M Tokens
赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)
DeepSeek-V3输入: 2 元/M Tokens
输出: 8 元/M Tokens
DeepSeek-R1-Distill-Qwen-32B输入: 1.5 元/M Tokens
输出: 6 元/M Tokens
DeepSeek-R1-Distill-Qwen-14B输入: 1 元/M Tokens
输出: 3 元/M Tokens
DeepSeek-R1-Distill-Llama-8B输入: 0.6 元/M Tokens
输出: 2.4 元/M Tokens
DeepSeek-R1-N011-Distill-Llama-70B-

GLM 系列模型

GLM 系列按需后付费方式包月预付费方式免费体验额度
GLM-4-Flash免费包月使用, 请联系您的客户经理不限量
GLM-4-9B输入: ¥2/M Tokens
输出: ¥2/M Tokens
赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)
GLM-4-Plus输入: ¥50/M Tokens
输出: ¥50/M Tokens
GLM-4-Air输入: ¥0.5/M Tokens
输出: ¥0.5/M Tokens
GLM-4-Long输入: ¥1/M Tokens
输出: ¥1/M Tokens
GLM-4-AirX输入: ¥10/M Tokens
输出: ¥10/M Tokens
GLM-4-FlashX输入: ¥0.1/M Tokens
输出: ¥0.1/M Tokens

Qwen 系列模型

Qwen 系列按需后付费方式包月预付费方式免费体验额度
QwQ-32B输入: ¥1.5/M Tokens
输出: ¥6/M Tokens
包月使用, 请联系您的客户经理赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)

3. 出账周期及账单查看

出账周期:后付费账单按小时结算,出账时间通常在当前计费周期结束后1-2小时左右,具体以系统出账时间为准。

例如:16:00~17:00 的账单约在 18:00~19:00 出账。

账单查看:请点击【费用-账单明细】查看

4. 欠费停服说明

  后付费账单按小时结算,出具账单后实时结算扣款。如果您账户中的可用额度(含充值余额和赠送金额)小于待结算的账单,会被认为欠费。

  欠费后会限制您API的可用模型,只保留免费模型的使用权限。

  欠费后,您可选择【平台在线充值】/联系客户经理线下充值,充值金额抵扣欠费后,您可继续正常使用付费模型。