计量计费

　　不同模型支持的能力及单价各不相同，本文将详细介绍各模型的计费单价、计费形式等内容，方便您合理选择模型。

1. Token 概念

　　Token 是模型服务用量的重要概念。在调用模型推理服务时，会将输入内容进行分词（tokenize），转化为模型可以理解的 token ，经过模型处理后，同样输出 token，并转化为您需要的文本或者其他内容载体。而模型处理（包括输入、输出）的 token 数量会被作为模型推理服务用量的一个重要计量单位。

　　由于不同模型采用的分词策略不同，同一段文本可能会被转化为不同数量的 token。

2. 产品价格

总费用 = (输入tokens × 输入单价) + (输出tokens × 输出单价)

DeepSeek 系列模型

模型名称	按需后付费方式	包月预付费方式
DeepSeek-R1-Distill-Qwen-7B	限时免费	包月使用，请联系您的客户经理
DeepSeek-R1	输入: 4 元/M Tokens 输出: 16 元/M Tokens
DeepSeek-V3	输入: 2 元/M Tokens 输出: 8 元/M Tokens
DeepSeek-R1-Distill-Qwen-32B	输入: 1.5 元/M Tokens 输出: 6 元/M Tokens
DeepSeek-R1-Distill-Qwen-14B	输入: 1 元/M Tokens 输出: 3 元/M Tokens
DeepSeek-R1-Distill-Llama-8B	输入: 0.6 元/M Tokens 输出: 2.4 元/M Tokens
DeepSeek-R1-N011-Distill-Llama-70B	-

GLM 系列模型

GLM 系列	按需后付费方式	包月预付费方式
GLM-4-Flash	免费	包月使用, 请联系您的客户经理
GLM-4-9B	输入: ¥2/M Tokens 输出: ¥2/M Tokens
GLM-4-Plus	输入: ¥50/M Tokens 输出: ¥50/M Tokens
GLM-4-Air	输入: ¥0.5/M Tokens 输出: ¥0.5/M Tokens
GLM-4-Long	输入: ¥1/M Tokens 输出: ¥1/M Tokens
GLM-4-AirX	输入: ¥10/M Tokens 输出: ¥10/M Tokens
GLM-4-FlashX	输入: ¥0.1/M Tokens 输出: ¥0.1/M Tokens

Qwen 系列模型

Qwen 系列	按需后付费方式	包月预付费方式
QwQ-32B	输入: ¥1.5/M Tokens 输出: ¥6/M Tokens	包月使用, 请联系您的客户经理

3. 出账周期及账单查看

出账周期：后付费账单按小时结算，出账时间通常在当前计费周期结束后1-2小时左右，具体以系统出账时间为准。

例如：16:00~17:00 的账单约在 18:00~19:00 出账。

账单查看：请点击【费用-账单明细】查看

4. 欠费停服说明

　　后付费账单按小时结算，出具账单后实时结算扣款。如果您账户中的可用额度（含充值余额和赠送金额）小于待结算的账单，会被认为欠费。

　　欠费后会限制您API的可用模型，只保留免费模型的使用权限。

　　欠费后，您可选择【平台在线充值】/联系客户经理线下充值，充值金额抵扣欠费后，您可继续正常使用付费模型。

快速入门-API密钥管理文本对话