大模型平台计费说明选型与定价

选型与定价

大模型平台(MaaS平台)提供丰富的模型供您使用,您可以根据文档介绍方便的将模型服务整合到您的业务中。

当前已提供DeepSeek系列、GLM系列以及Qwen系列模型,其他模型持续接入中。您可以参考下文模型介绍与定价,选择最适合您的模型。

DeepSeek 系列模型

模型名称上下文长度RPMTPMTokens计费免费体验额度
DeepSeek-R1-Distill-Qwen-7B32K1K测试用户:1W
付费用户:100W
限时免费赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)
DeepSeek-R164K输入:4 元/M Tokens
输出:16 元/M Tokens
DeepSeek-V364K输入:2 元/M Tokens
输出:8 元/M Tokens
DeepSeek-R1-Distill-Qwen-32B32K输入:1.5 元/M Tokens
输出:6 元/M Tokens
DeepSeek-R1-Distill-Qwen-14B32K输入:1 元/M Tokens
输出:3 元/M Tokens
DeepSeek-R1-Distill-Llama-8B32K输入:0.6 元/M Tokens
输出:2.4 元/M Tokens
DeepSeek-R1-N011-Distill-Llama-70B32K包月使用, 请联系您的客户经理

GLM 系列模型

GLM 系列上下文长度RPMTPMTokens计费免费体验额度
GLM-4-Flash128K1k10k免费赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)
GLM-4-9B128K输入:¥2/M Tokens
输出:¥2/M Tokens
GLM-4-Plus128K输入:¥50/M Tokens
输出:¥50/M Tokens
GLM-4-Air128K输入:¥0.5/M Tokens
输出:¥0.5/M Tokens
GLM-4-Long1M输入:¥1/M Tokens
输出:¥1/M Tokens
GLM-4-AirX8K输入:¥10/M Tokens
输出:¥10/M Tokens
GLM-4-FlashX128K输入:¥0.1/M Tokens
输出:¥0.1/M Tokens

Qwen 系列模型

Qwen 系列上下文长度RPMTPMTokens计费免费体验额度
Qwen-32B32K1k10k输入:¥1.5/M Tokens
输出:¥6/ M Tokens
赠送 40 元 token 体验券 (折 200 万-1300 万 tokens)