Deepseek-R1-Vllm 调用方式

一、创建资源

3090、4090资源已部署DeepSeek R1镜像，支持本地访问和对外访问方式。

选择创建云服务器 -> 选中图中镜像，配置云盘与带宽等参数 -> 创建资源。

具体配置选择可以根据需求创建，请参考：并行智算云产品文档中心_创建云服务器

二、运行

2.1 本地访问

2.1.1 命令行方式

云服务器部署了多个模型库，可根据需求自行选择。

（1）执行命令deepseek

为了保证服务的稳定性，建议使用screen的用法，例如：

安装：
sudo apt-get install screen 
 
新建一个session：
screen -S my  ; 新建一个会话，命名为my
 
查看当前打开session：
screen -ls     ; 列出当前登录节点打开的会话
 
返回到之前的session：
screen -r my   ; 回到my这个会话
screen -d -r my ; 结束当前到，返回my会话
 
离开当前会话：
ctrl A + D     ; 离开当前的会话，操作方法是同时按ctrl键和A键，然后按D键
终止screen某个后台运行的项目
screen -X -S ID quit
 
进入screen的会话后，则输入：
deepseek   
启动服务操作

（2）根据提示，输入【1】，选择”本地访问”，输入对应的模型编号，即可开启与 DeepSeek 命令行对话，如下图所示：

注意事项：

（1）脚本存放在家目录下，即：/home/ubuntu 路径下，名为: run_ds.sh，请勿删除。

（2）使用交互式方式进行选择模型、设置端口、API 密钥等参数；若需要修改相关参数，请自行输入即可。

（3）如有本地自定义模型库，可修改脚本中这个环境变量参数:

需要自定义挂载数据云盘，默认将模型下载到数据盘内，不占用系统盘空间

  MODELS_DIR="/data/deepseek-ai/"

修改为

  MODELS_DIR=="自定义模型库绝对路径"

2.1.2 Web可视化方式运行

（1）按照2.1.1步骤启动服务。

（2）点击云服务器ID：

（3）新增自定义端口：

（4）设置地址与端口：

源地址：0.0.0.0/0，端口：自定义或者服务对应的默认端口。例如：open-webui默认端口：8088，vllm默认端口：6006

（5）回到云服务器界面，复制外网IP。

（6）打开本地浏览器，输入”IP地址:端口号”如”xx.xxx.xxx.xxx:6006”（若自定义端口则输入：“xx.xxx.xxx.xxx:自定义端口”）。

注：首次登录需要先注册管理员账号。

默认web界面为中文

登录管理员账号后，根据自行选择，设置新用户注册，具体流程如下：

###2.2 对外访问

2.2.1 启动服务

（1）执行命令deepseek启动服务

  deepseek

（2）根据提示，输入【2】，选择”对外访问”。

（3）输入对应的模型编号，选择使用的模型。

（4）首先输入主机地址为：0.0.0.0，其次端口号、API密钥，可直接回车则系统自动配置成默认端口和API密钥。

注：当前密钥仅对当前服务有效，如果重启服务或关机，则会失效。请谨慎重启和关机！

2.2.2 调用API

API 支持WebUI、ChatBox、Cherry-Studio等客户端，可自行选择工具使用。

2.2.2.1 Web可视化方式

（1）根据 2.1.2 ，创建外网地址与端口（与2.2.1自定义的外网地址与端口号不同），打开浏览器配置粘贴 “外网地址及端口”。

（2）在界面中选择”管理员面板”

（3）选择”外部连接”——设置 -——开启 OpenAI-API

（4）配置相关API-KEY并验证，输入2.2.1中自定义的主机地址和端口、API 密钥。url格式：http://IP:端口号/v1 ，如：http://127.0.0.1:6006/v1。

刷新开启新对话。

2.2.2.2 ChatBox调用方式（推荐）

本地下载ChatBox客户端，在界面中配置2.2.1自定义的主机地址、端口号、KEY。url格式：“http://IP:端口号/v1” ，如：“http://127.0.0.1:6006/v1”。输入2.2.1中选择的模型。即可开启对话。

2.2.2.3 Cherry Studio调用方式

本地下载Cherry Studio客户端，在界面中配置2.2.1自定义的主机地址、端口号、KEY，url格式：“http://IP:端口号/v1” ，如：“http://127.0.0.1:6006/v1”。输入2.2.1中选择的模型。即可开启对话。

2.2.2.4 AnythingLLM调用方式

本地下载AnythingLLM客户端，在界面中配置2.2.1自定义的主机地址、端口号、KEY，url格式：“http://公网IP:端口号/v1” ，如： “http://127.0.0.1:6006/v1”。输入2.2.1中选择的模型。即可开启对话。

Deepseek-R1-Ollama TensorBoard