基于OpenAI API使用Fastchat部署调用本地大模型

news/2024/12/24 6:56:30 标签: llm, fastchat, fastapi
  • 安装Fastchat(换源版)
pip3 install "fschat[model_worker,webui]" -i https://pypi.tuna.tsinghua.edu.cn/simple/
  • 启动服务
  1. 启动控制器服务
python3 -m fastchat.serve.controller
  1. 启动 Model Worker 服务(可以通过CUDA_VISIBLE_DEVICES来指定显卡)
python3 -m fastchat.serve.model_worker --model-path 【你的本地大模型路径】
  1. 启动 RESTFul API 服务(可以指定ip和端口,默认端口是8000)
python3 -m fastchat.serve.openai_api_server --host 【你的ip】 --port 【你的端口】
  • 注意
    • –num-gpus 指定运行模型的gpu个数
      –model-name 默认以部署的model-path作为模型名称,可通过–model-name修改,比如–model-name Qwen
    • 在浏览器中访问http://【你的ip】:【你的端口】/docs可以查看接口信息,这个服务即最终要用的LLM API 服务,它的接口跟OpenAI 的接口是兼容的
  • 测试代码
import requests
import json
import openai

def get_completion_qwen_7B(prompt):
    openai.api_key = "你的密钥"
    openai.base_url = "http://【你的ip】:【你的端口】/v1/"
    model = "Qwen2.5-7B-Instruct" # 示例,此处需要换成你的本地模型名
    completion = openai.completions.create(model=model, prompt=prompt, max_tokens=64)
    data = {"messages": [{"role": "user", "content": prompt}]}
    
    completion = openai.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}]
    )

    return completion.choices[0].message.content

http://www.niftyadmin.cn/n/5797457.html

相关文章

面试经验分享 | 北京渗透测试岗位

更多大厂面试经验的视频经验分享看主页 目录: 所面试的公司:安全大厂 所在城市:北京 面试职位:渗透测试工程师 面试方式:腾讯会议线上面试线下面试 面试过程: 面试官的问题: 1、说一下XSS有哪…

【优选算法】Pointer-Slice:双指针的算法切片(上)

文章目录 1.概念解析2.移动零3.复写零4.快乐数5.盛最多水的容器希望读者们多多三连支持小编会继续更新你们的鼓励就是我前进的动力! 本篇是优选算法之双指针算法,该算法主要用于实现特定的算法逻辑,比如查找、比较、排序、合并等操作&#xf…

SmartX分享:SMTX ZBS 中 RDMA 技术简介

目录 背景如何实现存储网络是什么TCP/IPRDMARDMA 工作原理RDMA 的实现方案 ZBS 支持 RDMA 的要求 参考 背景 我们清楚,分布式存储将利用网络作不同设备的互联。最基础的如TCP/IP的IP SAN,进阶的有FC SAN、IB等等。 SmartX 支持 10G以上的TCP/IP网络作为…

【NI国产替代】基于国产FPGA+全志T3的全国产16振动+2转速(24bits)高精度终端采集板卡

16振动2转速(24bits)高精度终端采集板卡 采用AG16KF256国产FPGAT3国产ARM全国产化 的处理器架构,设计分为2块板,一块底板, 一块核心板,底板负责16路信号2路转速的 采集,信号的滤波&#xff0…

软件测试之压力测试【详解】

压力测试 压力测试是一种软件测试,用于验证软件应用程序的稳定性和可靠性。压力测试的目标是在极其沉重的负载条件下测量软件的健壮性和错误处理能力,并确保软件在危急情况下不会崩溃。它甚至可以测试超出正常工作点的测试,并评估软件在极端…

GCDWebServer 使用指南

GCDWebServer 使用指南 GCDWebServer The #1 HTTP server for iOS, macOS & tvOS (also includes web based uploader & WebDAV server) [这里是图片001] 项目地址: https://gitcode.com/gh_mirrors/gc/GCDWebServer 项目介绍 GCDWebServer 是一个现代且轻量级的基于…

Linux系统编程——理解系统内核中的信号捕获

目录 一、sigaction() 使用 信号捕捉技巧 二、可重入函数 三、volatile关键字 四、SIGCHLD信号 在信号这一篇中我们已经学习到了一种信号捕捉的调用接口:signal(),为了深入理解操作系统内核中的信号捕获机制,我们今天再来看一个接口:si…

Leetcode打卡:考场就坐

执行结果:通过 题目: 855 考场就坐 在考场里,有 n 个座位排成一行,编号为 0 到 n - 1。 当学生进入考场后,他必须坐在离最近的人最远的座位上。如果有多个这样的座位,他会坐在编号最小的座位上。(另外&am…