通义千问 Qwen-7B-Chat-Int4 模型本地化部署

互联网 2 年前 0 3

本文介绍: 如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Emb e dd in g 模型可以从下载。以本项目中默认使用的 LLM 模型与 Emb e dd ing 模型为例：下载模型需要先，然后运行拉代码修改 web _demo.py 启动：python web_demo.py 量化：(量化过程报GPU版本问题暂时未调通)

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Emb e dd ing 模型可以从 HuggingFace 下载。

以本项目中默认使用的 LLM 模型 THUDM/ChatGLM2-6B 与 Em b e dd ing 模型 moka-ai/m3e-base 为例：

下载模型需要先安装 Git LFS，然后运行

参考：通义千问部署搭建_代码浪人的博客-CSDN博客

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

embedding llm 模型

相关文章

transformer剪枝论文汇总

transformer剪枝论文汇总

互联网 2 年前 4

使用deepspeed继续训练LLAMA

使用deepspeed继续训练LLAMA

互联网 2 年前 4

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

【人工智能】Fine-tuning 微调：解析深度学习中的利器(7)

互联网 2 年前 9

GPT-4模型中的token和Tokenization概念介绍

GPT-4模型中的token和Tokenization概念介绍

互联网 2 年前 10

Linux 网络编程 + 笔记

Linux 网络编程 + 笔记

linux 2 年前 2

【成品论文】2024美赛B题完整成品论文23页+3小问matlab代码+数据集汇总

【成品论文】2024美赛B题完整成品论文23页+3小问matlab代码+数据集汇总

互联网 2 年前 3

JVM之GC垃圾回收

互联网 2 年前 7

行为型设计模式—中介者模式

互联网 2 年前 8

发表回复取消回复