使用Codestral和VS Code的continue插件实现AI辅助代码生成

作者

筋斗云

首页»
业界新闻»
新闻资讯»
使用Codestral和VS Code的continue插件实现AI辅助代码生成

发布时间:2024-07-19 02:03

阅读量:5

准备

python包vllm

用来加载模型，启动服务

安装可以参数：GitHub - vllm-project/vllm: A high-throughput and memory-efficient inference and serving engine for LLMs

模型文件

可以使用官方：mistralai/Codestral-22B-v0.1

我是使用AQW 4bit量化 solidrust/Codestral-22B-v0.1-hf-AWQ

也可以选择GPTQ 4bit量化，可以看看vllm支持哪个格式

如果是比较旧的显卡可能不支持量化版本模型

vs code 的continue插件

配置

使用vllm加载Codestral启动兼容OpenAI 接口服务

启动命令：

python -m vllm.entrypoints.openai.api_server \     --model /data/models/Codestral-22B-v0.1-hf-AWQ \     --served-model-name codestral \     --host 0.0.0.0 \     --port 9000 \     --quantization awq

如果显存不够可以考虑：

1. 多卡，使用参数 --tensor-parallel-size

2. 减少模型上下文长度：使用参数 --max-model-len

配置vs code 的continue插件

修改了红色框1和2的部分

注意apiBase的ip是部署模型的服务器ip，model和端口号要跟vllm启动命令一致。

人工智能

广告一刻

为您即时展示最新活动产品广告消息，让您随时掌握产品活动新动态！

弹性云特惠专区

轻量云年度专区

裸金属物理服务器

支持

资讯

使用Codestral和VS Code的continue插件实现AI辅助代码生成

准备

python包vllm

模型文件

vs code 的continue插件

配置

使用vllm加载Codestral启动兼容OpenAI 接口服务

配置vs code 的continue插件

相关阅读

广告一刻