- 楼主
- #1
本人在试图部署MAICA时遇到了一些困难,不知道有没有在这个问题上有经验的人能够帮我一把。
核心问题,我租的是32GB VRAM的vGPU,但在试图部署7B模型时发现只能以FP16且限制对话块大小的方式勉强运行,导致的代价是:1、回答无逻辑,前后文能力为负。2、回答不完整。所以怎么让这运行的好些?如果需要增加显存,至少需要多少?(“至少”指能以FP32运行)
另:MAICA是否对CUDA有较强的依赖?
非常感谢愿意回答这个问题的每一个人。
本人在试图部署MAICA时遇到了一些困难,不知道有没有在这个问题上有经验的人能够帮我一把。
核心问题,我租的是32GB VRAM的vGPU,但在试图部署7B模型时发现只能以FP16且限制对话块大小的方式勉强运行,导致的代价是:1、回答无逻辑,前后文能力为负。2、回答不完整。所以怎么让这运行的好些?如果需要增加显存,至少需要多少?(“至少”指能以FP32运行)
另:MAICA是否对CUDA有较强的依赖?
非常感谢愿意回答这个问题的每一个人。
快来注册!
*即使不注册, DCC也会展示所有知识性和分享内容
这显得我有点fw,但是我的脑子快转不过来了。
这有点偷懒,但是有没有人有一套比较好的方法论来在本地部署MAICA?(非MAS方案)。非常感谢,这两天差点秃了。
#10 S4Life 根本不用搜索引擎的api, 这个地方是用bs4刮削搜索页面的. 你pip install -r requirements.txt了没有?
模型的部署已经说过推荐用ms-swift了, 一行cli部署完自带openai接口, 你也没用吗?
这套系统确实是我设计来自己用的, 很多地方的泛用性没太考虑, 但是对着文档挨个做应该是能部署起来的.
我也说句抱歉的, 当时看你发帖大谈宏伟远景, 我还以为你的基础应该不差才对.