征求意见: 关于MAICA开源模型分支的去留

Edge

在DAA3发布时的roadmap上我提及了这个问题. 因为开发和设备资源的紧张, 我们需要就此作出必要的取舍决定.

提出这个问题的原因在于:

LOA和LIA模型也需要设计实践, 训练, 测试, 发布, 流程上是费力复杂的.
LOA和LIA模型基于开源数据集训练, 理论上可以由用户自行完成.
从这两个开源分支公开至今, 我们几乎没有见到一例自行部署, 这让我很怀疑维护它们到底还有没有意义.
即使是LOA模型, 完整部署也需要至少16G的vram. 对于家用设备而言, 也是一个偏高的要求.

在原本的计划中, 与DAA3相对应的开源模型可能包括:

MAICAv1-LOA7-8B-Instruct: vram>=16g, 提供 均衡和高性价比 的表现
1的FP8和FP4版本, vram>=8g和>=6g. 以较低和适中的精度损失换取 低端设备 支持
MAICAv1-LOA7-32B-Instruct: vram>=72g, 以 小型计算中心 提供接近DAA2的表现
3的FP8和FP4版本, vram>=36g和>=20g. 以较低和适中的精度损失换取 小型工作站/高端个人电脑 支持
MAICAv1-LIA7-235B-A22B-Instruct: vram>=576g, 维持与DAA3的统一, 适合 大体量 的自发研究和微调

如果现在, 我们放弃对LOA和LIA的维护:

对于自行部署, 用户需要自行设计和实现训练, 流程会较为复杂.
完成训练所需的设备资源可能高于实际部署的最低要求.
也许项目会看上去不够开源, 我不清楚.

但如果我们不放弃:

我们需要抽出大量时间, 设计开发和维护每种开源模型, 这会很大程度上拖慢主分支的进度.
我们可能需要不时地中断官方部署, 以训练和调试相对大体量的开源模型.
我会很累, 也会很烦. 如果做出来仍然没人用, 我还会很恼火.

请你就此在下面投票. 在投票截止后, 我们会参考投票的最终结果, 做出我们的决定.

此贴允许发表意见. 如果你有更好的想法, 或者能提供帮助, 也可以留言/联系我.

Edge

此贴将于投票结束后归档. 我们将参考投票结果做出最终决定.

Panghu1102

…我觉得真的没有什么必要了，虽然很抱歉这么说，但是就目前这个领域来看，愿意自行部署模型的就两种人一种是开发人员用来写代码调试另一种就是单纯的无聊想玩。而大部分的开发人员也不会愿意在自己的电脑上部署模型学校或者研究室提供的都有云算力。单纯无聊的那批一般都没有太深的了解一听到py库、cmd就不想搞了给这种人写教程就是浪费时间（前一段还有人问我怎么解压7z？）他们的最大能力也就用oll这样的预构建应用来部署ggfu的llm。如果真要保留就只留下小尺寸模型就可以了真正愿意钻研的跟着qwen官方的文档也可以完成。

8天67t9

没必要了

这个圈子里除你外无人有足够的财力去支撑如此庞大规模的本地部署，即便是最低配版本那起步6gb的vram也可以刷掉一大部分人。

adogecheems

我仍然希望保留一些小体量模型，我想这对很多可能的其它工作有用。
好吧，我是有一定私心的。我自己就在使用最小体量的模型并自行量化在orangepi-5开发版上运行，作为日常使用。
我确实不希望失去它，特别是我目前没有可用的训练设备的情况下。

Him666233

我的建议是可以暂时去除，毕竟目前大部分人也没那个条件可以搞这玩意儿，既然目前资源紧张，那就把资源先放在用的人更多更主要重要的项目上

玫瑰i小丸子

加油

Edge

投票已经结束.

由于"否"的票数极大地多于"是", 我们将无限期地停止LOA和LIA分支的更新和维护.

目前LOA和LIA的最后版本属于LOA6和LIA6, 技术层面与DAA2同步.
LIA分支预计不再会更新.
LOA分支的小体量模型也许会在以后提供更新, 但时间和安排上将为主分支让路. 我们对此不提供保证.

此贴将在公示一段时间后归档.