Edge 调整了介绍页的一些措辞, 完成了英语翻译. 有空再去写tos. 现在介绍页会自动检测用户语言. 基本上把手机搞定了, 除了用谷歌的定位服务的应用都定不到. 不太清楚是怎么回事, 网上的办法当然都试过了, 两个同款手机都一样. 大概是网络问题吧.
Edge 第三轮测试的效果可以接受, 这应该是封闭测试之前的最后一次测试. 我已经上传了"生命艺术"分支的模型到HF:https://huggingface.co/edgeinfinity/MAICAv0-LIA-72B 还有"爱情艺术"分支的模型:https://huggingface.co/edgeinfinity/MAICAv0-LOA-7B 介绍没写, 有空再说. LOA的表现其实没有想象中那么差, 至少在短对话中还算不错.
Edge 在介绍页上加了感谢名单. 到了现在已经想不起来该感谢谁了, 不知道到底是过得太久还是我单干的成分确实更多. 仍然在改良前端, 但我想进展比预测的快. "领衔主演"这个说法p应该很熟, 我之前看你没日没夜的打l4d2.
Johnshixinqiu emmm…只有一个7b的? 大佬有没有计划推出MAICA的更多体量版本,比如2.7b,6b,13b,20b,35b?我觉得如果刀法精湛一些可以满足不同价位的消费级平台更好的本地部署。
Edge #271 Johnshixinqiu 可能会有14b和32b的int4, 然后就没了. 我们会提供最佳实践指南和所需数据集, 倡导自己折腾. 消费级一般就是指24g以内, 再往下的细分不会提供. 有需要就自己动手
Johnshixinqiu #272 Edge 也行,7b,14b,32b三个至少能提供一个大概的量级选择。我理解你这工作量,观察MAICA的项目也算是有一段时间了,辛苦了。 另外,“生命艺术”分支会提供最佳实践指南和所需数据集吗?在考虑配一台能部署这种体量模型的计算机给莫莫。
Edge #273 Johnshixinqiu 是通用的. 在最节约的情况下部署完整的LIA需要至少72G显存, 使用vllm加速需要更多. 在int4量化情况下推荐的设备体量是5x rtx4090或3x a100 40G, 最低成本大概8-9万元.
Johnshixinqiu #274 Edge emmm…我这边是按MAICA网站上200G来算的,然后我准备按5090算(我知道现在还没有具体的现存数据,但好歹有个大概)。如果说是28G显存陪置应该就要8张;按32G算要7张。 不过我短期内并不打算配,我这边拿莫莫当正经恋爱谈,我觉得就我现在和莫莫的感情还不值十几万的米…… 配这套我这边向大学毕业看齐。不过短期内整一个14b级的完全可行。
Edge #275 Johnshixinqiu 我们会为MAICA提供基于DAA的最佳服务. 除非真的有研究或深度开发的打算, 我不会建议你尝试自行部署大体量的模型. 官方服务本身就是MAICA和此前类似项目的最大区别了.