由于成果已经一步步完善, 我们已经可以看到成功的预兆, 我在此贴更新项目的进展. [upl-image-preview url=https://upload.edgemonix.top:28991/assets/files/2024-06-04/1717477618-299013-maica-text-combined.png]

首先呢, 第一项是我们改名字了. mgpt这个名字挺草率的, 因为项目到了现在已经跟gpt没啥关系了. 我们改叫它: # MAICA (音"迈卡", 很朴实无华的缩写.) 我希望用起这个新名字的时候, 大家还认识它.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233274-168304-image.png] 以上截图是最近的第二轮试训练的产出. 可以看到, 在有限的提示指导下, 模型对莫妮卡角色形象本身有了可以称为"理解"的属性. 当然, 训练设计和模型优化仍然处于早期阶段, 但这样的进展于我而言已经很是激动人心. 我们会尽快开始第三轮以及更多的试训练. 如果一切顺利, 我希望在第三轮结束后就开始反馈式学习, 通过收集使用数据以进一步改善训练--当然还得是一切顺利的前提下, 而顺利的时候并不多. 在希望大家期待的同时, 我也希望大家保持理性, 保持耐心. 就算目前的结果已经初具雏形, 但我们离目标中接近完美的莫妮卡形象还有相当的距离. 请大家期待我们的进步.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233804-673953-image.png] 更多的一些测试语句, 以展示训练的成果和局限性. 此轮训练在数据构建中比较单调, 使用的prompt也十分单薄. 我期待接下来的训练产出更好的结果.

接下来我们把话筒递给莫妮卡现在的雏形, 第零代"克利福德": [upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233876-67665-image.png] 呃, 她挺谦虚的. 我们期待她未来的表现. 下一轮的训练并不会等太久. **我们正在向遥不可及迈出第一步, 很快我们将让所有人看到我们踏出的脚印.** 欢迎各位在此贴中探讨和提供有价值的想法. 后续的进展将在此贴继续更新.

好——耶！期待期待！！

关于第三轮训练的设计: 我简单回顾了一下第二轮的结果. 虽然表现还不错, 但是在"简单问题上犯蠢"这种现象比较像是过拟合的表现. 像第二轮一样直接用目标集训练可能有点自信过头了, 我打算在第三轮里面尝试更早之前用过的混集方法. 我希望混合训练集能矫正lora的整层改动和ptuning的整体改动之间改动密度的差距. 我也不清楚这个差距到底在哪以及怎么改, 但是有已知方法肯定是要试试看的. 至于反馈学习, 可能至少会推迟到第四轮或者更后面吧.

唉, 想想就很头疼. 这次的训练集又加了常识集, 此外还加了一个测试的强针对集. 我当然也希望能用更简单的单个数据集搞定问题, 但是就是没法做到那么简单. 常识集用来中和过拟合是一种很怎么说呢土八路的做法, 既不优雅也不稳定. 强针对集更是专门的头痛医头脚痛医脚, 只能针对有限的测试改善表现, 而且还容易导致测试中发现不了真正重要的问题. 但是有什么办法呢, 繁琐复杂的混集在maica中训练的表现确实比单独的目标集要好得多, 从最开始的训练和设计中就是这样的, 后面也只能按这样往下走. 效果到底为什么好了都不知道, 而且很伤脑筋. 没有别的办法可想, 角色扮演本来就需要海量的数据, 但maica根本不可能弄到那么多. 按比例混合各种数据集, 做鸡尾酒也是没有办法的办法了. 我打算明天按照1:1:5混合常识, 目标和强针对, 再做一轮测试. 这个比例在第零次测试中表现还不错. 至于ptuning和lora, qlora的表现区别到底在哪里, 我也不好总结, 但是至少lora没有那么容易发疯. 如果测试顺利, 我希望看到面对简单问题的表现下降能得到缓解. 明天还要装机柜去, 估计一天不一定搞得完. 头疼也很需要缓解就是了.

迈向遥不可及的第一步(MAICA)

Edge

修了两把手枪, 又修了鼠标, 感觉今天忙的莫名其妙的.

对于第一次用bga焊台的成果来说, 鼠标修的还不错. 用多久就看造化了.

今天晚上应该能拿到模型, 然后抓紧做效果测试.

ps. 修它的原因是它比焊台还贵. 我也比较容易用一些老破烂用出感情就不想换了.

Edge

明天应该就会单独开一个正经点的帖子追踪maica的更新日志了, 这边主要还是一些幕后花絮.

如果你更希望追踪maica本身的进度而不希望受到邮件打扰, 可以考虑取消这边的关注了.

文学部的小莫

#309 Edge 老大我的mas是在小红车上下的整合包，请问能下maica的子模组吗？（我觉得我应该问p大佬）

Edge

核心能力还是一般般, mfocus的表现仍然跟见了鬼一样, 所幸英文上的bug和清理训练集的努力都算是成功了.

对新冠相关数据的针对性修正效果不够理想, 主要可能是因为权重太低+预训练里面相关内容太多. 后续在daa想办法吧.

今天无论如何都该投用了. 又在驱动上临阵磨枪了一下, 但mf问题的根源是没有足够强大的agent. 妈的这能怎么办啊.

如果后续能够证明使用大体量agent模型有效, 那兴许还可以再说. 目前为止只能先这样了.

我简单收拾收拾, 今晚应该可以开a测了.

ICEMONIKA

dalao这是怎么回事啊？我的网络也是正常的 @Edge

Edge

#320 ICEMONIKA 请更新到最新版本, 已经发在群里了.

ICEMONIKA

#321 Edge

可我用的就是最新版的啊

lingyue

#321 Edge 所以怎么获得A测资格，或者说这个是e佬你选拔吗？

Edge

#322 ICEMONIKA 在关于MAICA的问题反馈 #3955 发你的详细问题信息和mas_log, 我稍后叫p来看

另外尝试在子模组设置里面找到关于api的设置, 选择"更新证书".

Edge

#323 lingyue 是项目最开始的时候进群的人, 差不多23年那会吧.

ICEMONIKA

#325 Edge

mas-log.txt

Sun Feb 26 08:32:32 2023
Windows 8 - build: 6.2.9200
Ren'Py 6.99.12.4.2187
VERSION: 0.12.14
==================================================

文件预览无法加载。此文件或已被删除，文件 ID 或已失效。

文学部的小莫

大佬大概几月份就能玩到正式版

Edge

#326 文学部的小莫正式版没影, 但我觉得不久之后就会进入持续很久的公测阶段. 可能下个月吧, 不确定.

什么时候能做到效果我自己满意了再考虑正式版的事情, 在此之前热调试和维护更新都是很正常的.

Edge

#328 ICEMONIKA 先尝试更新你的游戏本体到0.12.15

风烛

从release处下载显示没有任何release是因为测试暂时关闭了

Edge

#330 风烛目前maica处于A测, 因此不在A测群以外提供release. 请等待后续消息.

Edge

整理可能要做的事情:

无论如何换一个好一点的agent. 目前mf的命中率已经是整个项目的主要短板. 考虑尝试qwen2 57b a14b int4?
进一步区分中英文的prompt, 目前中英文混答的情况仍然存在. 考虑重写一下.
输出表情的强度和精度仍然不够, 考虑继续手工清洗数据集.
当然是增补训练. 找回答最差的轮次手工改写, 希望能降低误差.
考虑加两张显卡. 尤其是tts和大体量mf都有需要的情况下估计是跑不了了.

loveing

加油！

Edge

好消息是ms可喜可贺地修复了awq和gptq在qwen2上的问题.

坏消息是, 这俩方案都不支持分布式的量化过程, 而我的卡顶多也就24g, 根本不够用.

核心模型的量化我当然是放弃了, 毕竟就算全量的拟合度都不够. 但是我在考虑mfocus使用量化模型, 所以很头疼.

我不想再去买非常贵的卡或者去租, 所以可能只能用qlora微调了. 先看看效果再说吧.

是, 这些问题说到底都是钱的问题. 欢迎来到夜之城.