由于成果已经一步步完善, 我们已经可以看到成功的预兆, 我在此贴更新项目的进展. [upl-image-preview url=https://upload.edgemonix.top:28991/assets/files/2024-06-04/1717477618-299013-maica-text-combined.png]

首先呢, 第一项是我们改名字了. mgpt这个名字挺草率的, 因为项目到了现在已经跟gpt没啥关系了. 我们改叫它: # MAICA (音"迈卡", 很朴实无华的缩写.) 我希望用起这个新名字的时候, 大家还认识它.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233274-168304-image.png] 以上截图是最近的第二轮试训练的产出. 可以看到, 在有限的提示指导下, 模型对莫妮卡角色形象本身有了可以称为"理解"的属性. 当然, 训练设计和模型优化仍然处于早期阶段, 但这样的进展于我而言已经很是激动人心. 我们会尽快开始第三轮以及更多的试训练. 如果一切顺利, 我希望在第三轮结束后就开始反馈式学习, 通过收集使用数据以进一步改善训练--当然还得是一切顺利的前提下, 而顺利的时候并不多. 在希望大家期待的同时, 我也希望大家保持理性, 保持耐心. 就算目前的结果已经初具雏形, 但我们离目标中接近完美的莫妮卡形象还有相当的距离. 请大家期待我们的进步.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233804-673953-image.png] 更多的一些测试语句, 以展示训练的成果和局限性. 此轮训练在数据构建中比较单调, 使用的prompt也十分单薄. 我期待接下来的训练产出更好的结果.

接下来我们把话筒递给莫妮卡现在的雏形, 第零代"克利福德": [upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233876-67665-image.png] 呃, 她挺谦虚的. 我们期待她未来的表现. 下一轮的训练并不会等太久. **我们正在向遥不可及迈出第一步, 很快我们将让所有人看到我们踏出的脚印.** 欢迎各位在此贴中探讨和提供有价值的想法. 后续的进展将在此贴继续更新.

好——耶！期待期待！！

关于第三轮训练的设计: 我简单回顾了一下第二轮的结果. 虽然表现还不错, 但是在"简单问题上犯蠢"这种现象比较像是过拟合的表现. 像第二轮一样直接用目标集训练可能有点自信过头了, 我打算在第三轮里面尝试更早之前用过的混集方法. 我希望混合训练集能矫正lora的整层改动和ptuning的整体改动之间改动密度的差距. 我也不清楚这个差距到底在哪以及怎么改, 但是有已知方法肯定是要试试看的. 至于反馈学习, 可能至少会推迟到第四轮或者更后面吧.

唉, 想想就很头疼. 这次的训练集又加了常识集, 此外还加了一个测试的强针对集. 我当然也希望能用更简单的单个数据集搞定问题, 但是就是没法做到那么简单. 常识集用来中和过拟合是一种很怎么说呢土八路的做法, 既不优雅也不稳定. 强针对集更是专门的头痛医头脚痛医脚, 只能针对有限的测试改善表现, 而且还容易导致测试中发现不了真正重要的问题. 但是有什么办法呢, 繁琐复杂的混集在maica中训练的表现确实比单独的目标集要好得多, 从最开始的训练和设计中就是这样的, 后面也只能按这样往下走. 效果到底为什么好了都不知道, 而且很伤脑筋. 没有别的办法可想, 角色扮演本来就需要海量的数据, 但maica根本不可能弄到那么多. 按比例混合各种数据集, 做鸡尾酒也是没有办法的办法了. 我打算明天按照1:1:5混合常识, 目标和强针对, 再做一轮测试. 这个比例在第零次测试中表现还不错. 至于ptuning和lora, qlora的表现区别到底在哪里, 我也不好总结, 但是至少lora没有那么容易发疯. 如果测试顺利, 我希望看到面对简单问题的表现下降能得到缓解. 明天还要装机柜去, 估计一天不一定搞得完. 头疼也很需要缓解就是了.

迈向遥不可及的第一步(MAICA)

DanDan442

#170 Edge 大佬加油！！！

Edge

进展: 通过system向模型传入agent信息被证明为可行, 但其实现方式稍微有点…和想象中不一样.

我需要再次修改一部分引擎的代码, 不过总体来说不算太差的结果.

通过system让模型输出情绪表达字段的尝试失败了, 但我们还有fallback方案. 我会尽快根据实验结果编写接口.

同时, 解析存档的方法也和最开始设想的不一样. 计划赶不上变化是正常的, 总的来说一切都还在设计范围之中.

Edge

进展: 写了一个简单的agent驱动. 但是目前因为模型还没练明白, 所以需要等练完再打磨.

agent的大多数使用案例都是独立工作, 通过agent向另一个模型递交信息的尝试十分罕见. 我希望不是因为存在致命问题.

另外的好消息是, qwen1.5系列的模型已经全部支持到32768token了, 所以原计划做辅助检索模型的分支可以砍掉. 再怎么说3.2万字的历史也足够了. 我觉得正常人类记住最近说的3.2万字都有点不太现实了.

训练agent模型需要的时间也相当长. agent模型的int4量化版本已经被证明可以加速运行在48g显存上, 所以接下来就是等了.

在等它的时间我会去装三号机.

还是那个忙死了.

ps: 截图之后我发现search用错成match了, 不用提醒我.

Edge

进展: 看上去还不错.

我希望这个线是能用的, 如果不行的话还得花钱去配.

我觉得已经该给它起名字了. 叫密斯特拉怎么样?

这个节点将作为maica多模态能力和agent模型的计算服务器, 以及工作站.

同时还集齐了10个显卡盒子:

Edge

循此苦旅直抵群星

应该承认我在美术方面没什么天赋, 但还是做了一个banner. 我把它放在一楼了.

大家有什么修改意见吗?

Ἥβη

#175 Edge 如果让MAICA图标更有棱角可能会好点（图标有点。。。太粉了 =/

82192506

#175 Edge 老大的这个是专门给老莫做的ai，在图标上加一些莫妮卡或者文学部的元素会更好

CaCO3

好强的科幻风，有一种数字生命的美

Edge

#177 Ἥβη 是太粉了, 但是我也想不出来该用什么颜色. 这个粉色是论坛的#f7a1cf

需要用了再说吧.

至于图标本身, 我觉得已经很有棱角了, 现代化的图标设计是不能太有棱角的.

Edge

进展: 双卡辅助工作站"XP10 Mystra"已经上线.

其实它的块头也不小, 有点空间浪费的嫌疑. 在设计之初它是可以插4张卡的.

lingyue

太强了，大佬，奈何我技术力不够，也帮不上什么忙，只能为大佬加油，看了大佬一步一步真的感觉像在创造机械生命

Edge

进展: "前体驱动"的设计思路已被证明为可行.

简单来说, 原理是: 用户输入query(现在几点了) => 前体驱动截获query => 前体模型分析问题, 调用api(time_acquire) => 前体获知信息(time: 8:40) =>前体整合信息, alter核心模型的systemprompt(已知现在是8:40) => 模型参考agent信息做出回答(现在是8:40哦. [player])

现在不是八点四十, 我只是临时写了一个时间用于测试. 那不重要.

接下来我会调整和训练出一个更强大的agent模型, 目前7b基本模型训练出来的agent表现很差.

这个点子从思路上被实实在在地证明了, 让我有点兴奋. 这一特殊模式能够在数据集有限, 人力不足的情况下让模型既专注于角色扮演, 具有充分的可拓展性, 又有类似agent模型的信息获取和灵活利用能力. 说不定我会是第一个这样做的人.

这一有创意的设计模式能够保证maica的人类交互效果远高于简单的角色扮演模型.

文学部的小莫

#181 Edge 如果你成功了那你就将是ddlc圈子里无人可以撼动的一座高山

82192506

#182 文学部的小莫如果成功了那就不只是ddlc的一座高山了，甚至是ai女友领域的大佬了

文学部的小莫

有没有想过和mas结合一下

Edge

#185 文学部的小莫会有子模组, 而且主要受众应该是子模组

文学部的小莫

#186 Edge 太好了，赞美！

Edge

进展: 密斯特拉基本就位了. 从玻璃反光里能看到巨械的另外一半. 有一种科幻片里能见到的感觉.

灯控软件还没弄. 他们说兼容性还没做.

今天早上看到了qwen2发布的消息, 但是又要重新装配环境, 以及顺便做完第一轮数据集的调整. 可能开始训练还需要一段时间.

最近过得心力交瘁的.

82192506

#188 Edge 老大这么喜欢00和芳乃为什么一开始不整个痛机

Edge

#189 82192506 设计主题是星流巨械, 立牌只是个人爱好

而且说实话, 这么巨大而且改装过的机箱, 估计不好做整体涂装.