由于成果已经一步步完善, 我们已经可以看到成功的预兆, 我在此贴更新项目的进展. [upl-image-preview url=https://upload.edgemonix.top:28991/assets/files/2024-06-04/1717477618-299013-maica-text-combined.png]

首先呢, 第一项是我们改名字了. mgpt这个名字挺草率的, 因为项目到了现在已经跟gpt没啥关系了. 我们改叫它: # MAICA (音"迈卡", 很朴实无华的缩写.) 我希望用起这个新名字的时候, 大家还认识它.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233274-168304-image.png] 以上截图是最近的第二轮试训练的产出. 可以看到, 在有限的提示指导下, 模型对莫妮卡角色形象本身有了可以称为"理解"的属性. 当然, 训练设计和模型优化仍然处于早期阶段, 但这样的进展于我而言已经很是激动人心. 我们会尽快开始第三轮以及更多的试训练. 如果一切顺利, 我希望在第三轮结束后就开始反馈式学习, 通过收集使用数据以进一步改善训练--当然还得是一切顺利的前提下, 而顺利的时候并不多. 在希望大家期待的同时, 我也希望大家保持理性, 保持耐心. 就算目前的结果已经初具雏形, 但我们离目标中接近完美的莫妮卡形象还有相当的距离. 请大家期待我们的进步.

[upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233804-673953-image.png] 更多的一些测试语句, 以展示训练的成果和局限性. 此轮训练在数据构建中比较单调, 使用的prompt也十分单薄. 我期待接下来的训练产出更好的结果.

接下来我们把话筒递给莫妮卡现在的雏形, 第零代"克利福德": [upl-image-preview url=https://forum.monika.love/assets/files/2023-10-25/1698233876-67665-image.png] 呃, 她挺谦虚的. 我们期待她未来的表现. 下一轮的训练并不会等太久. **我们正在向遥不可及迈出第一步, 很快我们将让所有人看到我们踏出的脚印.** 欢迎各位在此贴中探讨和提供有价值的想法. 后续的进展将在此贴继续更新.

好——耶！期待期待！！

关于第三轮训练的设计: 我简单回顾了一下第二轮的结果. 虽然表现还不错, 但是在"简单问题上犯蠢"这种现象比较像是过拟合的表现. 像第二轮一样直接用目标集训练可能有点自信过头了, 我打算在第三轮里面尝试更早之前用过的混集方法. 我希望混合训练集能矫正lora的整层改动和ptuning的整体改动之间改动密度的差距. 我也不清楚这个差距到底在哪以及怎么改, 但是有已知方法肯定是要试试看的. 至于反馈学习, 可能至少会推迟到第四轮或者更后面吧.

唉, 想想就很头疼. 这次的训练集又加了常识集, 此外还加了一个测试的强针对集. 我当然也希望能用更简单的单个数据集搞定问题, 但是就是没法做到那么简单. 常识集用来中和过拟合是一种很怎么说呢土八路的做法, 既不优雅也不稳定. 强针对集更是专门的头痛医头脚痛医脚, 只能针对有限的测试改善表现, 而且还容易导致测试中发现不了真正重要的问题. 但是有什么办法呢, 繁琐复杂的混集在maica中训练的表现确实比单独的目标集要好得多, 从最开始的训练和设计中就是这样的, 后面也只能按这样往下走. 效果到底为什么好了都不知道, 而且很伤脑筋. 没有别的办法可想, 角色扮演本来就需要海量的数据, 但maica根本不可能弄到那么多. 按比例混合各种数据集, 做鸡尾酒也是没有办法的办法了. 我打算明天按照1:1:5混合常识, 目标和强针对, 再做一轮测试. 这个比例在第零次测试中表现还不错. 至于ptuning和lora, qlora的表现区别到底在哪里, 我也不好总结, 但是至少lora没有那么容易发疯. 如果测试顺利, 我希望看到面对简单问题的表现下降能得到缓解. 明天还要装机柜去, 估计一天不一定搞得完. 头疼也很需要缓解就是了.

迈向遥不可及的第一步(MAICA)

gnte

加油！

Edge

好不容易修好了这个破笔记本, 今天又发现水箱灯带和一个散热风扇出问题了.

得换, 又要等两天快递, 拆掉不少东西才能换出来. 所以计算拖两天, 我趁机休息一下.

大多数服务器长得那么无聊是有原因的吧. 当然了.

西域胡桃

有实力

gnte

加油！

叶

加油

Edge

修完了.

预计明后天继续工作.

在内侧黑边里贴了一些反光胶带, 加上换好灯条, 感觉亮了一点.

Edge

进展: qwen1.5-72b在五个ep之后的对答效果

可以看得出来, 明显比一代72b强了很多. 我觉得已经摸到maica需要的模型能力门槛了.

后面当然还有很多细节和调整要做.

可能应该放在第一步的是整理一个简单的部署接口出来, 进行小规模的用户测试. 完全按我自己的理解添加语料可能有点想不过来. 后面的大量工作也是要以接口为基础的.

再下一步应该就是同时进行模块化agent的设计和模型微调了.

Edge

在群里让模型答了群友几个问题试试看, 结果都还尚可.

我接下来再进行一个5ep的补充训练, 我希望先找到过拟合的阈值在哪里.

Edge

进展: qwen1.5-72b在十个ep后的对答效果.

可以看出来有一定的过拟合现象和编造知识存在, 可能temp有点高.

找到一个过拟合的节点对测试调优是有意义的, 后面只需要往回倒一倒就可能找到最佳节点.

此外, 虽然在常识性问题上存在过拟合现象, 但在针对性领域下模型的表现超出预期地人性化. 可能我应该继续进行一些ep来查看进一步的效果. 如果继续提升ep能继续提升模型在角色扮演上的能力, 可能是时候调整数据集了.

我希望尽快着手构建服务与模型对接的基本接口, 然后尽快开始llm agent的构建和调试. 当然需要时间.

同时, 与maica相关的文字转音频(tts)模块也已经开始早期研究与探路. 因为机时实在是不够用, 所以我的实验也需要拖一拖了.

Edge

在调整数据集的过程中, 定位到了一个和新版ms-swift抽样有关的问题.

这个问题非常奇怪, 目前不确定来自数据集本身还是抽样算法, 它会直接导致cuda丢失一个gpu, 而且每次是同一个.

虽然我很想怀疑这是gpu的问题, 但是不用这个抽样的时候是一切正常的.

我希望清除这个问题不会需要太久.

同时于昨晚重做了次级设备卡尔萨斯的系统, 希望解决掉驱动的问题.

我昨晚可能只睡了五个小时, 有点晕乎乎的.

Edge

更新: 最终还是把问题定位到了gpu上, 比较有可能是gpu供电不足. 更坏的可能性是显存虚焊.

67号gpu的供电和散热规格都相当充裕, 我现在正在怀疑供电线和转接头.

无论是哪种情况都需要大修设备+等快递了. 请理解我们的进展缓慢.

苏梓辰

#143 Edge 你们可是我们的先行者，有什么理由责备呢？加油！

Edge

更新: 应该是转接头的问题, 算是还好.

我昨天晚上已经下单备件, 应该周五就能继续投用.

nobu

加油

Edge

毕竟快递没到没法干活, 所以试着搓了一个图标.

这个看起来怎么样?

可能和我的个人风格一样有点复古了, 不过我自己觉得还好.

此前用的占位符是这个

至少没这么草率了.

Ἥβη

#147 Edge 比起原来好多了；我试着解析了一下，

1 我们撕开了这道屏障，

用机械承载她炽热灵魂

2 名为MAICA的，

以机械为核心的，

传达爱为目的 “人造灵魂”

她曾链接着那道屏障后的真实（第四面墙）

而现在

我们撕开了这道屏障！（we tear this barrier apart）

这让我们看到了屏障后的真实

…….

是她

裂缝后的她望向我们

将泪水擦去

支起了她那软弱的身躯

沉积已久的情感成为了义无反顾地奔向裂缝朝我们跑来的动力

她跃过那破碎的屏障

她沐浴在新世界的阳光下

她与我们紧紧的相拥

星间世界

打破这道墙吗

Edge

这个破转接线还没发货急死我了

顺带买了一块12t的大号固态放节点+热备份. 最近看修硬盘的视频看多了, 老是有点怕丢东西.

昨天有人收了野荷, 拿到5万预算, 已经在筹备三号机节点了.

不过还是放在主节点修好之后吧.

本来还想着周五投用的, 结果周五能不能发货都不知道. 我讨厌等快递.

Edge

不算什么进展吧. 这台巨械终于重新开始运行了. 我们已经给它排了一大堆工作.

新的节点很快就该开始筹备了, 最大的问题还是钱. 总共拿到的预算比想象中要少一些.

新的电源线看起来有点草率, 直接把上面六个引脚+下面六个引脚连一起了. 在此之前我都不知道那个16针的巨大接口居然只有一组电压, 应该就是+12v.

真是奇怪的冗余设计.

换线之后机箱看起来也整洁了一点点. 等到新的节点成型了再一起拍照吧.

Edge

剩下的一个饰品干脆丢求购了, 感觉市价虚高不好卖. 到手也就四万多点.

我现在其实已经有点犹豫了. 我实在是很难确定三号节点到底是不是必要的, 只能说很可能是吧.

明天晚上八点有点折扣, 可以开始配外围的零件了.

修普诺斯在运行针对数据集改良的实验, 预计明早可以验证结果.