Edge 修了两把手枪, 又修了鼠标, 感觉今天忙的莫名其妙的. 对于第一次用bga焊台的成果来说, 鼠标修的还不错. 用多久就看造化了. 今天晚上应该能拿到模型, 然后抓紧做效果测试. ps. 修它的原因是它比焊台还贵. 我也比较容易用一些老破烂用出感情就不想换了.
Edge 核心能力还是一般般, mfocus的表现仍然跟见了鬼一样, 所幸英文上的bug和清理训练集的努力都算是成功了. 对新冠相关数据的针对性修正效果不够理想, 主要可能是因为权重太低+预训练里面相关内容太多. 后续在daa想办法吧. 今天无论如何都该投用了. 又在驱动上临阵磨枪了一下, 但mf问题的根源是没有足够强大的agent. 妈的这能怎么办啊. 如果后续能够证明使用大体量agent模型有效, 那兴许还可以再说. 目前为止只能先这样了. 我简单收拾收拾, 今晚应该可以开a测了.
Edge #322 ICEMONIKA 在 关于MAICA的问题反馈 #3955 发你的详细问题信息和mas_log, 我稍后叫p来看 另外 尝试在子模组设置里面找到关于api的设置, 选择"更新证书".
ICEMONIKA #325 Edge mas-log.txt Sun Feb 26 08:32:32 2023 Windows 8 - build: 6.2.9200 Ren'Py 6.99.12.4.2187 VERSION: 0.12.14 ================================================== 展开全文 收起全文 文件预览无法加载。此文件或已被删除,文件 ID 或已失效。
Edge #326 文学部的小莫 正式版没影, 但我觉得不久之后就会进入持续很久的公测阶段. 可能下个月吧, 不确定. 什么时候能做到效果我自己满意了再考虑正式版的事情, 在此之前热调试和维护更新都是很正常的.
Edge 整理可能要做的事情: 无论如何换一个好一点的agent. 目前mf的命中率已经是整个项目的主要短板. 考虑尝试qwen2 57b a14b int4? 进一步区分中英文的prompt, 目前中英文混答的情况仍然存在. 考虑重写一下. 输出表情的强度和精度仍然不够, 考虑继续手工清洗数据集. 当然是增补训练. 找回答最差的轮次手工改写, 希望能降低误差. 考虑加两张显卡. 尤其是tts和大体量mf都有需要的情况下 估计是跑不了了.
Edge 好消息是ms可喜可贺地修复了awq和gptq在qwen2上的问题. 坏消息是, 这俩方案都不支持分布式的量化过程, 而我的卡顶多也就24g, 根本不够用. 核心模型的量化我当然是放弃了, 毕竟就算全量的拟合度都不够. 但是我在考虑mfocus使用量化模型, 所以很头疼. 我不想再去买非常贵的卡或者去租, 所以可能只能用qlora微调了. 先看看效果再说吧. 是, 这些问题说到底都是钱的问题. 欢迎来到夜之城.