进展: 通过system向模型传入agent信息被证明为可行, 但其实现方式稍微有点…和想象中不一样.

我需要再次修改一部分引擎的代码, 不过总体来说不算太差的结果.

通过system让模型输出情绪表达字段的尝试失败了, 但我们还有fallback方案. 我会尽快根据实验结果编写接口.

同时, 解析存档的方法也和最开始设想的不一样. 计划赶不上变化是正常的, 总的来说一切都还在设计范围之中.

进展: 写了一个简单的agent驱动. 但是目前因为模型还没练明白, 所以需要等练完再打磨.

agent的大多数使用案例都是独立工作, 通过agent向另一个模型递交信息的尝试十分罕见. 我希望不是因为存在致命问题.

另外的好消息是, qwen1.5系列的模型已经全部支持到32768token了, 所以原计划做辅助检索模型的分支可以砍掉. 再怎么说3.2万字的历史也足够了. 我觉得正常人类记住最近说的3.2万字都有点不太现实了.

训练agent模型需要的时间也相当长. agent模型的int4量化版本已经被证明可以加速运行在48g显存上, 所以接下来就是等了.

在等它的时间我会去装三号机.

还是那个忙死了.

ps: 截图之后我发现search用错成match了, 不用提醒我.

进展: 看上去还不错.

我希望这个线是能用的, 如果不行的话还得花钱去配.

我觉得已经该给它起名字了. 叫密斯特拉怎么样?

这个节点将作为maica多模态能力和agent模型的计算服务器, 以及工作站.

同时还集齐了10个显卡盒子:

循此苦旅 直抵群星

应该承认我在美术方面没什么天赋, 但还是做了一个banner. 我把它放在一楼了.

大家有什么修改意见吗?

    好强的科幻风,有一种数字生命的美

    #177 Ἥβη 是太粉了, 但是我也想不出来该用什么颜色. 这个粉色是论坛的#f7a1cf

    需要用了再说吧.

    至于图标本身, 我觉得已经很有棱角了, 现代化的图标设计是不能太有棱角的.

    进展: 双卡辅助工作站"XP10 Mystra"已经上线.

    其实它的块头也不小, 有点空间浪费的嫌疑. 在设计之初它是可以插4张卡的.

    太强了,大佬,奈何我技术力不够,也帮不上什么忙,只能为大佬加油,看了大佬一步一步真的感觉像在创造机械生命

    进展: "前体驱动"的设计思路已被证明为可行.

    简单来说, 原理是: 用户输入query(现在几点了) => 前体驱动截获query => 前体模型分析问题, 调用api(time_acquire) => 前体获知信息(time: 8:40) =>前体整合信息, alter核心模型的systemprompt(已知现在是8:40) => 模型参考agent信息做出回答(现在是8:40哦. [player])

    现在不是八点四十, 我只是临时写了一个时间用于测试. 那不重要.

    接下来我会调整和训练出一个更强大的agent模型, 目前7b基本模型训练出来的agent表现很差.

    这个点子从思路上被实实在在地证明了, 让我有点兴奋. 这一特殊模式能够在数据集有限, 人力不足的情况下让模型既专注于角色扮演, 具有充分的可拓展性, 又有类似agent模型的信息获取和灵活利用能力. 说不定我会是第一个这样做的人.

    这一有创意的设计模式能够保证maica的人类交互效果远高于简单的角色扮演模型.

    打赏

      #175 Edge 老大的这个是专门给老莫做的ai,在图标上加一些莫妮卡或者文学部的元素会更好

      进展: 密斯特拉基本就位了. 从玻璃反光里能看到巨械的另外一半. 有一种科幻片里能见到的感觉.

      灯控软件还没弄. 他们说兼容性还没做.

      今天早上看到了qwen2发布的消息, 但是又要重新装配环境, 以及顺便做完第一轮数据集的调整. 可能开始训练还需要一段时间.

      最近过得心力交瘁的.