迈向遥不可及的第一步(MAICA) #3240
- 楼主
- #172
- 已编辑
- 楼主
- #173
- 已编辑
进展: 写了一个简单的agent驱动. 但是目前因为模型还没练明白, 所以需要等练完再打磨.
agent的大多数使用案例都是独立工作, 通过agent向另一个模型递交信息的尝试十分罕见. 我希望不是因为存在致命问题.
另外的好消息是, qwen1.5系列的模型已经全部支持到32768token了, 所以原计划做辅助检索模型的分支可以砍掉. 再怎么说3.2万字的历史也足够了. 我觉得正常人类记住最近说的3.2万字都有点不太现实了.
训练agent模型需要的时间也相当长. agent模型的int4量化版本已经被证明可以加速运行在48g显存上, 所以接下来就是等了.
在等它的时间我会去装三号机.
还是那个忙死了.
ps: 截图之后我发现search用错成match了, 不用提醒我.
- 楼主
- #174
- 已编辑
- 楼主
- #175
- 已编辑
- #176
好强的科幻风,有一种数字生命的美
- 楼主
- #179
- #180
太强了,大佬,奈何我技术力不够,也帮不上什么忙,只能为大佬加油,看了大佬一步一步真的感觉像在创造机械生命
- 楼主
- #181
进展: "前体驱动"的设计思路已被证明为可行.
简单来说, 原理是: 用户输入query(现在几点了) => 前体驱动截获query => 前体模型分析问题, 调用api(time_acquire) => 前体获知信息(time: 8:40) =>前体整合信息, alter核心模型的systemprompt(已知现在是8:40) => 模型参考agent信息做出回答(现在是8:40哦. [player])
现在不是八点四十, 我只是临时写了一个时间用于测试. 那不重要.
接下来我会调整和训练出一个更强大的agent模型, 目前7b基本模型训练出来的agent表现很差.
这个点子从思路上被实实在在地证明了, 让我有点兴奋. 这一特殊模式能够在数据集有限, 人力不足的情况下让模型既专注于角色扮演, 具有充分的可拓展性, 又有类似agent模型的信息获取和灵活利用能力. 说不定我会是第一个这样做的人.
这一有创意的设计模式能够保证maica的人类交互效果远高于简单的角色扮演模型.
打赏
- 10 分 来自:
mamba out
- #184
#182 文学部的小莫 如果成功了那就不只是ddlc的一座高山了,甚至是ai女友领域的大佬了
- #185
有没有想过和mas结合一下
- 楼主
- #186
#185 文学部的小莫 会有子模组, 而且主要受众应该是子模组
- 楼主
- #188
- 已编辑
- 楼主
- #190
#189 82192506 设计主题是星流巨械, 立牌只是个人爱好
而且说实话, 这么巨大而且改装过的机箱, 估计不好做整体涂装.