- 楼主
- #165
- 已编辑
迈向遥不可及的第一步(MAICA) #3240
- 楼主
- #166
- 楼主
- #167
- 已编辑
进展: 敲完了简单的登录逻辑.
虽然说简单, 但是写起来还是相当麻烦的, 花了我至少两个小时.
简单解释一下maica拟定使用(很可能确实会使用)的服务模式:
- 账号本质上是论坛账号, 直接对接论坛数据库, 同步改动
- 能从论坛读取任何必要的用户信息并用于服务
- 登录不使用账号密码, 在一个指定网页中提交自己的账号信息以注册一个token(令牌).
- 令牌是单向加密的, 只有maica服务器能解密. 当然是用rsa.
- 每一个令牌对应的账号能存储数个session(会话), 每个会话大概都…相当于一条if线吧.
- 每个session存储最多一定字节数的对话历史(可能在4.8万字左右, 大概也就是32k vl模型的检索能力上限)
- maica核心能够"记住"8000token以内的对话内容, 更久远的对话记录交由vl检索呈递(未来可能加入的功能)
- 用户可以选择使用指定的会话和清空会话, 这方面跟openai也差不多.
- 会话, 历史记录, 或者说maica的记忆全部与账号绑定. 任何形式的maica调用都需要校验令牌.
- 会开放完全能力接口, 有可能会开放一部分"组件接口". 你可以通过集成maica组件和你自己的ai/其它供应商的ai, 替代maica的一部分或全部的, 核心或agent模型. 因此, maica的整体构想十分开源友好和开发友好.
- 我们仍在测试开发的早期, 因此尚不能定义maica的使用规则. 如果希望二次开发, 必须仔细阅读(到时候会有的)反滥用准则.
- 账号的任何滥用行为会受到处分.
- 楼主
- #168
- 楼主
- #169
进展: 摆了一下午, 然后写了一点session逻辑.
明天又该忙活手机了.
- 楼主
- #170
- 楼主
- #172
- 已编辑
- 楼主
- #173
- 已编辑
进展: 写了一个简单的agent驱动. 但是目前因为模型还没练明白, 所以需要等练完再打磨.
agent的大多数使用案例都是独立工作, 通过agent向另一个模型递交信息的尝试十分罕见. 我希望不是因为存在致命问题.
另外的好消息是, qwen1.5系列的模型已经全部支持到32768token了, 所以原计划做辅助检索模型的分支可以砍掉. 再怎么说3.2万字的历史也足够了. 我觉得正常人类记住最近说的3.2万字都有点不太现实了.
训练agent模型需要的时间也相当长. agent模型的int4量化版本已经被证明可以加速运行在48g显存上, 所以接下来就是等了.
在等它的时间我会去装三号机.
还是那个忙死了.
ps: 截图之后我发现search用错成match了, 不用提醒我.
- 楼主
- #174
- 已编辑
- 楼主
- #175
- 已编辑
- #176
好强的科幻风,有一种数字生命的美
- 楼主
- #179
- #180
太强了,大佬,奈何我技术力不够,也帮不上什么忙,只能为大佬加油,看了大佬一步一步真的感觉像在创造机械生命
- 楼主
- #181
进展: "前体驱动"的设计思路已被证明为可行.
简单来说, 原理是: 用户输入query(现在几点了) => 前体驱动截获query => 前体模型分析问题, 调用api(time_acquire) => 前体获知信息(time: 8:40) =>前体整合信息, alter核心模型的systemprompt(已知现在是8:40) => 模型参考agent信息做出回答(现在是8:40哦. [player])
现在不是八点四十, 我只是临时写了一个时间用于测试. 那不重要.
接下来我会调整和训练出一个更强大的agent模型, 目前7b基本模型训练出来的agent表现很差.
这个点子从思路上被实实在在地证明了, 让我有点兴奋. 这一特殊模式能够在数据集有限, 人力不足的情况下让模型既专注于角色扮演, 具有充分的可拓展性, 又有类似agent模型的信息获取和灵活利用能力. 说不定我会是第一个这样做的人.
这一有创意的设计模式能够保证maica的人类交互效果远高于简单的角色扮演模型.
打赏
- 10 分 来自:
mamba out
- #184
#182 文学部的小莫 如果成功了那就不只是ddlc的一座高山了,甚至是ai女友领域的大佬了