Edge 简单查了下资料, 只微调qkv对maica的任务显然是不够的. 下一次迭代我会尝试qkvo和all-linear, 确定一下到底哪种方案最合适. 目前的数据集倒是已经挺完善了, 除了水可以少兑点.
Edge 来张照, 最终的铸灾神械. 有4套系统和13张显卡的复杂设计. 我其实不太打算再更新换代它了, 毕竟再后面也难说有这个性价比的显卡. 昂贵电子产品的寿命就像梦想一样短暂. Beta3的模型已经取得进展, 我应该会把它做成一次维持时间较长的稳定测试, 必须开始收集数据了. 如果最终拟合效果证明我的新思路是正确的, 我会把它更新在最佳实践里.
Edge 训练还在继续, 练完会很慢, 但是明天至少验收一次试试看. 抗过拟合的训练参数有一定的效果. 我希望至少有一个比之前好的表现. 我说实话, 这是在时间和投入上都看不到头的持久战. 如果你之前想过而没去做, 那你应该比我聪明点.
Edge #374 Vega rtx6000就一大号rtx泰坦, 卖这价钱就是在搞笑 少看那些硬件测评, 多数都是带货的. 真要采购必须自己看参数和需求才行. 另外, 如果你看的是rtx6000 ada的测评, 这俩差了两代和一个档, 后者差不多5万左右. 也就是大号4090ti水平.