迈向遥不可及的第一步(MAICA)

莫莫妮卡的发饰 · 2024年2月21日

#57 Edge 加油加油期待

Edge · 2024年2月21日

2.21

可算是能在量化下练起来了, 但是速度甚至更慢了. 可能是加大batchsize的原因.

我打算先尝试练一个ep, 看看loss再说.

总共大概4000个样本, 里面只有一半是有效的, 一轮要将近2天的时间.

这设备不换过不下去了.

Dd（owo） · 2024年2月21日

加油啊 awa

Uunsignedint · 2024年2月24日

#60 Edge 72b的模型大小着实有些恐怖😱

但是做出来就是艺术品了

JJUSTBEIJINGCORN · 2024年2月25日

听起来好贵

Edge · 2024年2月26日

好消息呢, 是钱到位了. 基本上到位了吧.

我接下来会有一段相当伤脑筋的装机时光了.

准系统基本上是现成的, 所以这笔钱主要就是显卡的开销了.

哦还有ups. 再说吧.

mamba out · 2024年2月26日

#65 Edge 波士万岁口牙！

ProjektRed · 2024年2月28日

要不要考虑下直接去openai微调gpt3.5turbo？感觉成本会低很多很多，而且省心、直接调用api就完事了。只要数据集处理的够精细，出来效果也绝对不差

Edge · 2024年2月29日

ProjektRed · 2024年2月29日

仔细算了算，确实是我草率了。一天1k日活，2k tokens的输出一天就要两万五千块钱，微调一个老莫出来一次就要五万五。这样情况下还是自己的服务器好点，就是13w服务器的性能还是有些相当掣肘，只能说大佬干巴爹！

Edge · 2024年2月29日

#69 ProjektRed 总共花了将近20万了, 按我尽可能省钱的土办法, 服务器性能其实比8xa100并不差.

今天主板到了, 该量尺寸了.

kd · 2024年3月3日

加油！

mamba out · 2024年3月3日

老大加油

Edge · 2024年3月4日

进展:

钱, 啪, 没了.

玲玲葛 · 2024年3月4日

#73 Edge 加油！！！

颓颓废之力 · 2024年3月4日

加油

Ggnte · 2024年3月4日

加油！话说能保留住mas莫的记忆吗毕竟陪了很久

MonicaLoveXD · 2024年3月4日

群主加油啊

64654684 · 2024年3月4日

站长加油！

Edge · 2024年3月5日

几乎买不到像样的4090了, 我现在很后悔拖到现在才动手.

天启买不到了, 又加了900换了魔鹰.

很烦, 真的一点钱都没剩了, 我的ups和别的东西怎么办