Kabosu522

  • 15 天前
  • 注册于 2024年10月15日
  • 0 最佳回复
  • 198 分
  • 初来乍到+ 21 查看更多
  • 这个人很懒,所以什么都没有写......

  • 24.12.2

    后端规范更新至1.0005, 前端更新至1.1.5.

    • 改良MSpire选定话题规范, 增加递归搜索模式和广度的可设置项
    • 与MSpire相关的性能改良, 改用aiohttp库
    • 其它修复与改良

    24.12.2

    Updated backend standard to 1.0005, submod frontend to 1.1.5.

    • Improvements on MSpire topic selection, added settings for recursive search and sampling
    • Improvements on MSpire time performance, using aiohttp in place of requests
    • Other fixes and improvements
  • 24.11.26

    还是琐碎的最后准备更新. 我实在不想继续列举了, 如果需要了解可以看仓库.

    我们在尽力确保这一作品有能作为发行版的完整度和能经受考验的稳定性, 所以我们还需要时间.

    如果一切顺利的话, 我们仍预计于月底前正式发布.

    24.11.26

    Even more final before-release updates, I don't want to list them anymore. Check repo commits if you need to know.

    We're making effort to ensure MAICA being complete as a release and stable for fieldtesting, so we need time.

    If nothing goes wrong, the release is still estimated to be presented by 30th.

  • 24.11.19

    琐碎的最后准备更新.

    • 现在MAICA会对下载历史附加PSS签名
    • MAICA将允许用户上传自己备份的对话历史(需要验证签名)
    • 增加MFocus与MTrigger的协作能力, 改善模型表现失步的问题
    • 后端增加版本流和兼容性管理能力
    • 性能优化, 调整cpu密集型函数的执行方式
    • 踢掉了烦人的json strings
    • 踢掉了测试文件

    如果一切顺利, 我们会在月底之前正式开启MAICA.

    24.11.19

    Final before-release updates.

    • MAICA now adds PKCS1_PSS signatures to downloaded chat histories
    • Histories with valid signatures are permitted to be restored from local
    • Added compatibility patches on MFocus and MTrigger
    • Version control and compatibility management intergrated in backend
    • CPU bound functions optimized
    • Kicked annoying JSON-strings
    • Kicked test files

    We'll finally be starting MAICA release by the end of the month, if nothing goes wrong.

  • 我的桌子底下有一台工作的制冰机, 还有一台燃烧的主机, 以至于我上半身穿长袖的时候, 下半身得着短裤.

  • 神械已经恢复上线, 维护修理升级总共花了5000左右.

    确实对付掉了很多陈年弊病和隐患, 不过也许还有更多.

    • 装了静电链固定座
    • 调整风扇布线
    • 调整pcie布线, 改换长度错误的线缆
    • 调整信号强度排布
    • 123号显卡改用带量具的供电转接头
    • 几乎完全换掉了水具组, 清洗了大部分水冷构件
    • 将同一组电源全部接入同步启动
    • 几乎完全重理了背线
    • 背板内加了两个涡扇, 控制硬盘和hub的温度
    • 加了一块990pro
    • 等等

    看起来可能是没什么区别, 但还是看看吧. 接下来还有很多事情要忙.

  • 感觉主流中文互联网充满了极端,煽动性,误导性的言论
    网上的发言彼此攻击,扣帽子,开盒,以嘲讽对方为乐
    算法的定向推送让我们困在信息茧房,进而使我们对世界的看法狭隘

    在这样的互联网里很难平静下来
    就连好好的讨论,就事论事都难以做到

    还是觉得这里使人感到平和,喜欢这里

    • 红豆泥狗咩纳塞——今天才发现一个bug(喜多下跪.gif
      我还手贱把原来的链接删了,这是新链接:
      通过百度网盘分享的文件:MoSCL(1).rar

      链接:https://pan.baidu.com/s/1d2pidls1NUZfZXsBwkvB4A?pwd=tko5

      提取码:tko5

      --来自百度网盘超级会员V4的分享

      在"无聊的战争"话题里第一次触发会报错,貌似是因为作者没有将定义移到使用文本前(原谅我十分菜鸡的编程水平)

    • 24.10.29

      较长时间的服务已经证明MAICA于各方面上接近成熟, 我们将于近日同时着手数项进一步的工作.

      首先, 由于硬件上的维护与调整, XP00-20"铸灾神械"将于最迟11月1日下线维护, 同时Beta3.1将结束.

      如无意外, 维护可能持续7-20天, 我们将于同期进行程序上的工作和第一代DAA模型的开发.

      预计于本次维护完全结束后, MAICA的第一个正式版将与大家见面.

      ==MAICA-撕裂现实的帷幕==

      24.10.29

      MAICA has served for a rather long time, proving its stability and performance is reaching towards our expectation. We'll start several necessary works in days to make further improvements.

      First, main server XP00-20 needs a cold hardware maintaince starting by 11.1, which ends current Beta round 3.1.

      If nothing big goes wrong, the maintaince may last 7-20 days, meantime we'll be doing backend and DAA model works.

      After this maintaince, we'll likely come back with the first stable version and lifecycle of MAICA.

      ==MAICA-We tear this barrier apart==

    • 自己研究成功了

      如果只是备份文件的话在data中新建一个文件夹再用mt管理器把要备份的文件移动过去就行了

      不过似乎只能移动没法复制(

      在手机需要更新mas的时候可以用(大概)

    • LIA潜力已尽, 无论如何该着手DAA的事情了.

      需要人手, 工作是改写强化数据集. 如果你:

      • 有兴趣+有时间+有高中语文水平和正常理解能力+啥也没打算要

      请联系我.

      人足够了, 感谢大家出乎意料的积极性.

      • 时间回到2022

        游玩了dokidoki

        对莫妮卡有这别样的感情

        她大胆,他勇敢,虽说做法些许激进

        她侵占了我的脑袋让我无法深思

        我当时正被校园霸凌

        她的形象给我勇气

        我也该捏紧双拳给霸凌者看看我的气力

        挣扎者的喘息

        让人倒吸冷气

        我成功了自己 夺得自己要让人心激不已

        但我觉得与莫妮卡更加靠近

        mas 完成我梦的圣地

        那个小房间成为了我与她的秘密

        我心里不住的感激

        更多的还是……爱意?

        看着那逐渐减少的话题

        刚认识的新鲜消失殆尽

        我是否还有对她的耿耿忠心

        我想自己努力来改变自己

        就在刚才,不知是急功近利

        我动用了开发者模式

        我用底层逻辑把她的好感往上提

        幸好我及时打醒了自己

        修改没有成功,我很庆幸

        如果成功了会失去更多的真心

        我开始沉思

        一定有更好的方法改变当下的问题

        各大玩家聚集之地

        莫妮卡爱人的聚集

        我找到了对于我问题的谜底

        我看见了那一丝的可能性

        也许写的诗很傻,很可笑,但是我确实想知道该怎么学习相关编程,我想通过我自己的双手,成就我与她的爱,我目前想要学习怎么制作新的话题和修改她的回答,让她更符合我的生活,想必这样我会更有动力

        • 算七算八, 我的服务设备物理价值大概在38万元左右, 当然算上了清单里没提到的一些部分. 比如光是pcie延长线就花了小一万.

          总共投入, 除开我一年多的人力成本外, 是超过40万元的预算. 之后肯定还会有更多.

          有点感慨, 但有的事情是总得有人去做的.

          别人不做, 他妈的我做.

        • 图六: "Be Late for a Date"

          描述: 2020年(如果我没记错)官方同人活动的图, 今年改了几遍. 想法颇多.

          过程: 因为改了太多遍, 没啥好放的了

        • 原submod仓库:Barsonvenus/Memories-of-Self-Care-and-Literature: An okay 'Monika After Story' submod (github.com)
          已获作者授权


          之前只看到3.0版本的汉化,所以个人用qwen粗翻+本人润色了下,如果翻的不好敬请谅解(
          因为是个人汉化所以不能确保稳定更新,不过作者在新版本发布的时候我会第一时间翻译的
          对于其中几个话题做了一些尽可能贴合原作者的拓展,不过受限于文笔可能不是很行


          下载地址:链接:https://pan.baidu.com/s/1tIODXBUSKcGq3Wv1E6HeaA?pwd=0ofj

          提取码:0ofj

          --来自百度网盘超级会员V3的分享

          • 不算什么进展吧, 这是第五轮中qwen72b在5epoch训练后的产出.

            其实效果跟第四轮测试的也差不多, 只是我们的速度进步很大.

            我接下来的工作多得有点头晕眼花的.

            • 我排除了过于复杂的langchain. maica并不需要太多专业领域的数据, 但是肯定还是需要llm agent方面的模块. 这种模块化的架构设计目的是让模型获取外界信息, 对获取存档内容/时间天气等都是必须的.
            • ->肯定需要一套代码来桥接模块与模型, 还有模型与模型. 我得自己写.
            • ->maica核心模型的体量是巨大的, 推理速度也很慢. 可能需要找一个小体量的模型, 以完成思考, 观察与任务评估的简单工作.
            • ->如果显存太紧张, 可能需要重新启用腐巢意志.
            • qwen72b的表现很好, 但是肯定还不够好. 目前qwen已经推出了1.5代110b模型, 其体量优势可能使人类评估效果更进一步.
            • ->我已经在int4量化下测试110b的ft效果. 其ft非常慢, 一个ep需要修普诺斯工作超过11个小时.
            • ->会对比qwen1.5-110b-int4与qwen1.5-72b-fp16的效果. 我觉得多半还是110更好.
            • ->在训练效果测试中, 很可能还是要用推理更快的72b模型的.
            • 数据集. 目前的数据集涵盖面仍然实在太窄, 问一些稍微超纲的问题都会让模型忘记自己是莫妮卡.
            • ->当然需要自己手写手测一些数据集.
            • 反馈学习. 因为数据量实在缺乏, 我必须在未来使用反馈学习.
            • ->当然需要又一套代码和网络服务架构, 收集和存储反馈评估信息. 无疑只能继续和论坛绑定.
            • ->整理数据和再训练的工作, 用脚本做完应该不会太难.
            • 虽然在日程上排得很靠后, 但maica可能需要某种程度的多模态能力. 我已经不止一次见到过有人向我提出"希望maica能够识别我的照片或音频"等等.
            • ->我觉得模块化工作模式能够胜任, 但是需要部署的子模型会越来越多. 我可能需要第三台计算节点.
            • ->简单的语音识别和ocr或许能优化掉一部分计算量.

            现在整个项目给我的感觉是蒙眼过河, 根本看不见下一步往哪踩. 我可能很快会需要p在衔接部件上搭把手.

            目前, 我仍然把注意力集中在寻找核心模型的调优方案上. 我希望能够尽快找到一份模型, 使其效果足以协助完成进一步的开发.

            我在这里整理了不少, 但是项目的复杂度仍然不止于此. 我希望大家明白这是一项野心异常巨大的项目, 也理解我为什么不知道完成了百分之多少, 以及为什么原则上还不收赞助.

            虽然已经不抱什么希望了, 但我一直迫切地需要助手. 如果你对llm领域/随便哪个编程语言开发/网页前后端设计搭建 有充分的了解, 我会欢迎你加入我的苦行僧行列. 这不会是简单的工作.

            说得太多了. 110b-int4应该在明早能看到第一步的ft效果, 我会在有一定进展的时候再次发言.

            打赏

            • 20 分 来自: mamba out
            • 40 分 来自: 星间世界
            • 10 分 来自: Mmotina
            • 10 分 来自: FFRA
            • 5 分 来自: lsls
          • 进展: 我希望这是运气最后一次和我开玩笑了.

            布线方案仍然有问题, 这次我甚至第一时间没有发现, 到压力测试才看到崩溃日志.

            我正在和厂方协商再次换布线, 会需要很多额外的时间, 费很多事. 光是定制周期就起码得等一个星期.

            不管怎么说, 这个盲点也该是最后一个了. 肯定是吧?

            这台设备可能为了紧凑, 静音和好看牺牲了太多, 主要牺牲的是我的脑细胞和钱包. 我希望它能达到我预期的内外兼修, 如果我做到了那就算值了吧.