长话短说: 实力有限导致解决漫长, 非常抱歉.

快来注册!

*即使不注册, DCC也会展示所有知识性和分享内容

10月6日晚, 主路由固件因为未知原因崩溃, 我猜可能是mc服务器导致的载量过大.

当晚尝试修复无果.

次日检查, 发现崩溃的路由造成dcdn配置, wss配置全部崩溃, 一台dgx超算异常关机.

然后我也差不多崩溃了.

一直修, 和阿里的人沟通了很久很久, 直到现在基本上搞定了网络问题.

如果你在使用论坛时发现cors错误, csrf错误, 登录和退出登录异常, 莫名其妙的红条报错, 收到不属于自己的内容, 无法发帖和接收提醒等问题:

请等待最多24小时, 或刷新缓存重试. 最新的修正改动正在日夜兼程地发往各地cdn服务器.

我非常抱歉, 论坛繁杂困难的技术问题已经让我十分力不从心, 应该说改革永远是有代价的.

非常希望大家能体谅我的愚钝, 我诚挚地道歉.

另: 此次事故导致一台用于mgpt(暂)的dgx计算机出现异常, 我正在尝试修复.

此次事故发生后, 我重建了几乎整套路由网络和信息交换系统, 力求使用稳定可靠的固件和套件, 尽可能避免使用未经考验的第三方套件. 我希望这样的问题不会再发生了.

谁知道呢. 但只要我还站在这里一天, 它们就休想打倒我的心血.

打赏

Edge 超级置顶了此帖

此贴的置顶将在本次事故的余波完全修复后撤销.

由于cdn延时性, 此段时间内论坛及相关站点仍然需要调试.

为此考虑, 论坛将开启调试模式一段时间.

请不要向无关人员泄露调试信息, 以避免隐私问题.

23.10.8

重启错漏的端口映射, 莫盘无法正常使用的问题已经修复.

为合并设备事项重启后, 论坛服务器raid硬盘出现了奇偶校验错误.

raid卡会尝试自主修复问题, 但在此期间服务器的io延迟会明显增加.

请耐心等待论坛的恢复. 如果遇到前述关于cors的问题, 请等待24小时后刷新.

请注意, cors错误的征兆之一是你似乎登录了不属于你自己的账号.

此时你无法正常使用任何账号功能, 往好处说, 不用担心遭到破坏.

这种状态是cdn缓存异步导致的, 没有直接方法修复, 请耐心等待并刷新.

表示理解与支持

论坛SAN阵列的硬盘挂掉了一块, 目前系统处于急救状态.

这段时间内文件操作的响应速度会大幅度下降, 同时数据稳定性难以保证. 请尽可能避免使用云盘等服务.

SAN降级导致的mongodb数据库问题会造成DCC chat无法服务.

我会尽快换修受损的硬盘.

更新: DCC chat服务已经修复正常.

暂停了raid自动修复, 删除受损硬盘以临时提升响应速度.

这段时间内文件操作的响应速度会大幅度下降, 同时数据稳定性难以保证. 请尽可能避免使用云盘等服务!

此贴将在此次故障的影响完全解决后取消置顶. 而在此之前, 建议大家关注此贴的动向.

更新: 论坛raid阵列修复已经启动.

直至论坛存储介质完全调整完毕为止, 论坛及相关站点的访问速度会显著下降.

还请大家体谅.

本次调整会将阵列升为raid6, 并增加3块物理硬盘

更新: 再次更改dcdn缓存逻辑

终于发现400 csrf token mismatch的病因了. 找了好久.

现在应该不会再遇到了. 如果你暂时仍然有这种情况, 刷新你的浏览器缓存.

Edge 取消超级置顶此帖
无人输入