服务器掉电了 重启不了

敲 root 密码、回车,然后 systemctl list-units --failed 看看。



boot 挂不上


p

Linux 就这点不好,非法关机,就有大概率的系统坏掉。无论当初吹嘘的 ext4 文件系统有多优秀都没用。
非法关机这点来说,windows 的 ntfs 确实甩 Linux 几条街。
当然,linux 也有解决方案,我在网络上查询了很多天,各种文件系统比较总结。最终得到的方法是采用 xfs 文件系统。没有 ups 的一定不要用 ext4 文件系统。唯有 xfs,能抵御你的大部分非法关机而不坏系统。这点在我自己的机器上已验证,特别是装了 pve 的机器上。随时拔电,完全不用担心 pve 启动不起来。

难道你的 xfs 是假的?我 pve 就坚强些?

NTFS 确实非常优秀,但 ext4 也不弱。我的台式机时不时地会遭遇停电导致不正常关机,都从来没出现过 “系统坏掉” 的情况。别说 ext4, 就是以前的 ext3 都不会坏。

我就不信有许多人的 ext4 在非正常关机情况下会坏掉,可能只是你运气不好的特例。

那就不知道了,反正我用 ext 2-4 都是一样,停电或者死机了强关 2-3 次,必坏系统。
ntfs 下停电就没坏过。xfs15 年以前坏了 2-3 次把。近几年一直用 xfs,没坏过了。

ext4 的确不怎么样,但 NTFS 更烂啊。同学曾经强行关机一次,结果出现了同名目录项,然后 explorer.exe 卡死,最后重装了系统。

我没怎么用过 NTFS,ext4 也只早期用过,所以这方面的经验不多。我的 zfs、xfs 和 btrfs 在各种意外关机之下都存活得好好的,唯有 xfs 有两次需要手动跑 fsck。zfs 是在一次硬盘接触不良之后去世了(元数据损坏)。

你这种情况,有可能是你的硬盘的实现有问题:ext4 以为你的硬盘能做到某种保证、但实际上它没做到。

这个可能性是有。但在我这应该可能性最低。因为我硬盘多。并且这 20 年来机器都换了 5-6 台了。硬盘更是换了无数。其中不光装了 Linux,现在机器都是 3 系统。win+Linux+ 黑果。而掉电或死机崩溃的只是 Linux,当然也怀疑或硬盘,但也和 win 和黑果的硬盘调换过。但最终无论怎么调换,出问题的只是 linux。手动拔电测试的。
而现在看到单位的 linux 服务器都头疼,ups 只有 30 分钟时间,完全不够敢过去关机。导致停一次电。linux 服务器几台都起不来。十几年前也为这个问题在专业的 linux 论坛问过,结果人家的回答是,我们 linux 就是给专业服务器设计的,有专业的机房和电力设计,不会停电,所以我们都没考虑过这个问题。

30 分钟时间还不够你关机的,你得肉身去机房才能关机的吗?没 IPMI 的吗?
UPS 应该会给你的系统发信号的,然后你可以在收到信号的时候自己关机。

不过你这问题确实很奇怪。我从来不担心掉电了系统起不来(只担心我的服务没配好自己起不来)。

是有短信告警。30 分钟到不了机房。并且是内网。禁止任何方式连接外网。无法远程。

那就比较麻烦了,只能靠服务器自己了。

我就是说一句,你这图一里好几个核心过热了,是机房的问题还是服务器风扇坏了?

1赞