【求助】开机突然显示硬盘可能损坏

自从我使用 openSUSE 开始,就发现在这个系统下笔记本经常无缘无故满功率运行,但没太在意。昨晚用电脑比较久,今早开机以后突然跳出一个提示,说我的这块硬盘好像要不行了。我一脸懵逼啊,是我买的硬盘太菜了还是总是满功率运行的缘故?下面放截图

(上面这块是目前运行 openSUSE 的 SSD,我用的联想拯救者,这块是新买的加内存用,人家说是原厂的,我也没法分辨)


小白真心求助,我快吓死了 :joy:,我连夜打开论坛运行了一遍 openSUSE 电池管理教程(虽然也不知道这两者之间有没有关系)

如果你有双系统的话,可以先切换到 Windows 下,使用 磁盘精灵 检查一下是否存在 磁盘坏道

另外,在看到此类消息的时候,首要做的事情是备份重要的个人数据。

另见:

另外,我记得联想并没有硬盘销售业务;联想电脑的原厂配件应该是直接找主流硬盘供应商批发的,算是 OEM 渠道,消费者不通过售后渠道能直接购买到的联想原厂硬盘是经拆机获得的。

你在说啥?SSD 怎么会有坏道??

smartctl -a /dev/XXX(你的磁盘设备名)看一下 SMART 信息。
另外 journalctl -k 看一下有没有相关日志。
最后也是最重要的:不管它是不是真的要坏了,立即备份重要数据!

更新:哦,你有贴 SMART 信息的截图啊。刚才图片没刷出来……

啊,我犯了一个常识性错误。 :joy:

SMART 报告磁盘温度异常。这个异常值是 0℃——你把磁盘放冷冻柜里跑也许可以达到这个温度?总之看上去是温度传感器的问题。

其它数据看上去没啥问题,除了已经写了快 1T 数据了,是不是写得有点太多?可以用 sudo iotop -o 观察一下平时都谁在写磁盘。

看了一下 smart, 写了不到 1T,健康 100,33 度温度
有其他更详细的信息么,看起来不像能出问题样子

1T 不算多,有时候高磁盘占用可能是 btrfs 在进行操作

他说是新盘呢。

btrfs 在 ssd 上不能开 quota,然后 fstrim 是会满载一段时间,但一般是一周做一次啊。其它情况下还好啊,我没发现占用率很高的操作(我有上千个自动快照)。

我个人认为可能是 smart 中条目出了问题,第二张图里有一个 Temperature 为 0,又有一个 Temperature Sensor 是 33 度,他可能是因为这个报温度异常

谢谢大佬们回复 :joy:,昨晚外面确实比较冷有到 0 度,但是室内应该没那么低……顺便一提我看了一眼现在 SMART 里显示是 1 度 :joy:。我运行了 journalctl -k 没有看到相关日志。我日常用 openSUSE 也就写点老师布置的小代码,看看视频啥的,最多爱好下点软件(没特别多)。理论上应该是没有很多读写的,不过确实总是在大声运作,我也不知道为什么,我昨晚是在练习配置 vim,只是在配置文件之间不断来回,但是却能听到散热器在运作,我在双系统的 win11 下是不会运作的。至于 btrfs,我不太清楚,我更新频率不高,不知道不更新后台会不会也会运作这个

它显示的信息只有这么多了 :joy:。下午发帖的时候是读写分别是 837 918GB,现在是 849 925GB,中途只是开了些网页还有读写 VIM 配置,这个量算正常么。您的意思是我温度传感器有问题么,这两天确实降温到了 0 度,但是室内应该没有那么低

那个写入量完全不正常。建议好好盯一下,看看是什么软件在浪费你的硬盘。

至于那个温度,有可能是 smart 读取数据时有问题,也可能是盘那边的实现有问题。总之那个问题不大的样子。

1赞

楼主,你发的那个 SMART 状态的图片,是什么软件显示的?

我用的 KDE 桌面,在设置里找不到,但是 alt+ 空格然后输入smart可以找到这个

谢谢,我今天看也是多了将近 20GB,我再盯两天看看。iotop 用的时候下面显示一个CONFIG_TASK_DELAY_ACCT not enabled in kernel, cannot determine SWAPIN and IO % ,不知道有没有影响。能看到最大的数据流动是叫btrfs-transacti,过 10 几 20 秒会飞过,从 3M 到 15M 不等,其他的相比都是毛毛雨

btrfs-transacti 是 btrfs 的工作线程,实际工作来源显然不是它。不过这有点麻烦了啊。你可以用 bcc 工具 btrfsslower 看看(输出应该会非常多,注意观察)。

sudo ./btrfsslower 0 | awk '$4 != "O"'

之前我也遇到了类似的事情,开机提示硬盘 SMART 报告有问题,仔细检查之后发现没问题。但是如果你细看 SMART 报告的话,会发现硬盘自己用保留区块替换了出问题的存储块。这个时候虽然硬盘还可以用,但是在不久的将来有可能会坏掉,所以我直接买了新硬盘用 clonezilla 整盘拷贝了。