20 Apr 2020
Auch unter FreeBSD gibt es ernsthafte Dateisystem-Fehler, die dazu führen, dass der Server nicht mehr bootet, oder in einem Endlos-Reboot-Intervall verharrt.
Deshalb schildere ich jetzt hier ein Szenario, und wie ich das behoben habe. Das kommt nur in sehr seltenen Fällen vor, meist liegt eine Kombination von Stromausfall und/oder Harddisk-Problemen zugrunde. Genauer kann ich das aber nicht eingrenzen. Es ist nur mit UFS+Softupdates bisher passiert.
Wenn der Server immer wieder von selbst rebootet, muss man einen Montior anschließen, und den Boot-Prozess filmen. Diesen Film kann man dann gegen Ende Frame für Frame ansehen, und die Stelle mit der Panic identifizieren. Hier war es diese:
find: /var/spool/postfix/defer/A/AD5F892446CA: Bad file descriptor
panic: ufs_dirbad: / : bad dir ino 153375075 at offset 512: mangled entry
# fsdb /dev/ad0s1a
** /dev/ad0s1a
Editing file system '/dev/ad1s1a'
[...]
fsdb (inum: 2)> inode 153375075
current inode: directory
[...]
fsdb (inum:153375075)> clri 153375075
fsdb (inum:153375075)> quit
# reboot
sollte erst mal wieder möglich sein.