Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 03/12/2023, à 01:59

metalux

[Résolu]Input/output error invalid superblocks

Bonjour,

Suite à une coupure de courant il y a plusieurs mois,j'ai commencé à avoir l'erreur suivante sur la partition de mes données Nextcloud. Il s'agit d'un disque physique rattaché à une machine virtuelle qui me sert de serveur:

blk_update_request: I/O error, dev sdb, sector ...

Jusqu'alors un fsck résolvait le problème. Je n'ai jamais pris le temps de regarder de plus près jusqu'à maintenant par manque de temps.
Un test smartmontools m'a indiqué une erreur de lecture. J'ai corrigé les badblocks sans trop de dégâts avec la commande:

fsck -cfvr /dev/sdxx

Un test rapide de smartmontools ne m'indiquait plus d'erreurs après ça. Tout semblait fonctionner et c'est alors que j'ai remis le client Nextcloud en route sur mon Pc de bureau et que les ennuis se sont empirés. Des erreurs à la pelle reportées avec fsck ainsi que fsck -cfvr ainsi qu'un superblock corrompu.

J'ai essayé en vain d'utilisé un superblock alternatif avec l'option -b de e2fsck

j'ai récupéré la liste des backups de superblock avec mke2fs -n /dev/sdb1
J'ai finalement réussi à monter la partition à partir du backup du superblock 98304 (soit 98304*4=393216)

mount -o sb=393216 /dev/sdb1 /mnt/data/

1-Y-a-t-il une possibilité de récupérer le superblock malgré des erreurs d'entrée/sortie ou est-ce à minima possible de faire une copie sur un autre disque et de corriger à posteriori avec fsck sur le nouveau disque? Tout fonctionne à nouveau une fois monté la partition, il y a simplement des fichiers dans Lost+found (ce sont des copies d'une part, l'original étant toujours là et sans grande importance car ce sont les previews de Nextcloud que je peux regénérer).

2-Est-ce que le disque est mort ou est-il possible qu'il fonctionne encore en le formatant?

Dernière modification par metalux (Le 30/12/2023, à 02:53)

Hors ligne

#2 Le 03/12/2023, à 11:17

lann

Re : [Résolu]Input/output error invalid superblocks

As-tu la possibilité de faire un test avec smartctl :

smartctl -t long /dev/sdx

puis de donner le retour de

smartctl --all /dev/sdx

Remplaces sdx par le label de ton disque

Dernière modification par lann (Le 03/12/2023, à 11:17)

Hors ligne

#3 Le 03/12/2023, à 11:29

metalux

Re : [Résolu]Input/output error invalid superblocks

Voici le résultat:

martctl --all /dev/sdb
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.126-1-pve] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Toshiba 2.5" HDD MQ01ABF...
Device Model:     TOSHIBA MQ01ABF050
Serial Number:    75NTCYALT
LU WWN Device Id: 5 000039 664104306
Firmware Version: AM0P1A
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Dec  3 12:23:22 2023 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x86) Offline data collection activity
                                        was aborted by the device with a fatal error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 241) Self-test routine in progress...
                                        10% of test remaining.
Total time to complete Offline 
data collection:                (  120) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 120) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   099   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       1337
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       1893
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       8
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   030   030   000    Old_age   Always       -       28399
 10 Spin_Retry_Count        0x0033   137   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1471
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       472
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       136
193 Load_Cycle_Count        0x0032   095   095   000    Old_age   Always       -       57905
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       33 (Min/Max 11/49)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       4808
198 Offline_Uncorrectable   0x0030   100   001   000    Old_age   Offline      -       56
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       0
222 Loaded_Hours            0x0032   056   056   000    Old_age   Always       -       17635
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       267
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 23783 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 23783 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 e0 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 e0 80 af 20 40 00  24d+00:17:15.871  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:15.854  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:15.854  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:15.852  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:15.852  SET FEATURES [Set transfer mode]

Error 23782 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 78 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 78 80 af 20 40 00  24d+00:17:12.435  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:12.418  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:12.417  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:12.416  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:12.416  SET FEATURES [Set transfer mode]

Error 23781 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 38 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 38 80 af 20 40 00  24d+00:17:08.999  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:08.982  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:08.981  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:08.981  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:08.980  SET FEATURES [Set transfer mode]

Error 23780 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 30 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 30 80 af 20 40 00  24d+00:17:05.567  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:05.551  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:05.550  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:05.549  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:05.549  SET FEATURES [Set transfer mode]

Error 23779 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 f0 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 f0 80 af 20 40 00  24d+00:17:02.135  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:02.118  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:02.118  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:02.117  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:02.116  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     28289         -
# 2  Short offline       Completed without error       00%     28266         -
# 3  Short offline       Completed without error       00%     28266         -
# 4  Short offline       Completed: read failure       00%     28070         10744
# 5  Short offline       Completed without error       00%      5976         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Metalux a écrit :

Un test rapide de smartmontools ne m'indiquait plus d'erreurs après ça.

Finalement je m'aperçois que je n'ai pas lu le rapport mais je me suis contenté du status "Completed without error". Ce qui semble simplement dire que le test a été jusqu'au bout si je comprends bien mais ne veut absolument pas dire que le disque est OK. Merci pour ton aide @lann dans la lecture de ce rapport.

Dernière modification par metalux (Le 03/12/2023, à 13:42)

Hors ligne

#4 Le 03/12/2023, à 16:32

lann

Re : [Résolu]Input/output error invalid superblocks

Bon les paramètres les plus importants sont Reallocated_Sector_Ct et Current_Pending_Sector
Chez toi Reallocated_Sector_Ct est à 8 ce qui veut dire que tu as 8 secteurs réalloués
et Current_Pending_Sector est à 4808 ce qui veut dire que tu as ces secteurs qui n'ont pas été copiés sur un autre emplacement. Je pense que c'est le plus grave.

Hors ligne

#5 Le 03/12/2023, à 17:54

inbox

Re : [Résolu]Input/output error invalid superblocks

Salut,

Au vu des données Smart de ton disque dur, celui ci est en fin de vie. Il faut rapidement copier son contenu sur un autre support et remplacer ce disque dur.

Quant au disque, direction déchetterie.

A+


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#6 Le 03/12/2023, à 18:15

iznobe

Re : [Résolu]Input/output error invalid superblocks

Bonjour , juste en passant , on voit :

Self-test execution status:      ( 241) Self-test routine in progress...
                                        10% of test remaining.

qui signifie qu ' à la lecture du rapport le test version longue n' est pas encore terminé si je comprends bien .
Et que donc les compteurs d ' attributs ne sont pas encore incrémentés en fonction et que du coup , on ne peut voir l' evolution .

Mais c ' est sur que le disque est pas en bon état .

Selon le superblock endommagé , ca peut etre aussi plus ou moins grave , mais là , la question ne se pose pas tellement vu les compteurs .
un disque doit etre en parfait état , des qu il donne signe de malaise , il vaut mieux eviter de s ' en servir , et faire une sauvegarde sur un autre support des que possible et le changer rapidement .

Dernière modification par iznobe (Le 03/12/2023, à 18:19)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne

#7 Le 03/12/2023, à 18:16

metalux

Re : [Résolu]Input/output error invalid superblocks

Ok, je vais le faire dès maintenant, ça fait déjà plusieurs mois que je joue avec le feu.
Que me conseillez-vous comme outils? cp -a, rsync, ddrescue, autre chose?

J'ai 2 partitions sur ce disque, l'une avec les données Nextcloud, c'est celle qui est défectueuse qui ne se monte plus automatiquement mais que j'ai réussi à y avoir accès en précisant le sb, l'autre avec les backups de VM, backup Borg, backup qui elle se monte toujours bien avec le fstab et n'a pas d'erreurs.

En attendant votre réponse, je vais chercher si j'ai un DD de récup dans mes archives et je le prépare à recevoir les données.

Hors ligne

#8 Le 03/12/2023, à 18:23

iznobe

Re : [Résolu]Input/output error invalid superblocks

Autre chose , ces compteurs indiquent :

191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       472
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       136

pour l ' attribut 191 , des chocs qui ont provoqués des erreurs de lecture / ecriture .
Pour le 192 : Un retrait de l' alimentation inadequate pendant son service .

Si tu utilises ce disque dans un ordi portable , et que tu comptes le changer , opte alors pour un disque SSD , tu auras beaucoup moins de soucis de ce genre en transportant ton ordi pendant qu ' il est en route ... ou bien evite de le bouger pendant que ton ordi est en route . et surtout pendant un backup par exemple .
les tetes de lecture des HDD , c ' est hyper sensible .


Rsync est plutot pas mal car il peut gerer l' arret / reprise de la copie en cas de soucis .
ca evite de tout reprendre du debut plutot que cp .

Pour ddrescue , je n' utilise pas ce genre de logiciel .

Dernière modification par iznobe (Le 03/12/2023, à 18:27)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne

#9 Le 03/12/2023, à 18:23

metalux

Re : [Résolu]Input/output error invalid superblocks

iznobe a écrit :

Bonjour , juste en passant , on voit :

Self-test execution status:      ( 241) Self-test routine in progress...
                                        10% of test remaining.

qui signifie qu ' à la lecture du rapport le test version longue n' est pas encore terminé si je comprends bien .
Et que donc les compteurs d ' attributs ne sont pas encore incrémentés en fonction et que du coup , on ne peut voir l' evolution .

Tu as raison, je m'étais basé sur l'heure indiquée lors du lancement du test, ça a mis plus longtemps que prévu apparemment. Voici le nouveau rapport:

smartctl --all /dev/sdb
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.126-1-pve] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Toshiba 2.5" HDD MQ01ABF...
Device Model:     TOSHIBA MQ01ABF050
Serial Number:    75NTCYALT
LU WWN Device Id: 5 000039 664104306
Firmware Version: AM0P1A
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 2.6, 3.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Dec  3 17:17:35 2023 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x86) Offline data collection activity
                                        was aborted by the device with a fatal error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 112) The previous self-test completed having
                                        the read element of the test failed.
Total time to complete Offline 
data collection:                (  120) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 120) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   099   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       1337
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       1893
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       8
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   029   029   000    Old_age   Always       -       28404
 10 Spin_Retry_Count        0x0033   137   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1471
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       472
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       136
193 Load_Cycle_Count        0x0032   095   095   000    Old_age   Always       -       57915
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       26 (Min/Max 11/49)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       4808
198 Offline_Uncorrectable   0x0030   001   001   000    Old_age   Offline      -       255
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       0
222 Loaded_Hours            0x0032   056   056   000    Old_age   Always       -       17636
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       255
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 23783 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 23783 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 e0 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 e0 80 af 20 40 00  24d+00:17:15.871  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:15.854  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:15.854  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:15.852  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:15.852  SET FEATURES [Set transfer mode]

Error 23782 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 78 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 78 80 af 20 40 00  24d+00:17:12.435  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:12.418  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:12.417  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:12.416  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:12.416  SET FEATURES [Set transfer mode]

Error 23781 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 38 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 38 80 af 20 40 00  24d+00:17:08.999  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:08.982  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:08.981  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:08.981  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:08.980  SET FEATURES [Set transfer mode]

Error 23780 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 30 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 30 80 af 20 40 00  24d+00:17:05.567  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:05.551  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:05.550  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:05.549  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:05.549  SET FEATURES [Set transfer mode]

Error 23779 occurred at disk power-on lifetime: 28398 hours (1183 days + 6 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 41 f0 80 af 20 40  Error: UNC at LBA = 0x0020af80 = 2142080

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 08 f0 80 af 20 40 00  24d+00:17:02.135  READ FPDMA QUEUED
  ef 10 02 00 00 00 a0 00  24d+00:17:02.118  SET FEATURES [Enable SATA feature]
  27 00 00 00 00 00 e0 00  24d+00:17:02.118  READ NATIVE MAX ADDRESS EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 00  24d+00:17:02.117  IDENTIFY DEVICE
  ef 03 45 00 00 00 a0 00  24d+00:17:02.116  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       00%     28399         2048
# 2  Short offline       Completed without error       00%     28289         -
# 3  Short offline       Completed without error       00%     28266         -
# 4  Short offline       Completed without error       00%     28266         -
# 5  Short offline       Completed: read failure       00%     28070         10744
# 6  Short offline       Completed without error       00%      5976         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Pas d'évolution depuis que je l'ai remonté ce matin. Mais je ne vais pas jouer, il faut juste que je trouve un disque disponible et ça c'est pas gagné pour aujourd'hui.

Hors ligne

#10 Le 03/12/2023, à 18:30

metalux

Re : [Résolu]Input/output error invalid superblocks

iznobe a écrit :

Autre chose , ces compteurs indiquent :

191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       472
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       136

pour l ' attribut 191 , des chocs qui ont provoqués des erreurs de lecture / ecriture .
Pour le 192 : Un retrait de l' alimentation inadequate pendant son service .

Si tu utilises ce disque dans un ordi portable , et que tu comptes le changer , opte alors pour un disque SSD , tu auras beaucoup moins de soucis de ce genre en transportant ton ordi pendant qu ' il est en route ... ou bien evite de le bouger pendant que ton ordi est en route .

Non c'est un mini-pc sur lequel j'ai installé proxmox avec une VM qui me sert de serveur. Par contre le disque est de la récup d'un PC portable, je ne connais pas son passé, le problème doit dater d'avant mais ça ne lui a pas empêché de rendre de précieux services pendant un laps de temps non négligeable.

Super intéressant vos analyses, je m'était penché sur la question il y a de très nombreuses années, mais là je préférais demander vos avis plutôt que de passer beaucoup de temps dans des recherches avec des interprétations parfois erronées.

Pour l'attribut 192, ça voudrait dire quoi ce retrait inadéquat de l'alimentation? Ne serait-ce pas la panne de courant?

Hors ligne

#11 Le 03/12/2023, à 18:39

iznobe

Re : [Résolu]Input/output error invalid superblocks

pas forcément , ca peut etre lié au firmware du disque , a la gestion de la mise en veille , a une mise en veille pendant un transfert , ca peut etre plein de trucs , la panne de courant aussi , bien sur . sur un portable , plus de batterie par exemple ...

le pire c ' est ceux-ci de compteurs :
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       4808
198 Offline_Uncorrectable   0x0030   001   001   000    Old_age   Offline      -       255
presque 5000 secteurs a la rue . pas bon signe du tout , et 255 completement morts .

Dernière modification par iznobe (Le 03/12/2023, à 18:43)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne

#12 Le 30/12/2023, à 02:48

metalux

Re : [Résolu]Input/output error invalid superblocks

Voici un retour de mes mésaventures. Je n'ai rien perdu hormis quelques fichiers qui étaient corrompus (dont des images), mais suffisamment anciens pour les retrouver dans une sauvegarde.

Y-a-t-il une commande pour retrouver tous ces fichiers corrompus qui se retrouve sur le nouveau disque afin de les remplacer par l'original sauvegardé?
J'en ai repéré quelques uns en parcourant ceux-ci avec Nextcloud mais je ne suis pas sûr de tous les avoir remplacés vu qu'il y a pas mal de données sur ce disque.

Autre chose, je n'arrive plus à trouver ce qui m'a permis de débloquer la situation, à savoir monter la partition avec un superblock alternatif. Partout je vois d'utiliser le superblock conseillé par fsck, hors je n'ai réussi qu'en multipliant le superblock par 4 car j'avais lu que ceux-ci était constitués de 4 blocks. Donc au lieu de rentrer:

mount -o sb=98304 /dev/sdb1 /mnt/data/

J'ai réussi à monter la partition avec

mount -o sb=393216 /dev/sdb1 /mnt/data/

Hasard du calendrier, j'ai un voisin chez qui j'avais installé Ubuntu qui m'appelle que son ordinateur ne démarre plus ni sur Ubuntu , ni sur Windows en dual-boot. Idem, même type d'erreur, test smart pas folichon. la partition n'était même plus vu en ext4 mais en partition microsoft.
J'ai réussi à monter la partition de la même façon avec le superblock alternatif X4 et nous avons pu sauvegarder l'essentiel.

Si vous avez l'explication pourquoi il faut multiplier par 4 ou un lien éventuellement, je ne retrouve plus l'information que j'avais trouvé sur un forum en anglais. Partout je trouve l'info de monter avec sb=98304 (basé sur mon cas, ce superblock peut-être un autre) et jamais avec sb=393216 (hormis ou je l'ai lu 1 fois) et pourtant c'est ça qui a débloqué la situation dans les 2 cas.

Dernière modification par metalux (Le 30/12/2023, à 02:52)

Hors ligne

#13 Le 30/12/2023, à 11:51

lann

Re : [Résolu]Input/output error invalid superblocks

Pour l'histoire du superblock, je ne sais pas. Tu en avais peut être plusieurs corrompus et tu as trouvé un qui n'était pas ce qui 'a permis de monter ton disque. Mais pourquoi x4 ?
Pour tes images, je te conseille de toutes les remplacer par ta sauvegarde

Hors ligne

#14 Le 30/12/2023, à 13:18

metalux

Re : [Résolu]Input/output error invalid superblocks

lann a écrit :

Mais pourquoi x4 ?

Justement c'est ce qui m'interpelle. Pour les 2 disques, c'est en multipliant par 4 le superblock suggéré par fsck que la partition a bien voulu se monter. Tous les autres cas ont échoués. Or je ne retrouve pas la page qui en parlait et l'information n'a pas l'air d'être très connue. Pourtant c'est ce qui a permis la récupération des données pour ces 2 disques.

Edit: J'ai finalement retrouvé l'info sur une autre page mais ce n'est pas celle où je l'avais lue à l'origine:
https://www.linux.com/training-tutorial … d-debugfs/

mount command expects block address in 1KB. so we need to convert our address like 98304 * 4 = 393216 we will try again with alternate superblock option “-o sb=” now:
mount -o sb=393216 /dev/xvdb /mnt
Worked! Just go ahead and explore everything is fine on mountpoint!

Dernière modification par metalux (Le 30/12/2023, à 13:31)

Hors ligne

#15 Le 30/12/2023, à 15:29

lann

Re : [Résolu]Input/output error invalid superblocks

J'ai trouvé la réponse sur ce site : https://www.techtarget.com/searchdatace … superblock

The problem with this command, however, is that it expects you to specify the position of the superblock in 1024-byte blocks, whereas the default block size for a modern ext3 volume or partition is 4096 bytes. Therefore, to tell the mount command where it can find the superblock, you have to multiply the position of the superblock by four. This means you should enter the block value 141072 when the first backup superblock is stored on block 32768. If, for example, your /dev/sda5 file system had a problem, you could try mounting it with the command mount -o sb=141072 /dev/sda5/somewhere.

Hors ligne

#16 Le 30/12/2023, à 16:56

metalux

Re : [Résolu]Input/output error invalid superblocks

Merci, ce lien explique bien pourquoi il faut X4. Cette info n'était pas facile à trouver et je pense qu'il y en a plus d'un qui risque de passer à côté d'une partition qui se remonte sans problème; encore faut-il avoir les bonnes options et le bon usage.

RTFM me diront certains! Encore faut-il savoir dans quel man le trouver. J'ai trouver l'info en ligne sur https://fr.manpages.org/mount/8 par contre aucune idée de comment retrouver ce manuel en terminal (j'ai tenté man 8 mount sans succès)

Hors ligne

#17 Le 30/12/2023, à 20:59

lann

Re : [Résolu]Input/output error invalid superblocks

man mount

certainement ?

Hors ligne

#18 Le 30/12/2023, à 23:35

metalux

Re : [Résolu]Input/output error invalid superblocks

Non justement.
C'est hors sujet, je vais créer un autre sujet.
Merci à tous pour vos conseils.

Hors ligne