#1 Le 29/12/2005, à 12:13
- zebx
[Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
Bonjour,
BLD pour "Boom le Disque".
Cette nuit mon disque de boot a eu quelques menus soucis. Ca fesait tellement longtemps que je me sens aussi désarmé qu'une poule devant un écran bleu de dump.
Les questions :
Le disque est-il ko ?
Que dois je faire pour reconstituer un boot opérationnel ?
Que dois je modifier dans la table des partitions ?
Quelles peuvent être les conséquences des erreurs signalées par fsck ?
Les faits, rien que les faits :
/ passe en ro - reboot
fsck ok - / repasse en ro - reboot
fsck trouve des anos irréparables - reboot obligatoire
grub error 17 - plus de boot disk - reboot sur livecd
# fdisk /dev/hdc -l
Disque /dev/hdc: 20.4 Go, 20404101120 octets
255 têtes, 63 secteurs/piste, 2480 cylindres
Unités = cylindres de 16065 * 512 = 8225280 octets
Périphérique Amorce Début Fin Blocs Id Système
/dev/hdc1 * 1 823 6610716 b W95 FAT32
/dev/hdc2 824 2480 13309852+ 83 Linux
# parted /dev/hdc print
Géométrie du disque pour /dev/hdc: 0.000-19458,867 mégaoctets
Type d'étiquette de disque: msdos
Mineur Départ Fin Type Sys.fichiersFanions
1 0,031 6455,808 primaire fat32 amorce
2 6455,808 19453,710 primaire
Information: Ne pas oublier de mettre à jour /etc/fstab si nécessaire.
Impossible donc de monter hdc2.
# fsck.ext3 /dev/hdc2
e2fsck 1.35 (28-Feb-2004)
Ne peut repérer le superbloc ext2, tente d'archiver les blocs...
Archivage des informations journal inode bloc.
/ n'a pas été démonté proprement, vérification forcée.
Passe 1: vérification inodes, blocs, et des tailles
Racine inode n'est pas un répertoire. Effacer<y>? no (pour non)
Réservés inode 3 <L'inode d'index ACL> a un mode erroné. Effacer<y>? no (pour non)
Réservés inode 4 <L'inode des données ACL> a un mode erroné. Effacer<y>? no (pour non)
Réservés inode 6 <L'inode des répertoires non-détruits> a un mode erroné. Effacer<y>? no (pour non)
Réservés inode 9 <L'inode réservé 9> a un mode erroné. Effacer<y>? no (pour non)
Réservés inode 10 <L'inode réservé 10> a un mode erroné. Effacer<y>? no (pour non)
Inode 12, i_size est 1624138, devrait être 1773568. Fixer<y>? no (pour non)
Inode 12, i_blocs est 3184, devrait être 3472. Fixer<y>? no (pour non)
/: e2fsck a été annulé.
/: ***** SYSTàME DE FICHIER A àTà MODIFIà *****
/: ********** AVERTISSEMENT: le système de fichiers a encore des erreurs **********
Rhâ ! Répondre non fait quand même des modifs
La preuve :
# parted /dev/hdc print
Géométrie du disque pour /dev/hdc: 0.000-19458,867 mégaoctets
Type d'étiquette de disque: msdos
Mineur Départ Fin Type Sys.fichiersFanions
1 0,031 6455,808 primaire fat32 amorce
2 6455,808 19453,710 primaire ext3
Information: Ne pas oublier de mettre à jour /etc/fstab si nécessaire.
Je ne peux pas faire de reboot à distance sans perdre sshd (livecd dans le lecteur).
Enfin :
# smartctl /dev/hdc -l error
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
ATA Error Count: 1636 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 1636 occurred at disk power-on lifetime: 7134 hours (297 days + 6 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 65 2a 0e aa e0 Error: UNC 101 sectors at LBA = 0x00aa0e2a = 11144746
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 80 0f 0e aa e0 00 17:37:00.773 READ DMA
ca 00 80 4f bd 2f e0 00 17:37:00.770 WRITE DMA
c8 00 80 cf b8 83 e0 00 17:37:00.751 READ DMA
c8 00 08 17 5f 61 e0 00 17:37:00.719 READ DMA
c8 00 08 7f 67 61 e0 00 17:37:00.704 READ DMA
Error 1635 occurred at disk power-on lifetime: 7099 hours (295 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 25 2a 0e aa e0 Error: UNC 37 sectors at LBA = 0x00aa0e2a = 11144746
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 40 0f 0e aa e0 00 01:33:56.300 READ DMA
c6 00 10 00 00 00 e0 00 01:33:56.285 SET MULTIPLE MODE
91 00 3f 00 00 00 ef 00 01:33:56.285 INITIALIZE DEVICE PARAMETERS [OBS-6]
10 00 00 00 00 00 e0 00 01:33:56.285 RECALIBRATE [OBS-4]
00 00 00 00 00 00 00 04 01:33:56.168 NOP [Abort queued commands]
Error 1634 occurred at disk power-on lifetime: 7099 hours (295 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 25 2a 0e aa e0 Error: UNC 37 sectors at LBA = 0x00aa0e2a = 11144746
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 40 0f 0e aa e0 00 01:33:52.565 READ DMA
c6 00 10 00 00 00 e0 00 01:33:52.548 SET MULTIPLE MODE
91 00 3f 00 00 00 ef 00 01:33:52.547 INITIALIZE DEVICE PARAMETERS [OBS-6]
10 00 00 00 00 00 e0 00 01:33:52.547 RECALIBRATE [OBS-4]
00 00 00 00 00 00 00 04 01:33:52.430 NOP [Abort queued commands]
Error 1633 occurred at disk power-on lifetime: 7099 hours (295 days + 19 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 25 2a 0e aa e0 Error: UNC 37 sectors at LBA = 0x00aa0e2a = 11144746
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 40 0f 0e aa e0 00 01:33:48.820 READ DMA
c8 00 40 40 b9 83 e0 00 01:33:48.819 READ DMA
c8 00 31 0f b9 83 e0 00 01:33:48.818 READ DMA
c8 00 40 cf b8 83 e0 00 01:33:48.794 READ DMA
c8 00 40 00 5f 61 e0 00 01:33:48.792 READ DMA
Error 1632 occurred at disk power-on lifetime: 7087 hours (295 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 e5 2a 0e aa e0 Error: UNC 229 sectors at LBA = 0x00aa0e2a = 11144746
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 00 0f 0e aa e0 00 10:13:20.893 READ DMA
ca 00 80 9f d7 04 e0 00 10:13:20.820 WRITE DMA
c8 00 80 cf b8 83 e0 00 10:13:20.809 READ DMA
ca 00 08 27 0c 01 e0 00 10:13:20.644 WRITE DMA
ca 00 08 1f 0c 01 e0 00 10:13:20.644 WRITE DMA
Et bizarrement :
# smartctl /dev/hdc -H
smartctl version 5.32 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
et
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000e 081 062 025 Old_age Always - 117990877
3 Spin_Up_Time 0x0002 070 070 000 Old_age Always - 0
4 Start_Stop_Count 0x0033 100 100 020 Pre-fail Always - 898
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 5
7 Seek_Error_Rate 0x000f 045 032 030 Pre-fail Always - 10582868199439
9 Power_On_Hours 0x0032 087 087 000 Old_age Always - 11708
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0033 099 099 020 Pre-fail Always - 1136
194 Temperature_Celsius 0x0022 036 062 000 Old_age Always - 39
195 Hardware_ECC_Recovered 0x001a 076 062 000 Old_age Always - 46867749
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 099 096 000 Old_age Offline - 16777216
202 TA_Increase_Count 0x0032 099 252 000 Old_age Always - 1
Mais je ne suis pas un expert smart.
Merci d'avance.
ZebX.
PS :
Note pour plus tard : continuer à séparer /var, /tmp et /home de la racine surtout quand var abrite mysql et www
Loi de Murphy : fsck trouve une ano non corrigeable : reboot obligatoire ou mode maintenance. Choisir bêtement la 1ere option
Dernière modification par zebx (Le 27/09/2006, à 07:53)
ZebX
AMD X2 64, GA-K8NF9 Ultra, nVidia Geforce 7800GT, Intrepid Ibex 64 Generic
Annuaire Moto
Hors ligne
#2 Le 30/12/2005, à 15:19
- zebx
Re : [Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
Le CR des activités nocturnes :
mount de hdc2 : impossible.
parted ok
fsck /dev/hdc2 : correction des inodes...
hdc2 passe du type ext3 au type ext2
mount OK avec les inodes renommées.
j'identifie /var et /etc.
Certains fichiers m'ont l'air ok.
Sauvegarde de /var et /etc sur hdd2
Téléchargement de la breezy-install en iso.
La suite en 2006.
ZebX
AMD X2 64, GA-K8NF9 Ultra, nVidia Geforce 7800GT, Intrepid Ibex 64 Generic
Annuaire Moto
Hors ligne
#3 Le 03/01/2006, à 14:04
- zebx
Re : [Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
Bonjour et meilleurs voeux,
Un nouveau PC est en préparation mais je continue le thread car un point me tracasse et je voudrais bien récupérer ce PC pour en faire un petit serveur web.
Pour rappel:
Une partition de mon 1er disque est indiqués défectueuse par fsck
D'ailleurs, le 1er disque semble défectueux d'après smart.
Ce week-end, je procède à la réinstallation de l'OS en n'utilisant que mon 2eme disque.
Au bout de quelques minutes, ma partition root se retrouve en read-only
Même symptome que le 1er disque donc.
J'en déduis un pb de controleur, carte mère donc.
Je pensais pourtant que smart ne testait que les disques durs...
A+
Dernière modification par zebx (Le 03/01/2006, à 14:05)
ZebX
AMD X2 64, GA-K8NF9 Ultra, nVidia Geforce 7800GT, Intrepid Ibex 64 Generic
Annuaire Moto
Hors ligne
#4 Le 03/01/2006, à 14:16
- ffomnislash
Re : [Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
tes 2 DD etait branché sur la mm nap IDE quand tu a eu les erreurs ? Avec de la chance c'est juste le nap qui pose probleme.
Si c'est la carte mere qui pose probleme alors ca ne va pas etre facile a demontrer. Le mieux serait sans doute d'attendre le nouveau pc pour tester les DD dessus.
-- Mon blog --
Hors ligne
#5 Le 04/01/2006, à 15:27
- zebx
Re : [Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
Salut et merci de ta réponse.
Les disques ne sont pas sur la même nappe - pas le même UDMA.
Ce qui me choque, c'est les erreurs SMART. Ou alors, c'est vraiment un hasard malheureux : CM et HD HS...
ZebX
AMD X2 64, GA-K8NF9 Ultra, nVidia Geforce 7800GT, Intrepid Ibex 64 Generic
Annuaire Moto
Hors ligne
#6 Le 07/02/2006, à 15:08
- zebx
Re : [Résolu] Pb Disque: / read-only, grub error 17 et plus de partition
Et bien, je confirme.
Le même disque détecté comme défectueux par smart est considéré comme parfait sur ma nouvelle CM.
SMART ne remonte donc pas seulement les erreurs du HD mais celle de la combinaison HD et Controleur.
C'est ballot
ZebX
AMD X2 64, GA-K8NF9 Ultra, nVidia Geforce 7800GT, Intrepid Ibex 64 Generic
Annuaire Moto
Hors ligne