Pages : 1
#1 Le 04/01/2013, à 14:12
- chuky
Serveur : 2 points à corriger
Bonjour.
J'ai un petit problème avec le serveur de mon entreprise (10.04.4 LTS).
Il a correctement tourné pendant 8 mois et là depuis 1 mois environ, je le retrouve figé tous les lundi matin... Obligé de rebooter avec le bouton d'alim.
D'après les logs, il plante le samedi vers 7h00... j'ai regarder dans le dossier cron.weekly mais il n'y a rien d'extraordinaire.
Je viens d'installer linux-dumpcrash, j'espère en savoir plus lundi prochain, mais si vous avez une idée, je suis preneur.
Autre soucis, moins grave cette fois, mon /var/log/messages est rempli de :
Jan 4 07:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 07:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 07:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="2249" x-info="http://www.rsyslog.com"] (re)start
Jan 4 07:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 07:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 08:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 08:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 08:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="20151" x-info="http://www.rsyslog.com"] (re)start
Jan 4 08:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 08:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 09:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 09:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 09:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="5354" x-info="http://www.rsyslog.com"] (re)start
Jan 4 09:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 09:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 10:00:02 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 10:00:02 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 10:00:02 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="24116" x-info="http://www.rsyslog.com"] (re)start
Jan 4 10:00:02 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 10:00:02 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 11:00:02 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 11:00:02 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 11:00:02 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="10565" x-info="http://www.rsyslog.com"] (re)start
Jan 4 11:00:02 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 11:00:02 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 12:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 12:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 12:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="28574" x-info="http://www.rsyslog.com"] (re)start
Jan 4 12:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 12:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 13:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 4 13:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 4 13:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="13992" x-info="http://www.rsyslog.com"] (re)start
Jan 4 13:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 4 13:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 4 14:00:01 XRUK87 kernel: Kernel logging (proc) stopped.
Alors là pareil, j'ai cherché sur google, rien trouvé de probant...
Ca fait tellement longtemps que j'ai pas été ennuyé avec mes machines que j'avoue que j'ai un peu perdu la main :-)
Merci d'avance pour votre aide.
Hors ligne
#2 Le 04/01/2013, à 14:16
- chuky
Re : Serveur : 2 points à corriger
Pour info, il s'agit d'un serveur "multi usage" :
- LAMP + TOMCAT pour les divers intranets de l'entreprise
- VirtualBox pour l'hébergement de 2 services particuliers et propriétaire (gestion du temps et des accès)
Hors ligne
#3 Le 04/01/2013, à 15:15
- ssdg
Re : Serveur : 2 points à corriger
Y'aurais pas un disque dur plein quelque part? (Disque Virtuel ou non (surtout si le fichier DD de la machine virtuelle essaie de s'étendre sur un disque plein)
s'il n'y a pas de solution, c'est qu'il n'y a pas de problème... ou pas.
Hors ligne
#4 Le 04/01/2013, à 15:23
- chuky
Re : Serveur : 2 points à corriger
Non ça a l'air bon de ce coté.
Par contre, j'ai un montage NAS, je sais pas si ça joue.
Sys. de fichiers Tail. Occ. Disp. %Occ. Monté sur
/dev/sda2 9,2G 7,4G 1,5G 84% /
none 7,9G 356K 7,9G 1% /dev
none 7,9G 0 7,9G 0% /dev/shm
none 7,9G 156K 7,9G 1% /var/run
none 7,9G 8,0K 7,9G 1% /var/lock
none 7,9G 0 7,9G 0% /lib/init/rw
tmpfs 1,0G 107M 918M 11% /ram/dbcache/Ticket
tmpfs 3,5G 0 3,5G 0% /ram/session_php
/dev/sda4 402G 16G 365G 5% /home
/dev/sda3 46G 1,1G 43G 3% /var
//192.168.0.10/INTRANET
459G 187G 272G 41% /var/data/filestorage
Hors ligne
#5 Le 04/01/2013, à 15:30
- ssdg
Re : Serveur : 2 points à corriger
A noter qu'il n'y a pas que cron.weekly dans la vie (cron.weekly est en fait une tâche cron "classique" qui est lancée une fois par semaine par cron)
Désolé je ne peux que donner des pistes.
s'il n'y a pas de solution, c'est qu'il n'y a pas de problème... ou pas.
Hors ligne
#6 Le 04/01/2013, à 15:38
- tiramiseb
Re : Serveur : 2 points à corriger
Regarde dans /etc/cron.daily, /etc/cron.hourly, /etc/cron.d, /etc/crontab...
Sébastien Maccagnoni - https://www.maccagnoni.eu - https://www.domotego.com
Hors ligne
#7 Le 04/01/2013, à 15:55
- chuky
Re : Serveur : 2 points à corriger
Pour ce qui est du crash, je pense que le crashdump m'en dira plus lundi...
Par contre pour ce qui est des logs... je comprend pas pourquoi rsyslogd est relancé toutes les heures...
Merci pour votre aide en tout cas.
Hors ligne
#8 Le 04/01/2013, à 15:58
- tiramiseb
Re : Serveur : 2 points à corriger
As-tu regardé dans /etc/cron.hourly, /etc/cron.d et /etc/crontab ?
(et accessoirement tu peux exécuter crontab -l, sait-on jamais)
Sébastien Maccagnoni - https://www.maccagnoni.eu - https://www.domotego.com
Hors ligne
#9 Le 04/01/2013, à 16:11
- chuky
Re : Serveur : 2 points à corriger
cron.hourly --> vide
cron.d ---> rien qui se lance le weekend spécifiquement
Dans /etc/crontab :
47 6 * * 7 root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.weekly )
Normal quoi.
Enfin crontab -l : rien de spécifique au weekend
Hors ligne
#10 Le 04/01/2013, à 16:15
- Brunod
Re : Serveur : 2 points à corriger
Tu n'as pas un pc extérieur qui accède au serveur et le fait planter à cette heure précise ? Un backup qui remplit un disque ou qq chose du genre...
Windows est un système d'exploitation de l'homme par l'ordinateur. Linux, c'est le contraire...
39 pc linux convertis
Hors ligne
#11 Le 04/01/2013, à 16:27
- bruno
Re : Serveur : 2 points à corriger
Pour le service syslog qui redémarre toutes les heures cela fait penser à une rotation des logs. Il faudrait vérifier /etc/logrotate.conf et les fichiers sous /etc/logrotate.d/
Les tâches dans cron.weekly se lancent le dimanche à 6h47 ce qui ne "colle" pas avec le plantage du samedi à 7h00. Il faudrait que tu regardes les logs correspondant au samedi 7h00 (ceux du système et ceux des services qui tournent sur ton serveur).
#12 Le 04/01/2013, à 16:38
- chuky
Re : Serveur : 2 points à corriger
Normalement non :-) Le backup se fait toutes les nuits.
Par contre, je viens de regarder l'historique munin donc 2 choses : lors du freeze, le disque dur n'est pas saturé par contre la charge, sans être élevée, est tout de même différente. le serveur vacille entre 0.4 / 0.6 et au moment du plantage il est à 1.2 / 1.6, voire une pointe à 2
Il y a donc bien quelque chose qui se passe...
Hors ligne
#13 Le 04/01/2013, à 16:41
- chuky
Re : Serveur : 2 points à corriger
Pour le service syslog qui redémarre toutes les heures cela fait penser à une rotation des logs. Il faudrait vérifier /etc/logrotate.conf et les fichiers sous /etc/logrotate.d/
Les tâches dans cron.weekly se lancent le dimanche à 6h47 ce qui ne "colle" pas avec le plantage du samedi à 7h00. Il faudrait que tu regardes les logs correspondant au samedi 7h00 (ceux du système et ceux des services qui tournent sur ton serveur).
Je me suis trompé, le plantage à lieu le dimanche entre 9 et 10... n'importe quoi... il est temps de partir en weekend.
Merci pour la liste piste des logs, je vais regarder.
Dernière modification par chuky (Le 04/01/2013, à 16:44)
Hors ligne
#14 Le 04/01/2013, à 16:43
- chuky
Re : Serveur : 2 points à corriger
La config de logrotate laisse apparaitre souvent le mot clé weekly... je sais pas si ça peut avoir un lien
Par exemple :
/var/log/apache2/*.log {
weekly
missingok
rotate 52
compress
delaycompress
notifempty
create 640 root adm
sharedscripts
postrotate
if [ -f "`. /etc/apache2/envvars ; echo ${APACHE_PID_FILE:-/var/run/apache2.pid}`" ]; then
/etc/init.d/apache2 reload > /dev/null
fi
endscript
}
Hors ligne
#15 Le 04/01/2013, à 18:05
- jlmas
Re : Serveur : 2 points à corriger
Tu as combien de ram sur ton serveur ?
Hors ligne
#16 Le 04/01/2013, à 19:17
- chuky
Re : Serveur : 2 points à corriger
16Go
Hors ligne
#17 Le 07/01/2013, à 07:45
- chuky
Re : Serveur : 2 points à corriger
Bon ba voilà, il suffit que je me décide de poster sur le forum pour que mon serveur ne plante plus
Sinon, mon /var/log/messages est toujours rempli de lignes
Jan 7 06:00:01 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 7 06:00:01 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="30405" x-info="http://www.rsyslog.com"] (re)start
Jan 7 06:00:01 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 7 06:00:01 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Jan 7 06:45:54 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="30405" x-info="http://www.rsyslog.com"] rsyslogd was HUPed, type 'lightweight'.
Jan 7 07:00:02 XRUK87 kernel: Kernel logging (proc) stopped.
Jan 7 07:00:02 XRUK87 kernel: imklog 4.2.0, log source = /proc/kmsg started.
Jan 7 07:00:02 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="13477" x-info="http://www.rsyslog.com"] (re)start
Jan 7 07:00:02 XRUK87 rsyslogd: rsyslogd's groupid changed to 103
Jan 7 07:00:02 XRUK87 rsyslogd: rsyslogd's userid changed to 101
Par contre celle ci me dit quelque chose
Jan 7 06:45:54 XRUK87 rsyslogd: [origin software="rsyslogd" swVersion="4.2.0" x-pid="30405" x-info="http://www.rsyslog.com"] rsyslogd was HUPed, type 'lightweight'.
Je vais chercher mais il me semble avoir vu quelque chose sur google là dessus.
Je vous tiens au courant.
Hors ligne
#18 Le 07/01/2013, à 07:51
- tiramiseb
Re : Serveur : 2 points à corriger
C'est rsyslog qui est relancé toutes les heures.
Je t'avais demandé de vérifier dans cron.hourly, cron.d et crontab pour ça, mais tu n'y a cherché que des trucs liés à ton premier problème on dirait. Tu peux revérifier ça...
Sébastien Maccagnoni - https://www.maccagnoni.eu - https://www.domotego.com
Hors ligne
#19 Le 07/01/2013, à 16:54
- chuky
Re : Serveur : 2 points à corriger
Ups effecivement...
Je me permet de mettre le contenu des fichiers au cas où car je ne vois pas ce qui pourrait géner.
cron.hourly : vide
crond.d :
root@XRUK87:/etc/cron.d# ll
total 40K
4,0K drwxr-xr-x 2 root root 4,0K 2013-01-04 16:08 ./
12K drwxr-xr-x 141 root root 12K 2013-01-04 16:53 ../
4,0K -rw-r--r-- 1 root root 201 2011-01-12 17:03 awstats
4,0K -rw-r--r-- 1 root root 1,4K 2012-03-20 17:35 mailman
4,0K -rw-r--r-- 1 root root 506 2010-04-13 14:53 munin-node
4,0K -rw-r--r-- 1 root root 506 2012-02-11 08:06 php5
awstats :
0,10,20,30,40,50 * * * * www-data [ -x /usr/lib/cgi-bin/awstats.pl -a -f /etc/awstats/awstats.conf -a -r /var/log/apache2/access.log ] && /usr/lib/cgi-bin/awstats.pl -config=awstats -update >/dev/null
mailman :
# At 8AM every day, mail reminders to admins as to pending requests.
# They are less likely to ignore these reminders if they're mailed
# early in the morning, but of course, this is local time... ;)
0 8 * * * list [ -x /usr/lib/mailman/cron/checkdbs ] && /usr/lib/mailman/cron/checkdbs
#
# At 9AM, send notifications to disabled members that are due to be
# reminded to re-enable their accounts.
0 9 * * * list [ -x /usr/lib/mailman/cron/disabled ] && /usr/lib/mailman/cron/disabled
#
# Noon, mail digests for lists that do periodic as well as threshold delivery.
0 12 * * * list [ -x /usr/lib/mailman/cron/senddigests ] && /usr/lib/mailman/cron/senddigests
#
# 5 AM on the first of each month, mail out password reminders.
0 5 1 * * list [ -x /usr/lib/mailman/cron/mailpasswds ] && /usr/lib/mailman/cron/mailpasswds
#
# Every 5 mins, try to gate news to mail. You can comment this one out
# if you don't want to allow gating, or don't have any going on right now,
# or want to exclusively use a callback strategy instead of polling.
# */5 * * * * list [ -x /usr/lib/mailman/cron/gate_news ] && /usr/lib/mailman/cron/gate_news
#
# At 3:27am every night, regenerate the gzip'd archive file. Only
# turn this on if the internal archiver is used and
# GZIP_ARCHIVE_TXT_FILES is false in mm_cfg.py
27 3 * * * list [ -x /usr/lib/mailman/cron/nightly_gzip ] && /usr/lib/mailman/cron/nightly_gzip
Munin-node :
#
# cron-jobs for munin-node
#
MAILTO=root
# If the APT plugin is enabled, update packages databases approx. once
# an hour (12 invokations an hour, 1 in 12 chance that the update will
# happen), but ensure that there will never be more than two hour (7200
# seconds) interval between updates..
*/5 * * * * root if [ -x /etc/munin/plugins/apt_all ]; then /etc/munin/plugins/apt_all update 7200 12 >/dev/null; elif [ -x /etc/munin/plugins/apt ]; then /etc/munin/plugins/apt update 7200 12 >/dev/null; fi
php5 :
# /etc/cron.d/php5: crontab fragment for php5
# This purges session files older than X, where X is defined in seconds
# as the largest value of session.gc_maxlifetime from all your php.ini
# files, or 24 minutes if not defined. See /usr/lib/php5/maxlifetime
# Look for and purge old sessions every 30 minutes
09,39 * * * * root [ -x /usr/lib/php5/maxlifetime ] && [ -d /var/lib/php5 ] && find /var/lib/php5/ -depth -mindepth 1 -maxdepth 1 -type f -cmin +$(/usr/lib/php5/maxlifetime) -delete
Et le crontab :
# /etc/crontab: system-wide crontab
# Unlike any other crontab you don't have to run the `crontab'
# command to install the new version when you edit this file
# and files in /etc/cron.d. These files also have username fields,
# that none of the other crontabs do.
SHELL=/bin/sh
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
# m h dom mon dow user command
17 * * * * root cd / && run-parts --report /etc/cron.hourly
25 6 * * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily )
47 6 * * 7 root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.weekly )
52 6 1 * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.monthly )
Merci
Hors ligne
#20 Le 07/01/2013, à 16:57
- chuky
Re : Serveur : 2 points à corriger
Et un crontab -l
root@XRUK87:/etc/cron.d# crontab -l
20 17 * * * /etc/webmin/virtual-server/sendratings.pl
8,18,28,38,48,58 * * * * /etc/webmin/virtual-server/collectinfo.pl
37 13 * * * /etc/webmin/virtual-server/scriptlatest.pl
0,5,10,15,20,25,30,35,40,45,50,55 * * * * /etc/webmin/status/monitor.pl
@daily /etc/webmin/virtual-server/backup.pl --id 135256212913591
0 0,3,6,9,12,15,18,21 * * * /etc/webmin/virtual-server/bw.pl
0 * * * * /etc/webmin/bandwidth/rotate.pl
Est-ce que ça ne pourrais pas venir de cette dernière ligne ???
Je vais la commenter pour voir
Hors ligne
#21 Le 07/01/2013, à 17:06
- chuky
Re : Serveur : 2 points à corriger
Pas de message de rsyslogd à 17h00
Bon, je ne vais pas vendre la peau de l'ours mais c'est plutôt bon signe.
Merci pour ton aide tiramiseb, je pense avoir compris le raisonnement...
Hors ligne
Pages : 1