#1 Le 16/10/2008, à 19:17
- abeman
[répondu]prendre une partie du contenu d'un site
Bonjour.
Je viens vers vous pour vous demander comment capturer une partie d'un site pour l'enregistrer dans un fichier texte ou un BDD.
Par example, je cherche a pouvoir prendre automatiquement les numéro du tirage sur ce site http://www.fdjeux.com/jeux/loto/loto_s_tirage.php et de les enregistrer, et ceci tous les jours.
Pour le langage, du php, du c, c++ ou java (je préfèrerai php ou java perso ) devrai faire sa, mais je ne sais pas comment.
Merci de tout tuyau qui pourrait aider
Dernière modification par abeman (Le 17/10/2008, à 08:10)
Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"
Hors ligne
#2 Le 16/10/2008, à 19:23
- ®om
Re : [répondu]prendre une partie du contenu d'un site
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*
Hors ligne
#3 Le 16/10/2008, à 19:29
- abeman
Re : [répondu]prendre une partie du contenu d'un site
mmmmmmm je vois pas trop le fonctionnement de la commande. Peut tu m'en dire plus?
Merci pour ta réponse rapide
V'est surtout le
| grep -o [[:digit:]-]*
que je ne comprend pas :s
Dernière modification par abeman (Le 16/10/2008, à 19:30)
Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"
Hors ligne
#4 Le 16/10/2008, à 19:37
- ®om
Re : [répondu]prendre une partie du contenu d'un site
$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie'
<div title='49-28-18-20-40' class='hack_me_on_ffox and_not_on_ie'>
Dans une expression régulière, ce qui est entre [] veut dire "un de ces caractères".
Nous on veut que les suites composées des caractères 0123456789-.
Donc on écrit, au choix :
[013456789-]
[0-9-]
[[:digit:]-]
[b]grep -o[b] ça permet de ne sortir QUE ce qui a matché la regex
Hors ligne
#5 Le 16/10/2008, à 19:39
- abeman
Re : [répondu]prendre une partie du contenu d'un site
bon, apparement il y a un petit soucis. J'ai compris la commande, la partie "[[:digit:]-]*" etant un regex il me semble.
Par contre, cela ne marche pas. Il me prend tout le code de la page. Mais on est sur une bonne piste.
Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"
Hors ligne
#6 Le 16/10/2008, à 19:43
- ®om
Re : [répondu]prendre une partie du contenu d'un site
Tu n'as pas oublié le grep 'hack_me_on_ffox and_not_on_ie'?
$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*
49-28-18-20-40
Hors ligne
#7 Le 16/10/2008, à 19:51
- abeman
Re : [répondu]prendre une partie du contenu d'un site
stiven@stiven-desktop:~$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o [[:digit:]-]*
1
Moi j'ai sa en fait.
Pour ce qui est d'avant, je viens de voir que j'avais oublié le "q" dans "-q0-"
J'ai essayé le mettre
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*
Piour enregistrer dans un fichier, mais j'ai du me trompé, nan?
Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"
Hors ligne
#8 Le 16/10/2008, à 19:59
- ®om
Re : [répondu]prendre une partie du contenu d'un site
Que te donne :
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie'
Hors ligne
#9 Le 16/10/2008, à 20:00
- morphoneo69
Re : [répondu]prendre une partie du contenu d'un site
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o '[[:digit:]-]*' >fic
Dernière modification par morphoneo69 (Le 16/10/2008, à 20:00)
Hors ligne
#10 Le 17/10/2008, à 08:10
- abeman
Re : [répondu]prendre une partie du contenu d'un site
Parfait sa marche.
Merci a vous
Vous savez si c'est faisable en php ou java par example?
Merci encore
Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"
Hors ligne
#11 Le 17/10/2008, à 08:29
- HP
Re : [répondu]prendre une partie du contenu d'un site
Tu n'as pas oublié le grep 'hack_me_on_ffox and_not_on_ie'?
$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]* 49-28-18-20-40
chez moi il me faut :
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o [[0-9]*-]*[[0-9]*-]*[[0-9]*-]*[[0-9]*-]*[[0-9]*]*
~ > bash --version
GNU bash, version 3.2.17(1)-release (i386-apple-darwin9.0)
Copyright (C) 2005 Free Software Foundation, Inc.
après, est ce que la version de bash à y voir quelque chose… je l'ignore…: rolleyes:
cat /dev/urandom >/dev/null 2>&1 #github
Hors ligne
#12 Le 17/10/2008, à 09:41
- Alain.g
Re : [répondu]prendre une partie du contenu d'un site
HP, il faut mettre le motif entre guillemets
Xubuntu Karmic !
Hors ligne
#13 Le 17/10/2008, à 09:48
- HP
Re : [répondu]prendre une partie du contenu d'un site
pareil avec des "simples quotes" ou des "doubles quotes"…
cat /dev/urandom >/dev/null 2>&1 #github
Hors ligne
#14 Le 17/10/2008, à 10:13
- Alain.g
Re : [répondu]prendre une partie du contenu d'un site
ça ne fonctionne pas avec grep -o '[0-9-]*' ?
Xubuntu Karmic !
Hors ligne
#15 Le 17/10/2008, à 10:26
- HP
Re : [répondu]prendre une partie du contenu d'un site
non !
surprenant… mais non…
~ > grep --version
grep (GNU grep) 2.5.1
Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
cat /dev/urandom >/dev/null 2>&1 #github
Hors ligne
#16 Le 17/10/2008, à 16:54
- HP
Re : [répondu]prendre une partie du contenu d'un site
par contre, avec egrep, ça "marche mieux" :
wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | egrep -o '([0-9-]+)'
~ > egrep --version
egrep (GNU grep) 2.5.1
Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
cat /dev/urandom >/dev/null 2>&1 #github
Hors ligne