Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 16/10/2008, à 19:17

abeman

[répondu]prendre une partie du contenu d'un site

Bonjour.
Je viens vers vous pour vous demander comment capturer une partie d'un site pour l'enregistrer dans un fichier texte ou un BDD.
Par example, je cherche a pouvoir prendre automatiquement les numéro du tirage sur ce site http://www.fdjeux.com/jeux/loto/loto_s_tirage.php et de les enregistrer, et ceci tous les jours.
Pour le langage, du php, du c, c++ ou java (je préfèrerai php ou java perso tongue ) devrai faire sa, mais je ne sais pas comment.
Merci de tout tuyau qui pourrait aider smile

Dernière modification par abeman (Le 17/10/2008, à 08:10)


Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"

Hors ligne

#2 Le 16/10/2008, à 19:23

®om

Re : [répondu]prendre une partie du contenu d'un site

wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*

Hors ligne

#3 Le 16/10/2008, à 19:29

abeman

Re : [répondu]prendre une partie du contenu d'un site

mmmmmmm je vois pas trop le fonctionnement de la commande. Peut tu m'en dire plus?
Merci pour ta réponse rapide smile
V'est surtout le

| grep -o [[:digit:]-]*

que je ne comprend pas :s

Dernière modification par abeman (Le 16/10/2008, à 19:30)


Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"

Hors ligne

#4 Le 16/10/2008, à 19:37

®om

Re : [répondu]prendre une partie du contenu d'un site

$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie'
<div title='49-28-18-20-40' class='hack_me_on_ffox and_not_on_ie'>

Dans une expression régulière, ce qui est entre [] veut dire "un de ces caractères".
Nous on veut que les suites composées des caractères 0123456789-.
Donc on écrit, au choix :

[013456789-]
[0-9-]
[[:digit:]-]

[b]grep -o[b] ça permet de ne sortir QUE ce qui a matché la regex smile

Hors ligne

#5 Le 16/10/2008, à 19:39

abeman

Re : [répondu]prendre une partie du contenu d'un site

bon, apparement il y a un petit soucis. J'ai compris la commande, la partie "[[:digit:]-]*" etant un regex il me semble.
Par contre, cela ne marche pas. Il me prend tout le code de la page. Mais on est sur une bonne piste.


Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"

Hors ligne

#6 Le 16/10/2008, à 19:43

®om

Re : [répondu]prendre une partie du contenu d'un site

Tu n'as pas oublié le grep 'hack_me_on_ffox and_not_on_ie'?


$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*
49-28-18-20-40

Hors ligne

#7 Le 16/10/2008, à 19:51

abeman

Re : [répondu]prendre une partie du contenu d'un site

stiven@stiven-desktop:~$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o [[:digit:]-]*
1

Moi j'ai sa en fait.
Pour ce qui est d'avant, je viens de voir que j'avais oublié le "q" dans "-q0-"
J'ai essayé le mettre

 wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*

Piour enregistrer dans un fichier, mais j'ai du me trompé, nan?


Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"

Hors ligne

#8 Le 16/10/2008, à 19:59

®om

Re : [répondu]prendre une partie du contenu d'un site

Que te donne :

wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie'

Hors ligne

#9 Le 16/10/2008, à 20:00

morphoneo69

Re : [répondu]prendre une partie du contenu d'un site

wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o '[[:digit:]-]*' >fic

Dernière modification par morphoneo69 (Le 16/10/2008, à 20:00)

Hors ligne

#10 Le 17/10/2008, à 08:10

abeman

Re : [répondu]prendre une partie du contenu d'un site

Parfait sa marche.
Merci a vous smile
Vous savez si c'est faisable en php ou java par example?
Merci encore


Un site de vulgarisation scientifique : http://www.etcomment.fr
"Il faut savoir prendre son temps pour aller vite"

Hors ligne

#11 Le 17/10/2008, à 08:29

HP

Re : [répondu]prendre une partie du contenu d'un site

®om a écrit :

Tu n'as pas oublié le grep 'hack_me_on_ffox and_not_on_ie'?


$ wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | grep -o [[:digit:]-]*
49-28-18-20-40

chez moi il me faut :

wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep "hack_me_on_ffox and_not_on_ie" | grep -o [[0-9]*-]*[[0-9]*-]*[[0-9]*-]*[[0-9]*-]*[[0-9]*]*
~ > bash --version
GNU bash, version 3.2.17(1)-release (i386-apple-darwin9.0)
Copyright (C) 2005 Free Software Foundation, Inc.

après, est ce que la version de bash à y voir quelque chose… je l'ignore…: rolleyes:


cat /dev/urandom >/dev/null 2>&1 #github

Hors ligne

#12 Le 17/10/2008, à 09:41

Alain.g

Re : [répondu]prendre une partie du contenu d'un site

HP, il faut mettre le motif entre guillemets


Xubuntu Karmic !

Hors ligne

#13 Le 17/10/2008, à 09:48

HP

Re : [répondu]prendre une partie du contenu d'un site

pareil avec des "simples quotes" ou des "doubles quotes"…


cat /dev/urandom >/dev/null 2>&1 #github

Hors ligne

#14 Le 17/10/2008, à 10:13

Alain.g

Re : [répondu]prendre une partie du contenu d'un site

ça ne fonctionne pas avec grep -o '[0-9-]*' ?


Xubuntu Karmic !

Hors ligne

#15 Le 17/10/2008, à 10:26

HP

Re : [répondu]prendre une partie du contenu d'un site

non ! roll

surprenant… mais non…

~ > grep --version
grep (GNU grep) 2.5.1

Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

cat /dev/urandom >/dev/null 2>&1 #github

Hors ligne

#16 Le 17/10/2008, à 16:54

HP

Re : [répondu]prendre une partie du contenu d'un site

par contre, avec egrep, ça "marche mieux" :

wget http://www.fdjeux.com/jeux/loto/loto_s_tirage.php -qO- | grep 'hack_me_on_ffox and_not_on_ie' | egrep -o '([0-9-]+)'
~ > egrep --version
egrep (GNU grep) 2.5.1

Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

cat /dev/urandom >/dev/null 2>&1 #github

Hors ligne