#1 Le 27/06/2008, à 16:16
- beudbeud
recherche un pro de la commande sed
voila je bosse sur une nouvelle version de mon script Arte +7 recorder mais je tombe sur un probleme
j'aimerais faire disparaître toute les balise html de ce texte
<strong>« Tendances » Ecologie de luxe</strong><br />Eco-chic ou écologique tout court, Chic est tous les jours à l’affût de ceux qui intègrent les questions de respect de l’environnement à leur mode de vie, qui en nourrissent leurs créations. Alors que diriez-vous de quelques trouvailles éco-chic ? L’art de vivre écologique n’a plus rien de marginal, et pour épater son monde rien de tel que des produits « écologiquement corrects » . Le design écologique reste onéreux mais certains, de plus en plus nombreux, ne résistent pas au plaisir de conjuguer le beau et l’écologique. Chic vous fait découvrir les toutes dernières tendances en Allemagne.<br /><br /><strong>« Carte blanche à » Jean-Michel Othoniel</strong><br />Jean-Michel Othoniel s’est fait connaître avec ses sculptures : de belles bulles en verre de Venise. Pour Chic, il a fait le voyage jusqu’à Nîmes où il a retrouvé son ami Jean Lafont : un personnage atypique, ancien organisateur d’opéras dans les arènes de Nîmes et ancien éleveur de taureaux. Cet amoureux de la Camargue a choisi d’y rester pour l’éternité, et le jour venu, de reposer dans un somptueux « tombeau joyeux » orné des perles de verre de Jean-Michel Othoniel…<br /><br /><strong>« La Petite Histoire » du chewing-gum</strong><br />Collant, gluant, et fluorescent, aujourd'hui la petite histoire de la gomme à mâcher : le chewing-gum.<br /><br /><strong>« Coulisses » Gönül Paksoy</strong><br />Istanbul est un décor… celui de la styliste Gönül Paksoy. Chacun de ses bijoux, vêtements, meubles met en valeur un savoir-faire issu de siècles de civilisation orientale. Ingénieur chimiste de formation, passionnée d’histoire et de culture, elle collectionne poteries, tapis et tissus anciens … Autant de sources d’inspiration que Chic a retracées au cœur de ses créations originales.<br />
</p>
voila la commande que j'utilise pour récupérer ce texte
wget -O - -q http://plus7.arte.tv/fr/detailPage/1697660,CmC=2065930,scheduleId=2064402.html | grep -A 5 '<p class="text">' | awk -F'<p class="info">' '{print $1}'
merci d'avance
Télécharger les émissions de Arte +7 avec Arte +7 recorder
Theme pour Ubuntu Bisigi Project
Vostro 1510 Ubuntu 10.04
Hors ligne
#2 Le 27/06/2008, à 17:19
- Fake
Re : recherche un pro de la commande sed
Je suis pas un pro de sed mais ...
wget -O - -q http://plus7.arte.tv/fr/detailPage/1697660,CmC=2065930,scheduleId=2064402.html | grep -A 5 '<p class="text">' | awk -F'<p class="info">' '{print $1}' | sed 's/<.*>/\ /g'
Devrait remplacer ce qui est entre < et > (< et > compris) par un espace
Ensuite je sais pas ce ue tu veux faire de la sortie...
Pour la passer a une commande ajoute | xargs commande
Pour écrire dans un fichier ajoute > fichier ou >> fichier...
(J'ai testé avec une redirection de sortie et ca marche...)
Note : Ca va planter si dans le texte il y a le caractère < mais qu'il ne correspond pas à une balise.
On va alors virer tout le texte jusqu'au prochain caractère >
Dernière modification par Fake (Le 27/06/2008, à 17:21)
Hors ligne
#3 Le 27/06/2008, à 18:05
- beudbeud
Re : recherche un pro de la commande sed
merci ça marche au poil
Télécharger les émissions de Arte +7 avec Arte +7 recorder
Theme pour Ubuntu Bisigi Project
Vostro 1510 Ubuntu 10.04
Hors ligne
#4 Le 01/07/2008, à 16:22
- beudbeud
Re : recherche un pro de la commande sed
encore plus dure
example:
Visages d'Europe
donc quel commande peux supprimer les espaces devant ce nom
EDIT: c'est bon j'ai trouvé tout seul
la commande c'est
sed -e "s/[[:space:]][[:space:]].//g"
Dernière modification par beudbeud (Le 01/07/2008, à 16:39)
Télécharger les émissions de Arte +7 avec Arte +7 recorder
Theme pour Ubuntu Bisigi Project
Vostro 1510 Ubuntu 10.04
Hors ligne
#5 Le 01/07/2008, à 18:24
- Alain.g
Re : recherche un pro de la commande sed
la commande c'est
sed -e "s/[[:space:]][[:space:]].//g"
Pas vraiment correct : ceci revient à supprimer chaque morceau (/g) de la chaîne correspondant à deux espaces blanc consécutifs suivis d'un caractère quelconque.
Autrement dit, s'il y a un espace, ça ne marchera pas, s'il y en a deux ça supprimera la première lettre, s'il y en a trois ça marchera "par chance", mais s'il y en a quatre alors un espace ne sera pas supprimé.
Ça fonctionnerait mieux avec :
sed 's/^\s*//'
(à condition que ce soit en début de chaîne bien-sûr)
Dernière modification par Alain.g (Le 01/07/2008, à 18:28)
Xubuntu Karmic !
Hors ligne
#6 Le 01/07/2008, à 18:32
- beudbeud
Re : recherche un pro de la commande sed
merci Alain.g
Télécharger les émissions de Arte +7 avec Arte +7 recorder
Theme pour Ubuntu Bisigi Project
Vostro 1510 Ubuntu 10.04
Hors ligne