Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 18/09/2008, à 22:03

Hiéroglyphe

Description du format PDF

Salut à tous,

J'aimerai programmer un petit lecteur de fichiers pdf. Un logiciel qui n'affiche que le texte hein: pas les images ou autres chose. En fait idéalement ce serait pour lire des ebooks sur la DS.

Aussi est-ce qu'il existe une description de ce format un peu plus accessible que les bottins de 2000 pages d'Adobe ? Genre juste un guide qui décrive comment est codé le texte, les entêtes etc. ?

Hors ligne

#2 Le 18/09/2008, à 23:00

LittleWhite

Re : Description du format PDF

Salut,

je vais peut etre dire un tas de couenneries , mais dans l'espoir que je puisse t'aidé.

Bien sur le botin de 2000 pages d'adobe , c'est ce qu'il y a de mieux , malgré que je suis un peu perplexe dans le cas ou ils livrent leur format ( qui me semblait propriétaire ) directement.

Au sinon à l'arrache tu peux regarder le code avec un éditeur héxadécimal , avec une colonne pour la transcription en caractère ascii.
Afin de repéré comment est le texte

Au sinon , c'est à ct'heure là que tu pose de telle question... big_smile

Peut etre un site qui explique rapidement le format ... mais j'en doute
Et si tu ouvrai le code source de evince ( ou autre lecteur sous linux avec un code lbre )

Bonne chance


Linux ou mourir
Pour avoir des problemes : demarrer Windows
Script de compression multi archive : http://forum.ubuntu-fr.org/viewtopic.php?id=225297

Hors ligne

#3 Le 19/09/2008, à 10:36

Hiéroglyphe

Re : Description du format PDF

oui c'est ce que je suis en train de faire: je me sers du code source de xpdf, ghostscript etc. (vive le libre!).

Mais comme j'aimerai commencer par du simple (juste décoder le texte, en virant tout ce qui est image, mise en page etc.), un guide plus simpliste serait le bienvenu tongue
Enfin bon, je continue de chercher...

(pour info, les refs d'Adobe sont téléchargeables ici: http://www.adobe.com/devnet/pdf/pdf_reference.html )

Hors ligne

#4 Le 19/09/2008, à 10:40

bwana147

Re : Description du format PDF

Lire le code de pdftotext ?

Hors ligne

#5 Le 19/09/2008, à 11:02

Karl_le_rouge

Re : Description du format PDF

PDF est un format ouvert, normalisé par l'ISO pour certaines de ses itérations.
Faire un moteur de rendu PDF n'est pas une tâche aisée (enfin, tu fais ce que tu veux),  mais si tu veux en réutiliser un, je te recommanderais Poppler: http://poppler.freedesktop.org/
Tu as des bindings GObject, Qt4, "OpenStep" et ça fonctionne sur toute plateforme supportant Cairo (X11, windows, mac etc ...)

Poppler est utilisé par evince, okular, epdfview, sumatra pdf viewer etc ...

Hors ligne

#6 Le 19/09/2008, à 14:19

Hiéroglyphe

Re : Description du format PDF

ok merci.

Pdftotext fait partie du package de xPDF et Poppler utilise lui même... xPDF !
Je vous tiens au courant wink

Hors ligne