Pages : 1
#1 Le 18/09/2008, à 22:03
- Hiéroglyphe
Description du format PDF
Salut à tous,
J'aimerai programmer un petit lecteur de fichiers pdf. Un logiciel qui n'affiche que le texte hein: pas les images ou autres chose. En fait idéalement ce serait pour lire des ebooks sur la DS.
Aussi est-ce qu'il existe une description de ce format un peu plus accessible que les bottins de 2000 pages d'Adobe ? Genre juste un guide qui décrive comment est codé le texte, les entêtes etc. ?
Hors ligne
#2 Le 18/09/2008, à 23:00
- LittleWhite
Re : Description du format PDF
Salut,
je vais peut etre dire un tas de couenneries , mais dans l'espoir que je puisse t'aidé.
Bien sur le botin de 2000 pages d'adobe , c'est ce qu'il y a de mieux , malgré que je suis un peu perplexe dans le cas ou ils livrent leur format ( qui me semblait propriétaire ) directement.
Au sinon à l'arrache tu peux regarder le code avec un éditeur héxadécimal , avec une colonne pour la transcription en caractère ascii.
Afin de repéré comment est le texte
Au sinon , c'est à ct'heure là que tu pose de telle question...
Peut etre un site qui explique rapidement le format ... mais j'en doute
Et si tu ouvrai le code source de evince ( ou autre lecteur sous linux avec un code lbre )
Bonne chance
Linux ou mourir
Pour avoir des problemes : demarrer Windows
Script de compression multi archive : http://forum.ubuntu-fr.org/viewtopic.php?id=225297
Hors ligne
#3 Le 19/09/2008, à 10:36
- Hiéroglyphe
Re : Description du format PDF
oui c'est ce que je suis en train de faire: je me sers du code source de xpdf, ghostscript etc. (vive le libre!).
Mais comme j'aimerai commencer par du simple (juste décoder le texte, en virant tout ce qui est image, mise en page etc.), un guide plus simpliste serait le bienvenu
Enfin bon, je continue de chercher...
(pour info, les refs d'Adobe sont téléchargeables ici: http://www.adobe.com/devnet/pdf/pdf_reference.html )
Hors ligne
#4 Le 19/09/2008, à 10:40
- bwana147
Re : Description du format PDF
Lire le code de pdftotext ?
Hors ligne
#5 Le 19/09/2008, à 11:02
- Karl_le_rouge
Re : Description du format PDF
PDF est un format ouvert, normalisé par l'ISO pour certaines de ses itérations.
Faire un moteur de rendu PDF n'est pas une tâche aisée (enfin, tu fais ce que tu veux), mais si tu veux en réutiliser un, je te recommanderais Poppler: http://poppler.freedesktop.org/
Tu as des bindings GObject, Qt4, "OpenStep" et ça fonctionne sur toute plateforme supportant Cairo (X11, windows, mac etc ...)
Poppler est utilisé par evince, okular, epdfview, sumatra pdf viewer etc ...
Hors ligne
#6 Le 19/09/2008, à 14:19
- Hiéroglyphe
Re : Description du format PDF
ok merci.
Pdftotext fait partie du package de xPDF et Poppler utilise lui même... xPDF !
Je vous tiens au courant
Hors ligne
Pages : 1