La réponse actuellement acceptée fait le travail mais aboutit à une sortie de taille supérieure et qui souffre d’une perte de qualité.
La méthode dans la réponse donnée ici produit une sortie dont la taille est comparable à celle de l'entrée et de ne souffrent pas de perte de qualité.
TLDR - Utilisez pdfimages
: pdfimages -j input.pdf output
Citer la réponse liée:
Ce que vous entendez par "perte de qualité" n'est pas clair. Cela pourrait signifier beaucoup
de différentes choses. Pourriez-vous poster des exemples pour illustrer?
Peut-être couper la même section de la mauvaise qualité et de la bonne qualité
versions (en tant que PNG pour éviter de nouvelles pertes de qualité).
Peut-être devez-vous utiliser -density
pour effectuer la conversion à un niveau supérieur
dpi:
convert -density 300 file.pdf page_%04d.jpg
(Vous pouvez ajouter -units PixelsPerInch
ou -units
PixelsPerCentimeter
si nécessaire. Ma copie par défaut est ppi.)
Mise à jour: Comme vous l’avez souligné, gscan2pdf
(la manière dont vous l’utilisez) n’est qu’une enveloppe pour pdfimages
(provenant de ppler ). pdfimages
ne fait pas la même chose que convert
fait quand on lui donne un PDF comme
entrée.
convert
prend le PDF, le rend avec une certaine résolution et utilise le
bitmap résultant comme image source.
pdfimages
examine le PDF pour les images bitmap incorporées et
exporte chacun dans un fichier. Il ignore simplement tout texte ou vecteur
commandes de dessin dans le PDF.
En conséquence, si ce que vous avez est un PDF qui est juste une enveloppe autour d'un
série de bitmaps, pdfimages
fera un bien meilleur travail d'extraction
eux, car il vous obtient les données brutes à sa taille d'origine. Toi
probablement également vouloir utiliser l'option -j
à pdfimages
, car un
PDF peut contenir des données JPEG brutes. Par défaut, pdfimages
convertit
tout au format PNM, et la conversion JPEG & gt; PPM & gt; JPEG est une perte
processus.
Alors, essayez
pdfimages -j file.pdf page
Vous pouvez ou non avoir besoin de suivre cela avec une étape convert
à .jpg
(selon le format bitmap utilisé par le PDF).
J'ai essayé cette commande sur un PDF que j'avais fait moi-même à partir d'une séquence
des images JPEG. Les fichiers JPEG extraits étaient octet par octet identiques à
les images sources. Vous ne pouvez pas obtenir une qualité supérieure à cela.