Extraire des images incorporées à partir d'un PDF

137

Avant de commencer à utiliser Ubuntu, j'ai utilisé le lecteur Nitro PDF pour extraire automatiquement des images de fichiers PDF. Existe-t-il un lecteur de PDF pour Linux?

Je voudrais pouvoir extraire des images plus rapidement / plus facilement que lorsque vous prenez un instantané.

    
posée 1kb 13.06.2012 - 00:36
la source

8 réponses

166

Utilisez pdfimages

pdfimages est un outil d'extraction d'images PDF qui enregistre les images dans un fichier PDF au format de fichier (s) PPM, PBM, JPEG ou JPEG 2000.

C'est une partie du package poppler-utils , que vous devez installer.

Utilisation: pdfimages [options] <PDF-file> <image-root>

Exemple: Ce qui suit extrait toutes les images d’un fichier PDF et les enregistre au format JPEG.

pdfimages -j in.pdf /tmp/out

Sauvegarde les images du fichier PDF in.pdf dans les fichiers /tmp/out-000.jpg (ou /tmp/out-000.pbm ; voir ci-dessous), /tmp/out-001.jpg , etc.

La page de manuel de pdfimages explique:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
    
réponse donnée pl1nk 13.06.2012 - 01:06
la source
18

J'utilise souvent Inkscape pour cela. Chargez la page et supprimez tous les autres éléments. L'avantage est que vous pouvez obtenir des images vectorielles en SVG et les modifier à votre guise.

    
réponse donnée Gremlin 11.09.2014 - 15:12
la source
4

Vous pouvez également essayer pdfmod. Il s’agit d’une interface graphique qui peut extraire des images et effectuer d’autres manipulations de base en pdf.

    
réponse donnée To Do 13.06.2012 - 19:18
la source
3

J'ai un fichier PDF à double colonne avec des images incorporées créées avec LaTeX où les images originales ont été fournies en tant que fichiers EPS. J'ai essayé la solution proposée basée sur pdfimages , mais malheureusement, aucune image n'a été renvoyée. J'ai ensuite essayé d'utiliser Inkscape, mais les images SVG générées étaient déformées et je n'ai pas eu de chance de les exporter en EPS.

Le logiciel utilisé était le MasterPdfEditor .

Voici la procédure

  • Ouvrez votre fichier en utilisant Master PDF Editor
  • Utilisez l'outil d'édition (Alt + 1) pour sélectionner l'image à extraire
  • Copier la figure (Ctrl + C)
  • Cliquez sur le cadre en pointillé autour de l’image et consultez la barre latérale droite (Inspecteur d’objets) et cliquez sur "Geomerty". Là, vous pouvez voir la taille de votre sélection
  • Créez un nouveau fichier (Ctrl + N). Il vous demandera de fournir la taille de la page. Fournissez la taille exacte de votre image et créez le nouveau fichier
  • Maintenant, c'est un peu délicat: collez l'image (Ctrl + V). L'image peut ne pas apparaître dans le nouveau fichier. Utilisez les flèches pour le déplacer jusqu'à ce que vous puissiez le tracer.
  • Utilisez les flèches pour centrer l'image dans la nouvelle page
  • Enregistrer au format PDF

Le résultat est de très haute qualité, mais le logiciel n’est pas gratuit. Il existe une version de démonstration qui "vous permet d’essayer toutes les fonctionnalités", mais comprend "l’ajout d’un filigrane sur le fichier de sortie". Pour être franc, je n'ai pas remarqué de filigrane dans le PDF produit.

    
réponse donnée Pantelis Sopasakis 12.04.2016 - 18:50
la source
2

J'utilise pdfimages qui est un outil de ligne de commande et ça marche très bien pour moi. Il est très facile à utiliser et vous pouvez utiliser l'option --help pour en savoir plus sur son utilisation. J'utilise Ubuntu et il est pré-installé. Si vos fichiers pdf sont cryptés ou protégés par mot de passe, il existe des options pour cela, donc cet outil fonctionne très bien. Vous pouvez lire plus sur pdfimages ici

    
réponse donnée jetbird13 24.07.2013 - 03:39
la source
1

Si vous avez besoin d’une image recadrée au format pdf / eps, extrayez une page avec l’image en utilisant pdfmod (comme suggéré par To Do).

Ensuite, en utilisant pdfcrop , vous pouvez le rogner correctement en définissant les marges par essai et erreur:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
    
réponse donnée macieksk 12.06.2014 - 16:17
la source
1

Avec pdfimages l’image extraite peut être en deux ou plusieurs parties. Un moyen simple de les assembler à nouveau sans se soucier des formats extraits consiste à importer les pièces dans LibreOffice Draw, à recadrer avec le dialogue de recadrage, à positionner les pièces, à ajuster le format et à exporter dans le format de votre choix.

    
réponse donnée DafyddG 07.01.2015 - 00:54
la source
1

Si vous voulez rogner une image à partir d’un pdf avec un pdfviewer, vous pouvez essayer okular. Il peut rogner n'importe quoi (textes ou images) au format png ou jpeg. Si vous voulez extraire des images au format png à partir d'un pdf, vous pouvez le faire avec une commande minimale avec pdftohtml. Il convertit les images pdf en html plus images. Vous trouverez ici un exemple - lien . Si vous souhaitez extraire de nombreuses images d'un pdf, je vous suggère d'essayer ceci.

    
réponse donnée user203413 06.07.2015 - 17:09
la source

Lire d'autres questions sur les étiquettes