Numérisez de nombreuses pages directement dans un PDF

33

Existe-t-il un programme facile à utiliser dans Ubuntu capable de numériser de nombreuses pages directement dans un fichier PDF?

    
posée pupeno 03.10.2010 - 10:50
la source

5 réponses

37

L’idée de disposer d’un utilitaire de numérisation simple était à l’origine du développement de, Simple Scan : l’outil de numérisation installé par défaut à partir de 10.04 sur (Applications ‣ Graphiques Simple Scan).

NumérisezsimplementautantdepagesquevouslesouhaitezetchoisissezPDFcommeformatdefichierlorsdelasauvegarde.

gscan2pdfestunautreprogrammeunpeumoinssimplequioffredesfonctionnalitéssupplémentaires,tellesquelareconnaissancedetexte,égalementdanslesréférentiels.

    
réponse donnée Marcel Stimberg 03.10.2010 - 12:10
la source
5

"Facile à utiliser" est dans l'oeil de l'utilisateur, mais xsane fournit cette fonctionnalité. Choisissez plusieurs pages où il est dit spectateur (ou appuyez sur CTRL-M), et il ne devrait pas être trop difficile de comprendre à partir de là.

    
réponse donnée Karl Bielefeldt 03.10.2010 - 11:40
la source
3

J'utilisais xsane jusqu'à ce que je voie cette question et considère son interface pour le moins idiosyncratique, mais efficace.

Après avoir vu cette question, j’ai cherché et trouvé des gscan2pdf résidant dans les référentiels Ubuntu Lucid / Maverick. Il utilise le même moteur d'analyse (libsane), mais l'interface utilisateur est beaucoup plus gnome-ish. Pour passer un bon moment, essayez:

sudo apt-get install gscan2pdf
    
réponse donnée msw 03.10.2010 - 12:11
la source
3

Modifiez le nom du fichier de myfile.jpg à myfile.pdf dans la boîte de dialogue de sauvegarde de Simple Scan.

Testé sur Ubuntu 14.04, Simple Scan 3.12.1.

Cela fonctionne même si la liste déroulante des types de fichiers ne contient pas "PDF", mais uniquement "Images". Je considère cela comme un bug de l'interface utilisateur.

Cette fonctionnalité est documentée dans Help > Contents :

From the "Save As" dialog box, choose one of the supported file types, or simply change the extension in the "Name" field.

Il est indiqué que les formats suivants sont pris en charge:

  • PDF
  • JPEG
  • PNG
  • TIFF

Fait intéressant: si vous modifiez le type de numérisation (liste déroulante en plus de "Numériser") en "Texte", le type de fichier par défaut devient PDF.

    
la source
1

Numérisez des pages à partir d'un scanner USB. Utilisez tesseract to OCR dans un fichier PDF. Fusionner plusieurs pages en un seul PDF. Utilisation: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device 'genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME='basename "$0" .sh' #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}
    
réponse donnée morten 12.02.2016 - 14:52
la source

Lire d'autres questions sur les étiquettes