floss:pdf-20240316

Divers logiciels de manipulation de fichiers PDF

https://github.com/Boomaga/boomaga

  • PDFsam (basic) pour diviser, fusionner, extraire des pages, faire pivoter et mélanger des fichiers PDF
  • PDF Arranger small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive graphical interface
  • Xournal++ is an open-source and cross-platform note-taking software that is fast, flexible, and functional.
  • Okular (KDE)
  • LibreOffice Draw permet de modifier tous les documents PDF et d'utiliser en particulier la fonction « Consolidation de texte ». Elle permet de regrouper en une seule zone toutes les zones de texte séparées qu'on observe quand on ouvre le PDF (source Alain Michel)

Un fichier scanné en niveaux de gris (voire couleurs) de feuilles manuscrites génère un fichier PDF particulièrement gourmand en taille, avec souvent de l'ordre de 5 Mo par page ! Il est donc très intéressant d'archiver un tel document dans une version compressée monochrome.

Imagemagick, sous Linux, Windows et Mac OS X apporte une solution simple par la commande convert avec des arguments adéquats :

convert -density 300 -threshold 50% -type bilevel -compress fax in.pdf out.pdf

Les résultats peuvent être spectaculaires, avec un gain jusqu'à un facteur 100 (avec des pages finales d'environ 50 ko)

Remarques :

  • En fonction de l'intensité de gris de l'écriture scannée, la valeur limite 50% sera parfois portée à une valeur plus grande. C'est souvent le cas lorsque le document d'origine était écrit avec un stylo-plume, ou un stylo-bille à encre trop claire.
  • Si le pdf d'entrée n'est pas lisible par la commande convert, vous pouvez créer une version alternative via une impression intermédiaire vers un autre fichier pdf.
  • compression couleur : cf. par exemple convert -compress jpeg -density 150 -quality 50 in.pdf out.pdf
  • binarisation & compression d'une série d'images : convert -density 300 -threshold 50% -type bilevel -compress fax *.jpg out.pdf

Autres solutions équivalentes :

convert out50003.png -colors 2 +dither -type bilevel out50003bw.png

Conversion en batch avec remplacement (effectuer une sauvegarde et tester si nécessaire au préalable, voir ref) :

for img in $(find . -iname '*.png'); do echo -n "Converting $img"; convert -density 300 -threshold 50% -type bilevel $img $img && echo ' [Done]'; done

Premièrement, il faut convertir les images en des fichiers monochromes. Cela peut se faire à l'aide par exemple de i.e. Gwenview, en deux étapes de traitement par lôt (conversion jpg–>PNG et colorisation:monochrome). Utiliser ensuite la commande ImageMagick suivante :

convert *.png output.pdf

Alternativement, la conversion monochrome peut être effectuée après la création du pdf. Voir la page Convertir en mode monochrome compressé un fichier PDF

Firstly convert images to monochome PNG. This could be done using i.e. Gwenview with two successive batch operation (jpg–>PNG and colorise–> monochrome). Then use ImageMagick command :

convert *.png output.pdf

Pour concatener plusieurs fichier pdf (pdf1.pdf pdf3.pdf pdf2.pdf) :

convert pdf1.pdf pdf3.pdf pdf2.pdf final_pdf.pdf

Références :

Ce site web utilise des cookies. En utilisant le site Web, vous acceptez le stockage de cookies sur votre ordinateur. Vous reconnaissez également que vous avez lu et compris notre politique de confidentialité. Si vous n'êtes pas d'accord, quittez le site.En savoir plus
  • floss/pdf-20240316.txt
  • Dernière modification : 2024/03/16 16:31
  • de villersd