Table des matières
Divers logiciels de manipulation de fichiers PDF
https://github.com/Boomaga/boomaga
- PDFsam (basic) pour diviser, fusionner, extraire des pages, faire pivoter et mélanger des fichiers PDF
- PDF Arranger small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive graphical interface
- Xournal++ is an open-source and cross-platform note-taking software that is fast, flexible, and functional.
- Okular (KDE)
- LibreOffice Draw permet de modifier tous les documents PDF et d'utiliser en particulier la fonction « Consolidation de texte ». Elle permet de regrouper en une seule zone toutes les zones de texte séparées qu'on observe quand on ouvre le PDF (source Alain Michel)
- Documentation : Text Box Consolidation
- …
convert / magick
Convertir en mode monochrome compressé un fichier PDF
Un fichier scanné en niveaux de gris (voire couleurs) de feuilles manuscrites génère un fichier PDF particulièrement gourmand en taille, avec souvent de l'ordre de 5 Mo par page ! Il est donc très intéressant d'archiver un tel document dans une version compressée monochrome.
Imagemagick, sous Linux, Windows et Mac OS X apporte une solution simple par la commande convert avec des arguments adéquats :
convert -density 300 -threshold 50% -type bilevel -compress fax in.pdf out.pdf
Les résultats peuvent être spectaculaires, avec un gain jusqu'à un facteur 100 (avec des pages finales d'environ 50 ko)
Remarques :
- En fonction de l'intensité de gris de l'écriture scannée, la valeur limite 50% sera parfois portée à une valeur plus grande. C'est souvent le cas lorsque le document d'origine était écrit avec un stylo-plume, ou un stylo-bille à encre trop claire.
- Si le pdf d'entrée n'est pas lisible par la commande convert, vous pouvez créer une version alternative via une impression intermédiaire vers un autre fichier pdf.
- compression couleur : cf. par exemple convert -compress jpeg -density 150 -quality 50 in.pdf out.pdf
- binarisation & compression d'une série d'images : convert -density 300 -threshold 50% -type bilevel -compress fax *.jpg out.pdf
Autres solutions équivalentes :
convert out50003.png -colors 2 +dither -type bilevel out50003bw.png
Conversion en batch avec remplacement (effectuer une sauvegarde et tester si nécessaire au préalable, voir ref) :
for img in $(find . -iname '*.png'); do echo -n "Converting $img"; convert -density 300 -threshold 50% -type bilevel $img $img && echo ' [Done]'; done
Fusionner des images en un seul fichier PDF (Merge images into one PDF file)
Premièrement, il faut convertir les images en des fichiers monochromes. Cela peut se faire à l'aide par exemple de i.e. Gwenview, en deux étapes de traitement par lôt (conversion jpg–>PNG et colorisation:monochrome). Utiliser ensuite la commande ImageMagick suivante :
convert *.png output.pdf
Alternativement, la conversion monochrome peut être effectuée après la création du pdf. Voir la page Convertir en mode monochrome compressé un fichier PDF
Firstly convert images to monochome PNG. This could be done using i.e. Gwenview with two successive batch operation (jpg–>PNG and colorise–> monochrome). Then use ImageMagick command :
convert *.png output.pdf
Pour concatener plusieurs fichier pdf (pdf1.pdf pdf3.pdf pdf2.pdf) :
convert pdf1.pdf pdf3.pdf pdf2.pdf final_pdf.pdf
Références :
- erreur “convert: attempt to perform an operation not allowed by the security policy `PDF'” → https://askubuntu.com/questions/1127260/imagemagick-convert-not-allowed : sudo nano /etc/ImageMagick-6/policy.xml → <policy domain=“coder” rights=“read|write” pattern=“PDF” />