floss:pdf-20240316

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
floss:pdf-20240316 [2024/03/16 11:39] villersdfloss:pdf-20240316 [2024/03/16 16:31] (Version actuelle) villersd
Ligne 1: Ligne 1:
 ====== Divers logiciels de manipulation de fichiers PDF ====== ====== Divers logiciels de manipulation de fichiers PDF ======
 +
 +https://github.com/Boomaga/boomaga
 +
   * [[https://pdfsam.org/fr/|PDFsam]] (**basic**) pour diviser, fusionner, extraire des pages, faire pivoter et mélanger des fichiers PDF   * [[https://pdfsam.org/fr/|PDFsam]] (**basic**) pour diviser, fusionner, extraire des pages, faire pivoter et mélanger des fichiers PDF
   * [[https://github.com/pdfarranger/pdfarranger|PDF Arranger]] small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive graphical interface   * [[https://github.com/pdfarranger/pdfarranger|PDF Arranger]] small python-gtk application, which helps the user to merge or split PDF documents and rotate, crop and rearrange their pages using an interactive and intuitive graphical interface
Ligne 6: Ligne 9:
   * [[https://fr.libreoffice.org/download/telecharger-libreoffice/|LibreOffice]] Draw permet de modifier tous les documents PDF et d'utiliser en particulier la fonction « Consolidation de texte ». Elle permet de regrouper en une seule zone toutes les zones de texte séparées qu'on observe quand on ouvre le PDF (source [[https://twitter.com/alainmi11/status/1446772236707323909|Alain Michel]])   * [[https://fr.libreoffice.org/download/telecharger-libreoffice/|LibreOffice]] Draw permet de modifier tous les documents PDF et d'utiliser en particulier la fonction « Consolidation de texte ». Elle permet de regrouper en une seule zone toutes les zones de texte séparées qu'on observe quand on ouvre le PDF (source [[https://twitter.com/alainmi11/status/1446772236707323909|Alain Michel]])
     * Documentation : [[https://help.libreoffice.org/latest/en-GB/text/sdraw/01/consolidatetext.html|Text Box Consolidation]]     * Documentation : [[https://help.libreoffice.org/latest/en-GB/text/sdraw/01/consolidatetext.html|Text Box Consolidation]]
-  * convert / magick ([[https://imagemagick.org/|imagemagick]]) 
   * ...   * ...
 +===== convert / magick =====
 +[[https://imagemagick.org/|imagemagick]]
 +
 +==== Convertir en mode monochrome compressé un fichier PDF ====
 +Un fichier scanné en niveaux de gris (voire couleurs) de feuilles manuscrites génère un fichier PDF particulièrement gourmand en taille, avec souvent de l'ordre de 5 Mo par page ! Il est donc très intéressant d'archiver un tel document dans une version compressée monochrome.
 +
 +[[http://www.imagemagick.org|Imagemagick]], sous Linux, Windows et Mac OS X apporte une solution simple par la commande convert avec des arguments adéquats :
 +
 +  convert -density 300 -threshold 50% -type bilevel -compress fax in.pdf out.pdf
 +
 +Les résultats peuvent être spectaculaires, avec un gain jusqu'à un facteur 100 (avec des pages finales d'environ 50 ko)
 +
 +Remarques :
 +  * En fonction de l'intensité de gris de l'écriture scannée, la valeur limite 50% sera parfois portée à une valeur plus grande. C'est souvent le cas lorsque le document d'origine était écrit avec un stylo-plume, ou un stylo-bille à encre trop claire.
 +  * Si le pdf d'entrée n'est pas lisible par la commande convert, vous pouvez créer une version alternative via une impression intermédiaire vers un autre fichier pdf.
 +  * compression couleur : cf. par exemple convert -compress jpeg -density 150 -quality 50 in.pdf out.pdf
 +  * binarisation & compression d'une série d'images : convert -density 300 -threshold 50% -type bilevel -compress fax *.jpg out.pdf
 +
 +
 +Autres solutions équivalentes :
 +  convert out50003.png -colors 2 +dither -type bilevel out50003bw.png
 +
 +
 +Conversion en batch avec remplacement (effectuer une sauvegarde et tester si nécessaire au préalable, voir [[http://askubuntu.com/questions/293672/how-can-i-batch-convert-images-to-b-w-while-preserving-the-folder-structure|ref]]) :
 +  for img in $(find . -iname '*.png'); do echo -n "Converting $img"; convert -density 300 -threshold 50% -type bilevel $img $img && echo ' [Done]'; done
 +
 +==== Fusionner des images en un seul fichier PDF (Merge images into one PDF file) ====
 +
 +Premièrement, il faut convertir les images en des fichiers monochromes. Cela peut se faire à l'aide par exemple de //i.e.// Gwenview, en deux étapes de traitement par lôt (conversion jpg-->PNG et colorisation:monochrome). Utiliser ensuite la commande ImageMagick suivante :
 +
 +  convert *.png output.pdf
 +
 +Alternativement, la conversion monochrome peut être effectuée après la création du pdf. Voir la page [[convert_monochrome_pdf|Convertir en mode monochrome compressé un fichier PDF]]
 +
 +Firstly convert images to monochome PNG. This could be done using //i.e.// Gwenview with two successive batch operation (jpg-->PNG and colorise--> monochrome). Then use ImageMagick command :
 +
 +  convert *.png output.pdf
 +
 +Pour concatener plusieurs fichier pdf (pdf1.pdf pdf3.pdf pdf2.pdf) :
 +  convert pdf1.pdf pdf3.pdf pdf2.pdf final_pdf.pdf
 +
 +Références :
 +  * [[http://ubuntuforums.org/showthread.php?t=789359]]
 +  * erreur "convert: attempt to perform an operation not allowed by the security policy `PDF'" → [[https://askubuntu.com/questions/1127260/imagemagick-convert-not-allowed]] : sudo nano /etc/ImageMagick-6/policy.xml → <policy domain="coder" rights="read|write" pattern="PDF" />
 +
 +
  • floss/pdf-20240316.1710585579.txt.gz
  • Dernière modification : 2024/03/16 11:39
  • de villersd