martes, 15 de octubre de 2019

Otro poco de recorte de PDF

Antes de las vacaciones habíamos hablado de como obtener una copia digital de un manual de papel para evitar su deterioro (véase aquí). Hoy vamos a hacer una variación de esta técnica. Hemos vuelto de un congreso donde nos ha facilitado un libro de actas en papel —grapado, por cierto, no cosido—, y sin copia digital. Para justificar nuestra presencia, además de presentar las facturas y certificado de asistencia, siempre es interesante guardar una copia digital de los resúmenes de tus conferencias, que quedan como justificación para el futuro. Sin pensarlo mucho, escaneé directamente desde el libro, doblando como pude, y el resultado fue un fichero PDF A4 con un texto interior B5. En la otra entrada habíamos manejado con convert imágenes jpg, pero la aplicación de convert sobre un PDF puede generar una pérdida de calidad si no manejamos correctamente los argumentos, aparte de lo difícil que es cortar por el lado izquierdo, derecho y abajo. En general, lo podría realizar con pdf-shuffler, aplicación que llevo utilizando desde hace años para el manejo de los pdfs en linux. Sin embargo, pdfshuffler es una aplicación antigua python-gtk que hace de interfaz gráfica de python-pyPdf y depende de python 2; es más, no tiene mantenimiento desde hace bastante tiempo. En Fedora 30 se está haciendo una transición a python 3 y la librería python2-PyPDF2 no permite importar pyPDF2 como solicita shuffler (podemos ver aquí los errores). En resumen, pdf-shuffler no arranca:


Lo más sencillo es utilizar pdfarranger,


pero en esos momentos recordaba que en Fedora 29 pdfarranger no estaba en los repositorios habituales y había que incorporar un repositorio personal o COPR. Desde los últimos tiempos en que aun utilizaba Ubuntu, tengo muy malos recuerdos de los ppa, así que decidí buscar alternativas de terminal, a ver que había. En esta página describen, entre otras aplicaciones, pdfcrop. En Fedora requiere la instalación de texlive-pdfcrop:

su -c 'dnf install texlive-pdfcrop'

y luego ejecutar utilizando el argumento margins (--margins " " (0 0 0 0) para aumentar o disminuir los márgenes —si solo se una un número afecta a todos ellos—). En este caso el comando fue:

pdfcrop --margins '-145 -0 -110 -330' input.pdf output.pdf

Para comprender lo que cortamos, el pdf era de 826x1160 a 100 ppp, es decir, un A4 escaneado a calidad no muy alta, y nos aproximábamos a un B5.

Después descubrí que en Fedora 30 ya está pdfarranger en los repositorios, y además recomiendan no usar pdf-shuffler, ya que pdfarranger es una versión actualizada del otro, optimizada a python 3.

¿Qué hacer? Más fácil es usar pdfarranger; más rápido pdfcrop. Eso sí, pdfarranger permite hacer más cosas que recortar. Para los que estemos acostumbrados a shuffler, acudir a arranger, que es más o menos igual, salvo que tengáis prisa y solo queráis recortar o aumentar los márgenes.





No hay comentarios:

Publicar un comentario