.: HosiriS :.

Informatica e non solo

Estraiamo le immagini dai PDF

Posted by hosiris su dicembre 14, 2010

Spesso mi dicono che sono pazzo, ma in genere non raggiungo livelli che possano far preoccupare seriamente. Da qualche giorno ho superato quel limite: ho deciso di portare in formato testo tutti i pdf che ho. Non mi riferisco ai pdf da 100 pagine in su (che stanno nella cartella libri e così rimarranno), ma tutti quei file di 3 pagine che occupano spazio solo per il fatto di essere PDF.
Magari non molti vedono la pazzia, ma chi mi conosce sa che da quando per la prima volta accesi il computer (circa 10 anni fa) non ho mai cancellato un file…
Veniamo a noi… questa opera mi ha costretto a prendere delle decisioni come ad esempio il dover scrivere il tutto secondo formalismi che, se necessario, mi permetteranno di compilare i file con latex (causa formule principalmente).
Cosa farne delle immagini? Molti articoli presentano grafici o esempi… li butto? Non si può… allora li estraggo ed il tutto semplicemente con un comando:

$ pdfimages -j file.pdf images

cosa abbiamo detto al nostro terminale? Semplicissimo, gli abbiamo detto di salvare delle immagini che abbiano come radice del nome “images” prelevate dal file “file.pdf” che vengano salvate come jpeg (-j) utilizzando il programma pdfimages!
Appena terminato avrete modo di vedere le immagini nella stessa cartella del file.

Buon divertimento

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

 
%d blogger cliccano Mi Piace per questo: