.: HosiriS :.

Informatica e non solo

Ricercare in file PDF

Posted by hosiris su giugno 30, 2010

Almeno una volta nella vita ci è capitato di dover fare delle ricerche all’interno di testi e, se come me utilizzate prevalentemente la CLI, di sicuro avete usato almeno una volta il comando grep.
Ma se volessimo fare delle ricerche all’interno di file PDF? Dobbiamo necessariamente aprire il file?
Anche qui grep ci può essere d’aiuto, infatti possiamo usare il seguente comando:

$ pdftotext input.pdf -| grep "chiave"

in questo modo visualizzerete i risultati direttamente sul terminale (naturalmente potete redirigere l’output dove vi pare).
Ma il vero problema che mi si è presentato è quello di fare ricerche su un numero indefinito di file PDF… ricercando un po’ e rispolverando vecchi comandi, ho trovato questa soluzione che per quello che serve a me è decisamente onesta:

$ ls *.pdf | xargs -I{} pdftotext {} -| grep "chiave"

Naturalmente se qualcuno conoscesse una soluzione migliore può solo fare un piacere alla comunità postando il suo metodo.

Buon divertimento

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

 
%d blogger cliccano Mi Piace per questo: