Ako nekog interesuje, komanda za izvlacenje teksta iz PDF dokumenta (u kome je moguca selekcija teksta misem, ne oni dokumenti koji moraju da se obradjuju preko OCR), se vrsi ovako:
pdftotext -layout -enc UTF-8 pdf_koji_konvertujemo.pdf fajl_koji_dobijamo.txt
-layout - pasusi, stubci i sve...